Trascuratezza delle dimensioni del campione - KamilTaylan.blog
4 Maggio 2021 0:00

Trascuratezza delle dimensioni del campione

Che cos’è trascurare la dimensione del campione?

Sample Size Neglect è un Daniel Kahneman. Si verifica quando gli utenti delle informazioni statistiche traggono false conclusioni non considerando la dimensione del campione dei dati in questione.

La causa alla base di Sample Size Neglect è che le persone spesso non riescono a capire che è più probabile che si verifichino alti livelli di varianza in piccoli campioni. Pertanto, è fondamentale determinare se la dimensione del campione utilizzata per produrre una determinata statistica è sufficientemente ampia da consentire conclusioni significative.

Sapere quando una dimensione del campione è sufficientemente grande può essere difficile per coloro che non hanno una buona conoscenza dei metodi statistici.

Punti chiave

  • Sample Size Neglect è un pregiudizio cognitivo studiato da Amos Tversky e Daniel Kahneman.
  • Consiste nel trarre false conclusioni da informazioni statistiche, non avendo considerato gli effetti della dimensione del campione.
  • Coloro che desiderano ridurre il rischio di trascuratezza della dimensione del campione dovrebbero ricordare che dimensioni del campione più piccole sono associate a risultati statistici più volatili e viceversa.

Comprensione della negligenza della dimensione del campione

Quando una dimensione del campione è troppo piccola, non è possibile trarre conclusioni accurate e affidabili. Nel contesto della finanza, ciò può indurre in errore gli investitori in vari modi.

Ad esempio, un investitore potrebbe vedere una pubblicità per un nuovo fondo di investimento, vantandosi di aver generato un rendimento annualizzato del 15% sin dal suo inizio. L’investitore potrebbe essere pronto a includere che questo fondo è il loro biglietto per una rapida generazione di ricchezza. Tuttavia, questa conclusione potrebbe essere pericolosamente fuorviante se il fondo non investe da molto tempo. In tal caso, i risultati potrebbero essere dovuti ad anomalie a breve termine e avere poco a che fare con l’effettiva metodologia di investimento del fondo.

La negligenza della dimensione del campione viene spesso confusa con la negligenza del tasso di base, che è un bias cognitivo separato. Mentre Sample Size Neglect si riferisce all’incapacità di considerare il ruolo delle dimensioni del campione nel determinare l’attendibilità delle affermazioni statistiche, Base Rate Neglect si riferisce alla tendenza delle persone a trascurare le conoscenze esistenti su un fenomeno quando valutano nuove informazioni.

Esempio del mondo reale di trascuratezza delle dimensioni del campione

Per comprendere meglio Sample Size Neglect, si consideri il seguente esempio, tratto dalla ricerca di Amos Tversky e Daniel Kahneman:

A una persona viene chiesto di estrarre da un campione di cinque palline e scopre che quattro sono rosse e una è verde.

Una persona estrae da un campione di 20 palline e scopre che 12 sono rosse e otto sono verdi.

Quale campione fornisce una prova migliore che le palline sono prevalentemente rosse?

La maggior parte delle persone afferma che il primo campione più piccolo fornisce prove molto più forti perché il rapporto tra il rosso e il verde è molto più alto del campione più grande. Tuttavia, in realtà il rapporto più alto è controbilanciato dalla dimensione del campione più piccola. Il campione di 20 in realtà fornisce prove molto più forti.

Un altro esempio di Amos Tversky e Daniel Kahneman è il seguente:

Una città è servita da due ospedali. Nell’ospedale più grande nascono in media 45 bambini ogni giorno e nell’ospedale più piccolo ne nascono circa 15 ogni giorno. Sebbene il 50% di tutti i bambini siano maschi, la percentuale esatta oscilla di giorno in giorno.

Durante un anno, ogni ospedale ha registrato i giorni in cui più del 60% dei bambini erano maschi. Quale ospedale ha registrato più giorni simili?

Quando è stata posta questa domanda, il 22% degli intervistati ha affermato che l’ospedale più grande avrebbe segnalato più giorni simili, mentre il 56% ha affermato che i risultati sarebbero stati gli stessi per entrambi gli ospedali. In effetti, la risposta corretta è che l’ospedale più piccolo registrerebbe più giorni di questo tipo, perché la sua dimensione più piccola produrrebbe una maggiore variabilità.

Come abbiamo notato in precedenza, la radice di Sample Size Neglect è che le persone spesso non riescono a capire che è più probabile che si verifichino alti livelli di varianza in piccoli campioni. Nell’investire, questo può essere davvero molto costoso.