Distribuzione campionaria
Cos’è una distribuzione campionaria?
Una distribuzione campionaria è una distribuzione di probabilità di una statistica ottenuta da un numero maggiore di campioni estratti da una popolazione specifica. La distribuzione campionaria di una data popolazione è la distribuzione delle frequenze di una gamma di risultati diversi che potrebbero verificarsi per una statistica di una popolazione.
Nelle statistiche, una popolazione è l’intero pool da cui viene tratto un campione statistico . Una popolazione può riferirsi a un intero gruppo di persone, oggetti, eventi, visite ospedaliere o misurazioni. Una popolazione può quindi essere definita come un’osservazione aggregata di soggetti raggruppati insieme da una caratteristica comune.
- Una distribuzione campionaria è una statistica ottenuta tramite campionamento ripetuto da una popolazione più ampia.
- Descrive un intervallo di possibili risultati quello di una statistica, come la media o il modo di una variabile, in quanto esiste veramente una popolazione.
- La maggior parte dei dati analizzati dai ricercatori sono in realtà tratti da campioni e non da popolazioni.
Comprensione della distribuzione del campionamento
Molti dati elaborati e utilizzati da accademici, statistici, ricercatori, esperti di marketing, analisti, ecc. Sono in realtà campioni, non popolazioni. Un campione è un sottoinsieme di una popolazione. Ad esempio, un ricercatore medico che volesse confrontare il peso medio di tutti i bambini nati in Nord America dal 1995 al 2005 con quelli nati in Sud America nello stesso periodo di tempo non può, entro un ragionevole lasso di tempo, ricavare i dati per l’intera popolazione di oltre un milione di nascite avvenute nell’arco di dieci anni. Invece userà solo il peso di, diciamo, 100 bambini, in ogni continente per trarre una conclusione. Il peso di 200 bambini utilizzati è il campione e il peso medio calcolato è la media del campione.
Supponiamo ora che invece di prelevare un solo campione di 100 pesi neonati da ogni continente, il ricercatore medico prenda campioni casuali ripetuti dalla popolazione generale e calcoli la media campionaria per ciascun gruppo campione. Quindi, per il Nord America, estrae i dati per 100 pesi neonati registrati negli Stati Uniti, Canada e Messico come segue: quattro 100 campioni da ospedali selezionati negli Stati Uniti, cinque 70 campioni dal Canada e tre 150 record dal Messico, per un totale di 1200 pesi di neonati raggruppati in 12 set. Raccoglie anche un campione di dati di 100 pesi alla nascita da ciascuno dei 12 paesi del Sud America.
Ogni campione ha la propria media campionaria e la distribuzione delle medie campionarie è nota come distribuzione campionaria.
Il peso medio calcolato per ogni serie di campioni è la distribuzione campionaria della media. Non solo la media può essere calcolata da un campione. Altre statistiche, come la deviazione standard, la varianza, la proporzione e l’intervallo possono essere calcolate dai dati del campione. La deviazione standard e la varianza misurano la variabilità della distribuzione campionaria.
Il numero di osservazioni in una popolazione, il numero di osservazioni in un campione e la procedura utilizzata per disegnare le serie di campioni determinano la variabilità di una distribuzione campionaria. La deviazione standard di una distribuzione campionaria è chiamata errore standard. Mentre la media di una distribuzione campionaria è uguale alla media della popolazione, l’errore standard dipende dalla deviazione standard della popolazione, dalla dimensione della popolazione e dalla dimensione del campione.
Sapere quanto la media di ciascuno degli insiemi campionari siano distanti l’una dall’altra e dalla media della popolazione darà un’indicazione di quanto la media campionaria sia vicina alla media della popolazione. L’errore standard della distribuzione campionaria diminuisce all’aumentare della dimensione del campione.
considerazioni speciali
Una popolazione o un insieme di numeri campione avrà una distribuzione normale. Tuttavia, poiché una distribuzione campionaria include più serie di osservazioni, non avrà necessariamente una forma a campana.
Seguendo il nostro esempio, il peso medio della popolazione dei bambini in Nord America e in Sud America ha una distribuzione normale perché alcuni bambini saranno sottopeso (al di sotto della media) o sovrappeso (al di sopra della media), con la maggior parte dei bambini nel mezzo (intorno alla media). ). Se il peso medio dei neonati in Nord America è di sette libbre, anche il peso medio del campione in ciascuna delle 12 serie di osservazioni campione registrate per il Nord America sarà vicino a sette libbre.
Tuttavia, se si rappresenta graficamente ciascuna delle medie calcolate in ciascuno dei 1.200 gruppi di campioni, la forma risultante può risultare in una distribuzione uniforme, ma è difficile prevedere con certezza quale sarà la forma effettiva. Più campioni utilizza il ricercatore dalla popolazione di oltre un milione di figure di peso, più il grafico inizierà a formare una distribuzione normale.