4 Maggio 2021 3:31

Come funziona il campionamento casuale stratificato

Il campionamento casuale stratificato  è un metodo di campionamento che implica la divisione di una popolazione in gruppi più piccoli, chiamati strati. I gruppi o gli strati sono organizzati in base alle caratteristiche o agli attributi condivisi dei membri del gruppo. Il processo di classificazione della popolazione in gruppi è chiamato stratificazione.

Il campionamento casuale stratificato è anche noto come campionamento casuale a quote e campionamento casuale proporzionale. Il campionamento casuale stratificato ha numerose applicazioni e vantaggi, come lo studio dei dati demografici della popolazione e dell’aspettativa di vita.

Punti chiave

  • Il campionamento casuale stratificato è un metodo di campionamento che prevede il prelievo di campioni di una popolazione suddivisa in gruppi più piccoli chiamati strati.
  • Il campionamento casuale stratificato comporta il prelievo di campioni casuali da gruppi stratificati, in proporzione alla popolazione.
  • Il campionamento casuale stratificato è una metrica più precisa poiché rappresenta una migliore rappresentazione della popolazione complessiva.

Comprensione del campionamento casuale stratificato

Il campionamento casuale stratificato divide una popolazione in sottogruppi. Campioni casuali vengono prelevati nella stessa proporzione alla popolazione da ciascuno dei gruppi o strati. I membri in ogni strato (singolare per strati) formati hanno attributi e caratteristiche simili.

Il campionamento casuale stratificato è un metodo di campionamento, ovvero quando un ricercatore seleziona un piccolo gruppo come dimensione del campione per lo studio. Questo sottoinsieme rappresenta la popolazione più ampia. Organizzare una popolazione in gruppi con caratteristiche simili aiuta i ricercatori a risparmiare tempo e denaro quando la popolazione studiata è troppo numerosa per essere analizzata su base individuale. Il campionamento casuale stratificato aiuta consentendo ai ricercatori di organizzare i gruppi in base a caratteristiche simili per cui viene quindi prelevato un campione casuale da ogni strato o gruppo.

Il campionamento casuale stratificato può essere utilizzato, ad esempio, per studiare i sondaggi delle elezioni, le persone che fanno gli straordinari, l’aspettativa di vita, il reddito di diverse popolazioni e il reddito per diversi lavori in una nazione.

Campionamento casuale stratificato e semplificato

Un semplice campione casuale è un campione di individui che esistono in una popolazione in base al quale gli individui vengono selezionati casualmente dalla popolazione e inseriti nel campione. Questo metodo di selezione casuale degli individui cerca di selezionare una dimensione del campione che sia una rappresentazione imparziale della popolazione. Tuttavia, un semplice campione casuale non è vantaggioso quando i campioni della popolazione variano ampiamente.

Al contrario, il campionamento casuale stratificato scompone la popolazione in sottogruppi e li organizza in base a tratti, caratteristiche e comportamenti simili. Di conseguenza, il campionamento casuale stratificato è più vantaggioso quando la popolazione varia notevolmente poiché aiuta a organizzare meglio i campioni per lo studio.

Tuttavia, un semplice campione casuale è più vantaggioso quando la popolazione non può essere organizzata in sottogruppi perché ci sono troppe differenze all’interno della popolazione. Inoltre, i campioni casuali semplici sono i migliori quando ci sono poche o nessuna informazione sulla popolazione, il che impedisce alla popolazione di essere suddivisa in sottoinsiemi in base a caratteristiche o tratti.

Esempio di campionamento casuale stratificato

Un gruppo di ricerca ha deciso di eseguire uno studio per analizzare le medie dei voti o GPA per i 21 milioni di studenti universitari negli Stati Uniti. I ricercatori decidono di ottenere un campione casuale di 4.000 studenti universitari all’interno di una popolazione di 21 milioni. Il team vuole rivedere le varie major e i successivi GPA per gli studenti o per i partecipanti campione.

Su 4.000 partecipanti, la ripartizione delle major è la seguente:

  • Inglese: 560
  • Scienza: 1.135
  • Informatica: 800
  • Ingegneria: 1.090
  • Matematica: 415

I ricercatori hanno i loro cinque strati dal processo di campionamento casuale stratificato. Successivamente, i ricercatori studiano i dati della popolazione per determinare la percentuale dei 21 milioni di studenti che si specializzano nelle materie del loro campione. I risultati mostrano quanto segue:

  • 12% maggiore in inglese
  • 28% importante in scienze
  • 24% importante in informatica
  • 21% maggiore in ingegneria
  • 15% di specializzazione in matematica

Il team decide di utilizzare un campione casuale stratificato proporzionale in base al quale si desidera determinare se le major per gli studenti del campione rappresentano la stessa proporzione della popolazione.

Tuttavia, le proporzioni nel campione non sono uguali alle percentuali nella popolazione. Ad esempio, il 12% della popolazione studentesca sono major inglesi, mentre il 14% degli studenti del campione sono major inglesi (o 560 major inglesi / 4.000).

Di conseguenza, i ricercatori decidono di ricampionare gli studenti in modo che corrispondano alla percentuale di major nella popolazione. Dei 4.000 studenti nel loro campione, decidono di selezionare a caso quanto segue:

  • 480 major inglesi (12% di 4.000)
  • 1.120 specializzazioni in scienze (28% di 4.000)
  • 960 laureati in informatica (24% di 4.000)
  • 840 major in ingegneria (21% di 4.000)
  • 600 laureati in matematica (15% di 4.000)

I ricercatori ora dispongono di un campione casuale stratificato proporzionato di studenti universitari e delle rispettive major, che riflette in modo più accurato le major per la popolazione studentesca complessiva. Da lì, i ricercatori possono analizzare i GPA di ogni strato e le loro caratteristiche per avere un’idea migliore di come si sta comportando la popolazione studentesca complessiva.