4 Maggio 2021 1:11

Campionamento casuale stratificato

Che cos’è il campionamento casuale stratificato?

Il campionamento casuale stratificato è un metodo di campionamento che prevede la divisione di una popolazione in sottogruppi più piccoli noti come strati. Nel campionamento casuale stratificato, o stratificazione, gli strati sono formati sulla base degli attributi o delle caratteristiche condivise dai membri come il reddito o il livello di istruzione.

Il campionamento casuale stratificato è anche chiamato campionamento casuale proporzionale o campionamento casuale a quote.

Punti chiave

  • Il campionamento casuale stratificato consente ai ricercatori di ottenere una popolazione campione che rappresenta al meglio l’intera popolazione studiata.
  • Il campionamento casuale stratificato comporta la divisione dell’intera popolazione in gruppi omogenei chiamati strati.
  • Il campionamento casuale stratificato differisce dal campionamento casuale semplice, che implica la selezione casuale di dati da un’intera popolazione, quindi è altrettanto probabile che ogni possibile campione si verifichi.

Come funziona il campionamento casuale stratificato

Quando si completa l’analisi o la ricerca su un gruppo di entità con caratteristiche simili, un ricercatore può scoprire che la dimensione della popolazione è troppo grande per la quale completare la ricerca. Per risparmiare tempo e denaro, un analista può adottare un approccio più fattibile selezionando un piccolo gruppo dalla popolazione. Il piccolo gruppo viene indicato come dimensione del campione, che è un sottoinsieme della popolazione utilizzato per rappresentare l’intera popolazione. Un campione può essere selezionato da una popolazione in diversi modi, uno dei quali è il metodo di campionamento casuale stratificato.

Un campionamento casuale stratificato comporta la divisione dell’intera popolazione in gruppi omogenei chiamati strati (plurale di strato). I campioni casuali vengono quindi selezionati da ogni strato. Ad esempio, si consideri un ricercatore accademico che vorrebbe conoscere il numero di studenti MBA nel 2007 che hanno ricevuto un’offerta di lavoro entro tre mesi dalla laurea.

Presto scoprirà che c’erano quasi 200.000 laureati MBA per l’anno. Potrebbe decidere di semplice campione casuale di 50.000 laureati ed eseguire un sondaggio. Meglio ancora, potrebbe dividere la popolazione in strati e prelevare un campione casuale dagli strati. Per fare ciò, creerebbe gruppi di popolazione basati su sesso, fascia di età, razza, paese di nazionalità e background professionale. Viene prelevato un campione casuale da ogni strato in un numero proporzionale alla dimensione dello strato rispetto alla popolazione. Questi sottoinsiemi degli strati vengono quindi raggruppati per formare un campione casuale.

[Importante: il campionamento stratificato viene utilizzato per evidenziare le differenze tra i gruppi in una popolazione, al contrario del semplice campionamento casuale, che tratta tutti i membri di una popolazione come uguali, con la stessa probabilità di essere campionati.]

Esempio di campionamento casuale stratificato

Supponiamo che un gruppo di ricerca voglia determinare il GPA degli studenti universitari negli Stati Uniti. Il gruppo di ricerca ha difficoltà a raccogliere dati da tutti i 21 milioni di studenti universitari; decide di prelevare un campione casuale della popolazione utilizzando 4.000 studenti.

Supponiamo ora che il team esamini i diversi attributi dei partecipanti del campione e si chieda se ci siano differenze nei GPA e nelle major degli studenti. Supponiamo che rilevi che 560 studenti sono specializzandi in inglese, 1.135 in scienze, 800 in informatica, 1.090 in ingegneria e 415 in matematica. Il team desidera utilizzare un campione casuale stratificato proporzionale in cui lo strato del campione è proporzionale al campione casuale nella popolazione.

Supponiamo che il team effettui ricerche sui  dati demografici  degli studenti universitari negli Stati Uniti e trovi la percentuale di ciò in cui gli studenti si specializzano: 12% in inglese, 28% in scienze, 24% in informatica, 21% in ingegneria e 15% specializzarsi in matematica. Pertanto, cinque strati vengono creati dal processo di campionamento casuale stratificato.

Il team deve quindi confermare che lo strato della popolazione è proporzionale allo strato nel campione; tuttavia, trovano che le proporzioni non sono uguali. Il team deve quindi ricampionare 4.000 studenti dalla popolazione e selezionare casualmente 480 studenti di inglese, 1.120 di scienze, 960 di informatica, 840 di ingegneria e 600 di matematica.

Con quelli, ha un campione casuale stratificato proporzionato di studenti universitari, che fornisce una migliore rappresentazione delle major degli studenti negli Stati Uniti. I ricercatori possono quindi evidenziare uno strato specifico, osservare i vari studi degli studenti universitari statunitensi e osservare le varie medie dei voti.

Campioni casuali semplici e casuali stratificati

Campioni casuali semplici  e campioni casuali stratificati sono entrambi strumenti di misurazione statistica. Un semplice campione casuale viene utilizzato per rappresentare l’intera popolazione di dati. Un campione casuale stratificato divide la popolazione in gruppi più piccoli, o strati, in base a caratteristiche condivise.

Il campione casuale semplice viene spesso utilizzato quando sono disponibili pochissime informazioni sulla popolazione di dati, quando la popolazione di dati presenta troppe differenze da dividere in vari sottoinsiemi o quando esiste una sola caratteristica distinta tra la popolazione di dati.

Ad esempio, un’azienda di caramelle potrebbe voler studiare le abitudini di acquisto dei suoi clienti per determinare il futuro della sua linea di prodotti. Se ci sono 10.000 clienti, è possibile utilizzare scegli 100 di quei clienti come campione casuale. Può quindi applicare ciò che trova da quei 100 clienti al resto della sua base. A differenza della stratificazione, campionerà 100 membri in modo puramente casuale senza alcun riguardo per le loro caratteristiche individuali.

Stratificazione proporzionata e sproporzionata

Il campionamento casuale stratificato garantisce che ogni sottogruppo di una data popolazione sia adeguatamente rappresentato all’interno dell’intera popolazione campione di uno studio di ricerca. La stratificazione può essere proporzionata o sproporzionata. In un metodo stratificato proporzionato, la dimensione del campione di ogni strato è proporzionale alla dimensione della popolazione dello strato.

Ad esempio, se il ricercatore desidera un campione di 50.000 laureati utilizzando la fascia di età, il campione casuale stratificato proporzionato sarà ottenuto utilizzando questa formula: (dimensione del campione / dimensione della popolazione) x dimensione dello strato. La tabella seguente presuppone una dimensione della popolazione di 180.000 laureati MBA all’anno.

La dimensione del campione degli strati per i laureati MBA nella fascia di età compresa tra 24 e 28 anni è calcolata come (50.000 / 180.000) x 90.000 = 25.000. Lo stesso metodo viene utilizzato per le altre fasce d’età. Ora che la dimensione del campione degli strati è nota, il ricercatore può eseguire un semplice campionamento casuale in ogni strato per selezionare i partecipanti al sondaggio. In altre parole, 25.000 laureati della fascia di età 24-28 saranno selezionati in modo casuale da tutta la popolazione, 16.667 laureati della fascia di età 29-33 saranno selezionati in modo casuale dalla popolazione, e così via.

In un campione stratificato sproporzionato, la dimensione di ogni strato non è proporzionale alla sua dimensione nella popolazione. Il ricercatore può decidere di campionare 1/2 dei laureati nella fascia 34-37 anni e 1/3 dei laureati nella fascia 29-33 anni.

È importante notare che una persona non può adattarsi a più strati. Ogni entità deve stare solo in uno strato. Avere sottogruppi sovrapposti significa che alcuni individui avranno maggiori possibilità di essere selezionati per l’indagine, il che nega completamente il concetto di campionamento stratificato come tipo di campionamento probabilistico.



I gestori di portafoglio possono utilizzare il campionamento casuale stratificato per creare portafogli replicando un indice come un indice obbligazionario.

Vantaggi del campionamento casuale stratificato

Il vantaggio principale del campionamento casuale stratificato è che acquisisce le caratteristiche chiave della popolazione nel campione. Simile a una media ponderata, questo metodo di campionamento produce caratteristiche nel campione proporzionali alla popolazione complessiva. Il campionamento casuale stratificato funziona bene per le popolazioni con una varietà di attributi, ma è altrimenti inefficace se non è possibile formare sottogruppi.

La stratificazione fornisce un errore minore nella stima e una maggiore precisione rispetto al semplice metodo di campionamento casuale. Maggiore è la differenza tra gli strati, maggiore è il guadagno di precisione.

Svantaggi del campionamento casuale stratificato

Sfortunatamente, questo metodo di ricerca non può essere utilizzato in tutti gli studi. Lo svantaggio del metodo è che devono essere soddisfatte diverse condizioni affinché possa essere utilizzato correttamente. I ricercatori devono identificare ogni membro di una popolazione studiata e classificarli in una, e solo una, sottopopolazione. Di conseguenza, il campionamento casuale stratificato è svantaggioso quando i ricercatori non possono classificare con sicurezza ogni membro della popolazione in un sottogruppo. Inoltre, trovare un elenco esaustivo e definitivo di un’intera  popolazione  può essere difficile.

La sovrapposizione può essere un problema se ci sono soggetti che rientrano in più sottogruppi. Quando viene eseguito un semplice campionamento casuale, è più probabile che vengano scelti coloro che si trovano in più sottogruppi. Il risultato potrebbe essere una falsa dichiarazione o un riflesso impreciso della popolazione.

Gli esempi precedenti lo rendono facile: studenti universitari, laureati, maschi e femmine sono gruppi chiaramente definiti. In altre situazioni, tuttavia, potrebbe essere molto più difficile. Immagina di incorporare caratteristiche come razza, etnia o religione. Il processo di ordinamento diventa più difficile, rendendo il campionamento casuale stratificato un metodo inefficace e tutt’altro che ideale.