Errore di non campionamento
Che cos’è un errore non di campionamento?
Un errore di non campionamento è un termine statistico che si riferisce a un errore che si verifica durante la raccolta dei dati, facendo sì che i dati differiscano dai valori reali. Un errore di non campionamento è diverso da un errore di campionamento. Un errore di campionamento è limitato a qualsiasi differenza tra i valori del campione e i valori dell’universo che si verificano perché la dimensione del campione era limitata. (L’intero universo non può essere campionato in un sondaggio o in un censimento.)
Punti chiave
- Un errore di non campionamento è un termine utilizzato nelle statistiche che si riferisce a un errore che si verifica durante la raccolta dei dati, facendo sì che i dati differiscano dai valori reali.
- Un errore di non campionamento si riferisce a errori casuali o sistematici e questi errori possono essere difficili da individuare in un’indagine, un campione o un censimento.
- Gli errori sistematici di non campionamento sono peggiori degli errori casuali di non campionamento perché gli errori sistematici possono comportare la necessità di eliminare lo studio, il sondaggio o il censimento.
- Maggiore è il numero di errori, meno affidabili sono le informazioni.
- Quando si verificano errori di non campionamento, il tasso di bias in uno studio o in un’indagine aumenta.
Può verificarsi un errore di campionamento anche se non vengono commessi errori di alcun tipo. Gli “errori” derivano dal semplice fatto che è improbabile che i dati in un campione corrispondano perfettamente ai dati dell’universo da cui viene prelevato il campione. Questo “errore” può essere ridotto al minimo aumentando la dimensione del campione.
Gli errori di non campionamento coprono tutte le altre discrepanze, comprese quelle che derivano da una cattiva tecnica di campionamento.
Come funziona un errore non di campionamento
Errori non campionari possono essere presenti sia nei campioni che nei censimenti in cui viene rilevata un’intera popolazione. Gli errori non campionari rientrano in due categorie: casuali e sistematici.
Si ritiene che gli errori casuali si compensino a vicenda e quindi, molto spesso, sono di scarsa importanza. Gli errori sistematici, invece, interessano l’intero campione e quindi presentano un problema più significativo. Errori casuali, in genere, non comporteranno la rottamazione di un campione o di un censimento, mentre un errore sistematico molto probabilmente renderà inutilizzabili i dati raccolti.
Gli errori di non campionamento sono causati da fattori esterni piuttosto che da un problema all’interno di un’indagine, uno studio o un censimento.
Esistono molti modi in cui possono verificarsi errori di non campionamento. Ad esempio, gli errori di non campionamento possono includere, ma non sono limitati a, errori di immissione dei dati, domande di sondaggio distorte, elaborazione / processo decisionale distorti, mancate risposte, conclusioni di analisi inappropriate e false informazioni fornite dai rispondenti.
considerazioni speciali
Sebbene l’aumento della dimensione del campione possa aiutare a ridurre al minimo gli errori di campionamento, non avrà alcun effetto sulla riduzione degli errori di non campionamento. Questo perché gli errori di non campionamento sono spesso difficili da rilevare ed è praticamente impossibile eliminarli.
Gli errori di non campionamento includono errori di mancata risposta, errori di copertura, errori di intervista ed errori di elaborazione. Si verificherebbe un errore di copertura, ad esempio, se una persona fosse contata due volte in un sondaggio o le sue risposte fossero duplicate nel sondaggio. Se un intervistatore è distorto nel campionamento, l’errore di non campionamento sarebbe considerato un errore dell’intervistatore.
Inoltre, è difficile dimostrare che gli intervistati in un sondaggio forniscono informazioni false, per errore o di proposito. In ogni caso, la disinformazione fornita dagli intervistati conta come errori non campionari e sono descritti come errori di risposta.
Esistono errori tecnici in una categoria diversa. Se sono presenti voci relative ai dati, come codifica, raccolta, immissione o modifica, vengono considerate errori di elaborazione.