3 Maggio 2021 13:58

Intervallo di fiducia

Cos’è l’intervallo di fiducia?

Un intervallo di confidenza, nelle statistiche, si riferisce alla probabilità che un parametro della popolazione cada tra un insieme di valori per una certa proporzione di volte.

Punti chiave

  • Un intervallo di confidenza mostra la probabilità che un parametro cada tra una coppia di valori attorno alla media.
  • Gli intervalli di confidenza misurano il grado di incertezza o certezza in un metodo di campionamento.
  • Sono spesso costruiti utilizzando livelli di confidenza del 95% o del 99%.

Comprensione dell’intervallo di fiducia

Gli intervalli di confidenza misurano il grado di incertezza o certezza in un metodo di campionamento. Possono accettare qualsiasi numero di limiti di probabilità, il più comune è un livello di confidenza del 95% o del 99%. Gli intervalli di confidenza vengono condotti utilizzando metodi statistici, come un  t-test.

Gli statistici utilizzano intervalli di confidenza per misurare l’incertezza in una variabile campione. Ad esempio, un ricercatore seleziona casualmente diversi campioni dalla stessa popolazione e calcola un intervallo di confidenza per ogni campione per vedere come può rappresentare il valore reale della variabile della popolazione. I set di dati risultanti sono tutti diversi; alcuni intervalli includono il vero parametro della popolazione e altri no.

Un intervallo di confidenza è un intervallo di valori, delimitato al di sopra e al di sotto della media della statistica, che probabilmente conterrebbe un parametro di popolazione sconosciuto. Il livello di fiducia si riferisce alla percentuale di probabilità, o certezza, che l’intervallo di confidenza conterrebbe il parametro della popolazione reale quando si estrae un campione casuale molte volte. Oppure, in volgare, “siamo sicuri al 99% ( livello di confidenza) che la maggior parte di questi campioni (intervalli di confidenza) contengono il vero parametro della popolazione”.

Il più grande malinteso riguardo agli intervalli di confidenza è che rappresentano la percentuale di dati di un dato campione che rientra tra i limiti superiore e inferiore. Ad esempio, si potrebbe interpretare erroneamente il suddetto intervallo di confidenza del 99% da 70 a 78 pollici come indicante che il 99% dei dati in un campione casuale rientra tra questi numeri. Ciò non è corretto, sebbene esista un metodo separato di analisi statistica per effettuare tale determinazione. Ciò comporta l’identificazione della media e della deviazione standard del campione e il tracciamento di queste cifre su una curva a campana.



L’ intervallo di confidenza e il livello di confidenza sono correlati ma non sono esattamente gli stessi.

Calcolo dell’intervallo di fiducia

Supponiamo che un gruppo di ricercatori stia studiando le altezze dei giocatori di basket delle scuole superiori. I ricercatori prendono un campione casuale dalla popolazione e stabiliscono un’altezza media di 74 pollici.

La media di 74 pollici è una stima puntuale della media della popolazione. Una stima puntuale di per sé è di utilità limitata perché non rivela l’incertezza associata alla stima; non si ha una buona idea di quanto possa essere lontana questa media campionaria di 74 pollici dalla media della popolazione. Quello che manca è il grado di incertezza in questo singolo campione.

Gli intervalli di confidenza forniscono più informazioni rispetto alle stime puntuali. Stabilendo un intervallo di confidenza del 95% utilizzando la media e la deviazione standard del campione e assumendo una distribuzione normale rappresentata dalla curva a campana, i ricercatori arrivano a un limite superiore e inferiore che contiene la media reale per il 95% delle volte.

Supponiamo che l’intervallo sia compreso tra 72 pollici e 76 pollici. Se i ricercatori prendono 100 campioni casuali dalla popolazione di giocatori di basket delle scuole superiori nel suo insieme, la media dovrebbe essere compresa tra 72 e 76 pollici in 95 di quei campioni.

Se i ricercatori desiderano una sicurezza ancora maggiore, possono espandere l’intervallo fino al 99% di confidenza. In questo modo si crea invariabilmente una gamma più ampia, poiché lascia spazio a un numero maggiore di medie di campionamento. Se stabiliscono che l’intervallo di confidenza del 99% è compreso tra 70 pollici e 78 pollici, possono aspettarsi che 99 campioni su 100 valutati contengano un valore medio compreso tra questi numeri.

Un livello di confidenza del 90%, d’altra parte, implica che ci aspetteremmo che il 90% delle stime dell’intervallo includa il parametro della popolazione e così via.

Domande frequenti

Cosa rivela un intervallo di confidenza?

Un intervallo di confidenza è un intervallo di valori, delimitato al di sopra e al di sotto della media della statistica, che probabilmente conterrebbe un parametro di popolazione sconosciuto. Il livello di fiducia si riferisce alla percentuale di probabilità, o certezza, che l’intervallo di confidenza conterrebbe il parametro della popolazione reale quando si estrae un campione casuale molte volte.

Come vengono utilizzati gli intervalli di confidenza?

Gli statistici utilizzano intervalli di confidenza per misurare l’incertezza in una variabile campione. Ad esempio, un ricercatore seleziona diversi campioni in modo casuale dalla stessa popolazione e calcola un intervallo di confidenza per ogni campione per vedere come può rappresentare il vero valore della variabile della popolazione. I set di dati risultanti sono tutti diversi dove alcuni intervalli includono il vero parametro della popolazione e altri no.

Qual è un malinteso comune sugli intervalli di confidenza?

Il più grande malinteso riguardo agli intervalli di confidenza è che rappresentano la percentuale di dati di un dato campione che rientra tra i limiti superiore e inferiore. In altre parole, non sarebbe corretto presumere che un intervallo di confidenza del 99% significhi che il 99% dei dati in un campione casuale rientri tra questi limiti. Ciò che in realtà significa è che si può essere certi al 99% che l’intervallo conterrà la media della popolazione.

Cos’è un test T?

Gli intervalli di confidenza vengono condotti utilizzando metodi statistici, come un t-test. Un t-test è un tipo di statistica inferenziale utilizzata per determinare se esiste una differenza significativa tra le medie di due gruppi, che può essere correlata in determinate caratteristiche. Il calcolo di un test t richiede tre valori di dati chiave. Includono la differenza tra i valori medi di ciascun set di dati (chiamata differenza media), la deviazione standard di ciascun gruppo e il numero di valori dei dati di ciascun gruppo.