4 Maggio 2021 1:25

T-Test

Cos’è un T-Test?

Un t-test è un tipo di statistica inferenziale utilizzata per determinare se esiste una differenza significativa tra le medie di due gruppi, che può essere correlata in determinate caratteristiche. Viene utilizzato principalmente quando i set di dati, come il set di dati registrato come risultato del lancio di una moneta 100 volte, seguirebbero una distribuzione normale e potrebbero avere varianze sconosciute. A t-test viene utilizzato come uno strumento di test di ipotesi, che consente di testare un’ipotesi applicabile ad una popolazione.

Un test t esamina la statistica t, i valori di distribuzione t ei gradi di libertà per determinare la significatività statistica. Per condurre un test con tre o più mezzi, è necessario utilizzare  un’analisi della varianza.

Punti chiave

  • Un t-test è un tipo di statistica inferenziale utilizzata per determinare se esiste una differenza significativa tra le medie di due gruppi, che può essere correlata in determinate caratteristiche.
  • Il t-test è uno dei tanti test utilizzati ai fini del test di ipotesi in statistica.
  • Il calcolo di un test t richiede tre valori di dati chiave. Includono la differenza tra i valori medi di ciascun set di dati (chiamata differenza media), la deviazione standard di ciascun gruppo e il numero di valori dei dati di ciascun gruppo.
  • Esistono diversi tipi di test t che possono essere eseguiti a seconda dei dati e del tipo di analisi richiesti.

Spiegazione del T-Test

In sostanza, un test t ci consente di confrontare i valori medi dei due set di dati e determinare se provengono dalla stessa popolazione. Negli esempi precedenti, se prendessimo un campione di studenti della classe A e un altro campione di studenti della classe B, non ci aspetteremmo che abbiano esattamente la stessa media e deviazione standard. Allo stesso modo, i campioni prelevati dal gruppo di controllo nutrito con placebo e quelli prelevati dal gruppo prescritto dal farmaco dovrebbero avere una media e una deviazione standard leggermente diverse.

Matematicamente, il test t prende un campione da ciascuno dei due insiemi e stabilisce l’enunciato del problema assumendo un’ipotesi nulla che le due medie siano uguali. Sulla base delle formule applicabili, determinati valori vengono calcolati e confrontati con i valori standard e l’ipotesi nulla presunta viene accettata o rifiutata di conseguenza.

Se l’ipotesi nulla si qualifica per essere rifiutata, indica che le letture dei dati sono forti e probabilmente non sono dovute al caso. Il test t è solo uno dei tanti test utilizzati a questo scopo. Gli statistici devono inoltre utilizzare test diversi dal test t per esaminare più variabili e test con campioni di dimensioni maggiori. Per un campione di grandi dimensioni, gli statistici utilizzano uno  z-test. Altre opzioni di test includono il test chi-quadrato e il test f.

Esistono tre tipi di test t e sono classificati come test t dipendenti e indipendenti.

Risultati del test ambigui

Considera che un produttore di farmaci vuole testare un medicinale di nuova invenzione. Segue la procedura standard di provare il farmaco su un gruppo di pazienti e somministrare un placebo a un altro gruppo, chiamato gruppo di controllo. Il placebo somministrato al gruppo di controllo è una sostanza senza valore terapeutico previsto e serve come parametro di riferimento per misurare il modo in cui l’altro gruppo, a cui viene somministrato il farmaco effettivo, risponde.

Dopo la sperimentazione del farmaco, i membri del gruppo di controllo nutrito con placebo hanno riportato un aumento dell’aspettativa di vita media di tre anni, mentre i membri del gruppo a cui è stato prescritto il nuovo farmaco segnalano un aumento dell’aspettativa di vita media di quattro anni. L’osservazione immediata può indicare che il farmaco sta effettivamente funzionando poiché i risultati sono migliori per il gruppo che lo utilizza. Tuttavia, è anche possibile che l’osservazione sia dovuta a un evento casuale, soprattutto a un sorprendente colpo di fortuna. Un test t è utile per concludere se i risultati sono effettivamente corretti e applicabili all’intera popolazione.

In una scuola, 100 studenti della classe A hanno ottenuto una media dell’85% con una deviazione standard del 3%. Altri 100 studenti appartenenti alla classe B hanno ottenuto una media dell’87% con una deviazione standard del 4%. Sebbene la media della classe B sia migliore di quella della classe A, potrebbe non essere corretto saltare alla conclusione che il rendimento complessivo degli studenti della classe B è migliore di quello degli studenti della classe A. Questo perché esiste una variabilità naturale nei punteggi dei test in entrambe le classi, quindi la differenza potrebbe essere dovuta al solo caso. Un test t può aiutare a determinare se una classe è andata meglio dell’altra.

Presupposti del T-Test

  1. La prima ipotesi fatta riguardo ai test t riguarda la scala di misura. Il presupposto per un test t è che la scala di misurazione applicata ai dati raccolti segua una scala continua o ordinale, come i punteggi per un test QI.
  2. La seconda ipotesi fatta è quella di un semplice campione casuale, che i dati siano raccolti da una porzione rappresentativa e selezionata casualmente della popolazione totale.
  3. La terza ipotesi è che i dati, quando tracciati, si traducano in una distribuzione normale, curva di distribuzione a campana.
  4. L’assunto finale è l’omogeneità della varianza. La varianza omogenea o uguale esiste quando le deviazioni standard dei campioni sono approssimativamente uguali.

Calcolo dei test T

Il calcolo di un test t richiede tre valori di dati chiave. Includono la differenza tra i valori medi di ciascun set di dati (chiamata differenza media), la deviazione standard di ciascun gruppo e il numero di valori dei dati di ciascun gruppo.

Il risultato del test t produce il valore t. Questo valore t calcolato viene quindi confrontato con un valore ottenuto da una tabella dei valori critici (chiamata tabella di distribuzione T ). Questo confronto aiuta a determinare l’effetto del solo caso sulla differenza e se la differenza è al di fuori di tale intervallo di possibilità. Il test t si chiede se la differenza tra i gruppi rappresenti una vera differenza nello studio o se sia forse una differenza casuale priva di significato.

Tabelle di distribuzione a T.

La tabella di distribuzione a T è disponibile nei formati a una coda e due code. Il primo viene utilizzato per valutare i casi che hanno un valore o intervallo fisso con una direzione chiara (positiva o negativa). Ad esempio, qual è la probabilità che il valore di output rimanga al di sotto di -3 o che ne ottenga più di sette quando si lancia una coppia di dadi? Quest’ultimo viene utilizzato per l’analisi del limite di intervallo, ad esempio per chiedere se le coordinate sono comprese tra -2 e +2.

I calcoli possono essere eseguiti con programmi software standard che supportano le funzioni statistiche necessarie, come quelle presenti in MS Excel.

Valori T e gradi di libertà

Il test t produce due valori come output: valore t e gradi di libertà. Il valore t è un rapporto tra la differenza tra la media dei due insiemi campionari e la variazione che esiste all’interno degli insiemi campionari. Mentre il valore del numeratore (la differenza tra la media dei due set di campioni) è semplice da calcolare, il denominatore (la variazione che esiste all’interno dei set di campioni) può diventare un po ‘complicato a seconda del tipo di valori dei dati coinvolti. Il denominatore del rapporto è una misura della dispersione o variabilità. Valori più alti del valore t, chiamato anche punteggio t, indicano che esiste una grande differenza tra i due set di campioni. Più piccolo è il valore t, maggiore è la somiglianza tra i due set di campioni.

  • Un punteggio t elevato indica che i gruppi sono diversi.
  • Un piccolo punteggio t indica che i gruppi sono simili.

I gradi di libertà si riferiscono ai valori in uno studio che ha la libertà di variare e sono essenziali per valutare l’importanza e la validità dell’ipotesi nulla. Il calcolo di questi valori dipende solitamente dal numero di record di dati disponibili nel campione.

T-Test correlato (o accoppiato)

Il test t correlato viene eseguito quando i campioni sono tipicamente costituiti da coppie abbinate di unità simili o quando ci sono casi di misurazioni ripetute. Ad esempio, potrebbero esserci casi in cui gli stessi pazienti vengono sottoposti ripetutamente a test, prima e dopo aver ricevuto un particolare trattamento. In questi casi, ogni paziente viene utilizzato come campione di controllo contro se stesso.

Questo metodo si applica anche ai casi in cui i campioni sono correlati in qualche modo o hanno caratteristiche corrispondenti, come un’analisi comparativa che coinvolge bambini, genitori o fratelli. I test t correlati o accoppiati sono di tipo dipendente, poiché riguardano casi in cui i due set di campioni sono correlati.

La formula per calcolare il valore t ei gradi di libertà per un test t accoppiato è:

I restanti due tipi appartengono ai test t indipendenti. I campioni di questi tipi vengono selezionati indipendentemente l’uno dall’altro, ovvero i set di dati nei due gruppi non fanno riferimento agli stessi valori. Includono casi come un gruppo di 100 pazienti suddiviso in due serie di 50 pazienti ciascuna. Uno dei gruppi diventa il gruppo di controllo e riceve un placebo, mentre l’altro gruppo riceve il trattamento prescritto. Ciò costituisce due gruppi campione indipendenti che non sono accoppiati tra loro.

T-Test della varianza uguale (o aggregato)

Il test t di varianza uguale viene utilizzato quando il numero di campioni in ciascun gruppo è lo stesso o la varianza dei due set di dati è simile. La seguente formula viene utilizzata per calcolare il valore t ei gradi di libertà per il test t di varianza uguale:

T-value=meunn1-meunn2(n1-1)