3 Maggio 2021 11:20

Analisi della varianza (ANOVA)

Che cos’è l’analisi della varianza (ANOVA)?

L’analisi della varianza (ANOVA) è uno strumento di analisi utilizzato nelle statistiche che divide una variabilità aggregata osservata trovata all’interno di un set di dati in due parti: fattori sistematici e fattori casuali. I fattori sistematici hanno un’influenza statistica sul dato set di dati, mentre i fattori casuali no. Gli analisti utilizzano il test ANOVA per determinare l’influenza che le variabili indipendenti hanno sulla variabile dipendente in uno studio di regressione.

I metodi di test t e z sviluppati nel 20 ° secolo furono usati per l’analisi statistica fino al 1918, quando Ronald Fisher creò il metodo di analisi della varianza.1 ANOVA è anche chiamata analisi della varianza di Fisher ed è l’estensione dei test t e z. Il termine divenne famoso nel 1925, dopo essere apparso nel libro di Fisher, “Statistical Methods for Research Workers”. Venne impiegato in psicologia sperimentale e successivamente espanso ad argomenti più complessi.

La formula per ANOVA è:

Cosa rivela l’analisi della varianza?

Il test ANOVA è il primo passo nell’analisi dei fattori che influenzano un dato set di dati. Una volta terminato il test, un analista esegue ulteriori test sui fattori metodici che contribuiscono misurabilmente all’incoerenza del set di dati. L’analista utilizza i risultati del test ANOVA in un test f per generare dati aggiuntivi che si allineano con i modelli di regressione proposti.

Il test ANOVA consente un confronto di più di due gruppi contemporaneamente per determinare se esiste una relazione tra di loro. Il risultato della formula ANOVA, la statistica F (chiamata anche rapporto F), consente l’analisi di più gruppi di dati per determinare la variabilità tra i campioni e all’interno dei campioni.

Se non esiste alcuna differenza reale tra i gruppi testati, che è chiamata ipotesi nulla, il risultato della statistica del rapporto F dell’ANOVA sarà vicino a 1. La distribuzione di tutti i possibili valori della statistica F è la distribuzione F. Questo è in realtà un gruppo di funzioni di distribuzione, con due numeri caratteristici, chiamati gradi di libertà del numeratore e gradi di libertà del denominatore.

Punti chiave

  • L’analisi della varianza, o ANOVA, è un metodo statistico che separa i dati di varianza osservati in diversi componenti da utilizzare per ulteriori test.
  • Un’ANOVA unidirezionale viene utilizzata per tre o più gruppi di dati, per ottenere informazioni sulla relazione tra le variabili dipendenti e indipendenti.
  • Se non esiste una vera varianza tra i gruppi, il rapporto F dell’ANOVA dovrebbe essere vicino a 1.

Esempio di come utilizzare ANOVA

Un ricercatore potrebbe, ad esempio, testare studenti di più college per vedere se gli studenti di uno dei college superano costantemente gli studenti degli altri college. In un’applicazione aziendale, un ricercatore di ricerca e sviluppo potrebbe testare due diversi processi di creazione di un prodotto per vedere se un processo è migliore dell’altro in termini di efficienza dei costi.

Il tipo di test ANOVA utilizzato dipende da una serie di fattori. Viene applicato quando i dati devono essere sperimentali. L’analisi della varianza viene utilizzata se non è possibile accedere al software statistico con conseguente calcolo manuale dell’ANOVA. È semplice da usare e più adatto per piccoli campioni. Con molti progetti sperimentali, le dimensioni del campione devono essere le stesse per le varie combinazioni a livello di fattore.

ANOVA è utile per testare tre o più variabili. È simile a più test t a due campioni. Tuttavia, si traduce in un minor numero di errori di tipo I ed è appropriato per una serie di problemi. ANOVA raggruppa le differenze confrontando le medie di ciascun gruppo e include la distribuzione della varianza in diverse fonti. Viene utilizzato con soggetti, gruppi di prova, tra gruppi e all’interno di gruppi.

ANOVA unidirezionale contro ANOVA bidirezionale

Esistono due tipi principali di ANOVA: unidirezionale (o unidirezionale) e bidirezionale. Esistono anche variazioni di ANOVA. Ad esempio, MANOVA (ANOVA multivariata) differisce da ANOVA poiché il primo verifica più variabili dipendenti contemporaneamente mentre il secondo valuta solo una variabile dipendente alla volta. Unidirezionale o bidirezionale si riferisce al numero di variabili indipendenti nel test di analisi della varianza. Un’ANOVA unidirezionale valuta l’impatto di un unico fattore su un’unica variabile di risposta. Determina se tutti i campioni sono uguali. L’ANOVA unidirezionale viene utilizzato per determinare se ci sono differenze statisticamente significative tra le medie di tre o più gruppi indipendenti (non correlati).

Un ANOVA a due vie è un’estensione dell’ANOVA a una via. Con un senso unico, hai una variabile indipendente che influisce su una variabile dipendente. Con un ANOVA a due vie, ci sono due indipendenti. Ad esempio, un’ANOVA bidirezionale consente a un’azienda di confrontare la produttività dei lavoratori in base a due variabili indipendenti, come stipendio e set di competenze. Viene utilizzato per osservare l’interazione tra i due fattori e testare l’effetto di due fattori contemporaneamente.