Gradi di libertà
Cosa sono i gradi di libertà?
Gradi di libertà si riferisce al numero massimo di valori logicamente indipendenti, che sono valori che hanno la libertà di variare, nel campione di dati.
Punti chiave
- Gradi di libertà si riferisce al numero massimo di valori logicamente indipendenti, che sono valori che hanno la libertà di variare, nel campione di dati.
- I gradi di libertà sono comunemente discussi in relazione a varie forme di verifica delle ipotesi in statistica, come il Chi-quadrato.
- Il calcolo dei gradi di libertà è fondamentale quando si cerca di comprendere l’importanza di una statistica chi-quadrato e la validità dell’ipotesi nulla.
Comprensione dei gradi di libertà
Il modo più semplice per comprendere concettualmente i gradi di libertà è attraverso un esempio:
- Si consideri un campione di dati costituito, per semplicità, da cinque numeri interi positivi. I valori potrebbero essere qualsiasi numero senza alcuna relazione nota tra di loro. Questo campione di dati avrebbe, in teoria, cinque gradi di libertà.
- Quattro dei numeri nel campione sono {3, 8, 5 e 4} e la media dell’intero campione di dati risulta essere 6.
- Questo deve significare che il quinto numero deve essere 10. Non può essere nient’altro. Non ha la libertà di variare.
- Quindi i gradi di libertà per questo campione di dati sono 4.
La formula per i gradi di libertà è uguale alla dimensione del campione di dati meno uno:
I gradi di libertà sono comunemente discussi in relazione a varie forme di verifica delle ipotesi in statistica, come il Chi-quadrato. È essenziale calcolare i gradi di libertà quando si cerca di comprendere l’importanza di una statistica chi-quadrato e la validità dell’ipotesi nulla.
Test chi quadrato
Esistono due diversi tipi di test Chi-quadrato : il test di indipendenza, che pone una questione di relazione, come “Esiste una relazione tra sesso e punteggi SAT?”; e il test di bontà di adattamento, che chiede qualcosa come “Se una moneta viene lanciata 100 volte, uscirà testa 50 volte e croce 50 volte?”
Per questi test, i gradi di libertà vengono utilizzati per determinare se una certa ipotesi nulla può essere rifiutata in base al numero totale di variabili e campioni all’interno dell’esperimento. Ad esempio, quando si considerano gli studenti e la scelta del corso, una dimensione del campione di 30 o 40 studenti probabilmente non è abbastanza grande da generare dati significativi. Ottenere risultati uguali o simili da uno studio utilizzando una dimensione del campione di 400 o 500 studenti è più valido.
Storia dei gradi di libertà
Il concetto più antico e basilare di Gradi di libertà fu notato all’inizio del 1800, intrecciato nelle opere del matematico e astronomo Carl Friedrich Gauss. L’uso moderno e la comprensione del termine sono stati esposti per la prima volta da William Sealy Gosset, uno statistico inglese, nel suo articolo “The Probable Error of a Mean”, pubblicato su Biometrika nel 1908 con uno pseudonimo per preservare il suo anonimato.
Nei suoi scritti, Gosset non ha usato specificamente il termine “Gradi di libertà”. Tuttavia, ha fornito una spiegazione per il concetto nel corso dello sviluppo di quella che alla fine sarebbe stata conosciuta come distribuzione T di Student. Il termine effettivo non fu reso popolare fino al 1922. Il biologo e statistico inglese Ronald Fisher iniziò a usare il termine “Gradi di libertà” quando iniziò a pubblicare rapporti e dati sul suo lavoro di sviluppo del chi-quadrato.