Definizione di distribuzione T
Cos’è una distribuzione T?
La distribuzione T, nota anche come distribuzione t di Student, è un tipo di distribuzione di probabilità simile alla distribuzione normale con la sua forma a campana ma ha code più pesanti. Le distribuzioni T hanno maggiori possibilità di valori estremi rispetto alle distribuzioni normali, quindi le code più grasse.
Punti chiave
- La distribuzione T è una distribuzione di probabilità continua dello z-score quando la deviazione standard stimata viene utilizzata nel denominatore anziché la deviazione standard reale.
- La distribuzione T, come la distribuzione normale, è a campana e simmetrica, ma ha code più pesanti, il che significa che tende a produrre valori che cadono lontano dalla sua media.
- I test T vengono utilizzati nelle statistiche per stimare la significatività.
Cosa ti dice una distribuzione T?
La pesantezza della coda è determinata da un parametro della distribuzione T chiamato gradi di libertà, con valori più piccoli che danno code più pesanti e con valori più alti che fanno somigliare la distribuzione T a una distribuzione normale standard con una media di 0 e una deviazione standard di 1. Il La distribuzione T è anche nota come “distribuzione T di Student”.
Quando un campione di n osservazioni viene prelevato da una popolazione normalmente distribuita avente media M e deviazione standard D, la media campionaria, m, e la deviazione standard campionaria, d, differiranno da M e D a causa della casualità del campione.
Uno z-score può essere calcolato con la deviazione standard della popolazione come Z = (x – M) / D, e questo valore ha la distribuzione normale con media 0 e deviazione standard 1. Ma quando si usa la deviazione standard stimata, un t-score è calcolato come T = (m – M) / {d / sqrt (n)}, la differenza tra d e D rende la distribuzione una distribuzione T con (n – 1) gradi di libertà piuttosto che la distribuzione normale con media 0 e deviazione standard 1.
Esempio di come utilizzare una distribuzione a T.
Prendiamo il seguente esempio per come vengono utilizzate le distribuzioni t nell’analisi statistica. Innanzitutto, ricorda che un intervallo di confidenza per la media è un intervallo di valori, calcolato dai dati, inteso a catturare una media di “popolazione”. Questo intervallo è m + – t * d / sqrt (n), dove t è un valore critico della distribuzione T.
Ad esempio, un intervallo di confidenza del 95% per il rendimento medio del Dow Jones Industrial Average nei 27 giorni di negoziazione precedenti l’11 settembre 2001 è -0,33%, (+/- 2,055) * 1,07 / sqrt (27), dando un rendimento medio (persistente) come un numero compreso tra -0,75% e + 0,09%. Il numero 2.055, la quantità di errori standard da correggere, si trova dalla distribuzione T.
Poiché la distribuzione T ha code più grasse rispetto a una distribuzione normale, può essere utilizzata come modello per i rendimenti finanziari che mostrano una curtosi in eccesso, il che consentirà un calcolo più realistico del Value at Risk ( VaR ) in questi casi.
La differenza tra una distribuzione T e una distribuzione normale
Le distribuzioni normali vengono utilizzate quando si presume che la distribuzione della popolazione sia normale. La distribuzione T è simile alla distribuzione normale, solo con code più grasse. Entrambi assumono una popolazione normalmente distribuita. Le distribuzioni T hanno una curtosi maggiore rispetto alle distribuzioni normali. La probabilità di ottenere valori molto lontani dalla media è maggiore con una distribuzione T rispetto a una distribuzione normale.
Limitazioni dell’utilizzo di una distribuzione T.
La distribuzione T può distorcere l’esattezza rispetto alla distribuzione normale. Il suo difetto sorge solo quando c’è bisogno di una perfetta normalità. Tuttavia, la differenza tra l’utilizzo di una distribuzione normale e T è relativamente piccola.