Valore P
Che cos’è il valore P?
In statistica, il valore p è la probabilità di ottenere risultati estremi almeno quanto i risultati osservati di un test di ipotesi statistica , assumendo che l’ipotesi nulla sia corretta. Il valore p viene utilizzato come alternativa ai punti di rifiuto per fornire il livello di significatività minimo al quale l’ ipotesi nulla sarebbe rifiutata. Un valore p più piccolo significa che ci sono prove più forti a favore dell’ipotesi alternativa.
Punti chiave
- Un valore p è una misura della probabilità che una differenza osservata possa essersi verificata solo per caso.
- Più basso è il valore p, maggiore è la significatività statistica della differenza osservata.
- Il valore P può essere utilizzato in alternativa o in aggiunta ai livelli di confidenza preselezionati per la verifica delle ipotesi.
Come viene calcolato il valore P?
I valori di p si trovano solitamente utilizzando tabelle di valori p o fogli di calcolo / software statistico. Questi calcoli si basano sulla distribuzione di probabilità presunta o nota della statistica specifica da testare. I valori P sono calcolati dalla deviazione tra il valore osservato e un valore di riferimento scelto, data la distribuzione di probabilità della statistica, con una differenza maggiore tra i due valori corrispondente a un valore p inferiore.
Matematicamente, il valore p viene calcolato utilizzando il calcolo integrale dall’area sotto la curva di distribuzione di probabilità per tutti i valori delle statistiche che sono almeno tanto lontani dal valore di riferimento quanto lo è il valore osservato, rispetto all’area totale sotto la curva di distribuzione di probabilità. In poche parole, maggiore è la differenza tra due valori osservati, minore è la probabilità che la differenza sia dovuta a una semplice casualità, e ciò si riflette in un valore p inferiore.
Approccio del valore P alla verifica delle ipotesi
L’approccio del valore p alla verifica delle ipotesi utilizza la probabilità calcolata per determinare se esistono prove per rifiutare l’ipotesi nulla. L’ipotesi nulla, nota anche come congettura, è l’affermazione iniziale su una popolazione (o processo di generazione dei dati). L’ipotesi alternativa afferma se il parametro della popolazione differisce dal valore del parametro della popolazione dichiarato nella congettura.
In pratica, il livello di significatività viene stabilito in anticipo per determinare quanto piccolo deve essere il valore p per rifiutare l’ipotesi nulla. Poiché diversi ricercatori utilizzano diversi livelli di significatività quando esaminano una domanda, un lettore a volte può avere difficoltà a confrontare i risultati di due diversi test. I valori P forniscono una soluzione a questo problema.
Ad esempio, si supponga che uno studio che confronta i rendimenti di due risorse particolari sia stato intrapreso da ricercatori diversi che hanno utilizzato gli stessi dati ma livelli di significatività diversi. I ricercatori potrebbero giungere a conclusioni opposte riguardo alla differenza tra le risorse. Se un ricercatore utilizzava un livello di confidenza del 90% e l’altro richiedeva un livello di confidenza del 95% per rifiutare l’ipotesi nulla e il valore p della differenza osservata tra i due rendimenti era 0,08 (corrispondente a un livello di confidenza del 92%), quindi il primo ricercatore scoprirà che i due asset hanno una differenza statisticamente significativa, mentre il secondo non troverebbe alcuna differenza statisticamente significativa tra i rendimenti.
Per evitare questo problema, i ricercatori potrebbero riportare il valore p del test di ipotesi e consentire al lettore di interpretare da sé la significatività statistica. Questo è chiamato approccio del valore p al test di ipotesi. Un osservatore indipendente potrebbe notare il valore p e decidere autonomamente se questo rappresenta una differenza statisticamente significativa o meno.
Esempio del mondo reale di P-Value
Si supponga che un investitore dichiari che la performance del proprio portafoglio di investimenti è equivalente a quella dell’Indice Standard & Poor’s (S&P) 500. Per determinarlo, l’investitore esegue un test a due code. L’ipotesi nulla afferma che i rendimenti del portafoglio sono equivalenti ai rendimenti dell’S & P 500 in un periodo specificato, mentre l’ipotesi alternativa afferma che i rendimenti del portafoglio e quelli dell’S & P 500 non sono equivalenti. (Se l’investitore eseguisse un test a una coda, l’ipotesi alternativa affermerebbe che i rendimenti del portafoglio sono inferiori o superiori ai rendimenti dell’S & P 500.)
Il test di ipotesi del valore P non fa necessariamente uso di un livello di confidenza preselezionato al quale l’investitore dovrebbe reimpostare l’ipotesi nulla che i rendimenti siano equivalenti. Invece, fornisce una misura di quante prove ci sono per rifiutare l’ipotesi nulla. Minore è il valore p, maggiore è l’evidenza contro l’ipotesi nulla. Pertanto, se l’investitore rileva che il valore p è 0,001, vi sono prove evidenti contro l’ipotesi nulla e l’investitore può concludere con sicurezza che i rendimenti del portafoglio e quelli dell’S & P 500 non sono equivalenti.
Sebbene ciò non fornisca una soglia esatta su quando l’investitore dovrebbe accettare o rifiutare l’ipotesi nulla, ha un altro vantaggio molto pratico. Il test di ipotesi del valore P offre un modo diretto per confrontare la fiducia relativa che l’investitore può avere quando sceglie tra più tipi diversi di investimenti o portafogli, rispetto a un benchmark come l’S & P 500.
Ad esempio, per due portafogli, A e B, la cui performance differisce dall’S & P 500 con valori p rispettivamente di 0,10 e 0,01, l’investitore può essere molto più fiducioso che il portafoglio B, con un valore p inferiore, sarà effettivamente costantemente diverso risultati.