Statistiche non parametriche
Cosa sono le statistiche non parametriche?
La statistica non parametrica si riferisce a un metodo statistico in cui non si presume che i dati provengano da modelli prescritti determinati da un piccolo numero di parametri; esempi di tali modelli includono il modello di distribuzione normale e il modello di regressione lineare. Le statistiche non parametriche a volte utilizzano dati ordinali, il che significa che non si basano su numeri, ma piuttosto su una classifica o un ordine di sorta. Ad esempio, un sondaggio che trasmette le preferenze dei consumatori che vanno dal mi piace al non mi piace sarebbe considerato dati ordinali.
Le statistiche non parametriche includono statistiche descrittive non parametriche, modelli statistici, inferenza e test statistici. La struttura del modello dei modelli non parametrici non è specificata a priori ma è invece determinata dai dati. Il termine non parametrico non intende implicare che tali modelli siano completamente privi di parametri, ma piuttosto che il numero e la natura dei parametri sono flessibili e non fissati in anticipo. Un istogramma è un esempio di stima non parametrica di una distribuzione di probabilità.
Punti chiave
- Le statistiche non parametriche sono facili da usare ma non offrono la precisione millimetrica di altri modelli statistici.
- Questo tipo di analisi è spesso più adatto quando si considera l’ordine di qualcosa, dove anche se i dati numerici cambiano, i risultati rimarranno probabilmente gli stessi.
Comprensione delle statistiche non parametriche
Nella statistica, la statistica parametrica include parametri come la media, la deviazione standard, la correlazione di Pearson, la varianza, ecc. Questa forma di statistica utilizza i dati osservati per stimare i parametri della distribuzione. Nelle statistiche parametriche, i dati sono spesso considerati come provenienti da una distribuzione normale con parametri sconosciuti μ (media della popolazione) e σ2 (varianza della popolazione), che vengono quindi stimati utilizzando la media e la varianza del campione.
Le statistiche non parametriche non fanno supposizioni sulla dimensione del campione o se i dati osservati sono quantitativi.
Le statistiche non parametriche non presumono che i dati siano tratti da una distribuzione normale. Invece, la forma della distribuzione è stimata sotto questa forma di misurazione statistica. Mentre ci sono molte situazioni in cui si può presumere una distribuzione normale, ci sono anche alcuni scenari in cui il vero processo di generazione dei dati è ben lungi dall’essere distribuito normalmente.
Esempi di statistiche non parametriche
Nel primo esempio, si consideri un analista finanziario che desidera stimare il valore a rischio (VaR) di un investimento. L’analista raccoglie i dati sugli utili da centinaia di investimenti simili su un orizzonte temporale simile. Piuttosto che presumere che i guadagni seguano una distribuzione normale, utilizza l’istogramma per stimare la distribuzione in modo non parametrico. Il 5 ° percentile di questo istogramma fornisce quindi all’analista una stima non parametrica del VaR.
Per un secondo esempio, si consideri un ricercatore diverso che vuole sapere se le ore medie di sonno sono legate alla frequenza con cui ci si ammala. Poiché molte persone si ammalano raramente, se non del tutto, e altre occasionalmente si ammalano molto più spesso della maggior parte degli altri, la distribuzione della frequenza della malattia è chiaramente non normale, essendo distorta a destra e incline ai valori anomali. Pertanto, piuttosto che utilizzare un metodo che presuppone una distribuzione normale per la frequenza della malattia, come avviene ad esempio nell’analisi di regressione classica, il ricercatore decide di utilizzare un metodo non parametrico come l’analisi di regressione quantile.
considerazioni speciali
Le statistiche non parametriche hanno guadagnato apprezzamento grazie alla loro facilità d’uso. Quando la necessità di parametri viene eliminata, i dati diventano più applicabili a una più ampia varietà di test. Questo tipo di statistica può essere utilizzato senza la media, la dimensione del campione, la deviazione standard o la stima di altri parametri correlati quando nessuna di tali informazioni è disponibile.
Poiché la statistica non parametrica fa meno ipotesi sui dati di esempio, la sua applicazione ha un ambito più ampio rispetto alle statistiche parametriche. Nei casi in cui il test parametrico è più appropriato, i metodi non parametrici saranno meno efficienti. Questo perché le statistiche non parametriche scartano alcune informazioni disponibili nei dati, a differenza delle statistiche parametriche.