Statistiche descrittive
Cosa sono le statistiche descrittive?
Le statistiche descrittive sono brevi coefficienti descrittivi che riassumono un dato set di dati, che può essere una rappresentazione dell’intero o un campione di una popolazione. Le statistiche descrittive sono suddivise in misure di tendenza centrale e misure di variabilità (spread). Misure di tendenza centrale includono la media, mediana e moda, mentre le misure di variabilità includono curtosi e asimmetria.
Punti chiave
- Le statistiche descrittive riassumono o descrivono le caratteristiche di un set di dati.
- La statistica descrittiva consiste di due categorie fondamentali di misure: misure di tendenza centrale e misure di variabilità (o diffusione).
- Le misure di tendenza centrale descrivono il centro di un insieme di dati.
- Le misure di variabilità o diffusione descrivono la dispersione dei dati all’interno dell’insieme.
Comprensione delle statistiche descrittive
Le statistiche descrittive, in breve, aiutano a descrivere e comprendere le caratteristiche di uno specifico set di dati fornendo brevi riassunti sul campione e misure dei dati. I tipi più riconosciuti di statistica descrittiva sono le misure del centro: la media, la mediana e il modo, che vengono utilizzate a quasi tutti i livelli di matematica e statistica. La media, o media, viene calcolata sommando tutte le cifre all’interno del set di dati e quindi dividendo per il numero di cifre all’interno dell’insieme. Ad esempio, la somma del seguente set di dati è 20: (2, 3, 4, 5, 6). La media è 4 (20/5). La modalità di un set di dati è il valore che appare più spesso e la mediana è la cifra situata al centro del set di dati. È la cifra che separa le cifre superiori da quelle inferiori all’interno di un insieme di dati. Tuttavia, esistono tipi meno comuni di statistiche descrittive che sono ancora molto importanti.
Le persone utilizzano statistiche descrittive per riutilizzare intuizioni quantitative difficili da comprendere in un ampio set di dati in descrizioni brevi. La media dei voti (GPA) di uno studente, ad esempio, fornisce una buona comprensione delle statistiche descrittive. L’idea di un GPA è che prende i punti dati da un’ampia gamma di esami, classi e voti e li media insieme per fornire una comprensione generale del rendimento accademico complessivo di uno studente. Il GPA personale di uno studente riflette il loro rendimento scolastico medio.
Misure di statistica descrittiva
Tutte le statistiche descrittive sono misure di tendenza centrale o misure di variabilità, note anche come misure di dispersione. Le misure di tendenza centrale si concentrano sui valori medi o medi dei set di dati, mentre le misure di variabilità si concentrano sulla dispersione dei dati. Queste due misure utilizzano grafici, tabelle e discussioni generali per aiutare le persone a comprendere il significato dei dati analizzati.
Le misure di tendenza centrale descrivono la posizione centrale di una distribuzione per un insieme di dati. Una persona analizza la frequenza di ciascun punto dati nella distribuzione e la descrive utilizzando la media, la mediana o la modalità, che misura i modelli più comuni del set di dati analizzato.
Le misure di variabilità, o le misure di diffusione, aiutano ad analizzare quanto è diffusa la distribuzione per un insieme di dati. Ad esempio, mentre le misure della tendenza centrale possono fornire a una persona la media di un insieme di dati, non descrive come i dati sono distribuiti all’interno dell’insieme. Quindi, sebbene la media dei dati possa essere 65 su 100, possono ancora esserci punti dati sia a 1 che a 100. Le misure di variabilità aiutano a comunicarlo descrivendo la forma e la diffusione del set di dati. Intervallo, quartili, deviazione assoluta e varianza sono tutti esempi di misure di variabilità.
Considera il seguente set di dati: 5, 19, 24, 62, 91, 100. L’intervallo di quel set di dati è 95, che viene calcolato sottraendo il numero più basso (5) nel set di dati dal più alto (100).
Domande frequenti
Perché abbiamo bisogno di statistiche che descrivono semplicemente i dati?
Le statistiche descrittive vengono utilizzate per descrivere o riassumere le caratteristiche di un campione o di un set di dati, come la media, la deviazione standard o la frequenza di una variabile. Statistica inferenziale. Questo tipo di statistiche può aiutarci a comprendere le proprietà collettive degli elementi di un campione di dati. Queste misure possono darci un’idea della distribuzione di probabilità o della “forma” complessiva dei dati, che può essere rappresentata su un grafico come un istogramma o un diagramma a punti. Conoscere la media campionaria, la varianza e la distribuzione di una variabile può aiutarci a comprendere il mondo che ci circonda.
Cosa sono la media e la deviazione standard?
Queste sono due statistiche descrittive comunemente utilizzate. La media è il livello medio osservato in alcuni dati, mentre la deviazione standard descrive la varianza o il modo in cui i dati osservati in quella variabile sono distribuiti attorno alla sua media.
Le statistiche descrittive possono essere utilizzate per inferenze o previsioni?
No. Sebbene queste descrizioni siano utili per comprendere gli attributi dei dati, le tecniche di statistica inferenziale – un ramo separato della statistica – sono necessarie per capire come le variabili interagiscono tra loro in un insieme di dati.