Quartile
Cos’è un quartile?
Un quartile è un termine statistico che descrive una divisione delle osservazioni in quattro intervalli definiti in base ai valori dei dati e al modo in cui si confrontano con l’intero set di osservazioni.
Capire i quartili
Per comprendere il quartile, è importante comprendere la mediana come misura della tendenza centrale. La mediana nelle statistiche è il valore medio di un insieme di numeri. È il punto in cui esattamente la metà dei dati si trova al di sotto e al di sopra del valore centrale.
Quindi, dato un insieme di 13 numeri, la mediana sarebbe il settimo numero. I sei numeri che precedono questo valore sono i numeri più bassi nei dati e i sei numeri dopo la mediana sono i numeri più alti nel set di dati fornito. Poiché la mediana non è influenzata da valori estremi o valori anomali nella distribuzione, a volte è preferita alla media.
La mediana è uno stimatore affidabile della posizione ma non dice nulla su come i dati su entrambi i lati del suo valore vengono diffusi o dispersi. È qui che interviene il quartile. Il quartile misura la diffusione dei valori sopra e sotto la media dividendo la distribuzione in quattro gruppi.
Punti chiave
- Il quartile misura la diffusione dei valori sopra e sotto la media dividendo la distribuzione in quattro gruppi.
- Un quartile divide i dati in tre punti: un quartile inferiore, mediano e superiore, per formare quattro gruppi dell’insieme di dati.
- I quartili vengono utilizzati per calcolare l’intervallo interquartile, che è una misura della variabilità intorno alla mediana.
Come funzionano i quartili
Proprio come la mediana divide i dati a metà in modo che il 50% della misurazione si trovi al di sotto della mediana e il 50% al di sopra, il quartile suddivide i dati in trimestri in modo che il 25% delle misurazioni sia inferiore al quartile inferiore, 50 % sono inferiori alla mediana e il 75% sono inferiori al quartile superiore.
Un quartile divide i dati in tre punti: un quartile inferiore, mediano e superiore, per formare quattro gruppi dell’insieme di dati. Il quartile inferiore, o primo quartile, è indicato come Q1 ed è il numero centrale compreso tra il valore più piccolo del set di dati e la mediana. Il secondo quartile, Q2, è anche la mediana. Il quartile superiore o terzo, indicato come Q3, è il punto centrale che si trova tra la mediana e il numero più alto della distribuzione.
Ora possiamo mappare i quattro gruppi formati dai quartili. Il primo gruppo di valori contiene il numero più piccolo fino a Q1; il secondo gruppo include Q1 alla mediana; il terzo set è la mediana di Q3; la quarta categoria comprende Q3 al punto dati più alto dell’intero set.
Ogni quartile contiene il 25% delle osservazioni totali. In genere, i dati sono organizzati dal più piccolo al più grande:
- Primo quartile: il 25% più basso dei numeri
- Secondo quartile : tra il 25,1% e il 50% (fino alla mediana)
- Terzo quartile: dal 50,1% al 75% (sopra la mediana)
- Quarto quartile: il 25% più alto dei numeri
Esempio di Quartile
Supponiamo che la distribuzione dei punteggi di matematica in una classe di 19 studenti in ordine crescente sia:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
In primo luogo, mark down la mediana, Q2, che in questo caso è il 10 ° valore: 75.
Q1 è il punto centrale tra il punteggio più piccolo e la mediana. In questo caso, Q1 cade tra il primo e il quinto punteggio: 68. [Si noti che la mediana può essere inclusa anche quando si calcola Q1 o Q3 per un insieme dispari di valori. Se dovessimo includere la mediana su entrambi i lati del punto centrale, quindi Q1 sarà il valore di mezzo tra il primo e il 10 ° punteggio, che è la media del quinto e sesto punteggio- (quinta + sesta) / 2 = ( 68 + 69) / 2 = 68,5].
Q3 è il valore medio tra Q2 e il punteggio più alto: 84. [O se includi la mediana, Q3 = (82 + 84) / 2 = 83].
Ora che abbiamo i nostri quartili, interpretiamo i loro numeri. Un punteggio di 68 (Q1) rappresenta il primo quartile ed è il 25 ° percentile. 68 è la mediana della metà inferiore del punteggio impostato nei dati disponibili, ovvero la mediana dei punteggi da 59 a 75.
Q1 ci dice che il 25% dei punteggi è inferiore a 68 e il 75% dei punteggi delle classi è maggiore. Q2 (la mediana) è il 50 ° percentile e mostra che il 50% dei punteggi è inferiore a 75 e il 50% dei punteggi è superiore a 75. Infine, Q3, il 75 ° percentile, rivela che il 25% dei punteggi è maggiore e 75% sono inferiori a 84.
considerazioni speciali
Se il punto dati per Q1 è più lontano dalla mediana di quanto lo sia Q3 dalla mediana, allora possiamo dire che c’è una maggiore dispersione tra i valori più piccoli del set di dati rispetto ai valori più grandi. La stessa logica si applica se Q3 è più lontano da Q2 di quanto Q1 sia dalla mediana.
In alternativa, se c’è un numero pari di punti dati, la mediana sarà la media dei due numeri centrali. Nel nostro esempio di cui sopra, se avessimo 20 studenti, invece di 19, la mediana dei loro punteggi sarà la media aritmetica del 10 ° e 11 ° numero.
I quartili vengono utilizzati per calcolare l’intervallo interquartile, che è una misura della variabilità intorno alla mediana. L’intervallo interquartile viene semplicemente calcolato come differenza tra il primo e il terzo quartile: Q3 – Q1. In effetti, è l’intervallo della metà centrale dei dati che mostra quanto siano distribuiti i dati.
Per set di dati di grandi dimensioni, Microsoft Excel dispone di una funzione QUARTILE per calcolare i quartili.