Test a due code
Che cos’è un test a due code?
In statistica, un test a due code è un metodo in cui l’area critica di una distribuzione è bilaterale e verifica se un campione è maggiore o minore di un determinato intervallo di valori. Viene utilizzato nel test di ipotesi nulla e nel test per la significatività statistica. Se il campione in esame ricade in una delle aree critiche, viene accettata l’ipotesi alternativa invece dell’ipotesi nulla.
Punti chiave
- In statistica, un test a due code è un metodo in cui l’area critica di una distribuzione è bilaterale e verifica se un campione è maggiore o minore di un intervallo di valori.
- Viene utilizzato nel test di ipotesi nulla e nel test per la significatività statistica.
- Se il campione in esame ricade in una delle aree critiche, viene accettata l’ipotesi alternativa invece dell’ipotesi nulla.
- Per convenzione vengono utilizzati test a due code per determinare la significatività al livello del 5%, il che significa che ogni lato della distribuzione viene ridotto al 2,5%.
Capire un test a due code
Un concetto di base della statistica inferenziale è il test di ipotesi, che determina se un’affermazione è vera o meno dato un parametro della popolazione. Un test di ipotesi progettato per mostrare se la media di un campione è significativamente maggiore e significativamente inferiore alla media di una popolazione viene definito test a due code. Il test a due code prende il nome dal testare l’area sotto entrambe le code di una distribuzione normale, sebbene il test possa essere utilizzato in altre distribuzioni non normali.
Un test a due code è progettato per esaminare entrambi i lati di un intervallo di dati specificato come designato dalla distribuzione di probabilità coinvolta. La distribuzione di probabilità dovrebbe rappresentare la probabilità di un risultato specifico sulla base di standard predeterminati. Ciò richiede l’impostazione di un limite che designa i valori delle variabili accettati più alto (o superiore) e più basso (o inferiore) compresi nell’intervallo. Qualsiasi punto dati che esiste al di sopra del limite superiore o al di sotto del limite inferiore è considerato fuori dall’intervallo di accettazione e in un’area denominata intervallo di rifiuto.
Non esiste uno standard intrinseco per quanto riguarda il numero di punti dati che devono esistere all’interno dell’intervallo di accettazione. Nei casi in cui è richiesta precisione, come nella creazione di farmaci, può essere istituito un tasso di rigetto dello 0,001% o inferiore. Nei casi in cui la precisione è meno critica, come il numero di alimenti in un sacchetto del prodotto, può essere appropriato un tasso di scarto del 5%.
Campionamento Casuale
Un test a due code può anche essere utilizzato praticamente durante determinate attività di produzione in un’azienda, come la produzione e il confezionamento di caramelle in una particolare struttura. Se l’impianto di produzione designa 50 caramelle per sacchetto come obiettivo, con una distribuzione accettabile da 45 a 55 caramelle, qualsiasi sacchetto trovato con una quantità inferiore a 45 o superiore a 55 è considerato all’interno dell’intervallo di rifiuto.
Per confermare che i meccanismi di confezionamento siano calibrati correttamente per soddisfare l’output previsto, è possibile eseguire un campionamento casuale per confermare l’accuratezza. Un semplice campione casuale prende una piccola porzione casuale dell’intera popolazione per rappresentare l’intero set di dati, dove ogni membro ha la stessa probabilità di essere scelto.
Affinché i meccanismi di confezionamento siano considerati accurati, è auspicabile una media di 50 caramelle per sacchetto con una distribuzione appropriata. Inoltre, il numero di sacchi che rientrano nell’intervallo di scarto deve rientrare nel limite di distribuzione di probabilità considerato accettabile come tasso di errore. Qui, l’ipotesi nulla sarebbe che la media sia 50 mentre l’ipotesi alternativa sarebbe che non sia 50.
Se, dopo aver eseguito il test a due code, lo z-score cade nella regione di rigetto, il che significa che la deviazione è troppo lontana dalla media desiderata, allora potrebbero essere necessari aggiustamenti alla struttura o all’apparecchiatura associata per correggere l’errore. L’uso regolare di metodi di prova a due code può aiutare a garantire che la produzione rimanga entro i limiti a lungo termine.
Fai attenzione a notare se un test statistico è a una o due code poiché ciò influenzerà notevolmente l’interpretazione di un modello.
Due code vs. Test a una coda
Quando viene impostato un test di ipotesi per dimostrare che la media campionaria sarebbe superiore o inferiore alla media della popolazione, si parla di test a una coda. Il test a una coda prende il nome dal testare l’area sotto una delle code (lati) di una distribuzione normale. Quando si utilizza un test a una coda, un analista verifica la possibilità della relazione in una direzione di interesse e ignora completamente la possibilità di una relazione in un’altra direzione.
Se il campione in esame ricade nell’area critica unilaterale, sarà accettata l’ipotesi alternativa invece dell’ipotesi nulla. Un test a una coda è anche noto come ipotesi direzionale o test direzionale.
Un test a due code, d’altra parte, è progettato per esaminare entrambi i lati di un intervallo di dati specificato per verificare se un campione è maggiore o minore dell’intervallo di valori.
Esempio di un test a due code
Come esempio ipotetico, immagina che un nuovo agente di borsa (XYZ) affermi che le sue commissioni di intermediazione sono inferiori a quelle del tuo attuale agente di borsa (ABC). I dati disponibili da una società di ricerca indipendente indicano che la media e la deviazione standard di tutti i clienti dei broker ABC sono rispettivamente di $ 18 e $ 6.
Viene preso un campione di 100 clienti di ABC e le spese di intermediazione vengono calcolate con le nuove tariffe del broker XYZ. Se la media del campione è di $ 18,75 e la deviazione standard del campione è di $ 6, è possibile dedurre la differenza nella fattura di intermediazione media tra il broker ABC e XYZ?
- H 0 : Ipotesi nulla: media = 18
- H 1 : Ipotesi alternativa: media 18 (questo è ciò che vogliamo dimostrare).
- Regione di rifiuto: Z = Z 2,5 (assumendo un livello di significatività del 5%, diviso 2,5 ciascuno su entrambi i lati).
- Z = (media campione – media) / (dev-std / sqrt (n. Di campioni)) = (18,75 – 18) / (6 / (sqrt (100)) = 1,25
Questo valore Z calcolato è compreso tra i due limiti definiti da: – Z 2,5 = -1,96 e Z 2,5 = 1,96.
Ciò conclude che non ci sono prove sufficienti per dedurre che ci sia qualche differenza tra le tariffe del tuo broker esistente e del nuovo broker. Pertanto, l’ipotesi nulla non può essere respinta. In alternativa, il valore p = P (Z 1,25) = 2 * 0,1056 = 0,2112 = 21,12%, che è maggiore di 0,05 o 5%, porta alla stessa conclusione.
Domande frequenti
Come viene progettato un test a due code?
Un test a due code è progettato per determinare se un’affermazione è vera o meno dato un parametro della popolazione. Esamina entrambi i lati di un intervallo di dati specificato come designato dalla distribuzione di probabilità coinvolta. In quanto tale, la distribuzione di probabilità dovrebbe rappresentare la probabilità di un risultato specifico sulla base di standard predeterminati. Ciò richiede l’impostazione di un limite che designa i valori delle variabili accettati più alto (o superiore) e più basso (o inferiore) compresi nell’intervallo. Qualsiasi punto di dati che esiste al di sopra del limite superiore o inferiore al limite inferiore è considerato fuori dall’intervallo di accettazione e la richiesta viene respinta.
Qual è la differenza tra un test a due code e uno a una coda?
Un test di ipotesi a due code è progettato per mostrare se la media del campione è significativamente maggiore e significativamente inferiore alla media di una popolazione. Il test a due code prende il nome dal testare l’area sotto entrambe le code (lati) di una distribuzione normale. Un test di ipotesi a una coda, d’altra parte, è impostato per mostrare che la media campionaria sarebbe superiore o inferiore alla media della popolazione. Il test a una coda prende il nome dal testare l’area sotto una delle code di una distribuzione normale.
Cos’è un punteggio Z?
Un punteggio Z descrive numericamente la relazione di un valore con la media di un gruppo di valori e viene misurato in termini di deviazioni standard numeriche dalla media. Se un punteggio Z è 0, indica che il punteggio del punto dati è identico al punteggio medio, mentre i punteggi Z di 1,0 e -1,0 indicano valori una deviazione standard sopra o sotto la media. Nella maggior parte dei set di dati di grandi dimensioni, il 99% dei valori ha un punteggio Z compreso tra -3 e 3, il che significa che si trovano entro tre deviazioni standard sopra e sotto la media.