3 Maggio 2021 19:29

Correlazione inversa

Cos’è una correlazione inversa?

Una correlazione inversa, nota anche come correlazione negativa, è una relazione contraria tra due variabili in modo tale che quando il valore di una variabile è alto, il valore dell’altra variabile è probabilmente basso.

Ad esempio, con le variabili A e B, poiché A ha un valore alto, B ha un valore basso e poiché A ha un valore basso, B ha un valore alto. Nella terminologia statistica, una correlazione inversa è spesso indicata dal coefficiente di correlazione “r” avente un valore compreso tra -1 e 0, con r = -1 che indica una correlazione inversa perfetta.

Punti chiave

  • La correlazione inversa (o negativa) è quando due variabili in un set di dati sono correlate in modo tale che quando una è alta l’altra è bassa.
  • Anche se due variabili possono avere una forte correlazione negativa, ciò non implica necessariamente che il comportamento di una abbia un’influenza causale sull’altra.
  • La relazione tra due variabili può cambiare nel tempo e può avere anche periodi di correlazione positiva.

Rappresentazione grafica della correlazione inversa

È possibile tracciare due serie di punti dati su un grafico su un asse xey per verificare la correlazione. Questo è chiamato diagramma a dispersione e rappresenta un modo visivo per verificare una correlazione positiva o negativa. Il grafico seguente illustra una forte correlazione inversa tra due serie di punti dati tracciati sul grafico.

Esempio di calcolo della correlazione inversa

La correlazione può essere calcolata tra le variabili all’interno di un insieme di dati per arrivare a un risultato numerico, il più comune dei quali è noto come r di Pearson. Quando r è minore di 0, ciò indica una correlazione inversa. Ecco un esempio aritmetico di calcolo della r di Pearson, con un risultato che mostra una correlazione inversa tra due variabili.

Supponiamo che un analista debba calcolare il grado di correlazione tra X e Y nel seguente set di dati con sette osservazioni sulle due variabili:

  • X: 55, 37, 100, 40, 23, 66, 88
  • Y: 91, 60, 70, 83, 75, 76, 30

Ci sono tre passaggi coinvolti nella ricerca della correlazione. Innanzitutto, somma tutti i valori X per trovare SUM (X), somma tutti i valori Y per trovare SUM (Y) e moltiplica ciascun valore X con il valore Y corrispondente e sommali per trovare SUM (X, Y):

SUM(Y)=91+60+70+83+75+76+30=485\ begin {allineato} \ text {SUM} (Y) & = 91 + 60 + 70 + 83 + 75 + 76 + 30 \\ & = 485 \\ \ end {allineato}SOMMA (Y)​=91+60+70+83+75+76+30=485​

Il prossimo passo è prendere ogni valore X, quadrare e sommare tutti questi valori per trovare SUM (x 2 ). Lo stesso deve essere fatto per i valori Y:

SUM(X2)=(552)+(372)+(1002)+…+(882)=28,623\ text {SUM} (X ^ 2) = (55 ^ 2) + (37 ^ 2) + (100 ^ 2) + \ dotso + (88 ^ 2) = 28.623SOMMA (X2)=(552)+(372)+(1002)+…+(882)=28,623

Notando che ci sono sette osservazioni, n, la seguente formula può essere utilizzata per trovare il coefficiente di correlazione, r:

r=[n