3 Maggio 2021 21:11

Multicollinearità

Cos’è la multicollinearità?

La multicollinearità è il verificarsi di elevate intercorrelazioni tra due o più variabili indipendenti in un modello di regressione multipla. La multicollinearità può portare a risultati distorti o fuorvianti quando un ricercatore o un analista tenta di determinare in che misura ciascuna variabile indipendente può essere utilizzata in modo più efficace per prevedere o comprendere la variabile dipendente in un modello statistico.

In generale, la multicollinearità può portare a intervalli di confidenza più ampi che producono probabilità meno affidabili in termini di effetto delle variabili indipendenti in un modello. Cioè, le inferenze statistiche da un modello con multicollinearità potrebbero non essere affidabili.

Punti chiave

  • La multicollinearità è un concetto statistico in cui le variabili indipendenti in un modello sono correlate.
  • La multicollinearità tra variabili indipendenti risulterà in inferenze statistiche meno affidabili.
  • È preferibile utilizzare variabili indipendenti che non sono correlate o ripetitive quando si creano più modelli di regressione che utilizzano due o più variabili.

Capire la multicollinearità

Gli analisti statistici utilizzano più modelli di regressione per prevedere il valore di una variabile dipendente specificata in base ai valori di due o più variabili indipendenti. La variabile dipendente viene talvolta definita variabile di risultato, obiettivo o criterio.

Un esempio è un modello di regressione multivariata che tenta di anticipare i rendimenti delle azioni in base a elementi quali i rapporti prezzo / utili ( rapporti P / E), la capitalizzazione di mercato, le prestazioni passate o altri dati. Il rendimento delle azioni è la variabile dipendente e i vari bit di dati finanziari sono le variabili indipendenti.

La multicollinearità in un modello di regressione multipla indica che le variabili indipendenti collineari sono correlate in qualche modo, sebbene la relazione possa o meno essere casuale. Ad esempio, la performance passata potrebbe essere correlata alla capitalizzazione di mercato, poiché le azioni che hanno ottenuto buoni risultati in passato avranno valori di mercato crescenti. In altre parole, la multicollinearità può esistere quando due variabili indipendenti sono altamente correlate. Può anche accadere se una variabile indipendente viene calcolata da altre variabili nel set di dati o se due variabili indipendenti forniscono risultati simili e ripetitivi.

Uno dei modi più comuni per eliminare il problema della multicollinearità è identificare prima le variabili indipendenti collineari e quindi rimuovere tutte tranne una. È anche possibile eliminare la multicollinearità combinando due o più variabili collineari in una singola variabile. L’analisi statistica può quindi essere condotta per studiare la relazione tra la variabile dipendente specificata e solo una singola variabile indipendente.

Esempio di multicollinearità

Per gli investimenti, la multicollinearità è una considerazione comune quando si eseguono analisi tecniche per prevedere probabili movimenti futuri dei prezzi di un titolo, come un titolo azionario o un futuro su una materia prima.

Gli analisti di mercato vogliono evitare di utilizzare indicatori tecnici che sono collineari in quanto si basano su input molto simili o correlati; tendono a rivelare previsioni simili per quanto riguarda la variabile dipendente del movimento dei prezzi. Invece, l’analisi di mercato deve essere basata su variabili indipendenti notevolmente diverse per garantire che analizzino il mercato da diversi punti di vista analitici indipendenti.



Un esempio di un potenziale problema di multicollinearità è l’esecuzione dell’analisi tecnica utilizzando solo diversi indicatori simili.

Il noto analista tecnico John Bollinger, creatore dell’indicatore delle bande di Bollinger, osserva che “una regola cardinale per il successo dell’analisi tecnica richiede di evitare la multicollinearità tra gli indicatori”. Per risolvere il problema, gli analisti evitano di utilizzare due o più indicatori tecnici dello stesso tipo. Invece, analizzano un titolo utilizzando un tipo di indicatore, come un indicatore di momentum, e quindi eseguono analisi separate utilizzando un diverso tipo di indicatore, come un indicatore di tendenza.

Ad esempio, lo stocastico, l’ indice di forza relativa (RSI) e Williams% R sono tutti indicatori di momentum che si basano su input simili e possono produrre risultati simili. In questo caso, è meglio rimuovere tutti gli indicatori tranne uno o trovare un modo per fonderne diversi in un solo indicatore, aggiungendo anche un indicatore di tendenza che probabilmente non sarà altamente correlato con l’indicatore di momentum.