Regressione lineare multipla (MLR)
Che cos’è la regressione lineare multipla (MLR)?
La regressione lineare multipla (MLR), nota anche semplicemente come regressione multipla, è una tecnica statistica che utilizza diverse variabili esplicative per prevedere il risultato di una variabile di risposta. L’obiettivo della regressione lineare multipla (MLR) è modellare la relazione lineare tra le variabili esplicative (indipendenti) e la variabile di risposta (dipendente).
In sostanza, la regressione multipla è l’estensione dei minimi quadrati ordinari (OLS) di regressione perché si tratta di più di una variabile esplicativa.
Punti chiave
- La regressione lineare multipla (MLR), nota anche semplicemente come regressione multipla, è una tecnica statistica che utilizza diverse variabili esplicative per prevedere il risultato di una variabile di risposta.
- La regressione multipla è un’estensione della regressione lineare (OLS) che utilizza una sola variabile esplicativa.
- MLR è ampiamente utilizzato in econometria e inferenza finanziaria.
Formula e calcolo della regressione lineare multipla
Cosa può dirti la regressione lineare multipla
La regressione lineare semplice è una funzione che consente a un analista o statistico di fare previsioni su una variabile in base alle informazioni note su un’altra variabile. La regressione lineare può essere utilizzata solo quando si hanno due variabili continue: una variabile indipendente e una variabile dipendente. La variabile indipendente è il parametro utilizzato per calcolare la variabile dipendente o il risultato. Un modello di regressione multipla si estende a diverse variabili esplicative.
Il modello di regressione multipla si basa sui seguenti presupposti:
- Esiste una relazione lineare tra le variabili dipendenti e le variabili indipendenti
- Le variabili indipendenti non sono troppo strettamente correlate tra loro
- y i osservazioni sono scelti indipendentemente e in modo casuale dalla popolazione
- I residui dovrebbero essere normalmente distribuiti con media 0 e varianza σ
Il coefficiente di determinazione (R-quadrato) è una metrica statistica utilizzata per misurare la quantità di variazione del risultato che può essere spiegata dalla variazione delle variabili indipendenti. R 2 aumenta sempre con l’aggiunta di più predittori al modello MLR, anche se i predittori potrebbero non essere correlati alla variabile di risultato.
R2 da solo non può quindi essere utilizzato per identificare quali predittori dovrebbero essere inclusi in un modello e quali dovrebbero essere esclusi. R2 può essere compreso solo tra 0 e 1, dove 0 indica che il risultato non può essere previsto da nessuna delle variabili indipendenti e 1 indica che il risultato può essere previsto senza errori dalle variabili indipendenti.
Quando si interpretano i risultati di una regressione multipla, i coefficienti beta sono validi mantenendo costanti tutte le altre variabili (“tutto il resto uguale”). L’output di una regressione multipla può essere visualizzato orizzontalmente come un’equazione o verticalmente sotto forma di tabella.
Esempio di come utilizzare la regressione lineare multipla
Ad esempio, un analista potrebbe voler sapere in che modo il movimento del mercato influisce sul prezzo di ExxonMobil (XOM). In questo caso, la loro equazione lineare avrà il valore dell’indice S&P 500 come variabile indipendente, o predittore, e il prezzo di XOM come variabile dipendente.
In realtà, sono molteplici i fattori che predicono l’esito di un evento. Il movimento dei prezzi di ExxonMobil, ad esempio, non dipende solo dall’andamento del mercato complessivo. Altri predittori come il prezzo del petrolio, i tassi di interesse e il movimento dei prezzi dei futures sul petrolio possono influenzare il prezzo di XOM e i prezzi delle azioni di altre compagnie petrolifere. Per comprendere una relazione in cui sono presenti più di due variabili, viene utilizzata la regressione lineare multipla.
La regressione lineare multipla (MLR) viene utilizzata per determinare una relazione matematica tra un numero di variabili casuali. In altri termini, MLR esamina il modo in cui più variabili indipendenti sono correlate a una variabile dipendente. Una volta che ciascuno dei fattori indipendenti è stato determinato per prevedere la variabile dipendente, le informazioni sulle variabili multiple possono essere utilizzate per creare una previsione accurata sul livello di effetto che hanno sulla variabile di risultato. Il modello crea una relazione sotto forma di una linea retta (lineare) che approssima al meglio tutti i singoli punti dati.
Facendo riferimento all’equazione MLR sopra, nel nostro esempio:
- y i = variabile dipendente: il prezzo di XOM
- x i1 = tassi di interesse
- x i2 = prezzo del petrolio
- x i3 = valore dell’indice S&P 500
- x i4 = prezzo dei futures sul petrolio
- B 0 = intercetta y al tempo zero
- B 1 = coefficiente di regressione che misura una variazione unitaria nella variabile dipendente quando x i1 cambia – la variazione del prezzo XOM quando cambiano i tassi di interesse
- B 2 = valore del coefficiente che misura una variazione unitaria nella variabile dipendente quando x i2 cambia: la variazione del prezzo XOM quando cambiano i prezzi del petrolio
Le stime dei minimi quadrati, B 0, B 1, B 2 … B p, sono generalmente calcolate da software statistico. Molte variabili possono essere incluse nel modello di regressione in cui ogni variabile indipendente è differenziata con un numero – 1,2, 3, 4… p. Il modello di regressione multipla consente a un analista di prevedere un risultato in base alle informazioni fornite su più variabili esplicative.
Tuttavia, il modello non è sempre perfettamente accurato poiché ogni punto dati può differire leggermente dal risultato previsto dal modello. Il valore residuo, E, che è la differenza tra il risultato effettivo e il risultato previsto, è incluso nel modello per tenere conto di tali lievi variazioni.
Supponendo di eseguire il nostro modello di regressione dei prezzi XOM attraverso un software di calcolo delle statistiche, che restituisce questo output:
Un analista interpreterebbe questo output nel senso che se altre variabili vengono mantenute costanti, il prezzo di XOM aumenterà del 7,8% se il prezzo del petrolio nei mercati aumenta dell’1%. Il modello mostra anche che il prezzo di XOM diminuirà dell’1,5% a seguito di un aumento dell’1% dei tassi di interesse. R 2 indica che l’86,5% delle variazioni del prezzo delle azioni di Exxon Mobil può essere spiegato dalle variazioni del tasso di interesse, del prezzo del petrolio, dei future sul petrolio e dell’indice S&P 500.
La differenza tra regressione lineare e multipla
La regressione dei quadrati lineari ordinari (OLS) confronta la risposta di una variabile dipendente dato un cambiamento in alcune variabili esplicative. Tuttavia, è raro che una variabile dipendente sia spiegata da una sola variabile. In questo caso, un analista utilizza la regressione multipla, che tenta di spiegare una variabile dipendente utilizzando più di una variabile indipendente. Le regressioni multiple possono essere lineari e non lineari.
Le regressioni multiple si basano sul presupposto che esista una relazione lineare tra le variabili dipendenti e indipendenti. Inoltre, non presuppone alcuna correlazione importante tra le variabili indipendenti.
Domande frequenti
Cosa rende “multipla” una regressione multipla?
Una regressione multipla considera l’effetto di più di una variabile esplicativa su un risultato di interesse. Valuta l’effetto relativo di queste variabili esplicative o indipendenti sulla variabile dipendente quando si mantengono costanti tutte le altre variabili nel modello.
Perché si dovrebbe utilizzare una regressione multipla su una semplice regressione OLS?
È raro che una variabile dipendente sia spiegata da una sola variabile. In questi casi, un analista utilizza la regressione multipla, che tenta di spiegare una variabile dipendente utilizzando più di una variabile indipendente. Il modello, tuttavia, presuppone che non vi siano correlazioni importanti tra le variabili indipendenti.
Posso eseguire manualmente una regressione multipla?
Probabilmente no. I modelli di regressione multipla sono complessi e lo diventano ancora di più quando ci sono più variabili incluse nel modello o quando la quantità di dati da analizzare aumenta. Per eseguire una regressione multipla sarà probabilmente necessario utilizzare software statistico specializzato o funzioni all’interno di programmi aziendali come Excel.
Cosa significa che una regressione multipla è “lineare”?
In una regressione lineare multipla, il modello calcola la linea di adattamento migliore che riduce al minimo le varianze di ciascuna delle variabili incluse in relazione alla variabile dipendente. Poiché si adatta a una linea, è un modello lineare. Esistono anche modelli di regressione non lineare che coinvolgono più variabili, come la regressione logistica, la regressione quadratica e i modelli probit.
Come vengono utilizzati più modelli di regressione in finanza?
Qualsiasi modello econometrico che considera più di una variabile può essere una regressione multipla. I modelli fattoriali, ad esempio, confrontano due o più fattori per analizzare le relazioni tra le variabili e le prestazioni risultanti. Il Fama and French Three-Factor Mod è un modello che espande il modello di capital asset pricing (CAPM) aggiungendo fattori di rischio di dimensione e di valore al fattore di rischio di mercato nel CAPM (che è esso stesso un modello di regressione). Includendo questi due fattori aggiuntivi, il modello si adatta a questa tendenza a sovraperformare, che si ritiene lo renda uno strumento migliore per valutare le prestazioni dei manager.