3 Maggio 2021 23:23

Nozioni di base sulla regressione per l’analisi aziendale

Se ti sei mai chiesto in che modo due o più dati si relazionano tra loro (ad es. Come il PIL è influenzato dai cambiamenti nella disoccupazione e nell’inflazione), o se il tuo capo ti ha mai chiesto di creare una previsione o analizzare le previsioni sulle relazioni tra le variabili, quindi l’apprendimento dell’analisi di regressione varrebbe la pena.

In questo articolo imparerai le basi della regressione lineare semplice, a volte chiamata “minimi quadrati ordinari” o regressione OLS, uno strumento comunemente utilizzato nelle previsioni e nell’analisi finanziaria. Inizieremo imparando i principi fondamentali della regressione, imparando prima la covarianza e la correlazione, quindi passeremo alla costruzione e all’interpretazione di un output di regressione. Il software aziendale più diffuso come Microsoft Excel può eseguire tutti i calcoli e gli output di regressione per te, ma è comunque importante apprendere i meccanismi sottostanti.

punti chiave

  • La regressione lineare semplice è comunemente utilizzata nelle previsioni e nell’analisi finanziaria, ad esempio per consentire a un’azienda di dire in che modo una variazione del PIL potrebbe influire sulle vendite.
  • Microsoft Excel e altri software possono eseguire tutti i calcoli, ma è bene sapere come funzionano i meccanismi della regressione lineare semplice.

Variabili

Al centro di un modello di regressione c’è la relazione tra due diverse variabili, chiamate variabili dipendenti e indipendenti. Ad esempio, supponi di voler prevedere le vendite per la tua azienda e di aver concluso che le vendite della tua azienda aumentano e diminuiscono a seconda delle variazioni del PIL.

Le vendite previste sarebbero la variabile dipendente perché il loro valore “dipende” dal valore del PIL e il PIL sarebbe la variabile indipendente. Dovresti quindi determinare la forza della relazione tra queste due variabili per prevedere le vendite. Se il PIL aumenta / diminuisce dell’1%, quanto aumenteranno o diminuiranno le tue vendite?

Covarianza

La formula per calcolare la relazione tra due variabili è chiamata covarianza. Questo calcolo mostra la direzione della relazione. Se una variabile aumenta e anche l’altra tende ad aumentare, la covarianza sarebbe positiva. Se una variabile aumenta e l’altra tende a diminuire, la covarianza sarebbe negativa.

Il numero effettivo che ottieni dal calcolo può essere difficile da interpretare perché non è standardizzato. Una covarianza di cinque, ad esempio, può essere interpretata come una relazione positiva, ma la forza della relazione può essere definita solo più forte che se il numero fosse quattro o più debole che se il numero fosse sei.

Coefficiente di correlazione

Correluntioon=ρXy=CovXySXSy\ begin {align} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {align}​Correlation=ρxy​=SX​Sy​

Dobbiamo standardizzare la covarianza per consentirci di interpretarla e utilizzarla meglio nelle previsioni, e il risultato è il calcolo della correlazione. Il calcolo della correlazione prende semplicemente la covarianza e la divide per il prodotto della deviazione standard delle due variabili. Questo vincolerà la correlazione tra un valore di -1 e +1.

Una correlazione di +1 può essere interpretata per suggerire che entrambe le variabili si muovono perfettamente positivamente l’una con l’altra e un -1 implica che sono perfettamente correlate negativamente. Nel nostro esempio precedente, se la correlazione è +1 e il PIL aumenta dell’1%, le vendite aumenterebbero dell’1%. Se la correlazione è -1, un aumento dell’1% del PIL comporterebbe una diminuzione dell’1% delle vendite, l’esatto opposto.

Equazione di regressione

Ora che sappiamo come viene calcolata la relazione relativa tra le due variabili, possiamo sviluppare un’equazione di regressione per prevedere o prevedere la variabile che desideriamo. Di seguito è riportata la formula per una semplice regressione lineare. La “y” è il valore che stiamo cercando di prevedere, la “b” è la pendenza della retta di regressione, la “x” è il valore del nostro valore indipendente e la “a” rappresenta l’intercetta y. L’equazione di regressione descrive semplicemente la relazione tra la variabile dipendente (y) e la variabile indipendente (x).

L’intercetta, o “a”, è il valore di y (variabile dipendente) se il valore di x (variabile indipendente) è zero, e quindi a volte viene semplicemente chiamata “costante”. Quindi, se non ci fosse alcun cambiamento nel PIL, la tua azienda farebbe comunque delle vendite. Questo valore, quando la variazione del PIL è zero, è l’intercetta. Dai un’occhiata al grafico sotto per vedere una rappresentazione grafica di un’equazione di regressione. In questo grafico, ci sono solo cinque punti dati rappresentati dai cinque punti sul grafico. La regressione lineare tenta di stimare una linea che si adatta meglio ai dati (una linea di adattamento migliore ) e l’equazione di quella linea risulta nell’equazione di regressione.

Regressioni in Excel

Ora che hai compreso parte del background che va in un’analisi di regressione, facciamo un semplice esempio utilizzando gli strumenti di regressione di Excel. Ci baseremo sull’esempio precedente del tentativo di prevedere le vendite del prossimo anno in base alle variazioni del PIL. La tabella successiva elenca alcuni punti dati artificiali, ma questi numeri possono essere facilmente accessibili nella vita reale.

Basta guardare la tabella per vedere che ci sarà una correlazione positiva tra vendite e PIL. Entrambi tendono a salire insieme. Utilizzando Excel, tutto ciò che devi fare è fare clic sul menu a discesa Strumenti, selezionare Analisi dei dati  e da lì scegliere Regressione. La finestra popup è facile da compilare da lì; il tuo intervallo di input Y è la colonna “Vendite” e il tuo intervallo di input X è la variazione nella colonna del PIL; scegli l’intervallo di output per il punto in cui desideri che i dati vengano visualizzati sul foglio di calcolo e premi OK. Dovresti vedere qualcosa di simile a quanto indicato nella tabella seguente:

                                            Coefficienti statistici di regressione

Interpretazione

I principali output di cui ti devi preoccupare per la regressione lineare semplice sono l’ R-quadrato, l’intercetta (costante) e il coefficiente beta (b) del PIL. Il numero R quadrato in questo esempio è del 68,7%. Ciò mostra quanto bene il nostro modello prevede o prevede le vendite future, suggerendo che le variabili esplicative nel modello prevedevano il 68,7% della variazione nella variabile dipendente. Successivamente, abbiamo un’intercetta di 34,58, che ci dice che se la variazione del PIL fosse prevista pari a zero, le nostre vendite sarebbero di circa 35 unità. Infine, il beta del PIL o coefficiente di correlazione di 88,15 ci dice che se il PIL aumenta dell’1%, le vendite aumenteranno probabilmente di circa 88 unità.

La linea di fondo

Quindi come useresti questo semplice modello nella tua attività? Ebbene, se la tua ricerca ti porta a credere che la prossima variazione del PIL sarà una certa percentuale, puoi inserire quella percentuale nel modello e generare una previsione di vendita. Questo può aiutarti a sviluppare un piano e un budget più obiettivi per il prossimo anno.

Naturalmente, questa è solo una semplice regressione e ci sono regressioni lineari multiple. Ma le regressioni lineari multiple sono più complicate e presentano diversi problemi che richiederebbero un altro articolo da discutere.