3 Maggio 2021 17:59

Creazione di un modello di regressione lineare in Excel

Cos’è la regressione lineare?

La regressione lineare è un grafico di dati che rappresenta graficamente la relazione lineare  tra una variabile indipendente e una dipendente. Viene tipicamente utilizzato per mostrare visivamente la forza della relazione e la dispersione dei risultati, il tutto allo scopo di spiegare il comportamento della variabile dipendente.

Supponiamo di voler testare la forza del rapporto tra la quantità di gelato consumato e l’obesità. Prendiamo la variabile indipendente, la quantità di gelato, e la mettiamo in relazione con la variabile dipendente, l’obesità, per vedere se esiste una relazione. Data una regressione è una visualizzazione grafica di questa relazione, minore è la variabilità dei dati, più forte è la relazione e più stretto è l’adattamento alla linea di regressione.

Punti chiave

  • La regressione lineare modella la relazione tra una o più variabili dipendenti e indipendenti.
  • L’analisi di regressione può essere ottenuta se le variabili sono indipendenti, non c’è eteroschedasticità e i termini di errore delle variabili non sono correlati.
  • La modellazione della regressione lineare in Excel è più semplice con Data Analysis ToolPak.

Considerazioni importanti

Esistono alcune ipotesi critiche sul set di dati che devono essere vere per procedere con un’analisi di regressione :

  1. Le variabili devono essere veramente indipendenti (utilizzando un test Chi-quadrato ).
  2. I dati non devono avere varianze di errore diverse (questa è chiamata eteroschedasticità (anche ortografata eteroschedasticità)).
  3. I termini di errore di ciascuna variabile non devono essere correlati. In caso contrario, significa che le variabili sono  correlate in serie.

Se queste tre cose sembrano complicate, lo sono. Ma l’effetto di una di queste considerazioni non vero è una stima distorta. In sostanza, dichiareresti erroneamente la relazione che stai misurando.

Emissione di una regressione in Excel

Il primo passaggio nell’esecuzione dell’analisi di regressione in Excel consiste nel ricontrollare che il plug-in gratuito di Excel Data Analysis ToolPak sia installato. Questo plugin semplifica il calcolo di una serie di statistiche. Si Non  richiesto di tracciare una linea di regressione lineare, ma rende la creazione di tabelle statistiche più semplice. Per verificare se installato, seleziona “Dati” dalla barra degli strumenti. Se “Analisi dati” è un’opzione, la funzione è installata e pronta per l’uso. Se non installato, puoi richiedere questa opzione facendo clic sul pulsante Office e selezionando “Opzioni Excel”.

Utilizzando il Data Analysis ToolPak, la creazione di un output di regressione richiede solo pochi clic.



La variabile indipendente va nell’intervallo X.

Dati i rendimenti dell ‘S & P 500 , diciamo di voler sapere se possiamo stimare la forza e la relazione dei rendimenti delle azioni Visa (

  1. Seleziona “Dati” dalla barra degli strumenti. Viene visualizzato il menu “Dati”.
  2. Seleziona “Analisi dei dati”. Viene visualizzata la finestra di dialogo Analisi dei dati – Strumenti di analisi.
  3. Dal menu, seleziona “Regressione” e fai clic su “OK”.
  4. Nella finestra di dialogo Regressione, fare clic sulla casella “Input Y Range” e selezionare i dati della variabile dipendente (rendimenti azionari Visa (V)).
  5. Fare clic sulla casella “Input X Range” e selezionare i dati della variabile indipendente (restituisce S&P 500).
  6. Fare clic su “OK” per eseguire i risultati.

[Nota: se la tabella sembra piccola, fai clic con il pulsante destro del mouse sull’immagine e aprila in una nuova scheda per una risoluzione maggiore.]

Interpretare i risultati

Usando questi dati (gli stessi del nostro articolo R quadrato ), otteniamo la seguente tabella:

Il valore R 2, noto anche come coefficiente di determinazione, misura la proporzione di variazione nella variabile dipendente spiegata dalla variabile indipendente o quanto bene il modello di regressione si adatta ai dati. Il valore R 2 varia da 0 a 1 e un valore più alto indica un adattamento migliore. Anche il valore p, o valore di probabilità, varia da 0 a 1 e indica se il test è significativo. In contrasto con il valore R 2, un valore p più piccolo è favorevole in quanto indica una correlazione tra le variabili dipendenti e indipendenti.

Creazione di grafici di una regressione in Excel

Possiamo tracciare una regressione in Excel evidenziando i dati e rappresentandoli come grafico a dispersione. Per aggiungere una linea di regressione, scegli “Layout” dal menu “Strumenti grafico”. Nella finestra di dialogo, selezionare “Linea di tendenza” e poi “Linea di tendenza lineare”. Per aggiungere il valore R 2, seleziona “Altre opzioni linea di tendenza” dal menu “Linea di tendenza. Infine, seleziona” Visualizza valore R quadrato sul grafico “. Il risultato visivo riassume la forza della relazione, anche se a scapito di non fornire tanti dettagli quanto la tabella sopra.