4 Maggio 2021 1:03

Regressione graduale

Che cos’è la regressione graduale?

La regressione graduale è la costruzione iterativa graduale di un modello di regressione che prevede la selezione di variabili indipendenti da utilizzare in un modello finale. Implica l’aggiunta o la rimozione di potenziali variabili esplicative in successione e la verifica della significatività statistica dopo ogni iterazione.

La disponibilità di pacchetti software statistici rende possibile la regressione graduale, anche in modelli con centinaia di variabili.

Punti chiave

  • La regressione graduale è un metodo che esamina in modo iterativo la significatività statistica di ciascuna variabile indipendente in un modello di regressione lineare.
  • L’approccio di selezione in avanti inizia con niente e aggiunge ogni nuova variabile in modo incrementale, verificando la significatività statistica.
  • Il metodo di eliminazione all’indietro inizia con un modello completo caricato con diverse variabili e quindi rimuove una variabile per verificarne l’importanza rispetto ai risultati complessivi.
  • La regressione graduale ha i suoi svantaggi, tuttavia, poiché è un approccio che inserisce i dati in un modello per ottenere il risultato desiderato.

Tipi di regressione graduale

L’obiettivo alla base della regressione graduale è, attraverso una serie di test (ad es. F-test, t-test ) trovare un insieme di variabili indipendenti che influenzano in modo significativo la variabile dipendente. Questo viene fatto con i computer attraverso l’iterazione, che è il processo per arrivare a risultati o decisioni passando attraverso cicli ripetuti o cicli di analisi. L’esecuzione automatica dei test con l’aiuto di pacchetti software statistici ha il vantaggio di risparmiare tempo e limitare gli errori.

La regressione graduale può essere ottenuta provando una variabile indipendente alla volta e includendola nel modello di regressione se è statisticamente significativa o includendo tutte le potenziali variabili indipendenti nel modello ed eliminando quelle che non sono statisticamente significative. Alcuni usano una combinazione di entrambi i metodi e quindi ci sono tre approcci alla regressione graduale:

  1. La selezione in avanti inizia senza variabili nel modello, verifica ogni variabile quando viene aggiunta al modello, quindi mantiene quelle ritenute più statisticamente significative, ripetendo il processo finché i risultati non sono ottimali.
  2. L’eliminazione all’indietro inizia con una serie di variabili indipendenti, eliminandone una alla volta, quindi testando per vedere se la variabile rimossa è statisticamente significativa.
  3. L’eliminazione bidirezionale è una combinazione dei primi due metodi che verificano quali variabili devono essere incluse o escluse.

Esempio

Un esempio di regressione graduale utilizzando il metodo di eliminazione all’indietro sarebbe un tentativo di comprendere il consumo di energia in una fabbrica utilizzando variabili come il tempo di funzionamento dell’apparecchiatura, l’età dell’apparecchiatura, le dimensioni del personale, le temperature esterne e il periodo dell’anno. Il modello include tutte le variabili, quindi ciascuna viene rimossa, una alla volta, per determinare quale è meno significativa dal punto di vista statistico. Alla fine, il modello potrebbe mostrare che il periodo dell’anno e le temperature sono più significative, suggerendo forse che il picco di consumo energetico in fabbrica è quando l’utilizzo del condizionatore d’aria è al massimo.

Limitazioni della regressione graduale

L’analisi di regressione, sia rapporti prezzo / utili e i rendimenti delle azioni nel corso di molti anni per determinare se le azioni con rapporti P / E bassi (variabile indipendente) offrono rendimenti più elevati (variabile dipendente). Il problema con questo approccio è che le condizioni di mercato spesso cambiano e le relazioni che si sono mantenute in passato non sono necessariamente valide nel presente o nel futuro.

Nel frattempo, il processo di regressione graduale ha molti critici e ci sono persino chiamate per smettere di usare del tutto il metodo. Gli statistici notano diversi inconvenienti all’approccio, inclusi risultati errati, un pregiudizio intrinseco nel processo stesso e la necessità di una potenza di calcolo significativa per sviluppare modelli di regressione complessi attraverso l’iterazione.