Definizione della regressione non lineare - KamilTaylan.blog
3 Maggio 2021 21:39

Definizione della regressione non lineare

La regressione non lineare è una forma di analisi di regressione in cui i dati vengono adattati a un modello e quindi espressi come una funzione matematica. La regressione lineare semplice mette in   relazione due variabili (X e Y) con una linea retta (y = mx + b), mentre la regressione non lineare mette in relazione le due variabili in una relazione non lineare (curva).

L’obiettivo del modello è quello di ridurre il più possibile la  somma dei quadrati  . La somma dei quadrati è una misura che tiene traccia di quanto variano le osservazioni Y dalla funzione non lineare (curva) utilizzata per prevedere Y.

Viene calcolato trovando prima la differenza tra la funzione non lineare adattata e ogni punto Y dei dati nell’insieme. Quindi, ciascuna di queste differenze viene quadrata. Infine, tutte le figure quadrate vengono sommate. Più piccola è la somma di queste cifre quadrate, migliore è la funzione che si adatta ai punti dati nell’insieme. La regressione non lineare utilizza funzioni logaritmiche, funzioni trigonometriche, funzioni esponenziali, funzioni di potenza, curve di Lorenz, funzioni gaussiane e altri metodi di adattamento.

Punti chiave

  • Sia la regressione lineare che quella non lineare prevedono le risposte Y da una o più variabili X.
  • La regressione non lineare è una funzione curva di una variabile X (o variabili) utilizzata per prevedere una variabile Y.
  • La regressione non lineare può mostrare una previsione della crescita della popolazione nel tempo.

La modellazione di regressione non lineare è simile alla modellazione di regressione lineare in quanto entrambi cercano di tracciare graficamente una risposta particolare da un insieme di variabili. I modelli non lineari sono più complicati da sviluppare rispetto ai modelli lineari perché la funzione viene creata attraverso una serie di approssimazioni (iterazioni) che possono derivare da tentativi ed errori. I matematici usano diversi metodi consolidati, come il metodo Gauss-Newton e il metodo Levenberg-Marquardt.

Spesso, i modelli di regressione che a prima vista sembrano non lineari sono in realtà lineari. La procedura di stima della curva può essere utilizzata per identificare la natura delle relazioni funzionali in gioco nei dati, in modo da poter scegliere il modello di regressione corretto, lineare o non lineare. I modelli di regressione lineare, sebbene formino tipicamente una linea retta, possono anche formare curve, a seconda della forma dell’equazione di regressione lineare. Allo stesso modo, è possibile utilizzare l’algebra per trasformare un’equazione non lineare in modo che imiti un’equazione lineare: un’equazione non lineare viene definita “intrinsecamente lineare”.



La regressione lineare mette in relazione due variabili con una linea retta; la regressione non lineare mette in relazione le variabili utilizzando una curva.

Esempio di regressione non lineare

Un esempio di come è possibile utilizzare la regressione non lineare è prevedere la crescita della popolazione nel tempo. Un grafico a dispersione della variazione dei dati sulla popolazione nel tempo mostra che sembra esserci una relazione tra il tempo e la crescita della popolazione, ma che si tratta di una relazione non lineare, che richiede l’uso di un modello di regressione non lineare. Un modello logistico di crescita della popolazione può fornire stime della popolazione per periodi che non sono stati misurati e previsioni della futura crescita della popolazione.

Le variabili indipendenti e dipendenti utilizzate nella regressione non lineare dovrebbero essere quantitative. Le variabili categoriali, come la regione di residenza o la religione, dovrebbero essere codificate come variabili binarie o altri tipi di variabili quantitative.

Per ottenere risultati accurati dal modello di regressione non lineare, è necessario assicurarsi che la funzione specificata descriva accuratamente la relazione tra le variabili indipendenti e dipendenti. Sono necessari anche buoni valori di partenza. Valori iniziali scadenti possono comportare un modello che non riesce a convergere o una soluzione ottimale solo a livello locale, piuttosto che a livello globale, anche se è stata specificata la forma funzionale corretta per il modello.