Somma dei quadrati residua (RSS)
Qual è la somma dei quadrati residua (RSS)?
Una somma dei quadrati residua (RSS) è una tecnica statistica utilizzata per misurare la quantità di varianza in un set di dati che non è spiegata da un modello di regressione stesso. Invece, stima la varianza nei residui o nel termine di errore.
La regressione lineare è una misura che aiuta a determinare la forza della relazione tra una variabile dipendente e uno o più altri fattori, noti come variabili indipendenti o esplicative.
Punti chiave
- Una somma dei quadrati residua (RSS) misura il livello di varianza nel termine di errore, o residui, di un modello di regressione.
- Idealmente, la somma dei residui al quadrato dovrebbe essere un valore minore o minore della somma dei quadrati dagli input del modello di regressione.
- L’RSS è utilizzato dagli analisti finanziari per stimare la validità dei loro modelli econometrici.
La formula per RSS è
ESS =
∑
n
io = 1 (
y io –
f (
x i ))
2
dove:
- y i = l’i- esimo valore della variabile da prevedere
- f (x i ) = valore previsto di y i
- n = limite superiore della somma
- y i = l’i- esimo valore della variabile da prevedere
- f (x i ) = valore previsto di y i
- n = limite superiore della somma
Capire la somma dei quadrati residua (RSS)
In termini generali, la somma dei quadrati è una tecnica statistica utilizzata nell’analisi di regressione per determinare la dispersione dei punti dati. In un’analisi di regressione, l’obiettivo è determinare in che misura una serie di dati può essere adattata a una funzione che potrebbe aiutare a spiegare come è stata generata la serie di dati. La somma dei quadrati viene utilizzata come metodo matematico per trovare la funzione che meglio si adatta (varia di meno) dai dati.
L’RSS misura la quantità di errore rimanente tra la funzione di regressione e il set di dati dopo che il modello è stato eseguito. Una cifra della somma dei quadrati residua più piccola rappresenta una funzione di regressione.
L’RSS, noto anche come somma dei residui al quadrato, determina essenzialmente quanto bene un modello di regressione spiega o rappresenta i dati nel modello.
RSS contro RSE
Errore standard residuo * RSE) è un altro termine statistico utilizzato per descrivere la differenza nelle deviazioni standard dei valori osservati rispetto ai valori previsti, come mostrato dai punti in bontà di adattamento che può essere utilizzata per analizzare quanto bene un insieme di punti dati si adatta al modello reale.
L’RSE viene calcolato dividendo l’RSS per il numero di osservazioni nel campione meno 2 e quindi prendendo la radice quadrata: RSE = [RSS / (n-2)] 1/2
RSS, finanza ed econometria
I mercati finanziari sono diventati sempre più guidati quantitativamente; in quanto tale, alla ricerca di un vantaggio, molti investitori utilizzano tecniche statistiche avanzate per aiutare nelle loro decisioni. Le applicazioni di big data, apprendimento automatico e intelligenza artificiale richiedono inoltre l’uso di proprietà statistiche per guidare le strategie di investimento contemporanee. La somma residua dei quadrati – o statistiche RSS – è una delle tante proprietà statistiche che stanno vivendo una rinascita.
I modelli statistici vengono utilizzati da investitori e gestori di portafoglio per tenere traccia del prezzo di un investimento e utilizzare tali dati per prevedere i movimenti futuri. Lo studio, chiamato analisi di regressione, potrebbe comportare l’analisi della relazione nei movimenti di prezzo tra una merce e le azioni delle società impegnate nella produzione della merce.
Qualsiasi modello potrebbe presentare variazioni tra i valori previsti e i risultati effettivi. Sebbene le varianze possano essere spiegate dall’analisi di regressione, la somma residua dei quadrati rappresenta le varianze o gli errori non spiegati.
Poiché è possibile creare una funzione di regressione sufficientemente complessa per adattarsi praticamente a qualsiasi set di dati, sono necessari ulteriori studi per determinare se la funzione di regressione è, in effetti, utile per spiegare la varianza del set di dati. In genere, tuttavia, un valore inferiore o inferiore per la somma residua dei quadrati è l’ideale in qualsiasi modello poiché significa che c’è meno variazione nel set di dati. In altre parole, minore è la somma dei quadrati dei residui, migliore sarà la spiegazione dei dati da parte del modello di regressione.