4 Maggio 2021 1:18

Somma dei quadrati

Qual è la somma dei quadrati?

La somma dei quadrati è una tecnica statistica utilizzata nell’analisi di regressione per determinare la dispersione dei punti dati. In un’analisi di regressione, l’obiettivo è determinare in che misura una serie di dati può essere adattata a una funzione che potrebbe aiutare a spiegare come è stata generata la serie di dati. La somma dei quadrati viene utilizzata come metodo matematico per trovare la funzione che meglio si adatta (varia di meno) dai dati.

La formula per la somma dei quadrati è

La somma dei quadrati è anche nota come variazione.

Cosa ti dice la somma dei quadrati?

La somma dei quadrati è una misura della deviazione dalla media. In statistica, la media è la media di un insieme di numeri ed è la misura più comunemente usata della tendenza centrale. La media aritmetica viene calcolata semplicemente sommando i valori nel set di dati e dividendo per il numero di valori.

Supponiamo che i prezzi di chiusura di Microsoft (MSFT) negli ultimi cinque giorni siano stati 74,01, 74,77, 73,94, 73,61 e 73,40 in dollari USA. La somma dei prezzi totali è $ 369,73 e il prezzo medio o medio del libro di testo sarebbe quindi $ 369,73 / 5 = $ 73,95.

Ma conoscere la media di un set di misurazioni non è sempre sufficiente. A volte, è utile sapere quanta variazione c’è in un insieme di misurazioni. La distanza tra i singoli valori e la media può dare un’idea di quanto le osservazioni oi valori siano adatti al modello di regressione creato.

Ad esempio, se un analista desidera sapere se il prezzo delle azioni di MSFT si muove in tandem con il prezzo di Apple (AAPL), può elencare la serie di osservazioni per il processo di entrambe le azioni per un certo periodo, ad esempio 1, 2, o 10 anni e creare un modello lineare con ciascuna delle osservazioni o misurazioni registrate. Se la relazione tra entrambe le variabili (cioè il prezzo di AAPL e il prezzo di MSFT) non è una linea retta, allora ci sono variazioni nel set di dati che devono essere esaminate.

Nelle statistiche si parla, se la linea nel modello lineare creato non passa attraverso tutte le misurazioni del valore, allora una parte della variabilità che è stata osservata nei prezzi delle azioni è inspiegabile. La somma dei quadrati viene utilizzata per calcolare se esiste una relazione lineare tra due variabili e qualsiasi variabilità inspiegabile viene definita somma dei quadrati residua.

La somma dei quadrati è la somma del quadrato di variazione, dove la variazione è definita come la differenza tra ogni singolo valore e la media. Per determinare la somma dei quadrati, la distanza tra ciascun punto dati e la linea di migliore adattamento viene quadrata e quindi sommata. La linea di migliore adattamento ridurrà al minimo questo valore.

Come calcolare la somma dei quadrati

Ora puoi vedere perché la misurazione è chiamata somma delle deviazioni al quadrato o, in breve, somma dei quadrati. Utilizzando il nostro esempio MSFT sopra, la somma dei quadrati può essere calcolata come:

  • SS = (74,01 – 73,95) 2 + (74,77 – 73,95) 2 + (73,94 – 73,95) 2 + (73,61 – 73,95) 2 + (73,40 – 73,95) 2
  • SS = (0,06) 2 + (0,82) 2 + (-0,01) 2 + (-0,34) 2 + (-0,55) 2
  • SS = 1,0942

Sommando la sola somma delle deviazioni senza squadratura risulterà un numero uguale o prossimo a zero poiché le deviazioni negative compenseranno quasi perfettamente le deviazioni positive. Per ottenere un numero più realistico, la somma delle deviazioni deve essere quadrata. La somma dei quadrati sarà sempre un numero positivo perché il quadrato di qualsiasi numero, sia positivo che negativo, è sempre positivo.

Esempio di come utilizzare la somma dei quadrati

In base ai risultati del calcolo MSFT, una somma elevata di quadrati indica che la maggior parte dei valori è più lontana dalla media e, quindi, c’è una grande variabilità nei dati. Una bassa somma di quadrati si riferisce a una bassa variabilità nell’insieme di osservazioni.

Nell’esempio sopra, 1.0942 mostra che la variabilità del prezzo delle azioni di MSFT negli ultimi cinque giorni è molto bassa e gli investitori che desiderano investire in azioni caratterizzate da stabilità dei prezzi e bassa volatilità possono optare per MSFT.

Punti chiave

  • La somma dei quadrati misura la deviazione dei punti dati dal valore medio.
  • Un risultato della somma dei quadrati più alto indica un ampio grado di variabilità all’interno del set di dati, mentre un risultato inferiore indica che i dati non variano notevolmente dal valore medio.

Limitazioni nell’utilizzo della somma dei quadrati

Prendere una decisione di investimento su quale azione acquistare richiede molte più osservazioni rispetto a quelle elencate qui. Un analista potrebbe dover lavorare con anni di dati per sapere con maggiore certezza quanto sia alta o bassa la variabilità di un asset. Man mano che più punti dati vengono aggiunti all’insieme, la somma dei quadrati diventa maggiore man mano che i valori saranno più distribuiti.

Le misure di variazione più utilizzate sono la deviazione standard e la varianza. Tuttavia, per calcolare una delle due metriche, è necessario prima calcolare la somma dei quadrati. La varianza è la media della somma dei quadrati (cioè la somma dei quadrati divisa per il numero di osservazioni). La deviazione standard è la radice quadrata della varianza.

Esistono due metodi di analisi di regressione che utilizzano la somma dei quadrati: il metodo dei minimi quadrati lineari e il metodo dei minimi quadrati non lineari. Il metodo dei minimi quadrati si riferisce al fatto che la funzione di regressione riduce al minimo la somma dei quadrati della varianza dai punti dati effettivi. In questo modo, è possibile disegnare una funzione che statisticamente fornisce il miglior adattamento per i dati. Notare che una funzione di regressione può essere lineare (una linea retta) o non lineare (una linea curva).