18 Aprile 2022 0:12

Analisi dei componenti principali e curve di rendimento

L’analisi delle componenti principali (ACP) è una tecnica statistica per la riduzione delle dimensioni. In pratica, si utilizza quando all’interno di un dataset ci sono molte variabili correlate tra di loro e si vorrebbe ridurne il numero perdendo la minore quantità di informazione possibile.

Quando usare la PCA?

Nella PCA, l’idea è quella di trovare un nuovo sistema di riferimento in modo da massimizzare la varianza delle variabili rappresentate lungo gli assi. La varianza totale delle variabili viene suddivisa in un numero di variabili uguali a quello di partenza, ma il cui numero può essere ridotto.

Cosa sono i Loadings?

I loading sono i coefficienti applicati alle variabili originarie per determinare le componenti principali. … Anche una rappresentazione grafica dei valori di PCA tramite lo scatterplot dei loading può aiutare a “dare un nome” alle PC.

Qual è lo scopo di un analisi fattoriale?

Obiettivo dell’analisi fattoriale

L’obiettivo di questa analisi è capire se queste variabili misurabili sono effettivamente adatte a spiegare un determinato concetto che per sua natura non può essere direttamente misurato.

Cosa misura l Autovalore nell ACP?

Abbiamo già detto che l’autovalore è il risultato di una combinazione lineare delle variabili originarie in grado di riprodurre una data quota della varianza originaria e che i pesi componenziali elevati al quadrato esprimono la quota di varianza lorda in comune tra una variabile e una componente.

Come si calcola la varianza spiegata?

Varianza spiegata = Devianza spiegata / N. Più grande è questa quantità e migliore sarà il modello che sto applicando.

Che cosa è la varianza?

La varianza identifica la dispersione dei valori della variabile X attorno al valor medio. Tanto più piccola è la varianza, tanto più i valori della variabile sono concentrati attorno al valor medio.

Come si calcola il coefficiente di determinazione?

Una volta ottenuto r, possiamo calcolare r2 (r-quadrato), semplicemente elevando r al quadrato. r2 viene detto anche coefficiente di determinazione ed è un indice ricco di significato, in quanto esprime la variabilità nella variabile dipendente spiegata dalla variabile indipendente.