Quando si adatta una linea retta a un insieme di dati, potresti essere interessato a determinare quanto bene la linea risultante si adatta ai dati. Un modo per farlo è calcola la somma dei quadrati errore (SSE). Questo valore fornisce una misura di quanto la linea di miglior adattamento si avvicina al set di dati. Il SSE è un importante per l'analisi dei dati sperimentali e viene determinato solo attraverso pochi brevi passaggi.
Trova una linea più adatta per modellare i dati utilizzando la regressione. La linea di miglior adattamento ha la forma y = ax + b, dove aeb sono i parametri che devi determinare. Puoi trovare questi parametri usando una semplice analisi di regressione lineare. Ad esempio, supponiamo che la linea di miglior adattamento abbia la forma y = 0.8x + 7.
Utilizzare l'equazione per determinare il valore di ciascun valore y previsto dalla linea di miglior adattamento. Puoi farlo sostituendo ogni valore x nell'equazione della linea. Ad esempio, se x è uguale a 1, sostituendolo nell'equazione y = 0,8x + 7 si ottiene 7,8 per il valore di y.
Determinare la media dei valori previsti dalla linea dell'equazione di miglior adattamento. Puoi farlo sommando tutti i valori y previsti dalle equazioni e dividendo il numero risultante per il numero di valori. Ad esempio, se i valori sono 7,8, 8,6 e 9,4, sommando questi valori si ottiene 25,8 e dividendo questo numero per il numero di valori, in questo caso 3, si ottiene 8,6.
Sottrai ciascuno dei singoli valori dalla media e eleva al quadrato il numero risultante. Nel nostro esempio, se sottraiamo il valore 7,8 dalla media 8,6, il numero risultante è 0,8. La quadratura di questo valore dà 0,64.
Somma tutti i valori al quadrato del passaggio 4. Se applichi le istruzioni nel passaggio 4 a tutti e tre i valori nel nostro esempio, troverai i valori di 0,64, 0 e 0,64. Sommando questi valori si ottiene 1.28. Questa è l'errore della somma dei quadrati.