Dopasowując linię prostą do zestawu danych, możesz być zainteresowany określeniem, jak dobrze wynikowa linia pasuje do danych. Jednym ze sposobów na to jest: oblicz sumę kwadratów błąd (SSE). Ta wartość stanowi miarę tego, jak dobrze linia najlepszego dopasowania przybliża zestaw danych. SSE jest ważne dla analizy danych eksperymentalnych i jest określane tylko w kilku krótkich krokach.
Znajdź linię najlepszego dopasowania do modelowania danych za pomocą regresji. Linia najlepszego dopasowania ma postać y = ax + b, gdzie a i b to parametry, które należy określić. Możesz znaleźć te parametry za pomocą prostej analizy regresji liniowej. Na przykład załóżmy, że linia najlepszego dopasowania ma postać y = 0,8x + 7.
Użyj równania, aby określić wartość każdej wartości y przewidywanej przez linię najlepszego dopasowania. Możesz to zrobić, podstawiając każdą wartość x do równania linii. Na przykład, jeśli x jest równe 1, zastąpienie tego równaniem y = 0,8x + 7 daje 7,8 dla wartości y.
Określ średnią wartości przewidywanych z linii najlepszego dopasowania równania. Możesz to zrobić, sumując wszystkie wartości y przewidywane na podstawie równań i dzieląc wynikową liczbę przez liczbę wartości. Na przykład, jeśli wartości wynoszą 7,8, 8,6 i 9,4, zsumowanie tych wartości daje 25,8, a podzielenie tej liczby przez liczbę wartości, w tym przypadku 3, daje 8,6.
Odejmij każdą z poszczególnych wartości od średniej i podnieś do kwadratu uzyskaną liczbę. W naszym przykładzie, jeśli odejmiemy wartość 7,8 od średniej 8,6, wynikowa liczba to 0,8. Podniesienie tej wartości do kwadratu daje 0,64.
Zsumuj wszystkie kwadraty wartości z kroku 4. Jeśli zastosujesz instrukcje z kroku 4 do wszystkich trzech wartości w naszym przykładzie, otrzymasz wartości 0,64, 0 i 0,64. Zsumowanie tych wartości daje 1,28. To jest suma błędów kwadratów.