Suma kwadratów jest narzędziem używanym przez statystyków i naukowców do oceny ogólnej wariancji zbioru danych od jego średniej. Duża suma kwadratów oznacza dużą wariancję, co oznacza, że poszczególne odczyty znacznie odbiegają od średniej.
Ta informacja jest przydatna w wielu sytuacjach. Na przykład duża rozbieżność w odczytach ciśnienia krwi w określonym czasie może wskazywać na niestabilność układu sercowo-naczyniowego, która wymaga pomocy medycznej. Dla doradców finansowych duża rozbieżność w dziennych wartościach akcji oznacza niestabilność rynku i wyższe ryzyko dla inwestorów. Kiedy wyciągniesz pierwiastek kwadratowy z sumy kwadratów, otrzymasz odchylenie standardowe, jeszcze bardziej użyteczną liczbę.
Znalezienie sumy kwadratów
Liczba pomiarów to wielkość próbki. Oznacz to literą „nie."
Średnia jest średnią arytmetyczną wszystkich pomiarów. Aby go znaleźć, dodajesz wszystkie pomiary i dzielisz przez wielkość próbki,nie.
Liczby większe niż średnia dają liczbę ujemną, ale to nie ma znaczenia. Ten krok daje serię n indywidualnych odchyleń od średniej.
Kiedy podniesiesz liczbę do kwadratu, wynik jest zawsze dodatni. Masz teraz serię n liczb dodatnich.
Ten ostatni krok daje sumę kwadratów. Masz teraz standardową wariancję wielkości próbki.
Odchylenie standardowe
Statystycy i naukowcy zwykle dodają jeszcze jeden krok, aby uzyskać liczbę, która ma te same jednostki, co każdy z pomiarów. Krokiem jest wyciągnięcie pierwiastka kwadratowego z sumy kwadratów. Ta liczba jest odchyleniem standardowym i oznacza średnią wartość odchylenia każdego pomiaru od średniej. Liczby poza odchyleniem standardowym są albo niezwykle wysokie, albo niezwykle niskie.
Przykład
Załóżmy, że mierzysz temperaturę zewnętrzną każdego ranka przez tydzień, aby zorientować się, jak bardzo zmienia się temperatura w Twojej okolicy. Otrzymasz serię temperatur w stopniach Fahrenheita, która wygląda tak:
Pon: 55, Wt: 62, Śr: 45, Czw: 32, Pt: 50, Sob: 57, Niedz: 54
Aby obliczyć średnią temperaturę, dodaj pomiary i podziel przez zarejestrowaną liczbę, która wynosi 7. Uważasz, że średnia to 50,7 stopnia.
Teraz oblicz poszczególne odchylenia od średniej. Ta seria to:
50.7 - 55 = -4.3 \\ 50.7 -62 = −11.3 \\ 50.7 -45 = 5.7 \\ 50.7 - 32 = 18.7 \\ 50.7 -50 = 0.7 \\ 50.7 - 57 = −6.3 \\ 50.7 - 54 = −2.3
Kwadrat każda liczba:
-4.3^2 = 18.49 \\ −11.3^2 = 127.69 \\ 5.7^2 = 32.49\\ 18.7^2 = 349.69 \\ 0.7^2 = 0.49\\ −6.3^2 = 39.69 \\ −2.3^2 = 5.29
Dodaj liczby i podziel przez (nie− 1) = 6, aby uzyskać 95,64. Jest to suma kwadratów dla tej serii pomiarów. Odchylenie standardowe to pierwiastek kwadratowy z tej liczby, czyli 9,78 stopnia Fahrenheita.
To dość duża liczba, co świadczy o tym, że w ciągu tygodnia temperatury znacznie się różniły. Mówi również, że wtorek był niezwykle ciepły, podczas gdy czwartek był niezwykle zimny. Prawdopodobnie mógłbyś to poczuć, ale teraz masz dowód statystyczny.