Uprość porównywanie zbiorów liczb, zwłaszcza dużych zbiorów liczb, przez obliczenie wartości środkowych przy użyciu średniej, mody i mediany. Użyj zakresów i odchyleń standardowych zestawów do zbadania zmienności danych.
Średnia określa średnią wartość zbioru liczb. Rozważmy na przykład zestaw danych zawierający wartości 20, 24, 25, 36, 25, 22, 23.
Aby znaleźć średnią, użyj wzoru: Średnia równa się sumie liczb w zestawie danych podzielonej przez liczbę wartości w zestawie danych. W kategoriach matematycznych:
\text{Średnia}=\frac{\text{suma wszystkich wyrazów}}{\text{ile wyrazów lub wartości w zbiorze}}
Mediana określa punkt środkowy lub średnią wartość zbioru liczb.
Ułóż liczby w kolejności od najmniejszej do największej. Użyj przykładowego zestawu wartości: 20, 24, 25, 36, 25, 22, 23. Ułożony w kolejności zestaw staje się: 20, 22, 23, 24, 25, 25, 36.
Jeśli zbiór liczb ma parzystą liczbę wartości, oblicz średnią z dwóch wartości środkowych. Załóżmy na przykład, że zbiór liczb zawiera wartości 22, 23, 25, 26. Środek leży między 23 a 25. Dodanie 23 i 25 daje 48. Dzielenie 48 przez dwa daje medianę 24.
Tryb identyfikuje najczęściej występującą wartość lub wartości w zestawie danych. W zależności od danych może istnieć jeden lub więcej trybów albo wcale.
Podobnie jak w przypadku znalezienia mediany, uporządkuj zbiór danych od najmniejszego do największego. W zestawie przykładowym uporządkowane wartości to: 20, 22, 23, 24, 25, 25, 36.
Tryb występuje, gdy wartości się powtarzają. W zestawie przykładowym wartość 25 występuje dwukrotnie. Żadne inne liczby się nie powtarzają. Dlatego tryb to wartość 25.
W niektórych zestawach danych występuje więcej niż jeden tryb. Zestaw danych 22, 23, 23, 24, 27, 27, 29 zawiera dwa tryby, po jednym na 23 i 27. Inne zestawy danych mogą mieć więcej niż dwa tryby, mogą mieć tryby z więcej niż dwiema liczbami (jak 23, 23, 24, 24, 24, 28, 29: tryb równa się 24) lub może nie mieć żadnych trybów (jako 21, 23, 24, 25, 26, 27, 29). Tryb może występować w dowolnym miejscu zbioru danych, nie tylko w środku.
Zakres pokazuje matematyczną odległość między najniższą i najwyższą wartością w zestawie danych. Zakres mierzy zmienność zbioru danych. Szeroki zakres wskazuje na większą zmienność danych lub być może pojedynczą wartość odstającą daleko od reszty danych. Wartości odstające mogą przekrzywiać lub przesuwać średnią wartość na tyle, aby wpłynąć na analizę danych.
W zestawie próbek wysoka wartość danych 36 przekracza poprzednią wartość 25 o 11. Ta wartość wydaje się ekstremalna, biorąc pod uwagę inne wartości w zestawie. Wartość 36 może być wartością odstającą.
Odchylenie standardowe mierzy zmienność zbioru danych. Podobnie jak zakres, mniejsze odchylenie standardowe wskazuje na mniejszą zmienność.
Znalezienie odchylenia standardowego wymaga zsumowania kwadratu różnicy między każdym punktem danych a średnią [∑(x − µ)2], dodając wszystkie kwadraty, dzieląc tę sumę przez jeden mniej niż liczba wartości (N− 1), a na koniec obliczenie pierwiastka kwadratowego dywidendy. W jednej formule jest to:
Oblicz średnią, dodając wszystkie wartości punktów danych, a następnie dzieląc je przez liczbę punktów danych. W przykładowym zestawie danych
Podziel sumę 175 przez liczbę punktów danych, 7 lub ,
Następnie odejmij średnią od każdego punktu danych, a następnie podnieś do kwadratu każdą różnicę. Formuła wygląda tak:
gdzie ∑ oznacza sumę,xja reprezentuje każdą wartość zestawu danych iµreprezentuje wartość średnią. Kontynuując przykładowy zestaw, wartości stają się:
20-25=-5 \text{ i } -5^2=25 \\ 24-25=-1 \text{ i } -1^2=1 \\ 25-25=0 \text{ i } 0^ 2=0 \\ 36-25=11 \text{ i } 11^2=121 \\ 25-25=0 \text{ i } 0^2=0 \\ 22-25=-3 \text{ i } -3^2=9 \\ 23- 25=-2 \text{ i } -2^2=4
Podziel sumę kwadratów różnic o jeden mniej niż liczba punktów danych. Przykładowy zestaw danych ma 7 wartości, więcN− 1 równa się 7 − 1 = 6. Suma kwadratów różnic, 160, podzielona przez 6, wynosi około 26,6667.
Oblicz odchylenie standardowe, znajdując pierwiastek kwadratowy z dzielenia przezN− 1. W tym przykładzie pierwiastek kwadratowy z 26,6667 równa się około 5,164. Dlatego odchylenie standardowe wynosi około 5,164.
Odchylenie standardowe pomaga w ocenie danych. Liczby w zbiorze danych, które mieszczą się w obrębie jednego odchylenia standardowego średniej, są częścią zbioru danych. Liczby, które nie mieszczą się w dwóch odchyleniach standardowych, są wartościami ekstremalnymi lub wartościami odstającymi. W zestawie przykładowym wartość 36 leży więcej niż dwa odchylenia standardowe od średniej, więc 36 jest wartością odstającą. Wartości odstające mogą przedstawiać błędne dane lub mogą sugerować nieprzewidziane okoliczności i należy je dokładnie rozważyć podczas interpretacji danych.