Jak obliczyć wariancję

Umiejętność obliczenia średniej lub średniej wartości grupy liczb jest ważna w każdym aspekcie życia. Jeśli jesteś profesorem przypisującym oceny literowe do wyników egzaminów i tradycyjnie dajesz ocenę B- do a wynik w środku stawki, musisz wyraźnie wiedzieć, jak wygląda środek stawki liczebnie. Potrzebujesz również sposobu na zidentyfikowanie wyników jako odstających, aby móc określić, kiedy ktoś zasługuje na ocenę A lub A+ (oczywiście poza doskonałymi wynikami), a także, co zasługuje na ocenę niedostateczną.

Z tego i powiązanych powodów, pełne dane dotyczące średnich zawierają informacje o tym, jak ściśle skupione są wyniki w stosunku do średniego wyniku. Ta informacja jest przekazywana za pomocą odchylenie standardowe i w związku z tym zmienność próby statystycznej.

Miary zmienności

Prawie na pewno słyszałeś lub widziałeś termin „średnia” używany w odniesieniu do zestawu liczb lub punktów danych i prawdopodobnie masz pojęcie, na co to przekłada się w języku potocznym. Na przykład, jeśli przeczytasz, że przeciętny wzrost Amerykanki wynosi około 5 stóp i 4 cali, od razu wnioskujesz, że „średni” oznacza „typowy”, a około połowa kobiet w Stanach Zjednoczonych jest wyższa niż ta, podczas gdy około połowa jest krótszy.

Matematycznie, średni i oznaczać są dokładnie tym samym: dodajesz wszystkie wartości w zestawie i dzielisz przez liczbę elementów w zestawie. Na przykład, jeśli grupa 25 punktów w teście zawierającym 10 pytań zawiera się w przedziale od 3 do 10 i sumuje się do 196, średni (średni) wynik wynosi 196/25, czyli 7,84.

Mediana to wartość punktu środkowego w zestawie, liczba, przy której połowa wartości leży powyżej, a połowa poniżej. Zwykle jest zbliżony do średniej (średniej), ale to nie to samo.

Formuła wariancji

Jeśli przyjrzysz się zestawowi 25 wyników, jak te powyżej i zobaczysz prawie nic poza wartościami 7, 8 i 9, intuicyjnie zrozumiałe jest, że średnia powinna wynosić około 8. Ale co, jeśli nie widzisz prawie nic poza punktami 6 i 10? A może pięć punktów 0 i 20 punktów 9 lub 10? Wszystkie te mogą dać taką samą średnią.

Wariancja jest miarą tego, jak szeroko punkty w zestawie danych są rozłożone wokół średniej. Aby ręcznie obliczyć wariancję, bierzesz różnicę arytmetyczną między każdym z punktów danych a średnią, podnieś je do kwadratu, dodaj sumę kwadratów i podziel wynik przez jeden mniej niż liczba punktów danych w próba. Przykład tego znajduje się później. Możesz także używać programów takich jak Excel lub witryn internetowych, takich jak Rapid Tables (zobacz Zasoby dla dodatkowych witryn).

Wariancja jest oznaczona przez σ2, grecka „sigma” z wykładnikiem 2.

Odchylenie standardowe

odchylenie standardowe próbki to po prostu pierwiastek kwadratowy z wariancji. Powodem, dla którego kwadraty są używane podczas obliczania wariancji, jest to, że jeśli po prostu zsumujesz indywidualne różnice między średnią a każdą z nich pojedynczy punkt danych, suma zawsze wynosi zero, ponieważ niektóre z tych różnic są dodatnie, a niektóre ujemne i wzajemnie się znoszą na zewnątrz. Kwadratura każdego terminu eliminuje tę pułapkę.

Wariancja próbki i problem odchylenia standardowego

Załóżmy, że otrzymujesz 10 punktów danych:

4, 7, 10, 5, 7, 6, 9, 8, 5, 9

Znajdź średnią, wariancję i odchylenie standardowe.

Najpierw dodaj razem 10 wartości i podziel przez 10, aby uzyskać średnią (średnią):

70/10 = 7.0

Aby uzyskać wariancję, należy podnieść do kwadratu różnicę między każdym punktem danych a średnią, dodać je do siebie i podzielić wynik przez (10–1) lub 9:

  • 7 - 4 = 3; 32 = 9
  • 7 - 7 = 0; 02 = 0
  • 7 - 10 = -3; (-3)2 = 9.. .

9 + 0 + 9 +... + 4 = 36

σ2= 36/9 = 4.0

Odchylenie standardowe σ to tylko pierwiastek kwadratowy z 4.0 lub 2.0.

  • Dzielić
instagram viewer