Statistické testy, jako jet-test skutečně závisí na konceptu směrodatné odchylky. Každý student statistik nebo přírodních věd bude pravidelně používat standardní odchylky a bude muset pochopit, co to znamená a jak ji najít ze souboru údajů. Naštěstí jediné, co potřebujete, jsou původní data, a zatímco výpočty mohou být zdlouhavé, když máte spoustu dat, v těchto případech byste k tomu měli použít funkce nebo data tabulky automaticky. Vše, co musíte udělat, abyste pochopili klíčový koncept, je vidět základní příklad, který můžete snadno vyřešit ručně. Jádro standardní odchylky vzorku měří, do jaké míry se vámi vybrané množství liší v celé populaci na základě vašeho vzorku.
TL; DR (příliš dlouhý; Nečetl)
Použitímnznamenat velikost vzorku,μpro průměr dat,Xi pro každý jednotlivý datový bod (odi= 1 aži = n) a Σ jako součtový znak, rozptyl vzorku (s2) je:
s2 = (Σ Xi – μ)2 / (n − 1)
A standardní směrodatná odchylka je:
s = √s2
Standardní odchylka vs. Ukázková standardní odchylka
Statistiky se točí kolem vytváření odhadů pro celou populaci na základě menších vzorků z populace a zohlednění jakékoli nejistoty v odhadu v tomto procesu. Směrodatné odchylky kvantifikují míru odchylek v populaci, kterou studujete. Pokud se pokoušíte najít průměrnou výšku, získáte shluk výsledků kolem střední (průměrné) hodnoty, a směrodatná odchylka popisuje šířku klastru a rozložení výšek napříč populací.
Směrodatná odchylka „vzorku“ odhaduje skutečnou směrodatnou odchylku pro celou populaci na základě malého vzorku z populace. Většinu času nebudete moci odebrat vzorek celé dotčené populace, takže standardní směrodatná odchylka vzorku je často ta správná verze, kterou lze použít.
Nalezení vzorové standardní odchylky
Potřebujete své výsledky a číslo (n) lidí ve vašem vzorku. Nejprve spočítejte průměr výsledků (μ) sečtením všech jednotlivých výsledků a jejich vydělením počtem měření.
Jako příklad lze uvést srdeční frekvence (v tepech za minutu) pěti mužů a pěti žen:
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
Což vede k průměru:
\ begin {aligned} μ & = \ frac {71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68} {10} \\ & = \ frac {702} {10} \\ & = 70,2 \ end {zarovnáno}
Další fází je odečíst průměr z každého jednotlivého měření a výsledek umocnit na druhou. Jako příklad pro první datový bod:
(71 - 70.2)^2 = 0.8^2 = 0.64
A za druhé:
(83- 70.2)^2 = 12.8^2 = 163.84
Tímto způsobem pokračujete prostřednictvím dat a poté tyto výsledky sečtete. Takže pro ukázková data je součet těchto hodnot:
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
V další fázi se rozlišuje mezi směrodatnou odchylkou vzorku a směrodatnou odchylkou populace. U odchylky vzorku vydělíte tento výsledek velikostí vzorku minus jedna (n−1). V našem příkladun= 10, takžen – 1 = 9.
Tento výsledek dává rozptyl vzorku označenýs2, což je například:
s ^ 2 = \ frac {353.6} {9} = 39,289
Směrodatná odchylka vzorku (s) je pouze kladná druhá odmocnina tohoto čísla:
s = \ sqrt {39,289} = 6,268
Pokud jste počítali směrodatnou odchylku populace (σ) jediný rozdíl je v tom, že vydělítenspíše nežn −1.
Celý vzorec pro směrodatnou odchylku vzorku lze vyjádřit pomocí symbolu součtu Σ, přičemž součet je nad celým vzorkem, aXi zastupujícíivýsledek zn. Rozptyl vzorku je:
s ^ 2 = \ frac {(\ sum_i x_i - μ) ^ 2} {n - 1}
A standardní směrodatná odchylka je jednoduše:
s = \ sqrt {s ^ 2}
Střední odchylka vs. Standardní odchylka
Střední odchylka se mírně liší od standardní odchylky. Namísto vyrovnání rozdílů mezi průměrem a každou hodnotou místo toho vezmete absolutní rozdíl (ignorujete všechny znaménka mínus) a pak zjistíte jejich průměr. V příkladu v předchozí části dává první a druhý datový bod (71 a 83):
x_1 - μ = 71 - 70,2 = 0,8 \\ x_2 - μ = 83 - 70,2 = 12,8
Třetí datový bod dává negativní výsledek
x_3 - μ = 63 - 70,2 = -7,2
Ale stačí odstranit znaménko mínus a vzít to jako 7.2.
Součet všech těchto dávek dělenonudává střední odchylku. V příkladu:
\ begin {aligned} & \ frac {0,8 + 12,8 + 7,2 + 0,2 + 4,8 + 1,2 + 8,2 + 4,8 + 4,2 + 2,2} {10} \\ & = \ frac {46,4} {10} \\ & = 4,64 \ konec {zarovnáno}
To se podstatně liší od směrodatné odchylky vypočítané dříve, protože nezahrnuje čtverce a kořeny.