Statistiky jsou o vyvozování závěrů tváří v tvář nejistotě. Kdykoli si vezmete vzorek, nemůžete si být zcela jisti, že váš vzorek skutečně odráží populaci, ze které je čerpán. Statistici se s touto nejistotou zabývají zohledněním faktorů, které by mohly mít vliv na odhad, kvantifikovat jejich nejistotu a provádět statistické testy k vyvození závěrů z těchto nejistých údajů.
Statistici používají intervaly spolehlivosti k určení rozsahu hodnot, které pravděpodobně budou obsahovat „true“ populační průměr na základě vzorku a vyjádřit svou úroveň jistoty v tomto prostřednictvím důvěry úrovně. Zatímco výpočet úrovní spolehlivosti není často užitečný, výpočet intervalů spolehlivosti pro danou úroveň spolehlivosti je velmi užitečná dovednost.
TL; DR (příliš dlouhý; Nečetl)
Vypočítejte interval spolehlivosti pro danou úroveň spolehlivosti vynásobením standardní chyby číslemZskóre pro vámi zvolenou úroveň spolehlivosti. Odečtěte tento výsledek od průměrné hodnoty vzorku, abyste získali dolní mez, a přidejte ji k průměrné hodnotě vzorku, abyste našli horní mez. (Viz zdroje)
Opakujte stejný postup, ale stskóre místoZskóre pro menší vzorky (n < 30).
Najděte úroveň spolehlivosti pro sadu dat tak, že vezmete polovinu velikosti intervalu spolehlivosti, vynásobíte ji druhou odmocninou velikosti vzorku a poté vydělíte směrodatnou odchylkou vzorku. Vyhledejte výsledekZnebotskóre v tabulce najít úroveň.
Rozdíl mezi úrovní spolehlivosti vs. Interval spolehlivosti
Když uvidíte statistiku citovanou, je za ní někdy uveden rozsah se zkratkou „CI“ (pro „interval spolehlivosti“) nebo jednoduše se symbolem plus-minus následovaným číslicí. Například „průměrná hmotnost dospělého muže je 180 liber (CI: 178,14 až 181,86)“ nebo „průměrná hmotnost dospělého muže je 180 ± 1,86 liber. “ Oba vám říkají stejné informace: na základě použitého vzorku průměrná váha muže pravděpodobně spadá do určité míry rozsah. Samotný rozsah se nazývá interval spolehlivosti.
Pokud si chcete být jisti, že rozsah obsahuje skutečnou hodnotu, můžete rozsah rozšířit. To by zvýšilo vaši „úroveň spolehlivosti“ v odhadu, ale rozsah by pokryl více potenciálních vah. Většina statistik (včetně výše uvedené) je uvedena jako 95% intervaly spolehlivosti, což znamená, že existuje 95% šance, že skutečná střední hodnota bude v rozsahu. Můžete také použít 99% úroveň spolehlivosti nebo 90% úroveň spolehlivosti, v závislosti na vašich potřebách.
Výpočet intervalů spolehlivosti nebo úrovní pro velké vzorky
Když používáte statistiku úrovně spolehlivosti, obvykle ji potřebujete k výpočtu intervalu spolehlivosti. To je o něco snazší, pokud máte velký vzorek, například více než 30 lidí, protože můžete použítZskóre pro váš odhad, spíše než složitějšítskóre.
Vezměte nezpracovaná data a vypočítejte průměrnou hodnotu vzorku (jednoduše sečtěte jednotlivé výsledky a vydělte je počtem výsledků). Vypočítejte směrodatnou odchylku odečtením průměru od každého jednotlivého výsledku, abyste našli rozdíl, a poté tento rozdíl umocněte. Sečtěte všechny tyto rozdíly a poté vydělte výsledek velikostí vzorku minus 1. Vezměte druhou odmocninu tohoto výsledku a vyhledejte standardní směrodatnou odchylku (viz zdroje).
Určete interval spolehlivosti nejprve vyhledáním standardní chyby:
SE = \ frac {s} {\ sqrt {n}}
Kdesje vaše standardní směrodatná odchylka anje vaše velikost vzorku. Pokud byste například vzali vzorek 1 000 mužů, abyste zjistili průměrnou váhu muže, a dostali byste standardní směrodatnou odchylku 30, znamenalo by to:
SE = \ frac {30} {\ sqrt {1000}} = 0,95
Chcete-li z toho najít interval spolehlivosti, vyhledejte úroveň spolehlivosti, pro kterou chcete vypočítat interval v aZ- tabulka skóre a vynásobte tuto hodnotu číslemZskóre. Pro 95% úroveň spolehlivosti platíZ-skóre je 1,96. Na příkladu to znamená:
\ text {průměr} \ pm Z \ krát SE = 180 \ text {liber} \ pm1.96 \ krát 0,95 = 180 \ pm1.86 \ text {liber}
Zde je ± 1,86 libry 95% interval spolehlivosti.
Pokud místo toho máte tento bit informací, spolu s velikostí vzorku a směrodatnou odchylkou, můžete vypočítat úroveň spolehlivosti pomocí následujícího vzorce:
Z = 0,5 \ krát {velikost intervalu spolehlivosti} \ krát \ frac {\ sqrt {n}} {s}
Velikost intervalu spolehlivosti je jen dvojnásobek hodnoty ±, takže v příkladu výše víme 0,5krát, což je 1,86. To dává:
Z = 1,86 \ krát \ frac {\ sqrt {1000}} {30} = 1,96
To nám dává hodnotu proZ, kterou si můžete vyhledat v aZ-skóre, kde najdete odpovídající úroveň spolehlivosti.
Výpočet intervalů spolehlivosti pro malé vzorky
U malých vzorků existuje podobný postup pro výpočet intervalu spolehlivosti. Nejprve odečtěte 1 od velikosti vzorku, abyste našli své „stupně volnosti“. V symbolech:
df = n-1
Pro vzorekn= 10, to dávádf = 9.
Najděte svou hodnotu alfa odečtením desítkové verze úrovně spolehlivosti (tj. Procentuální úrovně spolehlivosti děleno 100) od 1 a vydělením výsledku 2 nebo v symbolech:
\ alpha = \ frac {(1 \ text {desetinná úroveň spolehlivosti})} {2}
Takže pro 95% (0,95) hladinu spolehlivosti:
\ alpha = \ frac {(1-0,95)} {2} = 0,025
Vyhledejte svou hodnotu alfa a stupně volnosti v (jednom ocasu)tdistribuční tabulka a výsledek si poznamenejte. Alternativně vynechejte dělení o 2 výše a použijte dvoustrannýthodnota. V tomto příkladu je výsledek 2,262.
Stejně jako v předchozím kroku vypočítejte interval spolehlivosti vynásobením tohoto čísla standardní chybou, která se určí pomocí standardní směrodatné odchylky a velikosti vzorku stejným způsobem. Jediný rozdíl je v tom, že místoZskóre, použijetetskóre.