Błąd. Samo słowo emanuje żalem i wyrzutem sumienia, przynajmniej jeśli jesteś graczem baseballu, egzaminatorem lub uczestnikiem quizu. Dla statystyków błędy to po prostu jeszcze jedna rzecz, którą należy śledzić w ramach opisu stanowiska — o ile oczywiście nie chodzi o błędy samego statystyka.
Terminmargines błędujest powszechny w języku potocznym, w tym w wielu artykułach medialnych o tematyce naukowej lub sondażach opinii. Jest to sposób zgłaszania wiarygodności wartości (np. odsetka dorosłych, którzy faworyzują konkretnego kandydata politycznego). Opiera się na wielu czynnikach, w tym wielkości pobranej próby i zakładanej wartości średniej populacji badanej zmiennej.
Aby zrozumieć margines błędu, musisz najpierw mieć praktyczną wiedzę na temat podstawowych statystyk, w szczególności koncepcji rozkładu normalnego. Czytając, zwróć szczególną uwagę na różnicę między średnią próbki a średnią dużej liczby tych średnich próbek.
Statystyki populacji: podstawy Pop
Jeśli masz próbkę danych, taką jak wagi 500 losowo wybranych 15-letnich chłopców w Szwecji, możesz oblicz średnią lub średnią, dzieląc sumę poszczególnych wag przez liczbę punktów danych (500). Odchylenie standardowe tej próby jest miarą rozrzutu danych dotyczących tej średniej, pokazującą, jak szeroko wartości (takie jak wagi) mają tendencję do grupowania.
- Co najprawdopodobniej ma większe odchylenie standardowe: średnia waga w funtach wspomnianych szwedzkich chłopców lub całkowita liczba lat szkoły, które ukończyli w wieku 15 lat?
Centralne twierdzenie granicznestatystyk mówi, że w dowolnej próbie pobranej z populacji o wartości danej zmiennej, która ma rozkład normalny wokół średniej, to średniaśrodków próbekpobrane z tej populacji zbliżą się do średniej populacji, ponieważ średnia liczba próbek rośnie w kierunku nieskończoności.
W statystyce próbki średnia i odchylenie standardowe są reprezentowane przez x̄ i s, które są prawdziwymi statystykami, a nieμi σ, które w rzeczywistości sąparametryi nie można go poznać ze 100-procentową pewnością. Poniższy przykład ilustruje różnicę, która pojawia się przy obliczaniu marginesów błędu.
Jeśli wielokrotnie badałeś wzrost 100 losowo wybranych kobiet w dużym kraju, w którym średni wzrost dorosłej kobiety wynosi 64,25 cala, z odchylenie standardowe 2 cale, możesz zebrać kolejne wartości x̄ 63,7, 64,9, 64,5 itd., z odchyleniami standardowymi s 1,7, 2,3, 2,2 cala i lubić. W każdej sprawie,μ iσ pozostają niezmienione i wynoszą odpowiednio 64,25 i 2 cale.
\text{Średnia populacji } = \mu \newline \text{Odchylenie standardowe populacji }= \sigma \newline \text{Wariancja populacji}= \sigma^2 \newline \text{Średnia próbki}= \bar{x} \newline \text{Odchylenie standardowe próbki }= s\newline \text{Wariancja próbki }= s^2
Co to jest przedział ufności?
Jeśli losowo wybrałeś jedną osobę i zadałeś jej 20-pytaniowy quiz naukowy, byłoby głupotą używać wyniku jako średniej dla większej populacji osób przystępujących do testu. Jeśli jednak znany jest średni wynik dla populacji dla tego quizu, wtedy moc statystyki może być wykorzystana do: określ pewność, jaką możesz mieć, że zakres wartości (w tym przypadku wyniki) będzie zawierał wartości tej pojedynczej osoby wynik.
ZAprzedział ufnościto zakres wartości, który odpowiada oczekiwanemu procentowi takich przedziałów, które będą zawierały wartość jeśli duża liczba takich przedziałów jest tworzona losowo, używając tych samych liczebności prób z tego samego większego populacja. Zawsze jesttrochęniepewne, czy określony przedział ufności mniejszy niż 100 procent rzeczywiście zawiera prawdziwą wartość parametru; w większości przypadków stosuje się przedział ufności 95 procent.
Przykład: Załóżmy, że uczestnik quizu uzyskał wynik 22/25 (88 procent), a średni wynik w populacji wynosi 53 procent z odchyleniem standardowym ± 10 procent. Czy istnieje sposób, aby dowiedzieć się, że ten wynik odnosi się do średniej w kategoriach percentylowych i jaki jest margines błędu?
Jakie są wartości krytyczne?
Wartości krytyczne są oparte na danych o rozkładzie normalnym, które były omawiane tutaj do tej pory. Są to dane, które są symetrycznie rozłożone wokół centralnej średniej, takiej jak wzrost i waga. Inne zmienne populacyjne, takie jak wiek, nie wykazują rozkładów normalnych.
Wartości krytyczne są używane do określenia przedziałów ufności. Opierają się one na zasadzie, że średnie populacji są w rzeczywistości bardzo, bardzo wiarygodnymi szacunkami zebranymi z praktycznie nieograniczonej liczby próbek. Są one oznaczone przezz, a do pracy z nimi potrzebny jest wykres podobny do tego w Zasobie, ponieważ wybrany przedział ufności określa ich wartość.
Jeden powód, którego potrzebujeszz-wartości (lubz-scores) ma na celu określenie marginesu błędu średniej próbki lub średniej populacji. Te obliczenia są obsługiwane w nieco inny sposób.
Błąd standardowy a Odchylenie standardowe
Odchylenie standardowe próbki s różni się dla każdej próbki; błąd standardowy średniej liczby próbek zależy od odchylenia standardowego populacji σ i wyraża się wyrażeniem:
\text{Błąd standardowy} = \dfrac{\sigma}{\sqrt{n}} \newline
Margines Formuły Błędu
Kontynuując powyższą dyskusję na temat wyników Z, są one wyprowadzane z wybranego przedziału ufności. Aby użyć powiązanej tabeli, przekształć procent przedziału ufności na ułamek dziesiętny, odejmij to ilość od 1,0 i podzielić wynik przez dwa (ponieważ przedział ufności jest symetryczny względem oznaczać).
Wielkość (1 − CI), gdzie CI jest przedziałem ufności wyrażonym w notacji dziesiętnej, nazywa siępoziom istotnościi jest oznaczony przez α. Na przykład, gdy CI = 95% = 0,95,α = 1.0 − 0.05 = 0.05.
Gdy uzyskasz tę wartość, znajdziesz miejsce, w którym pojawia się w tabeli z-score i określiszz-score, odnotowując wartości dla odpowiedniego wiersza i kolumny. Na przykład, kiedyα= 0,05, odwołujesz się do wartości 0,05/2 = 0,025 w tabeli, zwanejZ(α/2), zobacz, że jest powiązany zz-score -1,9 (wartość wiersza) minus kolejne 0,06 (wartość kolumny), aby dać az-wynik -1,96.
Margines obliczeń błędów
Teraz jesteś gotowy do wykonania obliczeń marginesu błędu. Jak już wspomniano, są one wykonywane różnie w zależności od tego, jaki jest margines błędu.
Wzór na margines błędu dla średniej z próby to:
E = Z_{(α/2)} × s
a dla marginesu błędu średniej populacji wynosi:
E = Z_{(α/2)} × \frac{σ}{\sqrt{n}} = Z_{(α/2)} × \text{błąd standardowy}
Przykład: Załóżmy, że wiesz, że liczba programów online, które ludzie oglądają w Twoim mieście w ciągu roku, ma rozkład normalny z odchyleniem standardowym populacji σ równym 3,2 programów. Pobrano losową próbę 29 mieszczan, a średnia z próby wynosi 14,6 wystaw/rok. Przy zastosowaniu 90% przedziału ufności, jaki jest margines błędu?
Widzisz, że do rozwiązania tego problemu użyjesz drugiego z powyższych dwóch równań, ponieważ dane jest σ. Najpierw oblicz błąd standardowy σ/√n:
\frac{3,6}{\sqrt{29}}= 0,67
Teraz używasz wartościZ(α/2) dlaα= 0.10. Znajdując wartość 0,050 na stole, widzisz, że odpowiada to wartościzod -1,64 do -1,65, więc możesz użyć -1,645. Za margines błędumi, to daje:
E = (−1,645)(0,67) = −1,10
Pamiętaj, że mogłeś zacząć od pozytywuz-score strony tabeli i znalazł wartość odpowiadającą 0,90 zamiast 0,10, ponieważ reprezentuje to odpowiedni punkt krytyczny po przeciwnej (prawej) stronie wykresu. To by dałomi= 1,10, co ma sens, ponieważ błąd jest taki sam po obu stronach średniej.
Podsumowując, liczba programów, które w ciągu roku upomina się w próbie 29 sąsiadów, wynosi 14,6 ± 1,10 programów rocznie.