Wielkość próby reprezentuje liczbę obserwacji podjętych w celu przeprowadzenia analizy statystycznej. Rozmiary próbek mogą składać się z ludzi, zwierząt, partii żywności, maszyn, baterii lub dowolnej ocenianej populacji.
Próbkowanie losowe
Próbkowanie losowe to metoda, za pomocą której pobierane są losowe próbki z populacji w celu oszacowania informacji o populacji bez stronniczości. Na przykład, jeśli chcesz wiedzieć, jakiego rodzaju ludzie mieszkają w określonym mieście, musisz przeprowadzić wywiad/zmierzyć losowo różne osoby. Jednakże, gdybyś wykorzystał wszystkich z biblioteki, nie miałbyś uczciwej/bezstronnej oceny tego, jaka jest ogólna populacja zamieszkująca miasto, tylko ludzie, którzy chodzą do biblioteki.
Precyzja
Wraz ze wzrostem wielkości próbki szacunki stają się dokładniejsze. Na przykład, jeśli losowo wybraliśmy 10 dorosłych mężczyzn, możemy stwierdzić, że ich średni wzrost wynosi 6 stóp do 3 cali, być może dlatego, że jest koszykarz, który zawyża nasze szacunki. Gdybyśmy jednak zmierzyli dwa miliony dorosłych mężczyzn, mielibyśmy lepszy predyktor średniego wzrostu mężczyzn, ponieważ skrajności zrównoważyłyby się, a prawdziwa średnia przyćmiłaby wszelkie odchylenia od oznaczać.
Przedziały ufności
Kiedy statystyk dokonuje prognozy dotyczącej wyniku, często buduje przedział wokół swoich szacunków. Na przykład, jeśli zmierzymy wagę 100 kobiet, możemy powiedzieć, że jesteśmy w 90 procentach pewni, że prawdziwa, średnia waga kobiet mieści się w przedziale od 103 do 129 funtów. (To oczywiście zależy również od innych czynników, takich jak zmienność pomiarów.) Wraz ze wzrostem wielkości próbki stajemy się bardziej pewni naszych szacunków, a nasze odstępy stają się mniejsze. Na przykład w przypadku miliona kobiet możemy powiedzieć, że jesteśmy w 98 procentach pewni, że prawdziwa, średnia waga kobiet wynosi od 115 do 117 funtów. Innymi słowy, wraz ze wzrostem wielkości próbki, nasza pewność pomiarów wzrasta, a rozmiar naszych przedziałów ufności maleje.
Standardowy błąd
Zmienność jest miarą rozrzutu danych wokół średniej. Odchylenie standardowe to pierwiastek kwadratowy zmienności i pomaga przybliżyć, jaki procent populacji mieści się w zakresie wartości w stosunku do średniej. Wraz ze wzrostem wielkości próby maleje błąd standardowy, który zależy od odchylenia standardowego i wielkości próby. W rezultacie oszacowania zwiększają precyzję, a badania oparte na tych szacunkach są uważane za bardziej wiarygodne (z mniejszym ryzykiem błędu).
Trudności w stosowaniu większych rozmiarów próbek
Większe rozmiary próbek oczywiście dają lepsze, dokładniejsze szacunki dotyczące populacji, ale istnieje kilka problemów z badaczami stosującymi większe próbki. Przede wszystkim znalezienie losowej próby osób chętnych do wypróbowania nowego leku może być trudne. Kiedy to zrobisz, bardziej kosztowne staje się dostarczanie leku większej liczbie osób i monitorowanie większej liczby osób z biegiem czasu. Dodatkowo uzyskanie i utrzymanie większej próbki wymaga więcej wysiłku. Nawet jeśli większe próbki dają dokładniejsze statystyki, dodatkowy koszt i wysiłek nie zawsze są potrzebne, ponieważ mniejsze próbki mogą również dawać znaczące wyniki.