Размерът на пробата е броят на отделните проби или наблюдения във всяка статистическа обстановка, като научен експеримент или проучване на общественото мнение. Въпреки че е относително ясна концепция, изборът на размер на извадката е критично определящ за даден проект. Твърде малката извадка дава ненадеждни резултати, докато прекалено голямата извадка изисква много време и ресурси.
TL; DR (твърде дълго; Не прочетох)
Размерът на пробата е пряк брой на измерваните проби или на направените наблюдения.
Определението за размера на извадката
Размерът на пробата измерва броя на отделните измервани проби или наблюденията, използвани при проучване или експеримент. Например, ако тествате 100 проби от почвата за наличие на киселинни дъждове, размерът на пробата ви е 100. Ако онлайн проучване върне 30 500 попълнени въпросника, размерът на извадката ви е 30 500. В статистиката размерът на извадката обикновено се представя от променливата "n".
Изчисляване на размера на извадката
За да определят размера на извадката, необходим за експеримент или проучване, изследователите вземат предвид редица желани фактори. Първо,
общият размер на изследваното население трябва да се обмисли - проучване, което се стреми да направи заключения за целия щата Ню Йорк, например, ще се нуждае от много по-голям размер на извадката от този, специално фокусиран върху Рочестър. Изследователите също ще трябва да вземат предвид граница на грешка, надеждността, че събраните данни обикновено са точни; и ниво на увереност, вероятността грешката ви да е точна. И накрая, изследователите трябва да вземат предвид стандартно отклонение те очакват да видят в данните. Стандартното отклонение измерва колко отделни части от данни се различават от средните измерени данни. Например, почвените проби от един парк вероятно ще имат много по-малко стандартно отклонение в съдържанието на азот от почвите, събрани от цял окръг.Опасности от малък размер на извадката
Необходими са големи размери на извадката, за да бъде статистиката точна и надеждна, особено ако нейните констатации трябва да бъдат екстраполирани на по-голяма популация или група данни. Да кажем, че провеждате проучване за упражненията и сте интервюирали пет души, двама от които са казали, че провеждат маратон годишно. Ако вземете това проучване, за да представите населението на страната като цяло, тогава според според вашето изследване 40 процента от хората изминават поне един маратон годишно - неочаквано висок процент. Колкото по-малък е размерът на извадката ви, толкова по-вероятно е отклонения - необичайни данни - да изкривят вашите констатации.
Размер на пробата и граница на грешка
Размерът на извадката от статистическо проучване също е пряко свързан с допуснатата грешка в изследването. Допустима грешка е процент, който изразява вероятността получените данни да са точни. Например, в проучване за религиозните вярвания, допустимата грешка е процентът на отговорилите, от които може да се очаква да дадат същия отговор, ако проучването е било повторено. За да определите граница на грешка, разделете 1 на квадратния корен от размера на извадката и след това умножете по 100, за да получите процент. Например, размер на извадката от 2400 ще има граница на грешка от 2,04%.