Provstorlek är en räkning av enskilda prover eller observationer i någon statistisk miljö, såsom ett vetenskapligt experiment eller en opinionsundersökning. Även om ett relativt enkelt koncept är valet av provstorlek en avgörande bestämning för ett projekt. Ett för litet urval ger otillförlitliga resultat, medan ett alltför stort urval kräver mycket tid och resurser.
TL; DR (för lång; Läste inte)
Provstorleken är en direkt räkning av antalet uppmätta prover eller observationer som görs.
Definitionen av provstorlek
Provstorlek mäter antalet enskilda mätprover eller observationer som används i en undersökning eller experiment. Om du till exempel testar 100 jordprover för bevis på surt regn är din provstorlek 100. Om en onlineundersökning returnerade 30 500 ifyllda frågeformulär är din provstorlek 30 500. I statistik, provstorlek representeras generellt av variabeln "n".
Beräkning av provstorlek
För att bestämma provstorleken som behövs för ett experiment eller en undersökning tar forskare hänsyn till ett antal önskade faktorer. Först,
den totala storleken på den befolkning som studeras måste övervägas - en undersökning som till exempel vill dra slutsatser om hela staten New York kommer att behöva en mycket större urvalsstorlek än en specifikt inriktad på Rochester. Forskare måste också överväga felmarginal, tillförlitligheten att de insamlade uppgifterna i allmänhet är korrekta; och den självförtroendenivå, sannolikheten att din felmarginal är korrekt. Slutligen måste forskare ta hänsyn till standardavvikelse de förväntar sig att se i uppgifterna. Standardavvikelsen mäter hur mycket enskilda datadelar som skiljer sig från de genomsnittliga uppmätta uppgifterna. Till exempel kommer jordprover från en park sannolikt att ha en mycket mindre standardavvikelse i kvävehalten än jordar som samlats in från hela länet.Faror med liten provstorlek
Stora urvalsstorlekar behövs för att en statistik ska vara korrekt och tillförlitlig, särskilt om dess resultat ska extrapoleras till en större population eller grupp av data. Anta att du genomförde en undersökning om träning och intervjuade fem personer, varav två sa att de kör ett maraton årligen. Om du tar den här undersökningen för att representera befolkningen i landet som helhet, enligt din forskning, 40 procent av människor springer minst ett maraton årligen - ett oväntat högt procentsats. Ju mindre din provstorlek, desto mer sannolikt avvikare - ovanliga bitar av data - är för att vrida dina resultat.
Provstorlek och felmarginal
Urvalsstorleken för en statistisk undersökning är också direkt relaterad till undersökningens felmarginal. Felmarginal är en procentsats som uttrycker sannolikheten för att de mottagna uppgifterna är korrekta. I en undersökning om religiösa övertygelser är till exempel felmarginalen andelen svarare som kan förväntas ge samma svar om undersökningen upprepades. För att bestämma felmarginalen, dela 1 med kvadratroten av provstorleken och multiplicera sedan med 100 för att få en procentsats. Till exempel kommer en urvalsstorlek på 2400 att ha en felmarginal på 2,04 procent.