Data, särskilt numeriska data, är ett kraftfullt verktyg att ha om du vet vad du ska göra med det; grafer är ett sätt att presentera data eller information på ett organiserat sätt, förutsatt att den typ av data du arbetar med lämpar sig för den typ av analys du behöver.
Ofta är statistiker, instruktörer och andra nyfikna på distribution av data. Till exempel, om data är en uppsättning kemitestresultat, kan du vara nyfiken på skillnaden mellan lägsta och högsta poäng eller ungefär bråkdelen av testpersoner som upptar de olika "slitsarna" mellan dessa ytterligheter.
Frekvensfördelningar är ett kraftfullt verktyg för forskare, särskilt (men inte bara) när data tenderar att kluster runt en genomsnittlig eller genomsnittlig smack-dab mellan höger och vänster sida av grafen. Detta är den välbekanta "klockformade kurvan" av normalt distribueras data.
Vad är en frekvensfördelning?
A frekvensfördelning är en tabell som innehåller intervall för datapunkter, kallade klasser och det totala antalet poster i varje klass. Frekvensen f för varje klass är bara antalet datapunkter den har. Begränsningspunkterna för varje klass kallas den lägre klassgränsen och den övre klassgränsen och
klassbredd är avståndet mellan de lägre (eller högre) gränserna för på varandra följande klasser. Det är inte skillnaden mellan de högre och nedre gränserna för samma klass.De räckvidd är skillnaden mellan de lägsta och högsta värdena i tabellen eller i motsvarande diagram.
När du skapar en grupperad frekvensfördelning börjar du med principen att du ska använda mellan fem och 20 klasser. Dessa klasser måste ha samma bredd, eller span eller numeriskt värde för att distributionen ska vara giltig. När du har bestämt klassbredden (detaljerad nedan) väljer du en startpunkt som är lika med eller mindre än det lägsta värdet i hela uppsättningen.
Allmänna riktlinjer för klassbestämning
Som nämnts, välj mellan fem och 20 klasser; du brukar använda fler klasser för ett större antal datapunkter, ett bredare intervall eller båda. Följ dessutom dessa riktlinjer:
- Klassbredden ska vara ett udda tal. Detta kommer att försäkra att klassens mittpunkter är heltal snarare än decimaltal.
- Varje datavärde måste falla i exakt en klass. Ingen ignoreras och ingen kan ingå i mer än en klass.
- Klasserna måste vara kontinuerliga, vilket innebär att du måste inkludera även de klasser som inte har några poster. (Undantag görs ytterst; om du sitter kvar med en tom första eller en tom klass i sista klass, uteslut den).
- Som sagt måste klasserna vara lika breda. De första och sista klasserna är återigen undantag, eftersom dessa till exempel kan vara vilket värde som helst under ett visst antal i den låga änden eller vilket som helst värde över ett visst antal i den högre
I en korrekt konstruerad frekvensfördelning måste startpunkten plus antalet klasser gånger klassbredden alltid vara större än det maximala värdet.
Exempel på klassbredd
En professor fick studenterna att hålla koll på sina sociala interaktioner i en vecka. Antalet sociala interaktioner under veckan visas i följande grupperade frekvensfördelning. Vad är klassens mittpunkt för varje klass?
Klassfrekvens (f)
- 0–7: 7
- 8–14: 37
- 15–21: 32
- 22–28: 21
- 29–35: 3
Totalt 100
Klassbredden valdes i detta fall till sju. Med tanke på ett intervall på 35 och behovet av ett udda tal för klassbredd får du fem klasser med ett intervall på sju. Mittpunkterna är 4, 11, 18, 25 och 32.