Veel universitaire programma's vereisen statistieken. Een belangrijk concept dat in een typische statistiekklasse wordt gepresenteerd, is de normale verdeling van gegevens of een klokkromme. Als u begrijpt hoe u een reeks gegevens moet interpreteren die in een natuurlijke verdeling valt, is het mogelijk om wetenschappelijke studies te begrijpen. Verkrijg een goed begrip van de belcurve, het gemiddelde, de standaarddeviaties en hun relatie tot percentielen om vertrouwd te raken met de taal van wetenschappelijk onderzoek.
Normale verdeling en de klokcurve
Wanneer veel soorten natuurlijk voorkomende gegevens, zoals lengte, intelligentiequotiënten en bloeddruk, worden uitgezet op een histogram, waarbij de scores op de horizontale as en het voorkomen of aantal scores op de verticale as, vallen de gegevens in een klokvormig patroon dat een klokkromme wordt genoemd. Dit patroon, bekend als een normale verdeling, leent zich voor statistische analyse.
Het gemiddelde en de mediaan
Het gemiddelde gemiddelde van alle scores zal ongeveer in het midden van de belcurve vallen. Het gemiddelde vertegenwoordigt het 50e percentiel, waarbij de helft van alle scores boven die maat ligt en de helft eronder. In normaal verdeelde gegevens zal de mediane score ook in het midden van de belcurve vallen, wat de meeste gevallen vertegenwoordigt.
Standaarddeviaties en variantie
Hoe ver verwijderd van het gemiddelde is een meting? In normaal verdeelde gegevenssets kan een maat worden beschreven als een bepaald aantal standaarddeviaties verwijderd van het gemiddelde. Een standaarddeviatie is een maatstaf voor variantie, of hoe verspreid of verspreid de gegevens van het gemiddelde zijn. Als maatregelen veel variantie hebben, wordt de belcurve gespreid; als ze weinig variantie hebben, is de belcurve smal. Hoe meer standaarddeviaties de score verwijderd is, hoe kleiner de kans dat de score in de natuur voorkomt.
Percentielen en de empirische regel
Bij het bekijken van een klokkromme ligt 68% van de metingen binnen één standaarddeviatie van het gemiddelde. 95% van de verdeling ligt binnen twee standaarddeviaties van het gemiddelde. Maar liefst 99,7% van de maatregelen valt binnen drie standaarddeviaties daarvan. Deze percentages, de empirische regel genoemd, vormen de basis van statistische analyse van natuurlijk voorkomende verschijnselen. Als een medisch onderzoeker bijvoorbeeld vaststelt dat een groep die een bepaald medicijn nam ter controle, cholesterol heeft nu metingen van cholesterol twee standaarddeviaties van het gemiddelde, het is onwaarschijnlijk dat bij toeval voorkomen.