Variantie berekenen

Het vermogen om de gemiddelde of gemiddelde waarde van een groep getallen te berekenen is belangrijk in elk aspect van het leven. Als je een professor bent die lettercijfers toekent aan examenscores en traditioneel een cijfer van B- geeft aan a midden van het peloton, dan moet je duidelijk weten hoe het midden van het peloton eruitziet numeriek. Je hebt ook een manier nodig om scores als uitbijters te identificeren, zodat je kunt bepalen wanneer iemand een A of A+ verdient (uiteraard buiten perfecte scores) en wat een onvoldoende verdient.

Om deze en aanverwante redenen bevatten volledige gegevens over gemiddelden informatie over hoe dicht de scores in het algemeen rond de gemiddelde score zijn geclusterd. Deze informatie wordt overgebracht met behulp van standaardafwijking en, daarmee verband houdend, de variantie van een statistische steekproef.

Maatregelen van variabiliteit

Je hebt vrijwel zeker de term 'gemiddeld' gehoord of gezien die wordt gebruikt met betrekking tot een reeks getallen of gegevenspunten, en je hebt waarschijnlijk een idee van wat het in de dagelijkse taal betekent. Als je bijvoorbeeld leest dat de gemiddelde lengte van een Amerikaanse vrouw ongeveer 1,75 meter is, concludeer je meteen dat "gemiddeld" betekent "typisch", en dat ongeveer de helft van de vrouwen in de Verenigde Staten langer is dan dit, terwijl ongeveer de helft korter.

wiskundig, gemiddelde en gemeen zijn precies hetzelfde: u telt alle waarden in een set op en deelt deze door het aantal items in de set. Als bijvoorbeeld een groep van 25 scores op een test van 10 vragen varieert van 3 tot 10 en optellen tot 196, is de gemiddelde (gemiddelde) score 196/25 of 7,84.

De mediaan is de middelpuntwaarde in een set, het aantal dat de helft van de waarden boven en de helft van de waarden eronder ligt. Het ligt meestal dicht bij het gemiddelde (gemiddelde), maar is niet hetzelfde.

Variantie formule

Als je een reeks van 25 scores zoals hierboven bekijkt en bijna niets anders ziet dan waarden van 7, 8 en 9, is het intuïtief logisch dat het gemiddelde rond de 8 moet liggen. Maar wat als je bijna niets anders ziet dan scores van 6 en 10? Of vijf scores van 0 en 20 scores van 9 of 10? Deze kunnen allemaal hetzelfde gemiddelde opleveren.

Variantie is een maatstaf voor hoe wijd de punten in een dataset zijn verspreid over het gemiddelde. Om de variantie met de hand te berekenen, neem je het rekenkundige verschil tussen elk van de gegevenspunten en het gemiddelde, kwadrateren, voeg de som van de kwadraten toe en deel het resultaat door één minder dan het aantal gegevenspunten in de monster. Een voorbeeld hiervan volgt verderop. U kunt ook programma's zoals Excel of websites zoals Rapid Tables gebruiken (zie bronnen voor extra sites).

De variantie wordt aangegeven met de σ2, een Griekse "sigma" met een exponent van 2.

Standaardafwijking

De standaardafwijking van een steekproef is gewoon de vierkantswortel van de variantie. De reden waarom vierkanten worden gebruikt bij het berekenen van variantie is dat als je gewoon de individuele verschillen tussen het gemiddelde en elk bij elkaar optelt individueel datapunt, de som is altijd nul omdat sommige van deze verschillen positief zijn en sommige negatief, en ze heffen elkaar op uit. Door elke term te kwadrateren, wordt deze valkuil geëlimineerd.

Voorbeeldvariantie en standaarddeviatieprobleem

Stel dat u de 10 gegevenspunten krijgt:

4, 7, 10, 5, 7, 6, 9, 8, 5, 9

Zoek het gemiddelde, de variantie en de standaarddeviatie.

Voeg eerst de 10 waarden bij elkaar en deel deze door 10 om het gemiddelde (gemiddelde) te krijgen:

70/10 = 7.0

Om de variantie te krijgen, kwadrateert u het verschil tussen elk gegevenspunt en het gemiddelde, telt u deze bij elkaar op en deelt u het resultaat door (10 - 1) of 9:

  • 7 - 4 = 3; 32 = 9
  • 7 - 7 = 0; 02 = 0
  • 7 - 10 = -3; (-3)2 = 9.. .

9 + 0 + 9 +... + 4 = 36

σ2= 36/9 = 4.0

De standaarddeviatie σ is gewoon de vierkantswortel van 4,0 of 2,0.

  • Delen
instagram viewer