Statistische tests zoals det-test intrinsiek afhankelijk van het concept van een standaarddeviatie. Elke student in statistiek of wetenschap zal regelmatig standaarddeviaties gebruiken en zal moeten begrijpen wat het betekent en hoe het uit een reeks gegevens kan worden gevonden. Gelukkig zijn de originele gegevens het enige dat je nodig hebt, en hoewel de berekeningen vervelend kunnen zijn wanneer je hebt veel gegevens, in deze gevallen moet je functies of spreadsheetgegevens gebruiken om dit te doen automatisch. Het enige wat u hoeft te doen om het sleutelconcept te begrijpen, is echter een eenvoudig voorbeeld zien dat u gemakkelijk met de hand kunt uitwerken. In de kern meet de standaarddeviatie van de steekproef hoeveel de hoeveelheid die je hebt gekozen varieert over de hele populatie op basis van je steekproef.
TL; DR (te lang; niet gelezen)
Gebruik makend vanneesteekproefomvang betekenen,μvoor het gemiddelde van de gegevens,Xik voor elk afzonderlijk datapunt (vanik= 1 totik = nee), en Σ als sommatieteken, de steekproefvariantie (zo2) is:
zo2 = (Σ Xik – μ)2 / (nee − 1)
En de standaarddeviatie van de steekproef is:
zo = √zo2
Standaarddeviatie vs. Voorbeeld standaarddeviatie
Statistiek draait om het maken van schattingen voor hele populaties op basis van kleinere steekproeven uit de populatie, en het verantwoorden van eventuele onzekerheid in de schatting in het proces. Standaarddeviaties kwantificeren de hoeveelheid variatie in de populatie die u bestudeert. Als u de gemiddelde hoogte probeert te vinden, krijgt u een cluster van resultaten rond de gemiddelde (de gemiddelde) waarde, en de standaarddeviatie beschrijft de breedte van het cluster en de verdeling van hoogtes over de populatie.
De standaarddeviatie van de "steekproef" schat de werkelijke standaarddeviatie voor de hele populatie op basis van een kleine steekproef uit de populatie. Meestal kunt u niet de hele populatie in kwestie bemonsteren, dus de standaarddeviatie van de steekproef is vaak de juiste versie om te gebruiken.
De standaarddeviatie van het voorbeeld vinden
U heeft uw resultaten en het aantal (nee) van mensen in uw steekproef. Bereken eerst het gemiddelde van de resultaten (μ) door alle individuele resultaten bij elkaar op te tellen en vervolgens te delen door het aantal metingen.
Als voorbeeld zijn de hartslagen (in slagen per minuut) van vijf mannen en vijf vrouwen:
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
Wat leidt tot een gemiddelde van:
\begin{uitgelijnd} μ &= \frac{71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68}{10} \\ &= \frac{702}{10} \\ &= 70.2 \end{uitgelijnd}
De volgende stap is om het gemiddelde van elke afzonderlijke meting af te trekken en vervolgens het resultaat te kwadrateren. Als voorbeeld voor het eerste gegevenspunt:
(71 - 70.2)^2 = 0.8^2 = 0.64
En voor de tweede:
(83- 70.2)^2 = 12.8^2 = 163.84
U gaat op deze manier door de gegevens en telt deze resultaten vervolgens bij elkaar op. Dus voor de voorbeeldgegevens is de som van deze waarden:
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
In de volgende fase wordt onderscheid gemaakt tussen de standaarddeviatie van de steekproef en de standaarddeviatie van de populatie. Voor de steekproefafwijking deel je dit resultaat door de steekproefomvang min één (nee−1). In ons voorbeeld,nee= 10, dusnee – 1 = 9.
Dit resultaat geeft de steekproefvariantie, aangeduid metzo2, wat voor het voorbeeld is:
s^2 = \frac{353.6}{9} = 39.289
De standaarddeviatie van de steekproef (zo) is gewoon de positieve vierkantswortel van dit getal:
s = \sqrt{39.289} = 6.268
Als u de standaarddeviatie van de populatie (σ) het enige verschil is dat je deelt doorneeliever dannee −1.
De hele formule voor de standaarddeviatie van het monster kan worden uitgedrukt met behulp van het sommatiesymbool with, waarbij de som over het hele monster gaat, enXik die de vertegenwoordigenikhet resultaat vannee. De steekproefvariantie is:
s^2 = \frac{(\sum_i x_i - μ)^2}{n - 1}
En de standaarddeviatie van de steekproef is eenvoudig:
s = \sqrt{s^2}
Gemiddelde afwijking vs. Standaardafwijking
De gemiddelde afwijking wijkt iets af van de standaarddeviatie. In plaats van de verschillen tussen het gemiddelde en elke waarde te kwadrateren, neem je gewoon het absolute verschil (negeer eventuele mintekens) en vind je het gemiddelde daarvan. Voor het voorbeeld in de vorige sectie geven de eerste en tweede gegevenspunten (71 en 83):
x_1 - μ = 71 - 70,2 = 0,8 \\ x_2 - μ = 83 - 70,2 = 12,8
Het derde gegevenspunt geeft een negatief resultaat
x_3 - μ = 63 - 70,2 = -7.2
Maar je verwijdert gewoon het minteken en neemt dit als 7,2.
De som van al deze geeft gedeeld doorneegeeft de gemiddelde afwijking. In het voorbeeld:
\begin{uitgelijnd} &\frac{0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2}{10} \\ &= \frac{46.4}{10} \\ &= 4.64 \ einde{uitgelijnd}
Dit wijkt wezenlijk af van de eerder berekende standaarddeviatie, omdat er geen sprake is van vierkanten en wortels.