Bij statistiek draait alles om het trekken van conclusies in het licht van onzekerheid. Telkens wanneer u een steekproef neemt, kunt u er niet helemaal zeker van zijn dat uw steekproef echt de populatie weerspiegelt waaruit deze is getrokken. Statistici gaan met deze onzekerheid om door rekening te houden met de factoren die van invloed kunnen zijn op de schatting, het kwantificeren van hun onzekerheid en het uitvoeren van statistische tests om conclusies te trekken uit deze onzekere gegevens.
Statistici gebruiken betrouwbaarheidsintervallen om een reeks waarden te specificeren die waarschijnlijk de "ware" bevatten populatiegemiddelde op basis van een steekproef, en hun mate van zekerheid hierin uitdrukken door middel van vertrouwen niveaus. Hoewel het berekenen van betrouwbaarheidsniveaus niet vaak nuttig is, is het berekenen van betrouwbaarheidsintervallen voor een bepaald betrouwbaarheidsniveau een zeer nuttige vaardigheid.
TL; DR (te lang; niet gelezen)
Bereken een betrouwbaarheidsinterval voor een bepaald betrouwbaarheidsniveau door de standaardfout te vermenigvuldigen met de
Zscore voor het door u gekozen vertrouwensniveau. Trek dit resultaat af van uw steekproefgemiddelde om de ondergrens te krijgen, en voeg het toe aan het steekproefgemiddelde om de bovengrens te vinden. (Zie bronnen)Herhaal hetzelfde proces, maar met detscoren in plaats van deZscore voor kleinere steekproeven (nee < 30).
Vind een betrouwbaarheidsniveau voor een gegevensset door de helft van de grootte van het betrouwbaarheidsinterval te nemen, dit te vermenigvuldigen met de vierkantswortel van de steekproefomvang en vervolgens te delen door de standaarddeviatie van de steekproef. Zoek het resultaat opZoftscore in een tabel om het niveau te vinden.
Het verschil tussen betrouwbaarheidsniveau vs. Betrouwbaarheidsinterval
Wanneer u een statistiek ziet geciteerd, staat er soms een bereik achter, met de afkorting "CI" (voor "betrouwbaarheidsinterval") of gewoon een plus-minteken gevolgd door een cijfer. Bijvoorbeeld: "het gemiddelde gewicht van een volwassen man is 180 pond (BI: 178,14 tot 181,86)" of "het gemiddelde gewicht van een volwassen man is 180 ± 1,86 pond.” Deze vertellen je allebei dezelfde informatie: op basis van het gebruikte monster valt het gemiddelde gewicht van een man waarschijnlijk binnen een bepaalde bereik. Het bereik zelf wordt het betrouwbaarheidsinterval genoemd.
Als je er zo zeker mogelijk van wilt zijn dat het bereik de werkelijke waarde bevat, dan kun je het bereik vergroten. Dit zou uw "betrouwbaarheidsniveau" in de schatting verhogen, maar het bereik zou meer potentiële gewichten dekken. De meeste statistieken (inclusief de hierboven geciteerde) worden gegeven als 95 procent betrouwbaarheidsintervallen, wat betekent dat er een kans van 95 procent is dat de werkelijke gemiddelde waarde binnen het bereik ligt. U kunt ook een betrouwbaarheidsniveau van 99 procent of een betrouwbaarheidsniveau van 90 procent gebruiken, afhankelijk van uw behoeften.
Betrouwbaarheidsintervallen of -niveaus voor grote steekproeven berekenen
Wanneer u een betrouwbaarheidsniveau in statistieken gebruikt, heeft u dit meestal nodig om een betrouwbaarheidsinterval te berekenen. Dit is iets gemakkelijker te doen als je een grote steekproef hebt, bijvoorbeeld meer dan 30 personen, omdat je kunt gebruikenZscore voor uw schatting in plaats van ingewikkeldertscoort.
Neem uw onbewerkte gegevens en bereken het steekproefgemiddelde (tel eenvoudig de afzonderlijke resultaten bij elkaar op en deel deze door het aantal resultaten). Bereken de standaarddeviatie door het gemiddelde van elk afzonderlijk resultaat af te trekken om het verschil te vinden en dit verschil vervolgens te kwadrateren. Tel al deze verschillen bij elkaar op en deel het resultaat vervolgens door de steekproefomvang minus 1. Neem de vierkantswortel van dit resultaat om de standaarddeviatie van de steekproef te vinden (zie bronnen).
Bepaal het betrouwbaarheidsinterval door eerst de standaardfout te vinden:
SE=\frac{s}{\sqrt{n}}
Waarzois de standaarddeviatie van uw steekproef enneeis uw steekproefomvang. Als u bijvoorbeeld een steekproef van 1.000 mannen zou nemen om het gemiddelde gewicht van een man te berekenen, en een steekproefstandaarddeviatie van 30 zou krijgen, zou dit het volgende opleveren:
SE=\frac{30}{\sqrt{1000}}=0.95
Om hieruit het betrouwbaarheidsinterval te vinden, zoekt u het betrouwbaarheidsniveau op waarvoor u het interval wilt berekenen in aZ-scoretabel en vermenigvuldig deze waarde met deZscoren. Voor een betrouwbaarheidsniveau van 95 procent is deZ-score is 1.96. Aan de hand van het voorbeeld betekent dit:
\text{mean }\pm Z\times SE=180\text{ pond }\pm1.96\times 0.95=180\pm1.86\text{ pond}
Hier is ± 1,86 pond het 95 procent betrouwbaarheidsinterval.
Als u in plaats daarvan over dit stukje informatie beschikt, samen met de steekproefomvang en de standaarddeviatie, kunt u het betrouwbaarheidsniveau berekenen met behulp van de volgende formule:
Z=0,5\times{ grootte van betrouwbaarheidsinterval }\times\frac{\sqrt{n}}{s}
De grootte van het betrouwbaarheidsinterval is slechts tweemaal de ± waarde, dus in het bovenstaande voorbeeld weten we dat 0,5 keer dit 1,86 is. Dit geeft:
Z=1,86\times\frac{\sqrt{1000}}{30}=1,96
Dit geeft ons een waarde voorZ, die u kunt opzoeken in eenZ-scoretabel om het bijbehorende betrouwbaarheidsniveau te vinden.
Betrouwbaarheidsintervallen voor kleine steekproeven berekenen
Voor kleine steekproeven is er een soortgelijk proces voor het berekenen van het betrouwbaarheidsinterval. Trek eerst 1 af van uw steekproefomvang om uw 'vrijheidsgraden' te vinden. In symbolen:
df=n-1
Voor een voorbeeldnee= 10, dit geeftdf = 9.
Vind uw alfawaarde door de decimale versie van het betrouwbaarheidsniveau (d.w.z. uw procentuele betrouwbaarheidsniveau gedeeld door 100) af te trekken van 1 en het resultaat te delen door 2, of in symbolen:
\alpha=\frac{(1-\text{ decimaal betrouwbaarheidsniveau})}{2}
Dus voor een betrouwbaarheidsniveau van 95 procent (0,95):
\alpha=\frac{(1-0.95)}{2}=0.025
Zoek je alfawaarde en vrijheidsgraden op in een (één staart)tdistributietabel en noteer het resultaat. Of laat de deling door 2 hierboven weg en gebruik een tweezijdigetwaarde. In dit voorbeeld is het resultaat 2.262.
Bereken net als in de vorige stap het betrouwbaarheidsinterval door dit getal te vermenigvuldigen met de standaardfout, die op dezelfde manier wordt bepaald aan de hand van uw steekproefstandaarddeviatie en steekproefomvang. Het enige verschil is dat in plaats van deZscoren, gebruik je detscoren.