Statistieken gebruiken om op te vallen op de wetenschapsbeurs

Het winnen van de wetenschapsbeurs betekent opvallen tussen de concurrentie.

Begrijp ons niet verkeerd, het creëren van een geweldige baking soda-vulkaan kan een paar hoofden doen draaien. Maar je moet iets robuusters doen als je de hoofdprijs wilt winnen, of het nu op je school is of voor de Google Science Fair.

Naast het hebben van een verstandig en goed opgezet experiment, is een van de belangrijkste dingen wanneer u een definitieve conclusie probeert te trekken, het nauwkeurig analyseren van uw resultaten. Hoewel je het misschien niet wilt horen, is dit niet van de meeste mensen favoriete onderdeel van het doen van wetenschap - dit betekent dat je wat basisstatistieken moet doen om te zien of er verschillen zijn die je waarneemt statistisch significant of mogelijk gewoon door toeval.

Maar maak je geen zorgen, het uitvoeren van statistische tests is niet echt moeilijk, maar het is een van de beste manieren om je project echt te laten opvallen bij de jury.

Waarom statistieken gebruiken?

Als je een variabele kiest - bijvoorbeeld lengte, spellingstestscores of het aantal succesvol ontkiemde zaden - zal er altijd enige variatie zijn, alleen door toeval. Er is over het algemeen een verdeling van resultaten rond een centrale waarde. Dit maakt het een beetje moeilijk om echt

weten of een schijnbaar verschil tussen twee resultaten echt belangrijk is, of alleen vanwege deze intrinsieke variatie. Daar gebruik je statistieken voor.

Statistische tests zoals de t-test en Pearson's correlatiecoëfficiënt geven u de tools om de effecten van willekeurig toeval te scheiden van echte effecten die verder gaan dan die welke door toeval worden verwacht. Als je bijvoorbeeld wilt weten of jongens groter zijn dan meisjes, dan vergelijk je niet alleen de gemiddelden (daarover straks meer), je moet kijken hoe de verschillen binnen een groep vergelijken met de verschillen tussen de groepen.

Basis statistische maatregelen Basic

Om statistische tests voor je wetenschapsproject te gebruiken, moet je eerst een aantal basisdingen weten. De eerste is vrij eenvoudig: het concept van een 'gemiddelde', waar de meeste mensen het over hebben als ze 'gemiddeld' zeggen. Dit is gewoon de som van een reeks waarden gedeeld door het aantal waarden. Dus als je vijf testscores hebt: 20, 13, 18, 22 en 16, dan is het gemiddelde:

\begin{uitgelijnd} \text{mean} &= μ = \frac{20 + 13 + 18 + 22 + 16}{5} \\ &= 17,8 \end{uitgelijnd}

Het andere belangrijke concept is de standaardafwijking. Dit is een maatstaf voor de spreiding van waarden rond het gemiddelde en wordt gebruikt als onderdeel van veel statistische tests. De formule voor standaarddeviatie is:

σ = \sqrt{\frac{1}{N} \sum (x_i - μ)^2}

Dit ziet er misschien eng uit, maar het is vrij eenvoudig te berekenen: begin met het berekenen van het gemiddelde μen trek deze waarde vervolgens af van elk van de individuele resultaten (de ( X_ik in de vergelijking), alvorens het antwoord te kwadrateren. Tel nu al deze individuele waarden bij elkaar op, gedeeld door het aantal resultaten (nee), en neem ten slotte de vierkantswortel van het antwoord.

Testen op een verschil: de t-Test

Als u wilt testen op een verschil in een bepaalde variabele tussen twee groepen, bijvoorbeeld de gemiddelde lengte van jongens vs. meisjes of testscores van studenten die een herhalingscursus hebben gevolgd vs. degenen die dat niet hebben - de t-test is een van de meest gebruikte statistische tests. Het gaat ervan uit dat uw gegevens normaal verdeeld zijn (zoals een belcurve - dat zal het waarschijnlijk zijn, dus u hoeft zich hier niet al te veel zorgen over te maken), dat de kwadraten van de standaarddeviaties (de "variantie") van elke groep hetzelfde zijn en dat de waarnemingen onafhankelijk zijn van elk andere.

om een uit te voeren t-test, gebruik je de formule:

t = \frac{μ_1 - μ_2}{\sqrt{\frac{s_p^2}{n_1}+\frac{s_p^2}{n_2}}}

Nu hoeft u alleen maar te weten wat elk van de symbolen betekent. Ten eerste, de μ symbolen zijn de middelen voor de monsters, de nee waarden zijn het aantal resultaten in elke groep, en de zo_p waarden hebben betrekking op de standaarddeviaties van de monsters. Dit is iets ingewikkelder en heeft een aparte formule:

s_p^2 = \frac{(n_1 - 1)σ_1^2 + (n_2 - 1)σ_2^2}{n_1+n_2 - 2}

Het is over het algemeen gemakkelijker om dit in stukjes te berekenen, te beginnen met de zo_p² waarde, en plaats de waarde in de vergelijking voor t. De laatste stap is het opzoeken van het resultaat waarvoor je krijgt t in een tabel (zie bronnen) voor het juiste significantieniveau, dat meestal 0,95 is (als u test op een verschil in beide richtingen, d.w.z. hoger en lager, gebruik dan ofwel een tabel voor "tweezijdige" test of gebruik de 0,975 waarde). U moet de rij controleren op uw aantal vrijheidsgraden (uw totale steekproefomvang minus 2), en als uw t waarde (negeer eventuele mintekens) hoger is dan de waarde in de tabel, heb je een significant verschil gevonden.

Dit is natuurlijk nog maar het begin: wat doe je met het resultaat als je het hebt gevonden? Het volgende deel van dit artikel gaat dieper in op het interpreteren van uw resultaten.

Statistieken gebruiken om op te vallen op de wetenschapsbeurs

Waarom statistieken gebruiken?

Basis statistische maatregelen Basic

Testen op een verschil: de t-Test

CATEGORIEËN

Het nieuwe klimaatpanel van het Witte Huis van president Trump bevat een klimaatontkenner

March Madness 2019: wat ik vroeg, liefhad en leerde

Waarom het voorspellen van maart-waanzin zo uitdagend is?

Statistieken gebruiken om op te vallen op de wetenschapsbeurs

Waarom statistieken gebruiken?

Basis statistische maatregelen Basic

Testen op een verschil: de t-Test

ABONNEER

CATEGORIEËN

Het nieuwe klimaatpanel van het Witte Huis van president Trump bevat een klimaatontkenner

March Madness 2019: wat ik vroeg, liefhad en leerde

Waarom het voorspellen van maart-waanzin zo uitdagend is?