Как да използваме статистика, за да изпъкнем на панаира на науката

Спечелването на научния панаир означава открояване от конкуренцията.

Не ни разбирайте погрешно, създаването на страхотен вулкан сода за хляб може да обърне няколко глави. Но трябва да направите нещо по-стабилно от това, ако искате да вземете най-голямата награда, независимо дали във вашето училище или за Google Science Fair.

Освен че имате разумен и добре проектиран експеримент, едно от най-важните неща, когато се опитвате да направите твърдо заключение, е анализът на вашите резултати точно. Въпреки че може да не искате да го чуете - това не е на повечето хора любим част от правенето на наука - това означава да направите някои основни статистически данни, за да видите дали има някакви разлики, които наблюдавате статистически значим или евентуално само по случайност.

Не се притеснявайте, извършването на статистически тестове всъщност не е трудно, но това е един от най-добрите начини да накарате вашия проект наистина да се открои пред съдиите.

Защо да използваме статистика

Ако изберете някаква променлива - например височина, резултати от теста за правопис или брой успешно покълнали семена - винаги ще има някои вариации случайно. Обикновено има разпределение на резултатите около някаква централна стойност. Това го прави малко трудно наистина

зная дали очевидната разлика между два резултата всъщност е важна или само поради тази вътрешна вариация. За това използвате статистически данни.

Статистически тестове като T-test и коефициентът на корелация на Pearson ви дават инструментите за отделяне на ефектите на случайния шанс от действителните ефекти извън очакваните случайно. Например, ако искате да знаете дали момчетата са по-високи от момичетата, не просто ще сравнявате средните стойности (повече за това след един момент), ще трябва да разгледате как разликите в рамките на група в сравнение с разликите между групите.

Основни статистически мерки

За да използвате статистически тестове за своя научен проект, първо трябва да знаете няколко основни неща. Първият е доста прост: понятието „средно“, за което говорят повечето хора, когато казват „средно“. Това е просто сумата от набор от стойности, разделена на броя на стойностите. Така че, ако имате пет резултата от теста: 20, 13, 18, 22 и 16, средната стойност е:

\ начало {подравнено} \ текст {означава} & = μ = \ frac {20 + 13 + 18 + 22 + 16} {5} \\ & = 17,8 \ край {подравнено}

Другата важна концепция е стандартно отклонение. Това е мярка за разпространението на стойностите около средната стойност и се използва като част от много статистически тестове. Формулата за стандартно отклонение е:

σ = \ sqrt {\ frac {1} {N} \ sum (x_i - μ) ^ 2}

Това може да изглежда страшно, но е доста лесно да се изчисли: започнете, като изчислите средното μи след това извадете тази стойност от всеки от отделните резултати ( хi в уравнението), преди квадратирането на отговора. Сега обобщете всички тези индивидуални стойности, разделете на броя на резултатите (н) и накрая вземете квадратния корен на отговора.

Тестване за разлика: T-тестът

Ако искате да тествате за разлика в определена променлива между две групи - например средната височина на момчетата vs. момичета или тестови резултати от ученици, които са преминали повторен курс срещу тези, които не са - T-test е един от най-често използваните статистически тестове. Предполага се, че вашите данни се разпределят нормално (като камбанна крива - вероятно ще бъде, така че не е нужно да се притеснявате твърде много за това), че квадратите на стандартните отклонения („дисперсията“) на всяка група са еднакви и че наблюденията са независими от всяка други.

За да извършите a T-test, вие използвате формулата:

t = \ frac {μ_1 - μ_2} {\ sqrt {\ frac {s_p ^ 2} {n_1} + \ frac {s_p ^ 2} {n_2}}}

Сега всичко, което трябва да знаете, е какво означава всеки от символите. Първо, μ символите са средствата за пробите, н стойностите са броят на резултатите във всяка група и сстр стойностите включват стандартните отклонения на пробите. Това е малко по-сложно и има отделна формула:

s_p ^ 2 = \ frac {(n_1 - 1) σ_1 ^ 2 + (n_2 - 1) σ_2 ^ 2} {n_1 + n_2 - 2}

По принцип е по-лесно да се изчисли това на парчета, като се започне с сстр2 стойност и след това я поставете в уравнението за T. Последната стъпка е търсенето на резултата, за който получавате T в таблица (вж. Ресурси) за подходящото ниво на значимост, което обикновено е 0,95 (ако тествате за разлика в двете посоки, т.е. по-висока и по-ниска, тогава или използвайте таблица за "двустранен" тест, или използвайте 0.975 стойност). Трябва да проверите реда за вашия брой степени на свобода (общият ви размер на извадката минус 2) и дали вашият T стойност (пренебрегвайки всякакви знаци минус) е по-висока от стойността в таблицата, установихте значителна разлика.

Разбира се, това всъщност е само началото: Какво правите с резултата, когато сте го намерили? Следващата част на тази статия ще бъде задълбочена за тълкуването на вашите резултати.

  • Дял
instagram viewer