Ако искате да спечелите научния си панаир, статистическият анализ на вашите данни е чудесен начин да се откроите от конкуренцията, но когато получите резултата - кажете P = 0,04 - какво всъщност прави означава? Можете да направите цялата математика от първата част на този пост, но ако наистина не разбирате числата, които статистическите тестове връщат, все още не знаете какво е открил експериментът ви.
Например: Можете ли да отхвърлите „нулева хипотеза”Въз основа на вашия резултат? Какво означава това? Възможно ли е вашето откритие да се дължи на случайност? Какво ви казва една корелация за връзката между две променливи? Това са типовете въпроси, на които ще трябва да отговорите, за да получите правилна интерпретация на резултатите от вашите научни панаири.
Нулевата хипотеза
Винаги, когато правите статистика, вие сравнявате „нулевата хипотеза“ срещу вашата „експериментална хипотеза“. Нулевата хипотеза винаги е една и съща: няма връзка между нещата, които сте тестване. В научните експерименти приемате, че нулевата хипотеза е вярна, докато не разполагате с достатъчно доказателства, за да я опровергаете. С други думи, не предполагате, че ще получите определен резултат от експериментите си - предполагате, че вашата хипотеза не е вярна, докато научните резултати не ви кажат друго.
Объркан? Ето един пример. Да кажем, че правите научен проект, за да разберете дали кучетата са десни или левичари. Вашата нулева хипотеза може да е, че кучетата нямат доминираща лапа. Оттам нататък вашите резултати ще ви покажат дали вашата нулева хипотеза е вярна или кучетата изглеждат десни или левичари.
Но как можете да различите между реалните резултати и това, което може да се случи съвсем случайно? Статистика, разбира се!
Определянето на това какви доказателства са „достатъчни“ е работата на статистическите тестове и тъй като тествате нулевата хипотеза, най-добре е да определите точно какво е за вашия експеримент. Наистина трябва да направите това, преди да започнете работата си, но дори и да сте се фокусирали върху експерименталния си хипотеза (връзката, за която подозирате, че всъщност може да съществува) е лесно да се състави нулева хипотеза след фактът.
P Стойности и статистическа значимост
Ако експериментът ви даде достатъчно основание да отхвърлите нулевата хипотеза, това се нарича „статистически значим“ резултат. Но, както при повечето неща в науката, има много конкретна дефиниция какво всъщност означава това и трябва да сте наясно с това, когато разглеждате резултатите от вашите научни панаири. Определението се свежда до значението на P стойност, която получавате от вашия статистически тест.
The P стойност често се тълкува погрешно, че означава „вероятността резултатът да се дължи на случайност“, и въпреки че това е близо до значението, че е всъщност не е вярно. The P вместо това ви показва шанса, че ако нулевата хипотеза е вярна, ще получите резултата си поради случайни статистически шумове. Например, ако тествате дали дадена монета е неравномерно претеглена (с нулева хипотеза, че това е справедлива монета), резултат от 45 глави до 55 опашки би било доста вероятно от обръщане на честна монета поради обща статистическа вариация и това е, което на P стойност количествено.
„Нивото на значимост“ е гранична стойност за P - всичко под това се счита за достатъчно малко вероятно да отхвърлите нулевата хипотеза. Това обикновено се избира като P = 0,05 (така че има само 5% шанс резултатите ви да бъдат получени в свят, в който нулевата хипотеза е вярна), но в крайна сметка това е само конвенция. При някои обстоятелства ниво на значимост от P = 0,10 е напълно добре, а в други учените малко „вдигат летвата“ и поставят по-строга граница P = 0.01. Обикновено е най-добре просто да се придържате P = 0,05, но разбирайте, че понякога има вариации.
Тълкуване на корелации
Ако тествате за разлика между две групи, разбирането на значението на статистическата значимост е достатъчно, но ако тестът ви включва корелация между две променливи (например количеството светлина, което растението получава и колко високо расте, или броя на предишните опити и резултата ви в игра), нещата са малко различен. Тестовете за корелации връщат стойности между -1 и +1, а разбирането им и това, което всеки тип корелация предполага за причинно-следствена връзка, е от съществено значение за интерпретирането на вашите резултати.
Първо, оценката на корелацията е лесна за разбиране, ако вземете предвид крайните случаи. Всяка положителна стойност на корелация означава, че и двете променливи се увеличават заедно, а стойност +1 е a перфектно корелация, където графиката на една променлива спрямо друга е права линия. По същия начин, всяка минусова стойност на корелация означава, че когато една променлива се увеличава, другата намалява и стойност от -1 е перфектна отрицателна корелация. И накрая, стойност 0 означава, че изобщо няма корелация. Разбира се, повечето резултати ще бъдат десетични (като 0.65), с по-големи стойности (по-големи числа, положителни или отрицателни), което означава по-силна корелация.
Ключово предупреждение обаче е това корелацията не предполага причинно-следствена връзка. С други думи, само защото две неща са свързани, не означава, че едното причинява другото и не бива да се изкушавате да правите такова заключение във вашия запис въз основа на корелация сам. Добър пример е корелация между жълтите зъби и рака на белия дроб: Това не е толкова жълтите зъби кауза рак на белия дроб; пушенето причинява както жълти зъби, така и рак на белия дроб. По същия начин вашите резултати може да се дължат на друг фактор, който не сте взели предвид, така че винаги е рисковано да се правят каузални твърдения, без много силни доказателства извън обикновената корелация.
Имайки предвид тези точки, какъвто и да е вашият научен проект, трябва да можете да правите статистиката, от която се нуждаете и обясняват какво точно показват. Може да не спечелите, но наученото ви дава инструментите, от които наистина се нуждаете, за да привлечете вниманието на съдиите.