Як використовувати статистику, щоб виділитися на науковому ярмарку

Перемога на науковому ярмарку означає виокремлення серед конкурентів.

Не помиліться з нами, створивши чудовий вулкан харчової соди може повернути кілька голов. Але вам потрібно зробити щось більш надійне, ніж це, якщо ви хочете взяти головний приз у своїй школі чи на Google Science Fair.

Окрім розумного та добре продуманого експерименту, однією з найважливіших речей, коли ви намагаєтесь зробити твердий висновок, є точний аналіз ваших результатів. Хоча ви можете не хотіти цього чути - це не для більшості людей улюблений частина занять наукою - це означає робити деякі базові статистичні дані, щоб перевірити, чи є якісь відмінності, які ви спостерігаєте статистично значущі або, можливо, просто завдяки випадковості.

Не хвилюйтеся, проте, проведення статистичних тестів насправді не складне, але це один з найкращих способів зробити так, щоб ваш проект справді виділявся на суддів.

Навіщо використовувати статистику

Якщо ви виберете будь-яку змінну - наприклад, висоту, результати перевірки орфографії чи кількість успішно пророщених насіння - завжди будуть випадкові зміни. Зазвичай існує розподіл результатів навколо якоїсь центральної цінності. Це трохи ускладнює насправді

знати чи очевидна різниця між двома результатами насправді важлива чи просто завдяки цій внутрішній варіації. Для цього ви використовуєте статистику.

Статистичні тести, такі як т-test та коефіцієнт кореляції Пірсона дають вам інструменти для відокремлення ефектів випадкового випадковості від справжніх ефектів, крім тих, що очікуються випадково. Наприклад, якщо ви хочете знати, чи хлопчики вищі за дівчат, ви не просто порівнюєте середні показники (про це докладніше за мить), вам потрібно буде поглянути на те, як різниці в межах групу порівняти з відмінностями між групи.

Основні статистичні заходи

Щоб використовувати статистичні тести для свого наукового проекту, спочатку потрібно знати пару основних речей. Перший досить простий: концепція "середнього", про що говорять більшість людей, коли кажуть "середній". Це просто сума набору значень, поділена на кількість значень. Отже, якщо у вас є п'ять балів: 20, 13, 18, 22 і 16, середнє значення:

\ begin {align} \ text {mean} & = μ = \ frac {20 + 13 + 18 + 22 + 16} {5} \\ & = 17.8 \ end {align}

Іншим важливим поняттям є стандартне відхилення. Це показник розподілу значень навколо середнього значення, і він використовується як частина багатьох статистичних тестів. Формула стандартного відхилення:

σ = \ sqrt {\ frac {1} {N} \ sum (x_i - μ) ^ 2}

Це може здатися страшним, але це досить легко підрахувати: почніть з обчислення середнього μ, а потім відніміть це значення від кожного з окремих результатів ( хi у рівнянні), перед тим, як відповісти квадрату. Тепер підсумуйте всі ці окремі значення, розділіть на кількість результатів (N), і нарешті візьмемо квадратний корінь відповіді.

Тестування на різницю: t-тест

Якщо ви хочете перевірити різницю в певній змінній між двома групами - наприклад, середній зріст хлопчиків проти дівчаток або тестові бали студентів, які пройшли повторний курс проти ті, хто цього не зробив - т-тест - один із найбільш часто використовуваних статистичних тестів. Передбачається, що ваші дані зазвичай розподіляються (як крива дзвоника - можливо, вона і буде, тому вам не доведеться надто турбуватися про це), що квадрати стандартних відхилень ("дисперсія") кожної групи однакові і що спостереження не залежать від кожної інший.

Для виконання a т-test, ви використовуєте формулу:

t = \ frac {μ_1 - μ_2} {\ sqrt {\ frac {s_p ^ 2} {n_1} + \ frac {s_p ^ 2} {n_2}}}

Тепер потрібно лише знати, що означає кожен із символів. По-перше, μ символи є засобами для зразків, п значення - це кількість результатів у кожній групі та sстор значення включають стандартні відхилення зразків. Це трохи складніше і має окрему формулу:

s_p ^ 2 = \ frac {(n_1 - 1) σ_1 ^ 2 + (n_2 - 1) σ_2 ^ 2} {n_1 + n_2 - 2}

Як правило, легше обчислити це по частинах, починаючи з sстор2 значення, а потім помістіть значення у рівняння для т. Останній крок - пошук результату, для якого ви отримуєте т у таблиці (див. Ресурси) для відповідного рівня значущості, який зазвичай становить 0,95 (якщо ви тестуєте на різниця в обох напрямках, тобто вище і нижче, тоді або скористайтеся таблицею для «двостороннього» тесту, або використовуйте 0,975 значення). Вам потрібно перевірити рядок на предмет вашої кількості ступенів свободи (загальний розмір вибірки мінус 2), а також, якщо ваш т значення (ігноруючи будь-які знаки мінус) вище значення в таблиці, ви виявили значну різницю.

Звичайно, це насправді лише початок: що ви робите з результатом, коли його знайшли? Наступна частина цієї статті буде детально розглядати інтерпретацію ваших результатів.

  • Поділитися
instagram viewer