科学博覧会に勝つことは、競争から際立つことを意味します。
誤解しないでください。素晴らしい重曹火山を作ると、頭がおかしくなるかもしれません。 しかし、学校であろうとGoogleサイエンスフェアであろうと、最優秀賞を獲得したいのであれば、それよりも少し頑強なことをする必要があります。
賢明で適切に設計された実験を行うだけでなく、確固たる結論を導き出そうとするときに最も重要なことの1つは、結果を正確に分析することです。 聞きたくないかもしれませんが、これはほとんどの人の話ではありません お気に入り 科学を行うことの一部–これは、観察した違いがあるかどうかを確認するためにいくつかの基本的な統計を行うことを意味します 統計学的に重要な またはおそらく偶然によるものです。
心配しないでください。統計的検定を実行することはそれほど難しいことではありませんが、プロジェクトを審査員に本当に目立たせるための最良の方法の1つです。
統計を使用する理由
高さ、スペルテストのスコア、発芽に成功した種子の数など、変数を選択した場合、偶然だけでも常にある程度の変動があります。 一般に、いくつかの中心値の周りに結果の分布があります。 これは本当にするのを少し難しくします 知っている 2つの結果の明らかな違いが実際に重要であるかどうか、または単にこの固有の変動によるものかどうか。 それがあなたが統計を使う目的です。
のような統計的検定 t-テストとピアソンの相関係数は、偶然に予想されるものを超えて、ランダムな偶然の影響を本物の影響から分離するためのツールを提供します。 たとえば、男の子が女の子より背が高いかどうかを知りたい場合は、平均を比較するだけでなく(これについては後で詳しく説明します)、違いがどのようになっているのかを確認する必要があります。 以内に グループは違いを比較します の間に グループ。
基本的な統計的測定
科学プロジェクトで統計的検定を使用するには、最初にいくつかの基本的なことを知っておく必要があります。 1つ目は非常に単純です。「平均」の概念です。これは、ほとんどの人が「平均」と言うときに話していることです。 これは、値のセットを値の数で割ったものの合計です。 したがって、20、13、18、22、16の5つのテストスコアがある場合、平均は次のようになります。
\ begin {aligned} \ text {mean}&=μ= \ frac {20 + 13 + 18 + 22 + 16} {5} \\&= 17.8 \ end {aligned}
他の重要な概念は 標準偏差. これは平均値の周りの値の広がりの尺度であり、多くの統計的検定の一部として使用されます。 標準偏差の式は次のとおりです。
σ= \ sqrt {\ frac {1} {N} \ sum(x_i-μ)^ 2}
これは恐ろしいように見えるかもしれませんが、計算するのは非常に簡単です。平均値を計算することから始めます。 μ、次に、個々の結果のそれぞれからこの値を減算します( バツ私 方程式で)、答えを二乗する前に。 次に、これらの個々の値をすべて合計し、結果の数で割ります(N)、そして最後に答えの平方根を取ります。
違いのテスト:t検定
たとえば、男の子と男の子の平均身長など、2つのグループ間の特定の変数の違いをテストする場合。 要約コースを受講した女の子または学生のテストスコアと 持っていない人– t-testは、最も一般的に使用される統計的検定の1つです。 データが正規分布していることを前提としています(ベルカーブのように、おそらくそうなるので、これについてあまり心配する必要はありません)。 各グループの標準偏差(「分散」)の2乗が同じであり、観測値がそれぞれから独立していること その他。
を実行するには t-テストでは、次の式を使用します。
t = \ frac {μ_1-μ_2} {\ sqrt {\ frac {s_p ^ 2} {n_1} + \ frac {s_p ^ 2} {n_2}}}
さて、あなたが知る必要があるのは、それぞれの記号が何を意味するかだけです。 まず、 μ 記号はサンプルの手段であり、 n 値は、各グループの結果の数であり、 sp 値には、サンプルの標準偏差が含まれます。 これはもう少し複雑で、別の式があります。
s_p ^ 2 = \ frac {(n_1-1)σ_1^ 2+(n_2-1)σ_2^ 2} {n_1 + n_2-2}
一般に、これを分割して計算する方が簡単です。 sp2 値を入力し、その値を次の式に代入します。 t. 最後のステップは、得られた結果を調べることです。 t 適切な有意水準については、表(「参考文献」を参照)で、通常は0.95です( 両方向、つまり高い方と低い方の違いがある場合は、「両面」テスト用のテーブルを使用するか、0.975を使用します。 値)。 自由度の数(合計サンプルサイズから2を引いたもの)について行を確認する必要があります。 t 値(マイナス記号を無視)が表の値よりも高い場合、大きな違いが見つかりました。
もちろん、これは本当に始まりにすぎません。結果を見つけたら、その結果をどうしますか? この記事の次のパートでは、結果の解釈について詳しく説明します。