手作業でANOVAを計算する方法

統計学者で進化生物学者のロナルド・フィッシャーは、目的を達成するための手段としてANOVA、つまり分散分析を開発しました。 実験、調査、または研究の結果が仮説を裏付けることができるかどうかを知るのに役立ちます。 ANOVAを使用すると、仮説が真であるか偽であるかをすばやく判断できます。

ANOVAとは何ですか?

サンプル内のグループ平均間の分散を評価するために使用されるANOVAは、統計モデルとそれに関連する推定手順を組み合わせたものです。 これは基本的に、2つの既知のデータグループ間の変動です。 これは、いくつかのデータセットの母平均が実際に等しいかどうかの統計的検定を提供します。 次に、t検定、つまり統計的調査による2つの母集団の平均の分析を、3つ以上のグループに一般化します。 t検定は、母平均と仮説値の間に有意差があるかどうかを示します。 サンプルデータの変動に対する差のサイズがt値です。

一方向または双方向?

使用する分散分析テストの独立変数の数によって、ANOVAがどちらであるかが決まります。 一方向検定には、2つのレベルを持つ単一の独立変数があります。 二元配置分散分析には、2つの独立変数があります。 双方向テストには、多数のレベルがあります。 一方向の例は、2つのブランドのゼリーを比較することです。 双方向では、ゼリーのブランドだけでなく、カロリー、脂肪、砂糖、または炭水化物のレベルを比較します。

レベルには、すべて同じ独立変数にあるさまざまなグループが含まれます。 レプリケーションとは、複数のグループでテストを繰り返す場合です。 反復による二元配置分散分析では、2つのグループと、そのグループ内にあり、複数のことを実行している個人を使用します。 双方向ANOVAテストは、反復の有無にかかわらず完了することができます。

手作業でANOVAを行う方法

ANOVAをすばやく簡単に計算できる統計ソフトウェアが利用可能ですが、ANOVAを手動で計算することには利点があります。 これにより、関連する個々のステップと、それらが複数のグループ間の違いを示すのにどのように貢献するかを理解できます。

収集したデータの基本的な要約統計量を収集します。 要約統計量には、「x」というラベルの付いた最初のグループの個々のデータポイントとその数が含まれます 2番目の個別のバリアント「y」のデータポイントの数。 各グループのデータポイントの数にはラベルが付けられています 「n。」

「SX」というラベルの付いた最初のグループのポイントを追加します。 収集されるデータの2番目のグループは「SY」です。

平均を計算するには、式C =(SX + SY)^ 2 /(2n)を使用します。

グループ間の二乗和を計算します。SSB= [(SX ^ 2 + SY ^ 2)/ n] –C。

すべてのデータポイントを2乗したら、それらを合計して「D」の最終的な合計にします。

次に、総平方和SST = D--Cを計算します。

式SST– SSBを使用して、SSW、またはグループ内の二乗和を求めます。

グループ間の自由度「dfb」とグループ内の自由度「dfw」を計算します。

グループ間の式はdfb = 1であり、グループ内の式はdfw = 2n-2です。

グループ内の平均二乗を計算します、MSW = SSW / dfw。

最後に、最終的な統計、つまり「F」を計算します。F= MSB / MSW

  • シェア
instagram viewer