3つ以上のデータセットを比較するための統計分析は、収集されるデータのタイプによって異なります。 各統計的検定には、検定が適切に機能するために満たす必要のある特定の仮定があります。 また、比較するデータのどの側面がテストに影響します。 たとえば、3つのデータセットのそれぞれに2つ以上の測定値がある場合、異なるタイプの統計的検定が必要になります。
ANOVA
3つ以上のデータセットのより一般的な統計的検定の1つは、分散分析(ANOVA)です。 このテストを使用するには、データが特定の基準を満たしている必要があります。 まず、データは数値である必要があります。 リッカート尺度と呼ばれる5段階の尺度評価などの順序データは数値データではなく、ANOVAを順序データと一緒に使用すると、正確な結果が得られません。 次に、データは正規分布でベルカーブになっている必要があります。 これらの仮定が満たされている場合、ANOVA検定を使用して、3つ以上のサンプルまたはデータセットにわたる単一の従属変数の分散を分析できます。 従属変数は、調査で測定している因子であることを忘れないでください。
マノバ
ANOVAの仮定が満たされているが、複数の従属変数を測定する場合は、多変量分散分析(MANOVA)が必要になります。 従属変数は、測定して調べたい要素です。 1つまたは複数の独立変数は、従属変数に影響を与えます。 たとえば、激しい運動が血圧、体重減少、心拍数に及ぼす影響を測定していると仮定します。 独立変数は運動であり、従属変数は血圧、体重減少、心拍数です。 この状況では、MANOVAを使用します。 この統計的検定は計算が非常に複雑であり、コンピューターと特別なソフトウェアを使用する必要があります。
ノンパラメトリック推論統計
さまざまなノンパラメトリック検定がありますが、一般に、データが順序変数であるか、正規分布していない場合は、ノンパラメトリック統計が使用されます。 ノンパラメトリック検定には、符号検定、カイ2乗、中央値検定が含まれます。 これらのテストは、回答者がさまざまなステートメントを評価する必要がある調査データを分析するときによく使用されます。 たとえば、「まったくそう思わない、そう思わない、そう思う、非常にそう思う」という尺度は、順序データと見なされます。 これらのテストは、スプレッドシートが役立ちますが、多くの場合、手動で簡単に計算できます。
記述統計
推測テストに加えて、簡単な記述統計を使用して、データセットをすばやく簡単に確認することもできます。 3つのデータセットのそれぞれについて、平均、標準偏差、およびパーセンテージをレポートできます。 記述統計は、データをすばやく確認するのに役立ちますが、結論を出すために使用することはできません。 たとえば、3つのデータセットの1つに、他の2つのデータセットよりも20%高い変数がある場合、 差異は、ANOVA、MANOVA、またはノンパラメトリック検定などの推測統計検定を使用せずに「統計的に有意」です。