Comment utiliser les statistiques pour se démarquer à l'expo-sciences

Gagner l'expo-sciences, c'est se démarquer de la concurrence.

Ne vous méprenez pas, la création d'un impressionnant volcan de bicarbonate de soude pourrait faire tourner quelques têtes. Mais vous devez faire quelque chose d'un peu plus robuste que cela si vous voulez remporter le premier prix, que ce soit dans votre école ou pour le Google Science Fair.

En plus d'avoir une expérience sensée et bien conçue, l'une des choses les plus importantes lorsque vous essayez de tirer une conclusion ferme est d'analyser vos résultats avec précision. Bien que vous ne vouliez peut-être pas l'entendre - ce n'est pas le cas de la plupart des gens préféré partie de la science - cela signifie faire des statistiques de base pour voir si les différences que vous observez sont statistiquement significatif ou peut-être simplement par hasard.

Ne vous inquiétez pas, cependant, effectuer des tests statistiques n'est pas vraiment difficile, mais c'est l'un des meilleurs moyens de faire en sorte que votre projet se démarque vraiment des juges.

Pourquoi utiliser les statistiques

Si vous choisissez une variable - par exemple, la taille, les résultats des tests d'orthographe ou le nombre de graines germées avec succès - il y aura toujours une certaine variation par hasard seul. Il y a généralement une distribution des résultats autour d'une valeur centrale. Cela rend un peu difficile de vraiment connaître si oui ou non une différence apparente entre deux résultats est réellement importante, ou simplement en raison de cette variation intrinsèque. C'est pour cela que vous utilisez les statistiques.

Des tests statistiques comme le t-test et le coefficient de corrélation de Pearson vous donnent les outils pour séparer les effets du hasard des effets réels au-delà de ceux attendus par hasard. Par exemple, si vous voulez savoir si les garçons sont plus grands que les filles, vous ne vous contenteriez pas de comparer les moyennes (nous en reparlerons dans un instant), vous devrez examiner comment les différences dans un groupe comparer aux différences entre les groupes.

Mesures statistiques de base

Pour utiliser des tests statistiques pour votre projet scientifique, vous devez d'abord connaître quelques éléments de base. Le premier est assez simple: le concept de « moyenne », ce dont la plupart des gens parlent lorsqu'ils disent « moyenne ». C'est simplement la somme d'un ensemble de valeurs divisée par le nombre de valeurs. Donc, si vous avez cinq résultats aux tests: 20, 13, 18, 22 et 16, la moyenne est :

\begin{aligned} \text{mean} &= μ = \frac{20 + 13 + 18 + 22 + 16}{5} \\ &= 17.8 \end{aligned}

L'autre concept important est le écart-type. Il s'agit d'une mesure de la répartition des valeurs autour de la moyenne, et elle est utilisée dans le cadre de nombreux tests statistiques. La formule de l'écart type est :

σ = \sqrt{\frac{1}{N} \somme (x_i - μ)^2}

Cela peut sembler effrayant, mais c'est assez facile à calculer: commencez par calculer la moyenne μ, puis soustrayez cette valeur de chacun des résultats individuels (le Xje dans l'équation), avant de mettre la réponse au carré. Résumez maintenant toutes ces valeurs individuelles, divisez par le nombre de résultats (N), et enfin prendre la racine carrée de la réponse.

Tester la différence: le test t

Si vous souhaitez tester une différence dans une certaine variable entre deux groupes - par exemple, la taille moyenne des garçons vs. filles ou résultats des tests des étudiants qui ont suivi un cours de récapitulation vs. ceux qui ne l'ont pas fait - le t-test est l'un des tests statistiques les plus couramment utilisés. Il suppose que vos données sont normalement distribuées (comme une courbe en cloche - ce sera probablement le cas, vous n'avez donc pas à vous en soucier trop), que les carrés des écarts types (la « variance ») de chaque groupe sont les mêmes et que les observations sont indépendantes de chacun autre.

Pour effectuer un t-test, vous utilisez la formule :

t = \frac{μ_1 - μ_2}{\sqrt{\frac{s_p^2}{n_1}+\frac{s_p^2}{n_2}}}

Maintenant, tout ce que vous devez savoir, c'est ce que signifie chacun des symboles. Premièrement, le μ les symboles sont les moyens pour les échantillons, les m les valeurs sont le nombre de résultats dans chaque groupe, et le sp les valeurs impliquent les écarts types des échantillons. C'est un peu plus compliqué et a une formule distincte :

s_p^2 = \frac{(n_1 - 1)σ_1^2 + (n_2 - 1)σ_2^2}{n_1+n_2 - 2}

Il est généralement plus facile de calculer cela en morceaux, en commençant par le sp2 valeur, puis mettez la valeur dans l'équation pour t. La dernière étape consiste à rechercher le résultat que vous obtenez pour t dans un tableau (voir Ressources) pour le niveau de signification approprié, qui est généralement de 0,95 (si vous testez un différence dans les deux sens, c'est-à-dire plus haut et plus bas, alors utilisez un tableau pour le test « bilatéral » ou utilisez le 0.975 valeur). Vous devez vérifier la ligne pour votre nombre de degrés de liberté (la taille totale de votre échantillon moins 2), et si votre t valeur (en ignorant les signes moins) est supérieure à la valeur du tableau, vous avez trouvé une différence significative.

Bien sûr, ce n'est vraiment que le début: que faites-vous du résultat lorsque vous l'avez trouvé? La prochaine partie de cet article ira en profondeur sur l'interprétation de vos résultats.

  • Partager
instagram viewer