Come usare le statistiche per distinguersi alla fiera della scienza

Vincere la fiera della scienza significa distinguersi dalla concorrenza.

Non fraintenderci, la creazione di un fantastico vulcano di bicarbonato di sodio potrebbe far girare la testa a qualcuno. Ma devi fare qualcosa di un po' più solido di quello se vuoi prendere il primo premio, sia nella tua scuola che per la Google Science Fair.

Oltre ad avere un esperimento sensato e ben progettato, una delle cose più importanti quando stai cercando di trarre una conclusione definitiva è analizzare i tuoi risultati in modo accurato. Anche se potresti non volerlo sentire, questo non è per la maggior parte delle persone preferito parte del fare scienza - questo significa fare alcune statistiche di base per vedere se le differenze che osservi sono statisticamente significante o forse solo per caso.

Non preoccuparti, tuttavia, eseguire test statistici non è molto difficile, ma è uno dei modi migliori per far risaltare davvero il tuo progetto ai giudici.

Perché usare le statistiche?

Se scegli una variabile, ad esempio l'altezza, i punteggi dei test di ortografia o il numero di semi germinati con successo, ci sarà sempre qualche variazione solo per caso. C'è generalmente una distribuzione dei risultati intorno a un valore centrale. Questo rende un po 'difficile davvero

conoscere se una differenza apparente tra due risultati è effettivamente importante o solo a causa di questa variazione intrinseca. È per questo che usi le statistiche.

Test statistici come il t-test e il coefficiente di correlazione di Pearson forniscono gli strumenti per separare gli effetti del caso casuale dagli effetti reali oltre a quelli previsti dal caso. Ad esempio, se vuoi sapere se i ragazzi sono più alti delle ragazze, non dovresti solo confrontare le medie (ne parleremo più in un momento), dovresti guardare come le differenze entro un gruppo confronta le differenze fra i gruppi.

Misure statistiche di base

Per utilizzare i test statistici per il tuo progetto di scienze, devi prima conoscere un paio di cose di base. Il primo è piuttosto semplice: il concetto di "media", che è ciò di cui la maggior parte delle persone parla quando dice "media". Questa è semplicemente la somma di un insieme di valori diviso per il numero di valori. Quindi, se hai cinque punteggi del test: 20, 13, 18, 22 e 16, la media è:

\begin{allineato} \text{mean} &= μ = \frac{20 + 13 + 18 + 22 + 16}{5} \\ &= 17,8 \end{allineato}

L'altro concetto importante è il deviazione standard. Questa è una misura della diffusione dei valori attorno alla media ed è utilizzata come parte di molti test statistici. La formula per la deviazione standard è:

= \sqrt{\frac{1}{N} \sum (x_i - μ)^2}

Potrebbe sembrare spaventoso, ma è abbastanza facile da calcolare: inizia calcolando la media μ, e quindi sottrarre questo valore da ciascuno dei singoli risultati (il Xio nell'equazione), prima di elevare al quadrato la risposta. Ora riassumi tutti questi valori individuali, dividi per il numero di risultati (no), e infine prendi la radice quadrata della risposta.

Test per la differenza: il t-Test

Se vuoi testare una differenza in una certa variabile tra due gruppi, ad esempio l'altezza media dei ragazzi rispetto a quella dei ragazzi. ragazze o punteggi dei test di studenti che hanno seguito un corso di riepilogo vs. quelli che non hanno - il t-test è uno dei test statistici più comunemente usati. Presuppone che i tuoi dati siano normalmente distribuiti (come una curva a campana - probabilmente lo sarà, quindi non devi preoccuparti troppo di questo), che i quadrati delle deviazioni standard (la “varianza”) di ciascun gruppo sono gli stessi e che le osservazioni sono indipendenti da ciascuno altro.

Per eseguire un t-test, usi la formula:

t = \frac{μ_1 - μ_2}{\sqrt{\frac{s_p^2}{n_1}+\frac{s_p^2}{n_2}}}

Ora, tutto ciò che devi sapere è cosa significa ciascuno dei simboli. In primo luogo, il μ i simboli sono i mezzi per i campioni, i n i valori sono il numero di risultati in ciascun gruppo e il Sp i valori coinvolgono le deviazioni standard dei campioni. Questo è un po' più complicato e ha una formula separata:

s_p^2 = \frac{(n_1 - 1)σ_1^2 + (n_2 - 1)σ_2^2}{n_1+n_2 - 2}

In genere è più facile calcolarlo a pezzi, iniziando dal Sp2 valore, quindi inserisci il valore nell'equazione per t. Il passo finale è cercare il risultato che ottieni t in una tabella (vedi Risorse) per il livello di significatività appropriato, che di solito è 0,95 (se stai testando per un differenza in entrambe le direzioni, cioè superiore e inferiore, quindi utilizzare una tabella per il test "a due code" o utilizzare il 0,975 valore). Devi controllare la riga per il tuo numero di gradi di libertà (la dimensione totale del campione meno 2) e se il tuo t valore (ignorando eventuali segni meno) è maggiore del valore nella tabella, hai trovato una differenza significativa.

Naturalmente, questo è davvero solo l'inizio: cosa fai con il risultato quando lo hai trovato? La prossima parte di questo articolo approfondirà l'interpretazione dei risultati.

  • Condividere
instagram viewer