Ako želite osvojiti vaš sajam znanosti, statistička analiza podataka sjajan je način da se istaknete u odnosu na konkurenciju, ali kad dobijete rezultat - recite Str = 0,04 - što zapravo čini znači? Možete raditi svu matematiku iz prvi dio ovog posta, ali ako doista ne razumijete brojeve statističkih testova, još uvijek zapravo ne znate što je vaš eksperiment pronašao.
Na primjer: Možete li odbiti "Nulta hipoteza”Na temelju vašeg rezultata? Što to uopće znači? Je li moguće da je vaše otkriće slučajno? Što vam korelacija govori o odnosu dviju varijabli? To su vrste pitanja na koja ćete trebati odgovoriti da biste pravilno interpretirali rezultate svojih sajamskih znanosti.
Nulta hipoteza
Kad god radite statistiku, postavljate "nulu hipotezu" naspram svoje "eksperimentalne hipoteze". Nulta hipoteza je u osnovi uvijek ista: ne postoji veza između stvari koje ste testiranje. U znanstvenim eksperimentima pretpostavljate da je nulta hipoteza istinita dok nemate dovoljno dokaza da je pobijete. Drugim riječima, ne pretpostavljate da ćete iz eksperimenata dobiti određeni rezultat - pretpostavljate da vaša hipoteza nije istinita dok vam znanstveni rezultati ne kažu drugačije.
Zbunjen? Evo primjera. Recimo da radite znanstveni projekt kako biste otkrili jesu li psi dešnjaci ili ljevaci. Vaša bi ništavna hipoteza mogla biti da psi nemaju dominantnu šapu. Od tada će vam vaši rezultati reći je li vaša nulta hipoteza istinita ili se čini da su psi dešnjaci ili ljevaci.
Ali kako možete razlikovati stvarne rezultate od onoga što bi se moglo dogoditi sasvim slučajno? Statistika, naravno!
Određivanje koji su dokazi "dovoljni" posao je statističkih ispitivanja, a budući da ispitujete nultu hipotezu, najbolje je točno definirati što je to za vaš eksperiment. To biste stvarno trebali učiniti prije nego što započnete s radom, ali čak i ako ste se usredotočili na eksperimentalni hipoteza (odnos za koji sumnjate da bi mogao stvarno postojati) lako je sastaviti nultu hipotezu nakon činjenica.
P vrijednosti i statistički značaj
Ako vam eksperiment pruži dovoljan razlog za odbacivanje ništetne hipoteze, to se naziva "statistički značajnim" rezultatom. Ali, kao i kod većine stvari u znanosti, postoji vrlo specifična definicija što ovo zapravo znači, i trebali biste biti jasni kad gledate rezultate svojih sajamskih znanosti. Definicija se svodi na značenje Str vrijednost koju dobijete statističkim testom.
The Str vrijednost se često pogrešno tumači da znači "vjerojatnost da je rezultat slučaj", i premda je to blizu značenja da je zapravo nije istina. The Str vrijednost vam umjesto toga govori o šansi da biste, da je nulta hipoteza istinita, dobili svoj rezultat zbog slučajnih statističkih šuma. Na primjer, ako ste testirali je li novčić neravnomjerno ponderiran (s nultom hipotezom da je to kovanica), rezultat od 45 grla do 55 repova bilo bi prilično vjerojatno od okretanja poštenog novčića zbog općih statističkih varijacija, a to je ono Str vrijednost kvantificira.
"Razina značajnosti" je granična vrijednost za Str - sve što je ispod ovoga smatra se dovoljno vjerojatnim da odbacite nultu hipotezu. Ovo se obično odabire kao Str = 0,05 (dakle, postojalo bi samo 5% šanse da se vaši rezultati dobiju u svijetu u kojem je nulta hipoteza bila istinita), ali u konačnici ovo je samo konvencija. U nekim okolnostima razina značajnosti Str = 0,10 je sasvim u redu, a u drugima znanstvenici malo "podižu ljestvicu" i postavljaju strožiju granicu Str = 0.01. Obično je najbolje samo se držati Str = 0,05, ali shvatite da ponekad postoje varijacije.
Tumačenje korelacija
Ako testirate na razliku između dvije skupine, razumijevanje značenja statističke značajnosti je dovoljno, ali ako vaš test uključuje korelacije između dviju skupina varijable (na primjer, količina svjetlosti koju biljka primi i koliko visoka raste, ili broj prethodnih pokušaja i vaš rezultat u igri), stvari su malo drugačiji. Testovi za korelacije vraćaju vrijednosti između -1 i +1, a razumijevanje njih i onoga što bilo koja vrsta korelacije podrazumijeva za uzročnost ključno je za tumačenje vaših rezultata.
Prvo, korelacijski rezultat lako je razumjeti ako uzmete u obzir ekstremne slučajeve. Svaka pozitivna vrijednost korelacije znači da se obje varijable povećavaju zajedno, a vrijednost +1 je a savršen korelacija, gdje je graf jedne varijable naspram druge ravna crta. Na isti način, bilo koja minus vrijednost korelacije znači da kada se jedna varijabla povećava, druga smanjuje, a vrijednost -1 je savršena negativna korelacija. Konačno, vrijednost 0 znači da uopće nema korelacije. Naravno, većina rezultata bit će decimalna (poput 0,65), s većim vrijednostima (veći brojevi, bilo pozitivni ili negativni) što znači jaču korelaciju.
Međutim, ključno je upozorenje to korelacija ne podrazumijeva uzročnost. Drugim riječima, samo zato što su dvije stvari povezane, ne znači da jedna uzrokuje drugu, i ne biste trebali doći u napast da u svom pisanju na osnovu korelacije izvučete takav zaključak sama. Dobar je primjer korelacija između žutih zuba i raka pluća: Nije to onaj žuti zub uzrok rak pluća; to je da pušenje uzrokuje i žute zube i rak pluća. Na isti način, vaši bi rezultati mogli biti posljedica drugog čimbenika koji niste uzeli u obzir, pa je uvijek rizično iznositi uzročne tvrdnje bez vrlo jakih dokaza izvan jednostavne korelacije.
Imajući ove točke na umu, bez obzira na vaš sajamski projekt, trebali biste biti u stanju izraditi statistiku koja vam je potrebna i objasniti što točno pokazuju. Možda nećete pobijediti, ali ono što ste naučili daje vam alate koji su vam potrebni da zaista privučete pažnju sudaca.