Štatistická významnosť je objektívnym ukazovateľom toho, či sú alebo nie sú výsledky štúdie matematicky „skutočné“ a štatisticky obhájiteľné, a nie iba náhodným výskytom. Bežne používané testy významnosti hľadajú rozdiely v priemeroch súborov údajov alebo rozdiely v variantoch súborov údajov. Typ použitého testu závisí od typu údajov, ktoré sa analyzujú. Je na vedcoch, aby určili, aké významné sú výsledky - inými slovami, aké veľké riziko sú ochotní podstúpiť, keď sa mýlia. Vedci sú zvyčajne ochotní akceptovať úroveň rizika 5 percent.
Chyba typu I: Nesprávne odmietnutie nulovej hypotézy
•••Scott Rothstein / iStock / Getty Images
Vykonávajú sa experimenty na testovanie konkrétnych hypotéz alebo experimentálnych otázok s očakávaným výsledkom. Nulová hypotéza je taká, ktorá nezistí žiadny rozdiel medzi dvoma porovnávanými súbormi údajov. Napríklad v lekárskej štúdii môže mať nulová hypotéza, že medzi pacientmi, ktorí dostávajú študovaný liek, a pacientmi, ktorí dostávajú placebo, nie je žiadny rozdiel v zlepšení. Ak výskumník chybne odmietne túto nulovú hypotézu, aj keď je v skutočnosti pravdivá, inými slovami, ak „zistí“ rozdiel medzi týmito dvoma skupinami pacientov, keď tam naozaj nebol žiadny rozdiel, potom sa dopustili I. typu chyba. Vedci vopred určia, aké veľké riziko spáchania chyby typu I sú ochotní akceptovať. Toto riziko je založené na maximálnej hodnote p, ktorú prijmú pred odmietnutím nulovej hypotézy, a nazýva sa alfa.
Chyba typu II: Nesprávne odmietnutie alternatívnej hypotézy
Alternatívnou hypotézou je detekcia rozdielu medzi dvoma porovnávanými súbormi údajov. V prípade lekárskeho pokusu by ste očakávali rozdielnu úroveň zlepšení u pacientov dostávajúcich študovaný liek a u pacientov užívajúcich placebo. Ak vedci neodmietnu nulovú hypotézu, keď by mali, inými slovami, ak „zistia“ č rozdiel medzi týmito dvoma súbormi pacientov, keď skutočne existoval rozdiel, potom spáchali typ II chyba.
Stanovenie úrovne dôležitosti
Ak vedci vykonajú test štatistickej významnosti a výsledná hodnota p je nižšia ako úroveň rizika považovaná za prijateľnú, potom sa výsledok testu považuje za štatisticky významný. V tomto prípade je nulová hypotéza - hypotéza, že medzi týmito dvoma skupinami nie je rozdiel - odmietnutá. Inými slovami, výsledky naznačujú, že existuje rozdiel v zlepšení medzi pacientmi, ktorí dostávali študovaný liek, a pacientmi, ktorí dostávali placebo.
Výber testu dôležitosti
Na výber je niekoľko rôznych štatistických testov. Štandardný t-test porovnáva priemery z dvoch súborov údajov, ako sú napríklad údaje o našom študovanom lieku a údaje o placebe. Párový t-test sa používa na zisťovanie rozdielov v rovnakom súbore údajov, napríklad v štúdii pred a po. Jednosmerná analýza odchýlky (ANOVA) môže porovnávať priemery z troch alebo viacerých súborov údajov a obojsmerná ANOVA porovnáva prostriedky dvoch alebo viacerých súborov údajov v reakcii na dve rôzne nezávislé premenné, ako sú rôzne silné stránky štúdie droga. Lineárna regresia porovnáva priemery súborov údajov pozdĺž gradientu liečby alebo času. Výsledkom každého štatistického testu budú miery významnosti alebo alfa, ktoré možno použiť na interpretáciu výsledkov testu.