Voitteko käyttää T-testiä luokiteltuihin tietoihin?

Tilastollisia testejä käytetään määrittämään, onko muuttujien välisellä oletetulla suhteella tilastollinen merkitsevyys. Testi tyypillisesti mittaa muuttujien korrelaatiota tai eroa. Parametriset testit ovat testejä, jotka perustuvat muuttujien keskeisiin suuntauksiin ja ottavat normaalijakauman. Ei-parametriset testit eivät tee oletuksia populaatiojakaumista.

T-testi on parametrinen testi, jossa verrataan mukana olevien näytteiden ja populaatioiden keskiarvoja. T-testejä on useita. Yhden otoksen t-testi vertaa näytteen keskiarvoa oletettuun keskiarvoon. Riippumattomien näytteiden t-testi tarkastaa, onko kahden eri näytteen keskiarvoilla samanlaiset arvot. Parillisen näytteen t-testiä käytetään, kun on olemassa kaksi havaintoa vertailtavaksi kullekin näytteen kohteelle. T-testi on suunniteltu numeeriselle tiedolle, jolla on normaali jakauma.

Järjestysdata on johdettua tietoa, joka kuvaa kunkin näytteen yksikön suhteellisia arvoja. Esimerkiksi 10 opiskelijan korkeuden järjestysluku luokkahuoneessa olisi yksinkertaisesti numeroita 1 - 10, missä 1 voi edustaa lyhintä opiskelijaa ja 10 korkeinta opiskelija. Yhdelläkään opiskelijalla ei olisi samaa arvoa, ellei heillä olisi täsmälleen sama korkeus. Keskitaipumuksen mittaukset ovat merkityksettömiä järjestysdatan suhteen.

T-testejä ei ole tarkoituksenmukaista käyttää järjestysdatan kanssa. Koska järjestysdatalla ei ole keskeistä taipumusta, sillä ei ole myöskään normaalijakaumaa. Järjestysdatan arvot jakautuvat tasaisesti, ei ryhmitelty keskipisteen ympärille. Tämän vuoksi järjestysdatan t-testillä ei olisi tilastollista merkitystä.

Tilastollisesti merkittäviä testejä on kolme, joita on asianmukaista käyttää järjestysdatan kanssa. Spearmanin järjestyskorrelaatiota on tarkoituksenmukaista käyttää, kun mukana on vain kaksi muuttujaa, ja niiden suhde on yksitoikkoinen, vaikkakaan ei välttämättä lineaarinen. Monotonisissa suhteissa ensimmäisen muuttujan kasvaessa toisen muuttujan suunta ei muutu. Kruskal-Wallis-testi on suunniteltu tapauksille, joissa on enemmän kuin kaksi näytettä, ja tietoja ei normaalisti jaeta. Se on samanlainen kuin yksisuuntainen varianssianalyysi. Friedmanin varianssianalyysiä riveittäin voidaan käyttää, kun yhdessä ryhmässä on kolme tai useampia havaintoja yhdestä muuttujasta.

  • Jaa
instagram viewer