Можете ли да използвате T-тест за класирани данни?

Статистическите тестове се използват, за да се определи дали хипотезираната връзка между променливите има статистическа значимост. Обикновено тестът измерва степента, до която променливите или корелират, или се различават. Параметричните тестове са тези, които разчитат на централните тенденции на променливите и приемат нормално разпределение. Непараметричните тестове не правят предположения за разпределението на популацията.

T-тестът е параметричен тест, който сравнява средствата на участващите проби и популации. Има няколко разновидности на t-тестове. T-тест с една проба сравнява средната стойност на проба с хипотезисна средна стойност. Независим t-тест за проби разглежда дали средствата на две различни проби имат сходни стойности. Сдвоен пробен t-тест се използва, когато има две наблюдения за сравнение за всеки обект в пробата. T-тестът е предназначен за цифрови данни, които имат нормално разпределение.

Обикновените данни са производни данни, които описват относителните стойности на всяка единица в извадката. Например, обикновените данни за височината на 10 ученика в класната стая биха били просто числата 1 до 10, където 1 може да представлява най-краткия ученик, а 10 може да представлява най-високия студент. Никой ученик няма да има еднаква стойност, освен ако не е с еднаква височина. Мерките за централна тенденция са безсмислени с редови данни.

Т-тестовете не са подходящи за използване с редови данни. Тъй като обикновените данни нямат централна тенденция, те също нямат нормално разпределение. Стойностите на обикновените данни са разпределени равномерно, а не групирани около средна точка. Поради това t-тестът на редови данни няма да има статистическо значение.

Има три теста със статистическа значимост, които е подходящо да се използват с редови данни. Корелацията на ранговия ред на Спиърман е подходящо да се използва, когато участват само две променливи и връзката им е монотонна, макар и не непременно линейна. В монотонните отношения, когато първата променлива се увеличава, няма промяна в посоката на втората променлива. Тестът на Крускал-Уолис е предназначен за случаи, в които има повече от две проби и данните обикновено не се разпределят. Подобно е на еднопосочен дисперсионен анализ. Дисперсионният анализ на Фридман по рангове може да се използва, когато има три или повече наблюдения на една променлива в една група.

  • Дял
instagram viewer