Testy statystyczne służą do określenia, czy hipotetyczny związek między zmiennymi ma istotność statystyczną. Zazwyczaj test mierzy stopień, w jakim zmienne są skorelowane lub różnią się. Testy parametryczne to takie, które opierają się na centralnych tendencjach zmiennych i zakładają rozkład normalny. Testy nieparametryczne nie zawierają założeń dotyczących rozkładów populacji.
Test t jest testem parametrycznym, który porównuje średnie badanych próbek i populacji. Istnieje kilka odmian t-testów. Test t dla jednej próby porównuje średnią próbki z hipotetyczną średnią. Test t dla niezależnych próbek sprawdza, czy średnie z dwóch różnych próbek mają podobne wartości. Test t dla sparowanych próbek jest stosowany, gdy istnieją dwie obserwacje do porównania dla każdego osobnika w próbce. Test t jest przeznaczony dla danych liczbowych o rozkładzie normalnym.
Dane porządkowe to dane pochodne, które opisują względne wartości każdej jednostki w próbce. Na przykład dane porządkowe wzrostu 10 uczniów w klasie to po prostu liczby 1 do 10, gdzie 1 może reprezentować najniższego ucznia, a 10 może reprezentować najwyższego student. Żaden student nie miałby takiej samej wartości, gdyby nie miał dokładnie tego samego wzrostu. Miary tendencji centralnej są bez znaczenia w przypadku danych porządkowych.
Testy T nie są odpowiednie do stosowania z danymi porządkowymi. Ponieważ dane porządkowe nie mają tendencji centralnej, nie mają również rozkładu normalnego. Wartości danych porządkowych są równomiernie rozłożone, a nie zgrupowane wokół punktu środkowego. Z tego powodu test t danych porządkowych nie miałby znaczenia statystycznego.
Istnieją trzy testy istotności statystycznej, które są odpowiednie do stosowania z danymi porządkowymi. Korelacja rang Spearmana jest odpowiednia do użycia, gdy zaangażowane są tylko dwie zmienne, a ich związek jest monotoniczny, choć niekoniecznie liniowy. W związkach monotonicznych wraz ze wzrostem pierwszej zmiennej nie następuje zmiana kierunku drugiej zmiennej. Test Kruskala-Wallisa jest przeznaczony do przypadków, w których jest więcej niż dwie próbki, a dane nie mają rozkładu normalnego. Jest to podobne do jednokierunkowej analizy wariancji. Analizę wariancji Friedmana według rang można zastosować, gdy w jednej grupie występują trzy lub więcej obserwacji jednej zmiennej.