Hoe de correlatie te berekenen

De correlatiecoëfficiënt, of r, valt altijd tussen -1 en 1 en beoordeelt de lineaire relatie tussen twee sets gegevenspunten zoals x en y. U kunt de correlatiecoëfficiënt berekenen door de voor de steekproef gecorrigeerde som, of S, van kwadraten voor (x maal y) te delen door de vierkantswortel van de voor de steekproef gecorrigeerde som van x2 maal y2. In vergelijkingsvorm betekent dit: Sxy/ [√(Sxx * Syy)].

U leidt S af door de som van uw gegevenspunten te kwadrateren, te delen door het aantal totale gegevenspunten en deze waarde vervolgens af te trekken van de som van de gekwadrateerde gegevenspunten. Als u bijvoorbeeld een reeks x gegevenspunten geeft: 3, 5, 7 en 9, zou u de Sxx-waarde berekenen door eerst elk punt te kwadrateren en vervolgens die vierkanten bij elkaar op te tellen, wat resulteert in 164. Trek vervolgens van deze waarde de kwadratische som van deze gegevenspunten af, gedeeld door het aantal gegevenspunten, of (24 * 24)/4, wat gelijk is aan 144. Dit resulteert in Sxx = 20. Gegeven een reeks y-gegevenspunten: 2, 4, 6 en 10, zou u op dezelfde manier te werk gaan om Syy = 156 – [(22 * 22)/4] te berekenen, wat gelijk is aan 35, en Sxy = 158 – [(24 * 22)/4], wat gelijk is aan 26.

Vervolgens kunt u de vastgestelde waarden voor Sxx, Syy en Sxy invoegen in de vergelijking Sxy/ [√(Sxx * Syy)]. Met de bovenstaande waarden resulteert dit in 26/[√(20 * 35)], wat gelijk is aan 0,983. Aangezien deze waarde heel dicht bij 1 ligt, suggereert dit een sterk lineair verband tussen deze twee gegevenssets.

  • Delen
instagram viewer