Het vinden van de sterkte van de associatie tussen twee variabelen is een belangrijke vaardigheid voor alle soorten wetenschappers. Als twee variabelen met elkaar gecorreleerd zijn, toont dit aan dat er een verband tussen bestaat. Een positieve correlatie betekent dat wanneer de ene variabele toeneemt, de andere dat ook doet, en een negatieve correlatie betekent dat wanneer de ene variabele toeneemt, de andere afneemt. Correlaties bewijzen geen oorzakelijk verband, hoewel het mogelijk is dat verdere tests een causaal verband tussen de variabelen aantonen. De correlatiecoëfficiënt R toont de sterkte van de relatie tussen de twee variabelen en of het een positieve of een negatieve correlatie is.
Maak een tabel van uw gegevens. Dit moet één kolom bevatten voor het deelnemernummer, één kolom voor de eerste variabele (gelabeld X) en één kolom voor de tweede variabele (gelabeld ja). Als u bijvoorbeeld wilt zien of er een verband is tussen lengte en schoenmaat, zou één kolom: identificeer elke persoon die u meet, één kolom toont de lengte van elke persoon en een andere toont hun schoenmaat. Maak drie extra kolommen, één voor
xy, een voor X2 en een voor ja2.Gebruik uw gegevens om de drie extra kolommen in te vullen. Stel je bijvoorbeeld voor dat je eerste persoon 75 centimeter lang is en maat 12 voet heeft. De X (hoogte) kolom zou 75 tonen, en de ja (schoenmaat) kolom zou 12 tonen. Je moet vinden xy, X2 en ja2. Dus met behulp van dit voorbeeld:
xy = 75 × 12 = 900
X2 = 752 = 5,625
ja2 = 122 = 144
Vul deze berekeningen in voor elke persoon van wie u gegevens heeft.
Maak een nieuwe rij aan de onderkant van uw tabel voor de sommen van elke kolom. Tel alle bij elkaar op X waarden, alle ja waarden, alle xy waarden, alle X2 waarden en alle ja2 waarden en plaats de resultaten vervolgens onder aan de overeenkomstige kolom in uw nieuwe rij. U kunt uw nieuwe rij 'som' noemen of een sigma-symbool (Σ) gebruiken.
Je vindt R van uw gegevens met behulp van de formule:
R = [n (Σxy) – (Σx) (Σy)] ÷ √{[nΣx2− (Σx)2] [ny2− (Σy)2]}
Dit ziet er een beetje ontmoedigend uit, dus je kunt het in twee delen splitsen, die we zullen noemen zo en t.
s = n (Σxy) – (Σx) (Σy)
t = √{[n Σx2− (Σx)2] [n y2− (Σy)2]}
In deze vergelijkingen, nee is het aantal deelnemers dat u heeft (uw steekproefomvang). De rest van de delen van de vergelijking zijn de sommen die u in de laatste stap hebt berekend. Dus voor zo, vermenigvuldig de grootte van uw steekproef met de som van de xy kolom en trek vervolgens de som van de X kolom vermenigvuldigd met de som van de ja kolom hiervan.
Voor t, zijn er vier hoofdstappen. Bereken eerst nee vermenigvuldigd met de som van jouw X2 kolom en trek vervolgens de som van uw X kolom kwadraat (vermenigvuldigd met zichzelf) van deze waarde. Ten tweede, doe precies hetzelfde, maar met de som van de ja2 kolom en de som van de ja kolom in het kwadraat in plaats van de X delen (d.w.z. n × Σy2 – [Σy × Σy]). Ten derde, vermenigvuldig deze twee resultaten (voor de Xs en jas) samen. Ten vierde, neem de vierkantswortel van dit antwoord.
Als je in delen hebt gewerkt, kun je rekenen R zo eenvoudig R = s ÷ t. Je krijgt een antwoord tussen −1 en 1. Een positief antwoord toont een positieve correlatie, waarbij alles boven de 0,7 over het algemeen als een sterke relatie wordt beschouwd. Een negatief antwoord toont een negatieve correlatie, waarbij alles boven −0,7 als een sterk negatief verband wordt beschouwd. Evenzo wordt ± 0,5 als een matige relatie beschouwd en ± 0,3 als een zwakke relatie. Alles dicht bij 0 wijst op een gebrek aan correlatie.