Il coefficiente di correlazione, o r, cade sempre tra -1 e 1 e valuta la relazione lineare tra due insiemi di punti di dati come x e y. È possibile calcolare il coefficiente di correlazione dividendo la somma corretta campionaria, o S, dei quadrati per (x per y) per la radice quadrata della somma corretta campionaria di x2 per y2. In forma di equazione, ciò significa: Sxy/ [√(Sxx * Syy)].
Ricavi S elevando al quadrato la somma dei punti dati, dividendo per il numero di punti dati totali e quindi sottraendo questo valore dalla somma dei punti dati quadrati. Ad esempio, dato un insieme di x punti dati: 3, 5, 7 e 9, calcoleresti il valore Sxx prima elevando al quadrato ogni punto e poi sommando quei quadrati, ottenendo 164. Quindi sottrarre da questo valore la somma al quadrato di questi punti dati divisa per il numero di punti dati, o (24 * 24)/4, che è uguale a 144. Ciò si traduce in Sxx = 20. Dato un insieme di punti dati y: 2, 4, 6 e 10, procederesti allo stesso modo per calcolare Syy = 156 – [(22 * 22)/4], che è uguale a 35, e Sxy = 158 – [(24 * 22)/4], che equivale a 26.
È quindi possibile inserire i valori stabiliti per Sxx, Syy e Sxy nell'equazione Sxy/ [√(Sxx * Syy)]. Usando i valori sopra, questo risulta in 26/[√(20 * 35)], che equivale a 0,983. Poiché questo valore è molto vicino a 1, suggerisce una forte relazione lineare tra questi due set di dati.