Как да намерим коефициента на корелация за 'R' в разпръснат парцел

Намирането на силата на връзката между две променливи е важно умение за учените от всички видове. Ако две променливи са свързани помежду си, това показва, че има връзка между тях. Положителната корелация означава, че когато една променлива се увеличава, другата също се увеличава, а отрицателната корелация означава, че когато една променлива се увеличава, другата намалява. Корелациите не доказват причинно-следствена връзка, въпреки че е възможно допълнителни тестове да докажат причинно-следствена връзка между променливите. Коефициентът на корелация R показва силата на връзката между двете променливи и дали е положителна или отрицателна корелация.

Направете таблица на вашите данни. Това трябва да включва една колона за номера на участника, една колона за първата променлива (с етикет х) и една колона за втората променлива (с етикет у). Например, ако искате да видите дали има връзка между височината и размера на обувката, една колона би го направила идентифицирайте всеки човек, когото измервате, една колона показва височината на всеки човек, а друга - размера на обувката му. Направете три допълнителни колони, една за

xy, един за х2 и един за у2.

Използвайте вашите данни, за да попълните трите допълнителни колони. Например, представете си, че първият ви човек е висок 75 инча и е с размер 12 фута. The х (височина) колона ще показва 75, а у (размер на обувката) ще показва 12. Трябва да намериш xy, х2 и у2. Така че, използвайки този пример:

xy = 75 × 12 = 900

х2 = 752 = 5,625

у2 = 122 = 144

Попълнете тези изчисления за всеки човек, за когото имате данни.

Създайте нов ред в долната част на таблицата за сумите на всяка колона. Съберете всички х стойности, всички у стойности, всички xy стойности, всички х2 стойности и всички у2 стойности и след това поставете резултатите в долната част на съответната колона в новия си ред. Можете да маркирате новия си ред „сума“ или да използвате символ сигма (Σ).

Ти намери R от вашите данни, използвайки формулата:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nΣy2- (Σy)2]}

Това изглежда малко плашещо, така че можете да го разделите на две части, които ще наречем с и T.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx2- (Σx)2] [n Σy2- (Σy)2]}

В тези уравнения, н е броят на участниците, които имате (размерът на извадката). Останалите части от уравнението са сумите, които сте изчислили в последната стъпка. Така че за с, умножете размера на вашата проба по сумата от xy и след това извадете сумата от х колона, умножена по сумата от у колона от това.

За T, има четири основни стъпки. Първо изчислете н умножен по сумата от вашия х2 и след това извадете сумата от вашата х колона на квадрат (умножена по себе си) от тази стойност. Второ, направете точно същото нещо, но със сумата от у2 колона и сумата от у колона на квадрат на мястото на х части (т.е. n × Σy2 - [Σy × Σy]). Трето, умножете тези два резултата (за хпясък уs) заедно. Четвърто, вземете квадратния корен от този отговор.

Ако сте работили на части, можете да изчислите R толкова просто R = s ÷ t. Ще получите отговор между -1 и 1. Положителният отговор показва положителна корелация, като всичко над 0,7 обикновено се счита за силна връзка. Отрицателният отговор показва отрицателна корелация, като всичко над -0,7 се счита за силна отрицателна връзка. По същия начин ± 0,5 се счита за умерена връзка и ± 0,3 се счита за слаба връзка. Всичко, което е близо до 0, показва липса на корелация.

  • Дял
instagram viewer