Ako vypočítať koeficient stanovenia

Korelácia sa nemusí nevyhnutne rovnať príčinným súvislostiam, ale nájdenie korelácie medzi dvoma premennými v experimente je stále veľmi dôležitou stopou, pokiaľ ide o vzťah medzi nimi. Preto sú testy korelácie jedným z najbežnejších typov štatistických testov používaných vo vede, pričom najznámejším je Pearsonov korelačný koeficient.

Koeficient determinácie je však nepochybne dôležitejší, pretože hovorí o podiele zmeny jednej premennej, ktorú možno predpovedať na základe druhej. Preto je pre každého, kto pracuje so štatistikami založenými na korelácii, dôležité naučiť sa vykonávať výpočet koeficientu determinácie.

Čo je to koeficient stanovenia?

Základným definíciou určovacieho koeficientu je, že je druhou mocninou Pearsonovho korelačného koeficientu, r, a tak sa často nazýva R2.

Pearsonov koeficient meria korelácie, keď zvýšenie jednej premennej sprevádza zvýšenie druhej (pozitívna korelácia) alebo jej zníženie (negatívna korelácia). Hodnota pre r môže byť čokoľvek medzi −1 a +1, pričom veľkosť čísla vám hovorí silu korelácie a znamienko vám hovorí, či ide o pozitívnu alebo negatívnu koreláciu.

instagram story viewer

R2 je druhá mocnina tejto miery, takže sa pohybuje medzi 0 a 1 a udáva percento variácie v jednej premennej, ktoré možno predpovedať korelovanou premennou. To je užitočné pre veľa vecí, najmä pre vytváranie matematických modelov na prediktívne účely.

Výpočet koeficientu určenia

Proces výpočtu koeficientu determinácie je preto v zásade rovnaký ako proces výpočtu Pearsonovho korelačného koeficientu, s výnimkou toho, že na konci výsledok zarovnáte na druhú. Vzorec pre Pearsonov korelačný koeficient je:

r = \ frac {n \ súčet xy - \ súčet x \ súčet y} {\ sqrt {(n \ súčet x ^ 2 - (\ súčet x) ^ 2) - (n \ súčet y ^ 2 - (\ súčet y ) ^ 2)}}

Existuje niekoľko kľúčových informácií, ktoré potrebujete na vypracovanie tohto (pravda, strašidelne vyzerajúceho!) Vzorca: váš X a r hodnoty pre každé pozorovanie (t.j. vaše dve premenné), súčet vašich X a r hodnoty, ich súčet X premenná vynásobená zodpovedajúcou r premenná a ich súčty X a r premenná na druhú.

Pohodlným spôsobom, ako to vyriešiť, je použitie a tabuľkový kalkulátor program ako Microsoft Excel so stĺpcami pre X, r, xy, X2 a r2 a sumy v dolnej časti každého stĺpca. Budete tiež potrebovať hodnotu pre n, veľkosť vašej vzorky (každá z nich má X a a r hodnota).

Prejdite procesom označeným vzorcom. Najprv vezmite n vynásobený súčtom vašich xy hodnoty a potom odčítajte súčet X hodnoty vynásobené súčtom r hodnoty.

Celý tento výsledok vydelíme spodnou časťou: n krát súčet štvorcov vašich X hodnoty mínus súčet X hodnoty na druhú, všetky vynásobené výsledkom toho istého pre váš r hodnoty, nakoniec pred vykonaním rozdelenia vezmeme druhú odmocninu. Toto ti dáva r, ktoré jednoducho zarovnáte na druhú a získate R2.

Interpretácia koeficientu stanovenia

Koeficient determinácie je číslo medzi 0 a 1, ktoré sa dá previesť na percento vynásobením 100. Štandardným interpretačným koeficientom determinácie je veľkosť variácie y, ktorú je možné vysvetliť Xinými slovami, ako dobre ich údaje zodpovedajú použitému regresnému modelu, ktorý ich popisuje.

Je však dôležité uvedomiť si zvyčajné výhrady obsiahnuté v dátach založených na koreláciách. Je úplne možné, aby dve premenné korelovali bez toho, aby to bolo v príčinnej súvislosti.

Zoberme si napríklad vzťah medzi používaním načúvacích prístrojov a počtom vrások na pokožke. Medzi týmito dvoma osobami existuje silná korelácia, ale obe sú samozrejme skutočne spôsobené starobou. Nejde o chybu v prístupe, ani o obmedzenie, ktoré musíte brať do úvahy, aby ste výsledky interpretovali správne.

Teachs.ru
  • Zdieľam
instagram viewer