Bagaimana Menafsirkan Scatter Plot

Plot sebar adalah alat diagnostik penting dalam gudang ahli statistik, diperoleh dengan membuat grafik dua variabel satu sama lain. Ini memungkinkan ahli statistik untuk mengamati variabel dan membentuk hipotesis kerja tentang hubungan mereka. Untuk alasan ini, biasanya ditarik sebelum analisis regresi dilakukan. Ahli statistik selanjutnya menguji hipotesis menggunakan analisis regresi dan menentukan tanda dan besaran yang tepat dari hubungan tersebut. Selain itu, plot pencar membantu mengidentifikasi outlier — nilai yang sangat jauh dari sebagian besar data dalam sampel. Menghilangkan outlier membantu meningkatkan model regresi.

Periksa hubungan negatif antara dua variabel dalam plot pencar. Jika nilai rendah dari variabel pertama sesuai dengan nilai tinggi dari variabel kedua, ada korelasi negatif. Dalam hal ini, garis yang ditarik melalui titik data memiliki kemiringan negatif.

Periksa plot pencar untuk hubungan positif antara variabel. Jika nilai rendah dari variabel pertama dalam plot pencar sesuai dengan nilai rendah dari yang kedua, dan tinggi nilai yang pertama sama sesuai dengan nilai tinggi yang kedua, variabel memiliki positif korelasi. Dalam hal ini, garis yang ditarik melalui titik data memiliki kemiringan positif.

Periksa plot pencar untuk tidak ada hubungan antara variabel. Jika titik-titik data dalam plot pencar didistribusikan secara acak tanpa hubungan yang jelas antara keduanya, mereka tidak memiliki korelasi, atau korelasi kecil yang tidak signifikan secara statistik. Dalam hal ini, garis yang ditarik melalui titik data adalah horizontal dengan kemiringan sama dengan nol.

Pasang garis melalui titik-titik data dan periksa bentuknya untuk mengukur sifat hubungan antara dua variabel. Garis lurus diartikan sebagai hubungan linier, bentuk lengkung menunjukkan hubungan kuadrat, dan a garis yang terletak relatif datar sebelum tiba-tiba melesat naik atau turun diinterpretasikan sebagai hubungan eksponensial.

Periksa plot pencar untuk outlier, nilai-nilai yang terletak tidak normal jauh dari cluster titik data. Pencilan mendistorsi hubungan antara variabel. Hilangkan mereka, tetapi hanya jika ketidakhadiran mereka tidak mempengaruhi analisis hubungan antara dua variabel.

  • Bagikan
instagram viewer