Hur man tolkar en scatterplot

En spridningsdiagram är ett viktigt diagnostiskt verktyg i en statistikars arsenal, erhållet genom att grafera två variabler mot varandra. Det gör det möjligt för statistikern att se på variablerna och bilda en arbetshypotes om deras förhållande. Av denna anledning ritas det vanligtvis innan en regressionsanalys utförs. Statistikern testar därefter hypotesen med hjälp av en regressionsanalys och bestämmer relationens tecken och exakta storlek. Dessutom hjälper en spridningsdiagram att identifiera avvikare - värden som är onormalt avlägsna från de flesta uppgifterna i urvalet. Att eliminera avvikare hjälper till att förbättra regressionsmodellen.

Kontrollera om det finns ett negativt samband mellan de två variablerna i spridningsdiagrammet. Om låga värden för den första variabeln motsvarar höga värden för den andra variabeln, finns det en negativ korrelation. I detta fall har en linje som dras genom datapunkterna en negativ lutning.

Undersök spridningsdiagrammet för positivt förhållande mellan variablerna. Om låga värden för den första variabeln i spridningsdiagrammet motsvarar låga värden för den andra och den höga värdena för den första motsvarar på samma sätt de höga värdena för den andra, variablerna har en positiv korrelation. I detta fall har en linje som dras genom datapunkterna en positiv lutning.

Inspektera spridningsdiagrammet för inget samband mellan variablerna. Om datapunkterna i spridningsdiagrammet fördelas slumpmässigt utan någon uppenbar relation mellan de två, har de antingen ingen korrelation eller liten, statistiskt obetydlig korrelation. I detta fall är en linje som dras genom datapunkterna horisontell med lutningen lika med noll.

Passa en linje genom datapunkterna och undersök dess form för att mäta arten av förhållandet mellan de två variablerna. En rak linje tolkas som ett linjärt förhållande, en böjd form antyder en kvadratisk relation och en linje som ligger relativt platt innan man plötsligt skjuter upp eller ner tolkas som ett exponentiellt förhållande.

Undersök spridningsdiagrammet för avvikelser, värden som ligger onormalt långt från klustret av datapunkter. Outliers förvränger förhållandet mellan variablerna. Eliminera dem, men bara om deras frånvaro inte påverkar analysen av förhållandet mellan de två variablerna.

  • Dela med sig
instagram viewer