Как да тълкуваме разпръснат сюжет

Разпръснатият график е важен диагностичен инструмент в арсенала на статистик, получен чрез графики на две променливи една срещу друга. Това позволява на статистика да наблюдава променливите и да формира работеща хипотеза за тяхната връзка. Поради тази причина обикновено се съставя, преди да се извърши регресионен анализ. Впоследствие статистикът тества хипотезата, използвайки регресионен анализ и определя знака и точната величина на връзката. Освен това, разпръснат график помага да се идентифицират отклонения - стойности, които са необичайно отдалечени от повечето данни в извадката. Елиминирането на отклоненията спомага за подобряване на модела на регресия.

Проверете за отрицателна връзка между двете променливи в графиката за разсейване. Ако ниските стойности на първата променлива съответстват на стойностите на втората променлива, има отрицателна корелация. В този случай линия, изтеглена през точките с данни, има отрицателен наклон.

Проучете графика на разсейване за положителна връзка между променливите. Ако ниските стойности на първата променлива в разпръснатия график съответстват на ниските стойности на втората, а високата Стойностите на първата по същия начин съответстват на високите стойности на втората, променливите имат положителна стойност корелация. В този случай линия, изтеглена през точките с данни, има положителен наклон.

Проверете разпръснатия график за липса на връзка между променливите. Ако точките от данни в разпръснатия график са разпределени произволно, без видима връзка между двете, те или нямат корелация, или са малки, статистически незначителни корелации. В този случай линия, изтеглена през точките с данни, е хоризонтална с наклон, равен на нула.

Поставете линия през точките с данни и изследвайте нейната форма, за да прецените естеството на връзката между двете променливи. Правата линия се тълкува като линейна връзка, извитата форма предполага квадратична връзка и a линия, която лежи сравнително плоско преди изведнъж стрелба нагоре или надолу, се интерпретира като експоненциална връзка.

Проучете графика на разсейване за изключения, стойности, които се намират необичайно далеч от клъстера от точки с данни. Отклоненията нарушават връзката между променливите. Елиминирайте ги, но само ако тяхното отсъствие не влияе на анализа на връзката между двете променливи.

  • Дял
instagram viewer