ხაზოვანი რეგრესიის უარყოფითი მხარეები

ხაზოვანი უკუგანვითარება არის სტატისტიკური მეთოდი დამოკიდებულ ცვლადს შორის კავშირის შესასწავლად, აღინიშნება როგორც y, და ერთი ან მეტი დამოუკიდებელი ცვლადი, აღინიშნება როგორც x. დამოკიდებული ცვლადი უნდა იყოს უწყვეტი, რომ მას შეუძლია მიიღოს ნებისმიერი მნიშვნელობა, ან სულ მცირე, უახლოესთან ახლოს. დამოუკიდებელი ცვლადები შეიძლება იყოს ნებისმიერი ტიპის. მართალია სწორხაზოვან რეგრესიას არ შეუძლია აჩვენოს მიზეზობრიობა თავისთავად, მაგრამ დამოკიდებულ ცვლადზე გავლენას ახდენენ დამოუკიდებელი ცვლადები.

ხაზოვანი უკუგანვითარება შემოიფარგლება ხაზოვანი ურთიერთობებით

თავისი ხასიათიდან, წრფივი უკუგანვითარება მხოლოდ განიხილავს დამოკიდებულ და დამოუკიდებელ ცვლადებს შორის ხაზოვან ურთიერთობებს. ეს ნიშნავს, რომ მათ შორის არსებობს სწორი ხაზის კავშირი. ზოგჯერ ეს არასწორია. მაგალითად, შემოსავლისა და ასაკის ურთიერთობა მრუდია, ანუ, შემოსავალი ზრდასრულობის ადრეულ ნაწილებში იზრდება, მოგვიანებით ზრდასრულობაში ბრტყელდება და პენსიაზე გასვლის შემდეგ იკლებს. ამის გარკვევა შეგიძლიათ თუ არა ეს პრობლემა, ხედავთ ურთიერთობების გრაფიკულ გამოსახულებებს.

ხაზოვანი რეგრესია მხოლოდ დამოკიდებულია დამოკიდებული ცვლადის საშუალოზე

ხაზოვანი რეგრესია უყურებს დამოკიდებულებას დამოკიდებული ცვლადის საშუალოსა და დამოუკიდებელ ცვლადებს შორის. მაგალითად, თუ გადავხედავთ ახალშობილთა და დედის დაბადების წონას შორის დამოკიდებულებას ისეთი მახასიათებლები, როგორიცაა ასაკი, წრფივი რეგრესია შეისწავლის ახალშობილთა საშუალო წონას დედებში სხვადასხვა ასაკის. ამასთან, ზოგჯერ თქვენ უნდა გაეცნოთ დამოკიდებული ცვლადის უკიდურესობებს, მაგალითად, ჩვილები საფრთხეში არიან, როდესაც მათი წონა დაბალია, ამიტომ ამ მაგალითში გსურთ უკიდურესობების ნახვა.

ისევე როგორც საშუალო არ არის ერთი ცვლადის სრული აღწერა, წრფივი უკუგანვითარება არ არის ცვლადებს შორის ურთიერთობების სრული აღწერა. ამ პრობლემის მოგვარება შეგიძლიათ რაოდენობრივი რეგრესიის გამოყენებით.

ხაზოვანი რეგრესია მგრძნობიარეა გარემოს მიმართ

Outlier არის გასაკვირი მონაცემები. დაშორებები შეიძლება იყოს ცალმხრივი (ეფუძნება ერთ ცვლადს) ან მრავალფეროვანი. თუ ასაკს და შემოსავალს ათვალიერებთ, ერთფეროვანი განტოლებები იქნება ისეთი ადამიანი, როგორიცაა 118 წლის ადამიანი, ან ის, ვინც შარშან 12 მილიონი დოლარი გამოიმუშავა. მრავალმხრივი მონაკვეთი იქნება 18 წლის, რომელმაც $ 200,000 გამოიმუშავა. ამ შემთხვევაში არც ასაკია და არც შემოსავალი ძალიან უკიდურესი, მაგრამ ძალიან ცოტა 18 წლის ადამიანი აკეთებს ამდენ ფულს.

განადგურებამ შეიძლება დიდი გავლენა იქონიოს რეგრესზე. ამ პრობლემის მოგვარება შეგიძლიათ თქვენი სტატისტიკური პროგრამიდან გავლენის სტატისტიკის მოთხოვნით.

მონაცემები უნდა იყოს დამოუკიდებელი

ხაზოვანი რეგრესია ითვალისწინებს მონაცემების დამოუკიდებლობას. ეს ნიშნავს, რომ ერთი საგნის (მაგალითად, პიროვნების) ქულებს საერთო არაფერი აქვთ მეორესთან. ეს ხშირად, მაგრამ არა ყოველთვის, საღად მოაზროვნეა. ორი ჩვეულებრივი შემთხვევა, როდესაც ამას აზრი არ აქვს, არის კლასტერული სივრცე და დრო.

სივრცეში კლასტერიზაციის კლასიკური მაგალითია სტუდენტური ტესტის ქულები, როდესაც გყავთ სხვადასხვა კლასის, კლასის, სკოლისა და სკოლის რაიონის მოსწავლეები. ერთი და იმავე კლასის მოსწავლეები მრავალი თვალსაზრისით მსგავსნი არიან, ანუ ისინი ხშირად მოდიან ერთი და იგივე უბნიდან, მათ ჰყავთ ერთი და იგივე მასწავლებლები და ა.შ. ამრიგად, ისინი არ არიან დამოუკიდებლები.

დროულად კლასტერიზაციის მაგალითებია ნებისმიერი კვლევა, სადაც ერთსა და იმავე საგნებს რამდენჯერმე გაზომავთ. მაგალითად, დიეტისა და წონის შესწავლისას შეიძლება თითოეული ადამიანი რამდენჯერმე გაზომოთ. ეს მონაცემები არ არის დამოუკიდებელი, რადგან ის, რასაც ადამიანი იწონის ერთ შემთხვევასთან, უკავშირდება იმას, რასაც სხვა შემთხვევებში იწონის. ამის მოგვარების ერთ – ერთი გზაა მრავალდონიანი მოდელები.

  • გაზიარება
instagram viewer