Scatter ნაკვეთი არის გრაფიკი, რომელიც გვიჩვენებს ურთიერთკავშირს მონაცემთა ორ წყობას შორის. ზოგჯერ გამოსადეგია მონაცემების გამოყენება scatter ნაკვეთში, მათემატიკური კავშირის მისაღებად ორ ცვლადს შორის. გაფანტული ნაკვეთის განტოლების მიღება შესაძლებელია ხელით, ორი ძირითადი ხერხის გამოყენებით: გრაფიკული ტექნიკა ან ტექნიკა, რომელსაც წრფივი უკუგანვითარება ეწოდება.
Scatter ნაკვეთის შექმნა
გამოიყენეთ გრაფიკული ქაღალდი გაფანტული ნაკვეთის შესაქმნელად. დახაზეთ x- და y- ცულები, დარწმუნდით, რომ ისინი იკვეთება და ასახავს წარმოშობას. დარწმუნდით, რომ x- და y- ცულებს ასევე აქვთ სწორი სათაურები. შემდეგ, თითოეული მონაკვეთის წერტილის გამოსახვა გრაფაში. ახლა უკვე აშკარა უნდა იყოს ნებისმიერი ტენდენცია მონაცემების სავარაუდო ნაკრებებს შორის.
ხაზის საუკეთესო ჯდება
მას შემდეგ, რაც scatter plot შეიქმნება, თუ ჩავთვლით, რომ წრფივი კორელაციაა მონაცემთა ორ წყობას შორის, განტოლების მისაღებად შეგვიძლია გამოვიყენოთ გრაფიკული მეთოდი. აიღეთ სახაზავი და დახაზეთ ხაზი რაც შეიძლება ახლოს ყველა წერტილთან. შეეცადეთ დარწმუნდეთ, რომ ხაზის ზემოთ იმდენი წერტილია, რამდენიც ხაზის ქვემოთ. ხაზის დახატვის შემდეგ გამოიყენეთ სტანდარტული მეთოდები, რომ იპოვოთ სწორი ხაზის განტოლება
სწორი ხაზის განტოლება
მას შემდეგ, რაც scatter გრაფაზე განთავსდება საუკეთესო წრფის ხაზი, მარტივია იპოვოთ განტოლება. სწორი ხაზის ზოგადი განტოლებაა:
y = mx + გ
სად მ არის ხაზის დახრა (გრადიენტი) და გ არის y-შეუკვეთე. გრადიენტის მისაღებად, იპოვნეთ ორი წერტილი წრფეზე. ამ მაგალითის გამო, ჩავთვალოთ, რომ ორი წერტილი არის (1,3) და (0,1). გრადიენტი შეიძლება გამოითვალოს y კოორდინატებში სხვაობის მიღებით და გაყოფით განსხვავებაზე x-კოორდინატები:
m = \ frac {3 - 1} {1 - 0} = \ frac {2} {1} = 2
გრადიენტი ამ შემთხვევაში ტოლია 2-ის. ჯერჯერობით, სწორი ხაზის განტოლებაა
y = 2x + გ
მნიშვნელობა ამისთვის გ შეიძლება მიღებულ იქნას ცნობილი წერტილის მნიშვნელობებით ჩანაცვლებით. მაგალითის შემდეგ, ერთ-ერთი ცნობილი პუნქტია (1,3). ჩართეთ ეს განტოლებაში და გადაალაგეთ გ:
3 = (2 × 1) + გ \\ გ = 3 - 2 = 1
ამ შემთხვევაში საბოლოო განტოლებაა:
y = 2x + 1
ხაზოვანი რეგრესია
ხაზოვანი უკუგანვითარება არის მათემატიკური მეთოდი, რომლის საშუალებითაც შესაძლებელია scatter ნაკვეთის სწორი ხაზის განტოლების მიღება. დაიწყეთ თქვენი მონაცემების ცხრილში განთავსებით. ამ მაგალითისთვის, ჩავთვალოთ, რომ ჩვენ გვაქვს შემდეგი მონაცემები:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
გამოთვალეთ x სიდიდეების ჯამი:
x_ {ჯამი} = 4,1 + 6,5 + 12,6 = 23,2
შემდეგ, გამოთვალეთ y- მნიშვნელობების ჯამი:
y_ {sum} = 2.2 + 4.4 + 10.4 = 17
ახლა შეაჯამეთ თითოეული მონაცემთა წერტილის ნაკრების პროდუქტები:
xy_ {sum} = (4.1 × 2.2) + (6.5 × 4.4) + (12.6 × 10.4) = 168.66
შემდეგ გამოთვალეთ x- მნიშვნელობების კვადრატის და y- მნიშვნელობების ჯამი ჯამი:
x ^ 2_ {sum} = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y ^ 2_ {sum} = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25
დაბოლოს, დაითვალეთ მონაცემთა წერტილების რაოდენობა. ამ შემთხვევაში გვაქვს მონაცემთა სამი წერტილი (N = 3). გრადიენტი საუკეთესოდ მორგებული ხაზისთვის შეგიძლიათ მიიღოთ შემდეგიდან:
m = \ frac {(N × xy_ {sum}) - (x_ {sum} y_ {sum})}} {(N × x ^ 2_ {sum}) - (x_ {sum} × x_ {sum})} \\ \, \\ = \ frac {(3 × 168,66) - (23,2 × 17)} {(3 × 217,82) - (23,2 × 23,2)} \\ \, \\ = 0,968
საუკეთესოდ მორგებული ხაზის ჩაჭრა შეგიძლიათ მიიღოთ აქ:
\ დაწყება {გასწორება} c & = \ frac {(x ^ 2_ {sum} × y_ {sum}) - (x_ {sum} × xy_ {sum})} {(N × x ^ 2_ {sum}) - ( x_ {ჯამი} x_ {sum})} \\ \, \\ & = \ frac {(217.82 × 17) - (23.2 × 168.66)} {(3 × 217.82) - (23.2 × 23.2)} \\ \, \\ & = -1.82 \ end {გასწორებული}
საბოლოო განტოლებაა:
y = 0.968x - 1.82