მონაცემები, განსაკუთრებით რიცხვითი მონაცემები, არის ძლიერი ინსტრუმენტი, რომ გქონდეთ, თუ იცით, რა უნდა გააკეთოთ მასთან; გრაფიკები წარმოადგენს მონაცემთა ან ინფორმაციის ორგანიზებულად წარმოჩენის ერთ-ერთ გზას, თუ მოცემული მონაცემები, რომელთანაც მუშაობთ, თავად მოგაწვდით თქვენთვის საჭირო ანალიზს.
ხშირად სტატისტიკოსები, ინსტრუქტორები და სხვები აინტერესებენ მონაცემთა განაწილებას. მაგალითად, თუ მონაცემები წარმოადგენს ქიმიის ტესტის შედეგების ერთობლიობას, თქვენ შეიძლება დაინტერესდეთ, თუ რა განსხვავებაა აქ ყველაზე დაბალი და ყველაზე მაღალი ქულები ან ტესტების მიმდევართა ნაწილის შესახებ, რომლებიც მათ შორის სხვადასხვა "სლოტს" იკავებენ უკიდურესობა.
სიხშირეების განაწილება ძლიერი იარაღია მეცნიერებისთვის, განსაკუთრებით (მაგრამ არა მხოლოდ), როდესაც მონაცემები გრაფიკის მარჯვენა და მარცხენა მხარეს შორის საშუალო ან საშუალო დარტყმის გარშემოა. ეს არის ნაცნობი "ზარის ფორმის მრუდი" ჩვეულებრივ განაწილებული მონაცემები
რა არის სიხშირის განაწილება?
ა სიხშირის განაწილება არის ცხრილი, რომელიც მოიცავს მონაცემთა წერტილების ინტერვალებს, ეწოდება კლასები და თითოეულ კლასში შესვლის საერთო რაოდენობა. თითოეული კლასის სიხშირე არის მხოლოდ მონაცემთა წერტილების რაოდენობა. თითოეული კლასის შემზღუდველ წერტილებს ეწოდება ქვედა კლასის ზღვარი და ზედა კლასის ზღვარი და
კლასის სიგანე არის მანძილი თანმიმდევრული კლასების ქვედა (ან უფრო მაღალ) საზღვრებს შორის. Ეს არის არა განსხვავება სიგნალის მაღალ და ქვედა საზღვრებს შორის იგივე კლასი.დიაპაზონი არის განსხვავება ცხრილში ან მის შესაბამის გრაფაში ყველაზე დაბალ და მაღალ მნიშვნელობებს შორის.
დაჯგუფებული სიხშირის განაწილების შექმნისას თქვენ იწყება პრინციპი, რომ გამოიყენოთ ხუთიდან 20 კლასამდე. ამ კლასებს უნდა ჰქონდეთ იგივე სიგანე, ან span ან რიცხვითი მნიშვნელობა, რომ განაწილება მართებული იყოს. მას შემდეგ რაც დაადგენთ კლასის სიგანეს (ქვემოთ მოცემულია დეტალური), თქვენ აირჩევთ ამოსავალ წერტილს იგივე ან ნაკლები, ვიდრე ყველაზე დაბალი მნიშვნელობა მთელ კომპლექტში.
ზოგადი სახელმძღვანელო მითითებები კლასების დასადგენად
როგორც აღინიშნა, აირჩიეთ ხუთიდან 20 კლასში; თქვენ ჩვეულებრივ გამოიყენებდით მეტ კლასს მონაცემთა წერტილების უფრო მეტი რაოდენობისთვის, უფრო ფართო დიაპაზონისთვის ან ორივესთვის. გარდა ამისა, მიჰყევით ამ მითითებებს:
- კლასის სიგანე უნდა იყოს კენტი რიცხვი. ეს დარწმუნდება, რომ კლასის შუა წერტილები მთელი რიცხვებია და არა ათობითი რიცხვები.
- მონაცემთა ყველა მნიშვნელობა ზუსტად ერთ კლასში უნდა მოხვდეს. არცერთი იგნორირებულია და არც ერთი არ შეიძლება შევიდეს ერთზე მეტ კლასში.
- კლასები უნდა იყოს უწყვეტი, რაც ნიშნავს, რომ თქვენ უნდა შეიტანოთ ის კლასებიც, რომლებსაც არ აქვთ ჩანაწერები. (გამონაკლისები ხდება უკიდურესობაში; თუ დარჩა ცარიელი პირველი ან ცარიელი ბოლო კლასის კლასი, გამორიცხეთ იგი).
- როგორც უკვე აღვნიშნეთ, კლასები უნდა იყოს ტოლი სიგანე. პირველი და ბოლო კლასები ისევ გამონაკლისებია, რადგან ეს შეიძლება იყოს, მაგალითად, ნებისმიერი მნიშვნელობა დაბალ ბოლოს გარკვეულ რიცხვზე ქვემოთ ან მაღალი რიცხვი გარკვეულ რიცხვზე მაღლა,
სწორად აგებული სიხშირის განაწილებისას, საწყისი წერტილი პლუს კლასის სიგანეზე მეტი კლასების რაოდენობა ყოველთვის უნდა აღემატებოდეს მაქსიმალურ მნიშვნელობას.
კლასის სიგანის მაგალითები
პროფესორმა სტუდენტებს ერთი კვირის განმავლობაში გააკონტროლეს მათი სოციალური ურთიერთობები. კვირის განმავლობაში სოციალური ურთიერთობების რაოდენობა ნაჩვენებია შემდეგ დაჯგუფებულ სიხშირეზე. რა არის კლასის საშუალო წერტილი თითოეული კლასისთვის?
კლასის სიხშირე (ვ)
- 0–7: 7
- 8–14: 37
- 15–21: 32
- 22–28: 21
- 29–35: 3
სულ 100
კლასის სიგანე ამ შემთხვევაში აირჩიეს შვიდი. 35 დიაპაზონის გათვალისწინებით და კენტი რიცხვის საჭიროება კლასის სიგანეზე, მიიღებთ ხუთ კლასს შვიდი დიაპაზონით. შუა წერტილებია 4, 11, 18, 25 და 32.