ข้อผิดพลาด คำพูดนี้สะท้อนถึงความเสียใจและความสำนึกผิด อย่างน้อยถ้าคุณบังเอิญเป็นนักเบสบอล คนสอบ หรือผู้เข้าร่วมการตอบคำถาม สำหรับนักสถิติ ข้อผิดพลาดเป็นเพียงอีกสิ่งหนึ่งที่ควรติดตามโดยเป็นส่วนหนึ่งของรายละเอียดงาน เว้นแต่ว่าข้อผิดพลาดของนักสถิติเองเป็นประเด็น
คำว่าขอบของความผิดพลาดเป็นเรื่องปกติในชีวิตประจำวัน รวมถึงบทความทางสื่อมากมายเกี่ยวกับหัวข้อทางวิทยาศาสตร์หรือการสำรวจความคิดเห็น เป็นวิธีการรายงานความน่าเชื่อถือของมูลค่า (เช่น เปอร์เซ็นต์ของผู้ใหญ่ที่ชอบผู้สมัครทางการเมืองคนใดคนหนึ่ง) มันขึ้นอยู่กับปัจจัยหลายประการ รวมถึงขนาดของกลุ่มตัวอย่างที่นำมาและค่าสันนิษฐานของค่าเฉลี่ยประชากรของตัวแปรที่สนใจ
เพื่อทำความเข้าใจขอบของข้อผิดพลาด คุณต้องมีความรู้เกี่ยวกับสถิติพื้นฐานก่อน โดยเฉพาะอย่างยิ่ง แนวคิดของการแจกแจงแบบปกติ ขณะที่คุณอ่าน ให้ใส่ใจเป็นพิเศษกับความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างกับค่าเฉลี่ยของค่าเฉลี่ยตัวอย่างเหล่านี้จำนวนมาก
สถิติประชากร: พื้นฐาน
หากคุณมีตัวอย่างข้อมูล เช่น น้ำหนักของเด็กชายอายุ 15 ปีสุ่มเลือก 500 คนในสวีเดน คุณสามารถ คำนวณค่าเฉลี่ยหรือค่าเฉลี่ย โดยการหารผลรวมของน้ำหนักแต่ละรายการด้วยจำนวนจุดข้อมูล (500). ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างนี้คือการวัดการแพร่กระจายของข้อมูลนั้นเกี่ยวกับค่าเฉลี่ยนั้น โดยแสดงให้เห็นว่าค่า (เช่น น้ำหนัก) มีแนวโน้มในการจัดกลุ่มอย่างกว้างขวางเพียงใด
- อะไรน่าจะมีค่าเบี่ยงเบนมาตรฐานมากกว่า: น้ำหนักเฉลี่ยเป็นปอนด์ของเด็กชายสวีเดนที่กล่าวถึงข้างต้น หรือจำนวนปีของการเรียนทั้งหมดที่พวกเขาสำเร็จการศึกษาเมื่ออายุ 15 ปี
ทฤษฎีบทขีด จำกัด กลางของสถิติระบุว่าในตัวอย่างใด ๆ ที่นำมาจากประชากรที่มีค่าสำหรับตัวแปรที่กำหนดซึ่งปกติจะแจกแจงเป็นค่าเฉลี่ย แล้วค่าเฉลี่ยของวิธีการ ของตัวอย่างที่นำมาจากประชากรนั้นจะเข้าใกล้ค่าเฉลี่ยของประชากร เนื่องจากจำนวนตัวอย่างหมายถึงค่าเฉลี่ยเพิ่มขึ้นจนเป็นอนันต์
ในสถิติตัวอย่าง ค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานแสดงด้วย x̄ และ s ซึ่งเป็นสถิติจริง แทนที่จะเป็นμและ σ ซึ่งจริงๆ แล้วคือพารามิเตอร์และไม่อาจทราบได้อย่างแน่ชัด 100 เปอร์เซ็นต์ ตัวอย่างต่อไปนี้แสดงให้เห็นถึงความแตกต่าง ซึ่งจะเกิดขึ้นเมื่อคำนวณระยะขอบของข้อผิดพลาด
หากคุณสุ่มตัวอย่างความสูงของผู้หญิงที่สุ่มเลือก 100 คนในประเทศใหญ่ๆ ที่ความสูงเฉลี่ยของผู้หญิงที่เป็นผู้ใหญ่คือ 64.25 นิ้ว โดยมี ส่วนเบี่ยงเบนมาตรฐาน 2 นิ้ว คุณอาจรวบรวมค่า x's 63.7, 64.9, 64.5 และอื่น ๆ โดยมีค่าเบี่ยงเบนมาตรฐาน s 1.7, 2.3, 2.2 นิ้วและ ชอบ. ในแต่ละกรณี,μ และσ ยังคงไม่เปลี่ยนแปลงที่ 64.25 และ 2 นิ้วตามลำดับ
\text{ค่าเฉลี่ยประชากร } = \mu \newline \text{ค่าเบี่ยงเบนมาตรฐานของประชากร }= \sigma \newline \text{ความแปรปรวนของประชากร}= \sigma^2 \newline \text{ค่าเฉลี่ยตัวอย่าง}= \bar{x} \newline \text{ค่าเบี่ยงเบนมาตรฐานตัวอย่าง }= s\newline \text{ความแปรปรวนตัวอย่าง }= ส^2
ช่วงความเชื่อมั่นคืออะไร?
หากคุณสุ่มเลือกคนเพียงคนเดียวและให้แบบทดสอบวิทยาศาสตร์ทั่วไป 20 คำถามกับเธอ มันคงเป็นเรื่องโง่ที่จะใช้ผลลัพธ์เป็นค่าเฉลี่ยสำหรับประชากรกลุ่มใหญ่ของผู้สอบ อย่างไรก็ตาม หากทราบคะแนนเฉลี่ยของประชากรสำหรับแบบทดสอบนี้ ก็สามารถใช้พลังของสถิติเพื่อ กำหนดความมั่นใจที่คุณสามารถมีได้ว่าช่วงของค่า (ในกรณีนี้คือคะแนน) จะประกอบด้วย .ของคนคนเดียว คะแนน.
อาช่วงความมั่นใจเป็นช่วงของค่าที่สอดคล้องกับเปอร์เซ็นต์ที่คาดไว้ของช่วงดังกล่าวที่จะมีค่า หากมีการสร้างช่วงเวลาดังกล่าวจำนวนมากขึ้นแบบสุ่ม โดยใช้ขนาดตัวอย่างเดียวกันจากช่วงที่ใหญ่กว่าเท่ากัน ประชากร. มีอยู่เสมอบางไม่แน่ใจเกี่ยวกับช่วงความเชื่อมั่นเฉพาะที่น้อยกว่า 100 เปอร์เซ็นต์จริง ๆ แล้วมีค่าที่แท้จริงของพารามิเตอร์หรือไม่ โดยส่วนใหญ่ จะใช้ช่วงความเชื่อมั่น 95 เปอร์เซ็นต์
ตัวอย่าง: สมมติว่าผู้ทำแบบทดสอบของคุณทำคะแนนได้ 22/25 (88 เปอร์เซ็นต์) และคะแนนเฉลี่ยของประชากรคือ 53 เปอร์เซ็นต์ โดยมีค่าเบี่ยงเบนมาตรฐาน ± 10 เปอร์เซ็นต์ มีวิธีใดบ้างที่จะรู้ว่าคะแนนนี้เกี่ยวข้องกับค่าเฉลี่ยในแง่เปอร์เซ็นไทล์ และส่วนต่างของข้อผิดพลาดที่เกี่ยวข้องคืออะไร
ค่านิยมที่สำคัญคืออะไร?
ค่าวิกฤตจะขึ้นอยู่กับข้อมูลที่กระจายตามปกติ ซึ่งเป็นประเภทที่ได้มีการกล่าวถึงในที่นี้ นี่คือข้อมูลที่กระจายแบบสมมาตรเกี่ยวกับค่าเฉลี่ยส่วนกลาง เช่น ส่วนสูงและน้ำหนักมีแนวโน้มว่าจะเป็น ตัวแปรประชากรอื่นๆ เช่น อายุ ไม่แสดงการแจกแจงแบบปกติ
ค่าวิกฤตใช้เพื่อกำหนดช่วงความเชื่อมั่น สิ่งเหล่านี้อยู่บนพื้นฐานของหลักการที่ว่าค่าเฉลี่ยประชากรเป็นค่าประมาณที่น่าเชื่อถือมาก ที่รวบรวมมาจากกลุ่มตัวอย่างที่แทบไม่จำกัดในทางปฏิบัติ พวกเขาจะเขียนแทนโดยzและคุณต้องการแผนภูมิเช่นเดียวกับแผนภูมิในแหล่งข้อมูลเพื่อทำงานกับแผนภูมิเหล่านี้ เนื่องจากช่วงความเชื่อมั่นที่คุณเลือกเป็นตัวกำหนดมูลค่าของแผนภูมิ
เหตุผลหนึ่งที่คุณต้องการz-ค่า (หรือz-scores) คือการกำหนดระยะขอบของความผิดพลาดของค่าเฉลี่ยตัวอย่างหรือค่าเฉลี่ยประชากร การคำนวณเหล่านี้ได้รับการจัดการในรูปแบบที่แตกต่างกันบ้าง
ข้อผิดพลาดมาตรฐานเทียบกับ ส่วนเบี่ยงเบนมาตรฐาน
ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างจะแตกต่างกันไปในแต่ละตัวอย่าง ข้อผิดพลาดมาตรฐานของค่าเฉลี่ยของกลุ่มตัวอย่างขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานของประชากร σ และกำหนดโดยนิพจน์:
\text{ข้อผิดพลาดมาตรฐาน} = \dfrac{\sigma}{\sqrt{n}} \newline
ระยะขอบของสูตรข้อผิดพลาด
เพื่อดำเนินการต่อการอภิปรายข้างต้นเกี่ยวกับคะแนน z พวกเขาจะได้มาจากช่วงความเชื่อมั่นที่เลือก หากต้องการใช้ตารางที่เกี่ยวข้อง ให้แปลงเปอร์เซ็นต์ช่วงความเชื่อมั่นเป็นทศนิยม ลบค่านี้ ปริมาณจาก 1.0 และหารผลลัพธ์ด้วยสอง (เพราะช่วงความเชื่อมั่นมีความสมมาตรเกี่ยวกับ หมายถึง)
ปริมาณ (1 - CI) โดยที่ CI คือช่วงความเชื่อมั่นที่แสดงเป็นสัญกรณ์ทศนิยมเรียกว่า isระดับความสำคัญและเขียนแทนด้วย α ตัวอย่างเช่น เมื่อ CI = 95% = 0.95α = 1.0 − 0.05 = 0.05.
เมื่อคุณมีค่านี้แล้ว คุณจะพบว่าตำแหน่งใดปรากฏบนตารางคะแนน z และกำหนดz-score โดยสังเกตค่าสำหรับแถวและคอลัมน์ที่เกี่ยวข้อง ตัวอย่างเช่น เมื่อα= 0.05 คุณอ้างถึงค่า 0.05/2 = 0.025 ในตารางที่เรียกว่าZ(α/2), เห็นว่ามีความเกี่ยวข้องกับ az-score ของ −1.9 (ค่าแถว) ลบอีก 0.06 (ค่าคอลัมน์) เพื่อให้az-คะแนน −1.96
ระยะขอบของการคำนวณข้อผิดพลาด
ตอนนี้ คุณพร้อมที่จะทำการคำนวณส่วนต่างของข้อผิดพลาดแล้ว ดังที่กล่าวไว้ สิ่งเหล่านี้จะทำแตกต่างกันขึ้นอยู่กับสิ่งที่คุณกำลังค้นหาระยะขอบของข้อผิดพลาด
สูตรสำหรับระยะขอบของข้อผิดพลาดสำหรับค่าเฉลี่ยตัวอย่างคือ:
E = Z_{(α/2)} × s
และสำหรับระยะขอบของความผิดพลาดของค่าเฉลี่ยประชากรคือ:
E = Z_{(α/2)} × \frac{σ}{\sqrt{n}} = Z_{(α/2)} × \text{ข้อผิดพลาดมาตรฐาน}
ตัวอย่าง: สมมติว่าคุณรู้ว่าจำนวนการแสดงออนไลน์ที่ผู้คนในเมืองของคุณรับชมต่อปีนั้นมีการแจกแจงโดยปกติโดยมีค่าเบี่ยงเบนมาตรฐานของประชากร σ เท่ากับ 3.2 รายการ สุ่มตัวอย่างจากชาวเมือง 29 คน ค่าเฉลี่ยกลุ่มตัวอย่างคือ 14.6 รอบ/ปี ใช้ช่วงความเชื่อมั่น 90% ระยะขอบของข้อผิดพลาดคืออะไร
คุณจะเห็นว่าคุณจะใช้สมการที่สองจากสองสมการข้างต้นเพื่อแก้ปัญหานี้ เนื่องจากให้ σ ขั้นแรก คำนวณข้อผิดพลาดมาตรฐาน σ/√น:
\frac{3.6}{\sqrt{29}}= 0.67
ตอนนี้คุณใช้ค่าของZ(α/2) สำหรับα= 0.10. การหาค่า 0.050 ในตาราง คุณจะเห็นว่าค่านี้สอดคล้องกับค่าของzระหว่าง −1.64 ถึง −1.65 ดังนั้น คุณสามารถใช้ −1.645 ได้ สำหรับขอบของข้อผิดพลาดอี, สิ่งนี้ให้:
E = (−1.645)(0.67) = -1.10
โปรดทราบว่าคุณสามารถเริ่มต้นในเชิงบวกz-score ด้านข้างของตารางและพบค่าที่สอดคล้องกับ 0.90 แทนที่จะเป็น 0.10 เนื่องจากสิ่งนี้แสดงถึงจุดวิกฤตที่สอดคล้องกันบนฝั่งตรงข้าม (ขวา) ของกราฟ นี้จะได้รับอี= 1.10 ซึ่งสมเหตุสมผลเนื่องจากข้อผิดพลาดนั้นเท่ากันในแต่ละด้านของค่าเฉลี่ย
โดยสรุปแล้ว จำนวนการแสดงต่อปีโดยกลุ่มตัวอย่าง 29 คนจากเพื่อนบ้านของคุณคือ 14.6 ± 1.10 รายการต่อปี