การกระจายแบบเกาส์เซียนคืออะไร?

ในสถิติ การแจกแจงแบบเกาส์เซียนหรือการแจกแจงแบบปกติใช้เพื่อกำหนดลักษณะระบบที่ซับซ้อนด้วยปัจจัยหลายอย่าง ตามที่อธิบายไว้ใน The History of Statistics ของ Stephen Stigler Abraham De Moivre ได้คิดค้นการแจกจ่ายที่มีชื่อของ Karl Fredrick Gauss การมีส่วนร่วมของเกาส์อยู่ในการประยุกต์ใช้การกระจายไปยังแนวทางกำลังสองน้อยที่สุดเพื่อลดข้อผิดพลาดในการปรับข้อมูลให้เหมาะสมด้วยบรรทัดที่เหมาะสมที่สุด เขาจึงทำให้การกระจายข้อผิดพลาดที่สำคัญที่สุดในสถิติ

แรงจูงใจ

การกระจายตัวอย่างข้อมูลคืออะไร? จะเกิดอะไรขึ้นถ้าคุณไม่ทราบการกระจายพื้นฐานของข้อมูล มีวิธีใดบ้างในการทดสอบสมมติฐานเกี่ยวกับข้อมูลโดยไม่ทราบการแจกแจงที่อยู่เบื้องหลัง ขอบคุณทฤษฎีบทขีด จำกัด กลาง คำตอบคือใช่

คำชี้แจงของทฤษฎีบท

มันระบุว่าค่าเฉลี่ยตัวอย่างจากประชากรอนันต์มีค่าประมาณปกติหรือเกาส์เซียนโดยมีค่าเฉลี่ย เช่นเดียวกับประชากรต้นแบบ และความแปรปรวนเท่ากับความแปรปรวนประชากรหารด้วยกลุ่มตัวอย่าง ขนาด. การประมาณจะดีขึ้นเมื่อขนาดกลุ่มตัวอย่างมีขนาดใหญ่ขึ้น

บางครั้งข้อความการประมาณค่าอาจผิดพลาดในฐานะข้อสรุปเกี่ยวกับการบรรจบกันของการแจกแจงแบบปกติ เนื่องจากการแจกแจงแบบปกติโดยประมาณจะเปลี่ยนไปเมื่อขนาดกลุ่มตัวอย่างเพิ่มขึ้น ข้อความดังกล่าวจึงทำให้เข้าใจผิด

ทฤษฎีบทนี้พัฒนาโดย Pierre Simon Laplace

ทำไมมันทุกที่

การแจกแจงแบบปกติมีอยู่ทั่วไปทุกหนทุกแห่ง เหตุผลมาจากทฤษฎีบทขีดจำกัดกลาง บ่อยครั้ง เมื่อวัดค่า มันคือผลรวมของตัวแปรอิสระหลายตัว ดังนั้น ค่าที่วัดเองจึงมีคุณภาพเฉลี่ยของตัวอย่าง ตัวอย่างเช่น การกระจายการแสดงของนักกีฬาอาจมีรูปทรงระฆัง อันเป็นผลมาจากความแตกต่างในด้านอาหาร การฝึก พันธุกรรม การฝึกสอน และจิตวิทยา แม้แต่ความสูงของผู้ชายก็มีการกระจายตัวแบบปกติ ซึ่งเป็นหน้าที่ของปัจจัยทางชีววิทยาหลายอย่าง

Gaussian Copulas

สิ่งที่เรียกว่า "ฟังก์ชันคอปูลา" ที่มีการแจกแจงแบบเกาส์เซียนอยู่ในข่าวในปี 2552 เนื่องจากมีการใช้ในการประเมินความเสี่ยงในการลงทุนในพันธบัตรที่มีหลักประกัน การใช้ฟังก์ชันในทางที่ผิดเป็นเครื่องมือในวิกฤตการเงินในปี 2551-2552 แม้ว่าจะมีสาเหตุหลายประการของวิกฤต แต่ในการเข้าใจถึงปัญหาย้อนหลัง การแจกแจงแบบเกาส์เซียนน่าจะไม่ควรใช้ ฟังก์ชันที่มีหางหนาขึ้นจะเพิ่มความน่าจะเป็นให้กับเหตุการณ์ไม่พึงประสงค์มากขึ้น

ที่มา

ทฤษฎีบทขีด จำกัด กลางสามารถพิสูจน์ได้ในหลายบรรทัดโดยการวิเคราะห์ฟังก์ชันสร้างโมเมนต์ (mgf) ของ (ตัวอย่าง ค่าเฉลี่ย - ค่าเฉลี่ยประชากร)/?(ความแปรปรวนของประชากร / ขนาดกลุ่มตัวอย่าง) เป็นฟังก์ชันของ mgf ของประชากรต้นแบบ ส่วนการประมาณของทฤษฎีบทได้รับการแนะนำโดยการขยาย mgf ของประชากรที่เป็นอนุกรมกำลัง จากนั้นการแสดงคำศัพท์ส่วนใหญ่ไม่มีนัยสำคัญเมื่อขนาดกลุ่มตัวอย่างมีขนาดใหญ่ขึ้น

สามารถพิสูจน์ได้ในบรรทัดที่น้อยกว่ามากโดยใช้การขยายของเทย์เลอร์กับสมการคุณลักษณะของฟังก์ชันเดียวกันและทำให้ขนาดกลุ่มตัวอย่างมีขนาดใหญ่

ความสะดวกในการคำนวณ

แบบจำลองทางสถิติบางตัวสันนิษฐานว่าข้อผิดพลาดนั้นเป็นแบบเกาส์เซียน ซึ่งช่วยให้สามารถใช้การกระจายฟังก์ชันของตัวแปรปกติ เช่น การแจกแจงแบบไคสแควร์และเอฟ ในการทดสอบสมมติฐาน โดยเฉพาะในการทดสอบ F สถิติ F ประกอบด้วยอัตราส่วนของการแจกแจงแบบไคสแควร์ ซึ่งตัวมันเองเป็นฟังก์ชันของพารามิเตอร์ความแปรปรวนปกติ อัตราส่วนของทั้งสองทำให้ความแปรปรวนหักล้าง ทำให้สามารถทดสอบสมมติฐานโดยปราศจากความรู้เกี่ยวกับความแปรปรวนได้ นอกเหนือจากความปกติและความคงตัวของพวกมัน

  • แบ่งปัน
instagram viewer