การกระจายแบบเกาส์เซียนคืออะไร?

ในสถิติ การแจกแจงแบบเกาส์เซียนหรือการแจกแจงแบบปกติใช้เพื่อกำหนดลักษณะระบบที่ซับซ้อนด้วยปัจจัยหลายอย่าง ตามที่อธิบายไว้ใน The History of Statistics ของ Stephen Stigler Abraham De Moivre ได้คิดค้นการแจกจ่ายที่มีชื่อของ Karl Fredrick Gauss การมีส่วนร่วมของเกาส์อยู่ในการประยุกต์ใช้การกระจายไปยังแนวทางกำลังสองน้อยที่สุดเพื่อลดข้อผิดพลาดในการปรับข้อมูลให้เหมาะสมด้วยบรรทัดที่เหมาะสมที่สุด เขาจึงทำให้การกระจายข้อผิดพลาดที่สำคัญที่สุดในสถิติ

แรงจูงใจ

การกระจายตัวอย่างข้อมูลคืออะไร? จะเกิดอะไรขึ้นถ้าคุณไม่ทราบการกระจายพื้นฐานของข้อมูล มีวิธีใดบ้างในการทดสอบสมมติฐานเกี่ยวกับข้อมูลโดยไม่ทราบการแจกแจงที่อยู่เบื้องหลัง ขอบคุณทฤษฎีบทขีด จำกัด กลาง คำตอบคือใช่

คำชี้แจงของทฤษฎีบท

มันระบุว่าค่าเฉลี่ยตัวอย่างจากประชากรอนันต์มีค่าประมาณปกติหรือเกาส์เซียนโดยมีค่าเฉลี่ย เช่นเดียวกับประชากรต้นแบบ และความแปรปรวนเท่ากับความแปรปรวนประชากรหารด้วยกลุ่มตัวอย่าง ขนาด. การประมาณจะดีขึ้นเมื่อขนาดกลุ่มตัวอย่างมีขนาดใหญ่ขึ้น

บางครั้งข้อความการประมาณค่าอาจผิดพลาดในฐานะข้อสรุปเกี่ยวกับการบรรจบกันของการแจกแจงแบบปกติ เนื่องจากการแจกแจงแบบปกติโดยประมาณจะเปลี่ยนไปเมื่อขนาดกลุ่มตัวอย่างเพิ่มขึ้น ข้อความดังกล่าวจึงทำให้เข้าใจผิด

instagram story viewer

ทฤษฎีบทนี้พัฒนาโดย Pierre Simon Laplace

ทำไมมันทุกที่

การแจกแจงแบบปกติมีอยู่ทั่วไปทุกหนทุกแห่ง เหตุผลมาจากทฤษฎีบทขีดจำกัดกลาง บ่อยครั้ง เมื่อวัดค่า มันคือผลรวมของตัวแปรอิสระหลายตัว ดังนั้น ค่าที่วัดเองจึงมีคุณภาพเฉลี่ยของตัวอย่าง ตัวอย่างเช่น การกระจายการแสดงของนักกีฬาอาจมีรูปทรงระฆัง อันเป็นผลมาจากความแตกต่างในด้านอาหาร การฝึก พันธุกรรม การฝึกสอน และจิตวิทยา แม้แต่ความสูงของผู้ชายก็มีการกระจายตัวแบบปกติ ซึ่งเป็นหน้าที่ของปัจจัยทางชีววิทยาหลายอย่าง

Gaussian Copulas

สิ่งที่เรียกว่า "ฟังก์ชันคอปูลา" ที่มีการแจกแจงแบบเกาส์เซียนอยู่ในข่าวในปี 2552 เนื่องจากมีการใช้ในการประเมินความเสี่ยงในการลงทุนในพันธบัตรที่มีหลักประกัน การใช้ฟังก์ชันในทางที่ผิดเป็นเครื่องมือในวิกฤตการเงินในปี 2551-2552 แม้ว่าจะมีสาเหตุหลายประการของวิกฤต แต่ในการเข้าใจถึงปัญหาย้อนหลัง การแจกแจงแบบเกาส์เซียนน่าจะไม่ควรใช้ ฟังก์ชันที่มีหางหนาขึ้นจะเพิ่มความน่าจะเป็นให้กับเหตุการณ์ไม่พึงประสงค์มากขึ้น

ที่มา

ทฤษฎีบทขีด จำกัด กลางสามารถพิสูจน์ได้ในหลายบรรทัดโดยการวิเคราะห์ฟังก์ชันสร้างโมเมนต์ (mgf) ของ (ตัวอย่าง ค่าเฉลี่ย - ค่าเฉลี่ยประชากร)/?(ความแปรปรวนของประชากร / ขนาดกลุ่มตัวอย่าง) เป็นฟังก์ชันของ mgf ของประชากรต้นแบบ ส่วนการประมาณของทฤษฎีบทได้รับการแนะนำโดยการขยาย mgf ของประชากรที่เป็นอนุกรมกำลัง จากนั้นการแสดงคำศัพท์ส่วนใหญ่ไม่มีนัยสำคัญเมื่อขนาดกลุ่มตัวอย่างมีขนาดใหญ่ขึ้น

สามารถพิสูจน์ได้ในบรรทัดที่น้อยกว่ามากโดยใช้การขยายของเทย์เลอร์กับสมการคุณลักษณะของฟังก์ชันเดียวกันและทำให้ขนาดกลุ่มตัวอย่างมีขนาดใหญ่

ความสะดวกในการคำนวณ

แบบจำลองทางสถิติบางตัวสันนิษฐานว่าข้อผิดพลาดนั้นเป็นแบบเกาส์เซียน ซึ่งช่วยให้สามารถใช้การกระจายฟังก์ชันของตัวแปรปกติ เช่น การแจกแจงแบบไคสแควร์และเอฟ ในการทดสอบสมมติฐาน โดยเฉพาะในการทดสอบ F สถิติ F ประกอบด้วยอัตราส่วนของการแจกแจงแบบไคสแควร์ ซึ่งตัวมันเองเป็นฟังก์ชันของพารามิเตอร์ความแปรปรวนปกติ อัตราส่วนของทั้งสองทำให้ความแปรปรวนหักล้าง ทำให้สามารถทดสอบสมมติฐานโดยปราศจากความรู้เกี่ยวกับความแปรปรวนได้ นอกเหนือจากความปกติและความคงตัวของพวกมัน

Teachs.ru
  • แบ่งปัน
instagram viewer