นัยสำคัญทางสถิติเป็นตัวบ่งชี้วัตถุประสงค์ว่าผลการศึกษาเป็น "ของจริง" ทางคณิตศาสตร์และป้องกันทางสถิติได้หรือไม่ มากกว่าที่จะเป็นเพียงแค่เหตุการณ์ที่เกิดขึ้นโดยบังเอิญ การทดสอบนัยสำคัญที่ใช้กันทั่วไปจะมองหาความแตกต่างในวิธีการของชุดข้อมูลหรือความแตกต่างของความแปรปรวนของชุดข้อมูล ประเภทของการทดสอบที่ใช้ขึ้นอยู่กับประเภทของข้อมูลที่กำลังวิเคราะห์ ขึ้นอยู่กับนักวิจัยในการพิจารณาว่าพวกเขาต้องการผลลัพธ์ที่สำคัญเพียงใด กล่าวอีกนัยหนึ่งว่าพวกเขายินดีที่จะรับความเสี่ยงมากน้อยเพียงใด โดยปกตินักวิจัยยินดีที่จะยอมรับระดับความเสี่ยง 5 เปอร์เซ็นต์
ข้อผิดพลาดประเภทที่ 1: การปฏิเสธสมมติฐานที่เป็นโมฆะอย่างไม่ถูกต้อง
•••สกอตต์ Rothstein / iStock / Getty Images
การทดลองดำเนินการเพื่อทดสอบสมมติฐานเฉพาะ หรือคำถามเชิงทดลองที่มีผลลัพธ์ที่คาดหวัง สมมติฐานว่างคือสมมติฐานที่ตรวจไม่พบความแตกต่างระหว่างข้อมูลสองชุดที่เปรียบเทียบ ตัวอย่างเช่น ในการทดลองทางการแพทย์ สมมติฐานว่างอาจเป็นได้ว่าไม่มีความแตกต่างในการปรับปรุงระหว่างผู้ป่วยที่ได้รับยาที่ใช้ในการศึกษากับผู้ป่วยที่ได้รับยาหลอก หากผู้วิจัยปฏิเสธสมมติฐานว่างนี้อย่างผิด ๆ เมื่อมันเป็นเรื่องจริง กล่าวอีกนัยหนึ่งหากพวกเขา "ตรวจพบ" a ความแตกต่างระหว่างผู้ป่วยทั้งสองกลุ่มเมื่อไม่มีความแตกต่างจริงๆ จึงได้ทำสัญญา Type I ข้อผิดพลาด นักวิจัยกำหนดล่วงหน้าว่ามีความเสี่ยงที่จะเกิดข้อผิดพลาดประเภทที่ 1 ที่พวกเขายินดีจะยอมรับล่วงหน้ามากน้อยเพียงใด ความเสี่ยงนี้ขึ้นอยู่กับค่า p สูงสุดที่พวกเขาจะยอมรับก่อนที่จะปฏิเสธสมมติฐานว่าง และเรียกว่าอัลฟา
ข้อผิดพลาดประเภท II: การปฏิเสธสมมติฐานสำรองอย่างไม่ถูกต้อง
สมมติฐานทางเลือกหนึ่งคือสมมติฐานที่ตรวจพบความแตกต่างระหว่างข้อมูลสองชุดที่นำมาเปรียบเทียบ ในกรณีของการทดลองทางการแพทย์ คุณคาดหวังว่าจะเห็นการปรับปรุงในระดับต่างๆ ในผู้ป่วยที่ได้รับยาในการศึกษาและผู้ป่วยที่ได้รับยาหลอก หากนักวิจัยล้มเหลวในการปฏิเสธสมมติฐานว่างเมื่อควร กล่าวอีกนัยหนึ่งหากพวกเขา "ตรวจพบ" ไม่ ความแตกต่างระหว่างผู้ป่วยทั้งสองกลุ่มเมื่อมีความแตกต่างกันจริง ๆ แล้วพวกเขาได้ทำสัญญา Type ข้อผิดพลาดครั้งที่สอง
การกำหนดระดับความสำคัญ
เมื่อนักวิจัยทำการทดสอบที่มีนัยสำคัญทางสถิติและค่า p ที่ได้นั้นน้อยกว่าระดับความเสี่ยงที่ถือว่ายอมรับได้ ผลการทดสอบจะถือว่ามีนัยสำคัญทางสถิติ ในกรณีนี้ สมมติฐานว่าง -- สมมติฐานที่ไม่มีความแตกต่างระหว่างทั้งสองกลุ่ม -- ถูกปฏิเสธ กล่าวอีกนัยหนึ่ง ผลลัพธ์ระบุว่ามีความแตกต่างในการปรับปรุงระหว่างผู้ป่วยที่ได้รับยาในการศึกษากับผู้ป่วยที่ได้รับยาหลอก
การเลือกการทดสอบความสำคัญ
มีการทดสอบทางสถิติหลายแบบให้เลือก การทดสอบ t มาตรฐานจะเปรียบเทียบค่าเฉลี่ยจากชุดข้อมูลสองชุด เช่น ข้อมูลยาที่ใช้ในการศึกษาและข้อมูลยาหลอก การทดสอบแบบจับคู่จะใช้เพื่อตรวจหาความแตกต่างในชุดข้อมูลเดียวกัน เช่น การศึกษาก่อนและหลัง การวิเคราะห์ความแปรปรวนทางเดียว (ANOVA) สามารถเปรียบเทียบค่าเฉลี่ยจากชุดข้อมูลตั้งแต่สามชุดขึ้นไป และการวิเคราะห์ความแปรปรวนแบบสองทางจะเปรียบเทียบ หมายถึงชุดข้อมูลตั้งแต่สองชุดขึ้นไปเพื่อตอบสนองต่อตัวแปรอิสระสองตัวที่แตกต่างกัน เช่น จุดแข็งที่แตกต่างกันของการศึกษา ยา. การถดถอยเชิงเส้นเปรียบเทียบค่าเฉลี่ยของชุดข้อมูลตามระดับของการรักษาหรือเวลา การทดสอบทางสถิติแต่ละครั้งจะส่งผลให้เกิดการวัดที่มีนัยสำคัญหรืออัลฟ่าที่สามารถใช้ในการตีความผลการทดสอบได้