อ่าน 3 นาที
อัตราความคุ้มครองที่ไม่ถูกต้อง
ในทางสถิติอัตราการครอบคลุมที่ผิดพลาด (FCR)คืออัตราเฉลี่ยของการครอบคลุม ที่ผิดพลาด กล่าวคือ ไม่ครอบคลุมพารามิเตอร์ที่แท้จริง ในช่วงเวลาที่เลือกไว้
อัตราความคุ้มครองที่ไม่ถูกต้อง
ในทางสถิติอัตราการครอบคลุมที่ผิดพลาด (FCR)คืออัตราเฉลี่ยของการครอบคลุม ที่ผิดพลาด กล่าวคือ ไม่ครอบคลุมพารามิเตอร์ที่แท้จริง ในช่วงเวลาที่เลือกไว้
FCR ให้การครอบคลุมพร้อมกันที่ระดับ (1 − α )×100% สำหรับพารามิเตอร์ทั้งหมดที่พิจารณาในปัญหา FCR มีความเชื่อมโยงอย่างมากกับอัตราการค้นพบที่ผิดพลาด (FDR) ทั้งสองวิธีนี้แก้ปัญหาการเปรียบเทียบหลายรายการโดย FCR แก้ปัญหาจากช่วงความเชื่อมั่น (CI) และ FDR แก้ปัญหาจากมุมมองของค่า P
FCR มีความจำเป็นเนื่องจากอันตรายที่เกิดจากการอนุมานแบบเลือกสรร นักวิจัยและนักวิทยาศาสตร์มักจะรายงานหรือเน้นเฉพาะส่วนของข้อมูลที่ถือว่ามีความสำคัญโดยไม่ระบุสมมติฐานต่างๆ ที่พิจารณาไว้อย่างชัดเจน ดังนั้นจึงจำเป็นต้องเข้าใจว่าข้อมูลถูกปกปิดอย่างผิดพลาดได้อย่างไร มีขั้นตอน FCR หลายวิธีที่สามารถใช้ได้ขึ้นอยู่กับความยาวของช่วงความเชื่อมั่น – การเลือกแบบ Bonferroni – การปรับแบบ Bonferroni, ช่วงความเชื่อมั่นที่เลือกแบบ BH ที่ปรับแล้ว (Benjamini และ Yekutieli 2005 [ 1 ] ) แรงจูงใจในการเลือกขั้นตอนหนึ่งเหนืออีกขั้นตอนหนึ่งคือเพื่อให้แน่ใจว่าช่วงความเชื่อมั่นแคบที่สุดเท่าที่จะเป็นไปได้และรักษา FCR ไว้ สำหรับ การทดลอง ไมโครอาร์เรย์และการใช้งานสมัยใหม่อื่นๆ มีพารามิเตอร์ จำนวนมาก มักจะหลายหมื่นหรือมากกว่านั้น และการเลือกขั้นตอนที่มีประสิทธิภาพที่สุดเป็นสิ่งสำคัญมาก
FCR ได้รับการแนะนำครั้งแรกโดยDaniel Yekutieliในวิทยานิพนธ์ปริญญาเอกของเขาในปี 2544 [ 2 ]
คำจำกัดความ
การไม่รักษา FCR หมายถึงเมื่อโดยที่คือจำนวนสมมติฐานว่างที่เป็นจริงคือจำนวนสมมติฐานที่ถูกปฏิเสธคือจำนวนผลบวกเท็จ และคือระดับนัยสำคัญ ช่วงความเชื่อมั่นที่มีความน่าจะเป็นของการครอบคลุมพร้อมกันสามารถควบคุม FCR ให้อยู่ภายใน ขอบเขต ของ
การจำแนกประเภทของการทดสอบสมมติฐานหลายรายการ
ตารางต่อ ไปนี้แสดงผลลัพธ์ที่เป็นไปได้เมื่อทดสอบสมมติฐานว่างหลายข้อ สมมติว่าเรามีสมมติฐานว่างจำนวนm ข้อ ซึ่งแสดงด้วย H₁ , H₂ , ... , Hᵢโดย ใช้ การทดสอบทางสถิติเราจะปฏิเสธสมมติฐานว่างหากการทดสอบนั้นมีนัยสำคัญ เราจะไม่ปฏิเสธสมมติฐานว่างหากการทดสอบนั้นไม่มีนัยสำคัญ การรวมผลลัพธ์แต่ละประเภทสำหรับHᵢ ทั้งหมด จะ ได้ตัวแปรสุ่มดังต่อไปนี้:
| สมมติฐานว่างเป็นจริง (H 0 ) | สมมติฐานทางเลือกเป็นจริง ( HA ) | ทั้งหมด | |
|---|---|---|---|
| การทดสอบนี้ถือว่ามีความสำคัญ | วี | เอส | อาร์ |
| ผลการทดสอบถือว่าไม่มีนัยสำคัญ | ยู | ที | |
| ทั้งหมด | ม |
- mคือจำนวนสมมติฐานทั้งหมดที่ได้รับการทดสอบ
- คือจำนวนสมมติฐานว่างที่ เป็นจริง ซึ่งเป็นพารามิเตอร์ที่ไม่ทราบค่า
- คือจำนวนของสมมติฐานทางเลือกที่ เป็นจริง
- Vคือจำนวนผลบวกเท็จ (ข้อผิดพลาดประเภทที่ 1) (เรียกอีกอย่างว่า "การค้นพบที่ผิดพลาด")
- Sคือจำนวนผลบวกที่ถูกต้อง (หรือเรียกว่า "การค้นพบที่ถูกต้อง")
- Tคือจำนวนผลลบเท็จ (ข้อผิดพลาดประเภทที่ 2)
- Uคือจำนวนของผลลัพธ์ที่เป็นลบที่ถูกต้อง
- คือจำนวนสมมติฐานว่างที่ถูกปฏิเสธ (หรือเรียกว่า "การค้นพบ" ไม่ว่าจะเป็นจริงหรือเท็จ)
ใน การทดสอบสมมติฐาน m ครั้งซึ่งมีสมมติฐานว่างที่เป็นจริงRเป็นตัวแปรสุ่มที่สังเกตได้ และS , T , UและVเป็นตัวแปรสุ่ม ที่สังเกตไม่ ได้
ปัญหาที่ FCR กล่าวถึง
การคัดเลือก
การเลือกทำให้ความครอบคลุมโดยเฉลี่ยลดลง การเลือกสามารถนำเสนอได้ในรูปแบบของการกำหนดเงื่อนไขตามเหตุการณ์ที่กำหนดโดยข้อมูล และอาจส่งผลต่อความน่าจะเป็นของความครอบคลุมของช่วงความเชื่อมั่นสำหรับพารามิเตอร์ เดียว ในทำนองเดียวกัน ปัญหาของการเลือกเปลี่ยนความหมายพื้นฐานของค่า Pกระบวนการ FCR พิจารณาว่าเป้าหมายของความครอบคลุมแบบมีเงื่อนไขหลังจากกฎการเลือกใดๆ สำหรับชุดค่าใดๆ (ที่ไม่ทราบ) สำหรับพารามิเตอร์นั้นเป็นไปไม่ได้ คุณสมบัติที่อ่อนกว่าเมื่อพูดถึงช่วงความเชื่อมั่นแบบเลือกนั้นเป็นไปได้และจะหลีกเลี่ยงข้อความแสดงความครอบคลุมที่ผิดพลาด FCR เป็นการวัดความครอบคลุมของช่วงหลังจากการเลือก ดังนั้น แม้ว่าช่วงความเชื่อมั่น 1 − αจะไม่ให้ความครอบคลุมแบบเลือก ( แบบมีเงื่อนไข ) ความน่าจะเป็นของการสร้างช่วงความเชื่อมั่นที่ไม่ครอบคลุมนั้นมีค่าสูงสุดเพียงαโดยที่
การเลือกและความหลากหลาย
เมื่อเผชิญกับทั้งความหลากหลาย (การอนุมานเกี่ยวกับพารามิเตอร์หลายตัว) และการเลือกไม่เพียงแต่สัดส่วนที่คาดหวังของการครอบคลุมเหนือพารามิเตอร์ที่เลือกที่ 1−α จะไม่เท่ากับสัดส่วนที่คาดหวังของการไม่ครอบคลุมที่ α เท่านั้น แต่ยังไม่สามารถรับประกันสัดส่วนหลังได้อีกต่อไปโดยการสร้างช่วงความเชื่อมั่นแบบมาร์จินัลสำหรับแต่ละพารามิเตอร์ที่เลือก กระบวนการ FCR แก้ปัญหานี้โดยการนำสัดส่วนที่คาดหวังของพารามิเตอร์ที่ไม่ได้รับการครอบคลุมโดยช่วงความเชื่อมั่นของพวกมันในบรรดาพารามิเตอร์ที่เลือก โดยที่สัดส่วนจะเป็น 0 หากไม่มีการเลือกพารามิเตอร์ใด อัตราการกล่าวอ้างความครอบคลุมที่ผิดพลาด (FCR) นี้เป็นคุณสมบัติของกระบวนการใดๆ ที่กำหนดโดยวิธีการเลือกพารามิเตอร์และวิธีการสร้างช่วงความเชื่อมั่นหลายช่วง
ขั้นตอนการควบคุม
วิธีการบอนเฟอร์โรนี (แบบเลือกบอนเฟอร์โรนี – แบบปรับบอนเฟอร์โรนี) สำหรับช่วงความเชื่อมั่นพร้อมกัน
ช่วงความเชื่อมั่นพร้อมกัน (Simultaneous CIs) ที่ใช้ขั้นตอน Bonferroni เมื่อเรามีพารามิเตอร์ m ตัว โดยแต่ละช่วงความเชื่อมั่นย่อยสร้างขึ้นที่ระดับ 1 − α/m หากไม่มีการเลือก ช่วงความเชื่อมั่นเหล่านี้จะให้ความครอบคลุมพร้อมกัน ในแง่ที่ว่าความน่าจะเป็นที่ช่วงความเชื่อมั่นทั้งหมดครอบคลุมพารามิเตอร์ที่เกี่ยวข้องนั้นอย่างน้อยที่สุดคือ 1 − α น่าเสียดายที่แม้คุณสมบัติที่แข็งแกร่งเช่นนี้ก็ไม่รับประกันคุณสมบัติความเชื่อมั่นแบบมีเงื่อนไขหลังจากการเลือก
FCR สำหรับช่วงความเชื่อมั่นพร้อมกันที่เลือกโดย Bonferroni และปรับโดย Bonferroni
วิธีการ Bonferroni–Bonferroni ไม่สามารถให้ความครอบคลุมแบบมีเงื่อนไขได้ อย่างไรก็ตาม มันควบคุม FCR ที่ <α ได้ ที่จริงแล้วมันทำได้ดีเกินไป ในแง่ที่ว่า FCR ใกล้เคียงกับ 0 มากเกินไปสำหรับค่า θ ที่มาก การเลือกช่วงความเชื่อมั่นนั้นขึ้นอยู่กับการทดสอบ Bonferroni และจากนั้นจึงสร้างช่วงความเชื่อมั่น Bonferroni FCR ถูกประมาณโดยการคำนวณสัดส่วนของช่วงความเชื่อมั่นที่ไม่ครอบคลุมพารามิเตอร์ที่เกี่ยวข้องในบรรดาช่วงความเชื่อมั่นที่สร้างขึ้น (โดยกำหนดสัดส่วนเป็น 0 เมื่อไม่มีการเลือก) โดยการเลือกนั้นขึ้นอยู่กับการทดสอบรายบุคคลที่ไม่ได้ปรับค่า และสร้างช่วงความเชื่อมั่นที่ไม่ได้ปรับค่า
ช่วงความเชื่อมั่นที่เลือกโดย BH ที่ปรับด้วย FCR
ในขั้นตอน BH สำหรับ FDR หลังจากเรียงลำดับค่าp P (1) ≤ • • • ≤ P ( m ) และคำนวณR = max{ j : P ( j ) ≤ j • q / m } สมมติฐานว่าง Rที่P ( i ) ≤ R • q / mจะถูกปฏิเสธ หากทำการทดสอบโดยใช้ขั้นตอน Bonferroni ขอบล่างของ FCR อาจลดลงต่ำกว่าระดับq ที่ต้องการ มาก ซึ่งหมายความว่าช่วงความเชื่อมั่นยาวเกินไป ในทางตรงกันข้าม การใช้ขั้นตอนต่อไปนี้ ซึ่งรวมขั้นตอนทั่วไปเข้ากับการทดสอบควบคุม FDR ในขั้นตอน BH จะให้ขอบล่างสำหรับ FCR เช่นกัน คือq /2 ≤ FCR ขั้นตอนนี้มีความคมชัดในแง่ที่ว่าสำหรับบางการกำหนดค่า FCR จะเข้าใกล้ q
1. เรียงลำดับค่า p ที่ใช้ในการทดสอบสมมติฐาน m เกี่ยวกับพารามิเตอร์P (1) ≤ • • • ≤ P ( m )
2. คำนวณR = max{ i : P ( i ) ≤ i • q / m }
3. เลือก พารามิเตอร์ Rที่P ( i ) ≤ R • q / mซึ่งสอดคล้องกับสมมติฐานที่ถูกปฏิเสธ
4. สร้างช่วงความเชื่อมั่น 1 − R • q / mสำหรับแต่ละพารามิเตอร์ที่เลือก
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ อัตราความคุ้มครองที่ไม่ถูกต้อง
ในทางสถิติอัตราการครอบคลุมที่ผิดพลาด (FCR)คืออัตราเฉลี่ยของการครอบคลุม ที่ผิดพลาด กล่าวคือ ไม่ครอบคลุมพารามิเตอร์ที่แท้จริง ในช่วงเวลาที่เลือกไว้
คำจำกัดความ
การไม่รักษา FCR หมายถึงเมื่อโดยที่คือจำนวนสมมติฐานว่างที่เป็นจริงคือจำนวนสมมติฐานที่ถูกปฏิเสธคือจำนวนผลบวกเท็จ และคือระดับนัยสำคัญ ช่วงความเชื่อมั่นที่มีความน่าจะเป็นของการครอบคลุมพร้อมกันสามารถควบคุม FCR ให้อยู่ภายใน ขอบเขต ของ เอฟซีอาร์ > q {\displaystyle...
การจำแนกประเภทของการทดสอบสมมติฐานหลายรายการ
ตารางต่อ ไป นี้ แสดงผลลัพธ์ที่เป็นไปได้เมื่อทดสอบสมมติฐานว่างหลายข้อ สมมติว่าเรามีสมมติฐานว่างจำนวน m ข้อ ซึ่งแสดงด้วย H₁ , H₂ , ...
การคัดเลือก
การเลือก ทำให้ความครอบคลุมโดยเฉลี่ยลดลง การเลือกสามารถนำเสนอได้ในรูปแบบของการกำหนดเงื่อนไขตามเหตุการณ์ที่กำหนดโดยข้อมูล และอาจส่งผลต่อความน่าจะเป็นของความครอบคลุมของช่วงความเชื่อมั่นสำหรับ พารามิเตอร์ เดียว ในทำนองเดียวกัน...