อัตราความคุ้มครองที่ไม่ถูกต้อง

Q: ข้อมูลสำคัญเกี่ยวกับ อัตราความคุ้มครองที่ไม่ถูกต้อง

ในทางสถิติอัตราการครอบคลุมที่ผิดพลาด (FCR)คืออัตราเฉลี่ยของการครอบคลุม ที่ผิดพลาด กล่าวคือ ไม่ครอบคลุมพารามิเตอร์ที่แท้จริง ในช่วงเวลาที่เลือกไว้

ในทางสถิติอัตราการครอบคลุมที่ผิดพลาด (FCR)คืออัตราเฉลี่ยของการครอบคลุม ที่ผิดพลาด กล่าวคือ ไม่ครอบคลุมพารามิเตอร์ที่แท้จริง ในช่วงเวลาที่เลือกไว้

FCR ให้การครอบคลุมพร้อมกันที่ระดับ (1 − α )×100% สำหรับพารามิเตอร์ทั้งหมดที่พิจารณาในปัญหา FCR มีความเชื่อมโยงอย่างมากกับอัตราการค้นพบที่ผิดพลาด (FDR) ทั้งสองวิธีนี้แก้ปัญหาการเปรียบเทียบหลายรายการโดย FCR แก้ปัญหาจากช่วงความเชื่อมั่น (CI) และ FDR แก้ปัญหาจากมุมมองของค่า P

FCR มีความจำเป็นเนื่องจากอันตรายที่เกิดจากการอนุมานแบบเลือกสรร นักวิจัยและนักวิทยาศาสตร์มักจะรายงานหรือเน้นเฉพาะส่วนของข้อมูลที่ถือว่ามีความสำคัญโดยไม่ระบุสมมติฐานต่างๆ ที่พิจารณาไว้อย่างชัดเจน ดังนั้นจึงจำเป็นต้องเข้าใจว่าข้อมูลถูกปกปิดอย่างผิดพลาดได้อย่างไร มีขั้นตอน FCR หลายวิธีที่สามารถใช้ได้ขึ้นอยู่กับความยาวของช่วงความเชื่อมั่น – การเลือกแบบ Bonferroni – การปรับแบบ Bonferroni, ช่วงความเชื่อมั่นที่เลือกแบบ BH ที่ปรับแล้ว (Benjamini และ Yekutieli 2005 ^{[ 1 ]} ) แรงจูงใจในการเลือกขั้นตอนหนึ่งเหนืออีกขั้นตอนหนึ่งคือเพื่อให้แน่ใจว่าช่วงความเชื่อมั่นแคบที่สุดเท่าที่จะเป็นไปได้และรักษา FCR ไว้ สำหรับ การทดลอง ไมโครอาร์เรย์และการใช้งานสมัยใหม่อื่นๆ มีพารามิเตอร์ จำนวนมาก มักจะหลายหมื่นหรือมากกว่านั้น และการเลือกขั้นตอนที่มีประสิทธิภาพที่สุดเป็นสิ่งสำคัญมาก

FCR ได้รับการแนะนำครั้งแรกโดยDaniel Yekutieliในวิทยานิพนธ์ปริญญาเอกของเขาในปี 2544 ^{[ 2 ]}

คำจำกัดความ

การไม่รักษา FCR หมายถึงเมื่อโดยที่คือจำนวนสมมติฐานว่างที่เป็นจริงคือจำนวนสมมติฐานที่ถูกปฏิเสธคือจำนวนผลบวกเท็จ และคือระดับนัยสำคัญ ช่วงความเชื่อมั่นที่มีความน่าจะเป็นของการครอบคลุมพร้อมกันสามารถควบคุม FCR ให้อยู่ภายใน ขอบเขต ของ ${\text{FCR}}>q$ $q={\frac {V}{R}}={\frac {\alpha m_{0}}{R}}$ $m_{0}$ $R$ $V$ $\alpha$ $1-q$ $q$

การจำแนกประเภทของการทดสอบสมมติฐานหลายรายการ

$ตารางต่อ ไป$ $นี้$ แสดงผลลัพธ์ที่เป็นไปได้เมื่อทดสอบสมมติฐานว่างหลายข้อ สมมติว่าเรามีสมมติฐานว่างจำนวน $m ข้อ ซึ่งแสดงด้วย H₁$ , H₂ $, ..., Hᵢ โดย ใช้$ การทดสอบทางสถิติเราจะปฏิเสธสมมติฐานว่างหากการทดสอบนั้นมีนัยสำคัญ เราจะไม่ปฏิเสธสมมติฐานว่างหากการทดสอบนั้นไม่มีนัยสำคัญ การรวมผลลัพธ์แต่ละประเภทสำหรับHᵢ ทั้งหมด _จะ ได้ตัวแปรสุ่มดังต่อไปนี้:

	สมมติฐานว่างเป็นจริง (H ₀ )	สมมติฐานทางเลือกเป็นจริง ( _HA )	ทั้งหมด
การทดสอบนี้ถือว่ามีความสำคัญ	$วี$	$เอส$	$อาร์$
ผลการทดสอบถือว่าไม่มีนัยสำคัญ	$ยู$	$ที$	$mR$
ทั้งหมด	$m_{0}$	$m-m_{0}$	$ม$

$m$ คือจำนวนสมมติฐานทั้งหมดที่ได้รับการทดสอบ
$m_{0}$ คือจำนวนสมมติฐานว่างที่ เป็นจริง ซึ่งเป็นพารามิเตอร์ที่ไม่ทราบค่า
$m-m_{0}$ คือจำนวนของสมมติฐานทางเลือกที่ เป็นจริง
$V$ คือจำนวนผลบวกเท็จ (ข้อผิดพลาดประเภทที่ 1) (เรียกอีกอย่างว่า "การค้นพบที่ผิดพลาด")
$S$ คือจำนวนผลบวกที่ถูกต้อง (หรือเรียกว่า "การค้นพบที่ถูกต้อง")
$T$ คือจำนวนผลลบเท็จ (ข้อผิดพลาดประเภทที่ 2)
$U$ คือจำนวนของผลลัพธ์ที่เป็นลบที่ถูกต้อง
$R=V+S$ คือจำนวนสมมติฐานว่างที่ถูกปฏิเสธ (หรือเรียกว่า "การค้นพบ" ไม่ว่าจะเป็นจริงหรือเท็จ)

ใน การทดสอบสมมติฐาน $m ครั้ง$ ซึ่งมีสมมติฐานว่างที่เป็นจริง $R$ เป็นตัวแปรสุ่มที่สังเกตได้ และ $S$ , $T$ , $U$ และ $V$ เป็นตัวแปรสุ่ม ที่สังเกตไม่ ได้ $m_{0}$

ปัญหาที่ FCR กล่าวถึง

การคัดเลือก

การเลือกทำให้ความครอบคลุมโดยเฉลี่ยลดลง การเลือกสามารถนำเสนอได้ในรูปแบบของการกำหนดเงื่อนไขตามเหตุการณ์ที่กำหนดโดยข้อมูล และอาจส่งผลต่อความน่าจะเป็นของความครอบคลุมของช่วงความเชื่อมั่นสำหรับพารามิเตอร์ เดียว ในทำนองเดียวกัน ปัญหาของการเลือกเปลี่ยนความหมายพื้นฐานของค่า Pกระบวนการ FCR พิจารณาว่าเป้าหมายของความครอบคลุมแบบมีเงื่อนไขหลังจากกฎการเลือกใดๆ สำหรับชุดค่าใดๆ (ที่ไม่ทราบ) สำหรับพารามิเตอร์นั้นเป็นไปไม่ได้ คุณสมบัติที่อ่อนกว่าเมื่อพูดถึงช่วงความเชื่อมั่นแบบเลือกนั้นเป็นไปได้และจะหลีกเลี่ยงข้อความแสดงความครอบคลุมที่ผิดพลาด FCR เป็นการวัดความครอบคลุมของช่วงหลังจากการเลือก ดังนั้น แม้ว่าช่วงความเชื่อมั่น 1 − αจะไม่ให้ความครอบคลุมแบบเลือก ( แบบมีเงื่อนไข ) ความน่าจะเป็นของการสร้างช่วงความเชื่อมั่นที่ไม่ครอบคลุมนั้นมีค่าสูงสุดเพียงαโดยที่

\Pr[\theta \not \in \mathrm {CI} ,\ {\text{CI builded}}]\leq \Pr[\theta \not \in \mathrm {CI} ]\leq \alpha

การเลือกและความหลากหลาย

เมื่อเผชิญกับทั้งความหลากหลาย (การอนุมานเกี่ยวกับพารามิเตอร์หลายตัว) และการเลือกไม่เพียงแต่สัดส่วนที่คาดหวังของการครอบคลุมเหนือพารามิเตอร์ที่เลือกที่ 1−α จะไม่เท่ากับสัดส่วนที่คาดหวังของการไม่ครอบคลุมที่ α เท่านั้น แต่ยังไม่สามารถรับประกันสัดส่วนหลังได้อีกต่อไปโดยการสร้างช่วงความเชื่อมั่นแบบมาร์จินัลสำหรับแต่ละพารามิเตอร์ที่เลือก กระบวนการ FCR แก้ปัญหานี้โดยการนำสัดส่วนที่คาดหวังของพารามิเตอร์ที่ไม่ได้รับการครอบคลุมโดยช่วงความเชื่อมั่นของพวกมันในบรรดาพารามิเตอร์ที่เลือก โดยที่สัดส่วนจะเป็น 0 หากไม่มีการเลือกพารามิเตอร์ใด อัตราการกล่าวอ้างความครอบคลุมที่ผิดพลาด (FCR) นี้เป็นคุณสมบัติของกระบวนการใดๆ ที่กำหนดโดยวิธีการเลือกพารามิเตอร์และวิธีการสร้างช่วงความเชื่อมั่นหลายช่วง

ขั้นตอนการควบคุม

วิธีการบอนเฟอร์โรนี (แบบเลือกบอนเฟอร์โรนี – แบบปรับบอนเฟอร์โรนี) สำหรับช่วงความเชื่อมั่นพร้อมกัน

ช่วงความเชื่อมั่นพร้อมกัน (Simultaneous CIs) ที่ใช้ขั้นตอน Bonferroni เมื่อเรามีพารามิเตอร์ m ตัว โดยแต่ละช่วงความเชื่อมั่นย่อยสร้างขึ้นที่ระดับ 1 − α/m หากไม่มีการเลือก ช่วงความเชื่อมั่นเหล่านี้จะให้ความครอบคลุมพร้อมกัน ในแง่ที่ว่าความน่าจะเป็นที่ช่วงความเชื่อมั่นทั้งหมดครอบคลุมพารามิเตอร์ที่เกี่ยวข้องนั้นอย่างน้อยที่สุดคือ 1 − α น่าเสียดายที่แม้คุณสมบัติที่แข็งแกร่งเช่นนี้ก็ไม่รับประกันคุณสมบัติความเชื่อมั่นแบบมีเงื่อนไขหลังจากการเลือก

FCR สำหรับช่วงความเชื่อมั่นพร้อมกันที่เลือกโดย Bonferroni และปรับโดย Bonferroni

วิธีการ Bonferroni–Bonferroni ไม่สามารถให้ความครอบคลุมแบบมีเงื่อนไขได้ อย่างไรก็ตาม มันควบคุม FCR ที่ <α ได้ ที่จริงแล้วมันทำได้ดีเกินไป ในแง่ที่ว่า FCR ใกล้เคียงกับ 0 มากเกินไปสำหรับค่า θ ที่มาก การเลือกช่วงความเชื่อมั่นนั้นขึ้นอยู่กับการทดสอบ Bonferroni และจากนั้นจึงสร้างช่วงความเชื่อมั่น Bonferroni FCR ถูกประมาณโดยการคำนวณสัดส่วนของช่วงความเชื่อมั่นที่ไม่ครอบคลุมพารามิเตอร์ที่เกี่ยวข้องในบรรดาช่วงความเชื่อมั่นที่สร้างขึ้น (โดยกำหนดสัดส่วนเป็น 0 เมื่อไม่มีการเลือก) โดยการเลือกนั้นขึ้นอยู่กับการทดสอบรายบุคคลที่ไม่ได้ปรับค่า และสร้างช่วงความเชื่อมั่นที่ไม่ได้ปรับค่า

ช่วงความเชื่อมั่นที่เลือกโดย BH ที่ปรับด้วย FCR

ในขั้นตอน BH สำหรับ FDR หลังจากเรียงลำดับค่าp P (1) ≤ • • • ≤ P ( m ) และคำนวณR = max{ j : P ( j ) ≤ j • q / m } สมมติฐานว่าง Rที่P ( i ) ≤ R • q / mจะถูกปฏิเสธ หากทำการทดสอบโดยใช้ขั้นตอน Bonferroni ขอบล่างของ FCR อาจลดลงต่ำกว่าระดับq ที่ต้องการ มาก ซึ่งหมายความว่าช่วงความเชื่อมั่นยาวเกินไป ในทางตรงกันข้าม การใช้ขั้นตอนต่อไปนี้ ซึ่งรวมขั้นตอนทั่วไปเข้ากับการทดสอบควบคุม FDR ในขั้นตอน BH จะให้ขอบล่างสำหรับ FCR เช่นกัน คือq /2 ≤ FCR ขั้นตอนนี้มีความคมชัดในแง่ที่ว่าสำหรับบางการกำหนดค่า FCR จะเข้าใกล้ q

1. เรียงลำดับค่า p ที่ใช้ในการทดสอบสมมติฐาน m เกี่ยวกับพารามิเตอร์P (1) ≤ • • • ≤ P ( m )

2. คำนวณR = max{ i : P ( i ) ≤ i • q / m }

3. เลือก พารามิเตอร์ Rที่P ( i ) ≤ R • q / mซึ่งสอดคล้องกับสมมติฐานที่ถูกปฏิเสธ

4. สร้างช่วงความเชื่อมั่น 1 − R • q / mสำหรับแต่ละพารามิเตอร์ที่เลือก

ดูเพิ่มเติม

[ 1 ]

[ 2 ]