อ่าน 5 นาที
การทดสอบความเท่าเทียมกัน
การทดสอบความเท่าเทียมกัน เป็นการ ทดสอบสมมติฐาน ประเภทหนึ่งที่ใช้ในการ อนุมาน ทางสถิติ จากข้อมูลที่สังเกตได้ ในการทดสอบเหล่านี้ สมมติฐาน ว่าง (null hypothesis)...
การทดสอบความเท่าเทียมกัน
การทดสอบความเท่าเทียมกัน เป็นการ ทดสอบสมมติฐานประเภทหนึ่งที่ใช้ในการ อนุมาน ทางสถิติจากข้อมูลที่สังเกตได้ ในการทดสอบเหล่านี้ สมมติฐาน ว่าง (null hypothesis)ถูกกำหนดให้เป็นผลกระทบที่มีขนาดใหญ่พอที่จะถือว่าน่าสนใจ โดยระบุด้วยขอบเขตความเท่าเทียมกัน สมมติฐานทางเลือก (alternative hypothesis) คือผลกระทบใดๆ ที่มีความรุนแรงน้อยกว่าขอบเขตความเท่าเทียมกันดังกล่าว ข้อมูลที่สังเกตได้จะถูกเปรียบเทียบทางสถิติกับขอบเขตความเท่าเทียมกัน หากการทดสอบทางสถิติบ่งชี้ว่าข้อมูลที่สังเกตได้นั้นน่าประหลาดใจ โดยสมมติว่าผลกระทบที่แท้จริงมีความรุนแรงอย่างน้อยเท่ากับขอบเขตความเท่าเทียมกัน เรา สามารถใช้แนวทางของ เนย์แมน-เพียร์สัน (Neyman-Pearson)ในการอนุมานทางสถิติเพื่อปฏิเสธขนาดของผลกระทบที่ใหญ่กว่าขอบเขตความเท่าเทียมกันด้วยอัตรา ความผิดพลาดประเภทที่ 1 ที่กำหนดไว้ล่วงหน้า
การทดสอบความเท่าเทียม กันมีต้นกำเนิดมาจากสาขาการทดลองทางคลินิก[ 1 ]การประยุกต์ใช้อย่างหนึ่งที่เรียกว่าการทดลองที่ไม่ด้อยกว่าใช้เพื่อแสดงให้เห็นว่ายาใหม่ที่ราคาถูกกว่ายาทางเลือกที่มีอยู่ทำงานได้ดีเท่ากับยาที่มีอยู่แล้ว โดยพื้นฐานแล้ว การทดสอบความเท่าเทียมกันประกอบด้วยการคำนวณช่วงความเชื่อมั่นรอบขนาดผลกระทบ ที่สังเกตได้ และปฏิเสธผลกระทบที่รุนแรงกว่าขอบเขตความเท่าเทียมกันเมื่อช่วงความเชื่อมั่นไม่ทับซ้อนกับขอบเขตความเท่าเทียมกัน ในการทดสอบแบบสองด้าน จะมีการระบุทั้งขอบเขตความเท่าเทียมกันบนและล่าง ในการทดลองที่ไม่ด้อยกว่า ซึ่งเป้าหมายคือการทดสอบสมมติฐานว่าการรักษาใหม่ไม่แย่กว่าการรักษาที่มีอยู่ จะมีการระบุเฉพาะขอบเขตความเท่าเทียมกันล่างเท่านั้น

การทดสอบความเท่าเทียมกันสามารถดำเนินการได้นอกเหนือจากการทดสอบความสำคัญของสมมติฐานว่าง[ 2 ] [ 3 ] [ 4 ] [ 5 ]ซึ่งอาจป้องกันการตีความค่า p ที่มากกว่าระดับอัลฟาผิดพลาดว่าเป็นหลักฐานสนับสนุนการไม่มีผลกระทบที่แท้จริง นอกจากนี้ การทดสอบความเท่าเทียมกันยังสามารถระบุผลกระทบที่มีนัยสำคัญทางสถิติแต่ไม่มีนัยสำคัญในทางปฏิบัติได้ เมื่อใดก็ตามที่ผลกระทบแตกต่างจากศูนย์ทางสถิติ แต่ยังเล็กกว่าขนาดผลกระทบใดๆ ที่ถือว่าคุ้มค่าทางสถิติ (ดูรูปแรก) [ 6 ]เดิมทีการทดสอบความเท่าเทียมกันถูกนำมาใช้ในสาขาต่างๆ เช่น เภสัชกรรม โดยมักใช้ในการทดลองความเท่าเทียมกันทางชีวภาพ อย่างไรก็ตาม การทดสอบเหล่านี้สามารถนำไปใช้กับกรณีใดๆ ก็ตามที่คำถามวิจัยถามว่าค่าเฉลี่ยของคะแนนสองชุดนั้นเท่าเทียมกันในทางปฏิบัติหรือทางทฤษฎีหรือไม่ การทดสอบความเท่าเทียมกันเพิ่งได้รับการแนะนำในการประเมินอุปกรณ์การวัด[ 7 ] [ 8 ]ปัญญาประดิษฐ์[ 9 ]สรีรวิทยาการออกกำลังกายและวิทยาศาสตร์การกีฬา[ 10 ]รัฐศาสตร์[ 11 ]จิตวิทยา[ 6 ] [ 12 ]และเศรษฐศาสตร์[ 13 ]มีการทดสอบหลายอย่างสำหรับการวิเคราะห์ความเท่าเทียมกัน อย่างไรก็ตาม เมื่อไม่นานมานี้ ขั้นตอนการทดสอบ t แบบสองด้าน (TOST) ได้รับความสนใจอย่างมาก ดังที่ได้กล่าวไว้ด้านล่าง วิธีการนี้เป็นการดัดแปลงมาจากการทดสอบ t ที่เป็นที่รู้จักกันอย่างแพร่หลาย
ขั้นตอน TOST
วิธีการทดสอบความเท่าเทียมกันที่ง่ายมากวิธีหนึ่งคือขั้นตอน 'การทดสอบ t แบบด้านเดียวสองครั้ง' (TOST) [ 14 ]ในขั้นตอน TOST จะมีการระบุขอบเขตความเท่าเทียมกันบน (Δ U ) และล่าง (–Δ L ) โดยอิงจากขนาดผลกระทบที่เล็กที่สุดที่สนใจ (เช่น ความแตกต่างที่เป็นบวกหรือลบของ d = 0.3) จะมีการทดสอบสมมติฐานว่างแบบผสมสองข้อ: H 01 : Δ ≤ –Δ Lและ H 02 : Δ ≥ Δ Uเมื่อการทดสอบแบบด้านเดียวทั้งสองนี้สามารถถูกปฏิเสธทางสถิติได้ เราสามารถสรุปได้ว่า –Δ L < Δ < Δ Uหรือว่าผลกระทบที่สังเกตได้นั้นอยู่ภายในขอบเขตความเท่าเทียมกันและมีขนาดเล็กกว่าผลกระทบใดๆ ที่ถือว่าคุ้มค่าและถือว่าเทียบเท่ากันในทางปฏิบัติ[ 6 ]นอกจากนี้ยังมีการพัฒนาทางเลือกอื่นนอกเหนือจากขั้นตอน TOST ด้วย[ 15 ]การปรับเปลี่ยน TOST ครั้งล่าสุดทำให้วิธีการนี้สามารถทำได้ในกรณีของการวัดซ้ำและการประเมินตัวแปรหลายตัว[ 16 ]
การเปรียบเทียบระหว่างการทดสอบ t และการทดสอบความเท่าเทียมกัน
การทดสอบความเท่าเทียมกันสามารถอนุมานได้จากการทดสอบt [ 7 ]พิจารณาการทดสอบ t ที่ระดับนัยสำคัญ α t-testด้วยกำลัง 1-β t-testสำหรับขนาดผลกระทบที่เกี่ยวข้อง d rหาก Δ = d rเช่นเดียวกับ α equiv.-test = β t-testและ β equiv.-test = α t-testตรงกัน กล่าวคือ ประเภทของข้อผิดพลาด (ประเภทที่ 1 และประเภทที่ 2) สลับกันระหว่างการทดสอบ t และการทดสอบความเท่าเทียมกัน การทดสอบ t จะได้ผลลัพธ์เช่นเดียวกับการทดสอบความเท่าเทียมกัน เพื่อให้ได้ผลลัพธ์นี้สำหรับการทดสอบ t จำเป็นต้องคำนวณขนาดตัวอย่างอย่างถูกต้อง หรือต้องปรับระดับนัยสำคัญของการทดสอบ t α t-testซึ่งเรียกว่าการทดสอบ t ที่แก้ไขแล้ว[ 7 ]ทั้งสองแนวทางมีข้อจำกัดในทางปฏิบัติ เนื่องจากการวางแผนขนาดตัวอย่างขึ้นอยู่กับสมมติฐานที่ไม่สามารถตรวจสอบได้ของค่าเบี่ยงเบนมาตรฐานและการทดสอบ t ที่แก้ไขแล้วก่อให้เกิดปัญหาเชิงตัวเลข[ 7 ]การรักษาพฤติกรรมการทดสอบ ข้อจำกัดเหล่านั้นสามารถขจัดออกได้โดยใช้การทดสอบความเท่าเทียมกัน
ภาพด้านล่างแสดงการเปรียบเทียบเชิงภาพระหว่างการทดสอบความเท่าเทียมกันและการทดสอบ t เมื่อการคำนวณขนาดตัวอย่างได้รับผลกระทบจากความแตกต่างระหว่างค่าเบี่ยงเบนมาตรฐานที่กำหนดไว้ล่วงหน้าและค่าเบี่ยงเบนมาตรฐานของตัวอย่างซึ่งเป็นปัญหาที่พบได้ทั่วไป การใช้การทดสอบความเท่าเทียมกันแทนการทดสอบ t ยังช่วยให้มั่นใจได้ว่าค่า α ของการทดสอบความเท่าเทียมกันนั้นมีขอบเขตจำกัด ซึ่งการทดสอบ t ไม่สามารถทำได้ในกรณีที่ความผิดพลาดประเภทที่ 2 เพิ่มขึ้นอย่างไม่มีขีดจำกัด ในทางกลับกันผลลัพธ์ของการทดสอบ t นั้นเข้มงวดกว่าค่า d rที่ระบุไว้ในการวางแผน ซึ่งอาจลงโทษแหล่งที่มาของตัวอย่าง (เช่น ผู้ผลิตอุปกรณ์) อย่างไม่เป็นธรรม ทำให้การทดสอบความเท่าเทียมกันมีความปลอดภัยในการใช้งานมากกว่า

ดูเพิ่มเติม
- การทดสอบโดยใช้บูตสแตรป (สถิติ)
วรรณกรรม
เอกสารด้านล่างนี้เป็นบทนำที่ดีเกี่ยวกับการทดสอบความเท่าเทียมกัน
- Westlake, WJ (1976). "ช่วงความเชื่อมั่นแบบสมมาตรสำหรับการทดลองความเท่าเทียมทางชีวภาพ". Biometrics . 32 (4): 741– 744. doi : 10.2307/2529265 . JSTOR 2529265 .
- Berger, Roger L. ; Hsu, Jason C. (1996). "การทดลองความเท่าเทียมทางชีวภาพ การทดสอบจุดตัด-จุดรวม และชุดความเชื่อมั่นความเท่าเทียม" . วิทยาศาสตร์สถิติ . 11 (4): 283– 319. doi : 10.1214/ss/1032280304 .
- Walker, Esteban; Nowacki, Amy S. (2011). "การทำความเข้าใจการทดสอบความเท่าเทียมและการไม่ด้อยกว่า"วารสารเวชศาสตร์ภายในทั่วไป 26 ( 2): 192– 196. doi : 10.1007/s11606-010-1513-8 . PMC 3019319 . PMID 20857339 .
- Rainey, Carlisle (2014). "การโต้แย้งเพื่อผลกระทบที่เล็กน้อย" (PDF) . American Journal of Political Science . 58 (4): 1083– 1091. doi : 10.1111/ajps.12102 . สืบค้นเมื่อ2025-06-01 .
- Lakens, Daniël (2017). "การทดสอบความเท่าเทียมกัน: คู่มือเบื้องต้นเชิงปฏิบัติสำหรับการทดสอบ t, ความสัมพันธ์ และการวิเคราะห์เมตา" . วิทยาศาสตร์จิตวิทยาสังคมและบุคลิกภาพ . 8 (4): 355– 362. doi : 10.1177/1948550617697177 . PMC 5502906 .
- Lakens, Daniël ; Isager, PM; Scheel, AM (2018). "การทดสอบความเท่าเทียมกันสำหรับการวิจัยทางจิตวิทยา: บทช่วยสอน" . ความก้าวหน้าในวิธีการและแนวปฏิบัติในวิทยาศาสตร์จิตวิทยา . 1 (2): 259– 269. doi : 10.1177/2515245918770963 .
- ฟิตซ์เจอรัลด์, แจ็ค (2025). "ความจำเป็นของการทดสอบความเท่าเทียมกันในเศรษฐศาสตร์" . MetaArXiv . สืบค้นเมื่อ2025-06-01 .
- บทนำเชิงประยุกต์เกี่ยวกับการทดสอบความเท่าเทียมกันปรากฏอยู่ในส่วนที่ 4.2 ของหนังสือ Model to Meaning ของ Vincent Arel-Bundock ซึ่งสามารถเข้าถึงได้ฟรี[ 17 ]
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การทดสอบความเท่าเทียมกัน
การทดสอบความเท่าเทียมกัน เป็นการ ทดสอบสมมติฐาน ประเภทหนึ่งที่ใช้ในการ อนุมาน ทางสถิติ จากข้อมูลที่สังเกตได้ ในการทดสอบเหล่านี้ สมมติฐาน ว่าง (null hypothesis)...
ขั้นตอน TOST
วิธีการทดสอบความเท่าเทียมกันที่ง่ายมากวิธีหนึ่งคือขั้นตอน 'การทดสอบ t แบบด้านเดียวสองครั้ง' (TOST) [ 14 ] ในขั้นตอน TOST จะมีการระบุขอบเขตความเท่าเทียมกันบน (Δ U ) และล่าง (–Δ L ) โดยอิงจากขนาดผลกระทบที่เล็กที่สุดที่สนใจ (เช่น ความแตกต่างที่เป็นบวกหรือลบของ d...
การเปรียบเทียบระหว่างการทดสอบ t และการทดสอบความเท่าเทียมกัน
การทดสอบความเท่าเทียมกันสามารถ อนุมานได้ จากการทดสอบ t [ 7 ] พิจารณาการทดสอบ t ที่ระดับนัยสำคัญ α t-test ด้วย กำลัง 1-β t-test สำหรับขนาดผลกระทบที่เกี่ยวข้อง d r หาก Δ = d r เช่นเดียวกับ α equiv.-test = β t-test และ β equiv.
วรรณกรรม
เอกสารด้านล่างนี้เป็นบทนำที่ดีเกี่ยวกับการทดสอบความเท่าเทียมกัน