อ่าน 8 นาที
ปัจจัยเบย์ส
ปัจจัยเบย์ส คืออัตราส่วนของ แบบจำลองทางสถิติ ที่แข่งขันกันสองแบบ ซึ่งแสดงโดย หลักฐาน ของแบบจำลองเหล่านั้น และใช้ในการวัดปริมาณการสนับสนุนแบบจำลองหนึ่งเหนืออีกแบบจำลองหนึ่ง [ 1 ]...
ปัจจัยเบย์ส
| ส่วนหนึ่งของชุดบทความเกี่ยวกับ |
| สถิติแบบเบย์เซียน |
|---|
| ความน่าจะเป็นภายหลัง = ความน่าจะเป็น × ความน่าจะเป็น ก่อนหน้า ÷ หลักฐาน |
| พื้นหลัง |
| การสร้างแบบจำลอง |
| การประมาณค่าด้านหลัง |
| ผู้ประเมิน |
| การประมาณหลักฐาน |
| การประเมินแบบจำลอง |
ปัจจัยเบย์สคืออัตราส่วนของแบบจำลองทางสถิติ ที่แข่งขันกันสองแบบ ซึ่งแสดงโดยหลักฐาน ของแบบจำลองเหล่านั้น และใช้ในการวัดปริมาณการสนับสนุนแบบจำลองหนึ่งเหนืออีกแบบจำลองหนึ่ง[ 1 ]แบบจำลองที่กล่าวถึงอาจมีชุดพารามิเตอร์ร่วมกัน เช่นสมมติฐานว่างและสมมติฐานทางเลือก แต่ไม่จำเป็นเสมอไป ตัวอย่างเช่น อาจเป็นแบบจำลองที่ไม่เป็นเชิงเส้นเมื่อเทียบกับการประมาณเชิงเส้นปัจจัยเบย์สสามารถคิดได้ว่าเป็นอนาล็อกแบบเบย์สของการทดสอบอัตราส่วนความน่าจะเป็นแม้ว่าจะใช้ความน่าจะเป็นแบบบูรณาการ (เช่น ความน่าจะเป็นแบบมาร์จินัล) แทนที่จะเป็นความน่าจะเป็นสูงสุด ดังนั้น ปริมาณทั้งสองจะตรงกันภายใต้สมมติฐานที่ง่าย (เช่น ค่าพารามิเตอร์เฉพาะสองค่า) [ 2 ]นอกจากนี้ เมื่อเปรียบเทียบกับการทดสอบความสำคัญของสมมติฐานว่างปัจจัยเบย์สสนับสนุนการประเมินหลักฐานที่สนับสนุนสมมติฐานว่าง แทนที่จะอนุญาตให้ปฏิเสธหรือไม่ปฏิเสธสมมติฐานว่างเท่านั้น[ 3 ]
แม้ว่าในเชิงแนวคิดจะง่าย แต่การคำนวณปัจจัยเบย์สอาจเป็นเรื่องท้าทายขึ้นอยู่กับความซับซ้อนของแบบจำลองและสมมติฐาน[ 4 ]เนื่องจากโดยทั่วไปแล้วไม่มีนิพจน์แบบปิดของความน่าจะเป็นแบบมาร์จินัลจึงมีการเสนอ การประมาณเชิงตัวเลขโดยอาศัย ตัวอย่าง MCMC [ 5 ] สำหรับกรณีพิเศษบางกรณี สามารถหานิพจน์พีชคณิตแบบง่ายได้ ตัวอย่างเช่น อัตราส่วนความหนาแน่นของ Savage–Dickey ในกรณีของสมมติฐานที่แม่นยำ (ถูกจำกัดด้วยความเท่าเทียมกัน) เทียบกับทางเลือกที่ไม่จำกัด[ 6 ] [ 7 ]การประมาณอีกวิธีหนึ่งที่ได้มาจากการใช้การประมาณของ Laplaceกับความน่าจะเป็นแบบบูรณาการ เรียกว่าเกณฑ์ข้อมูลแบบเบย์ส (BIC) [ 8 ]ในชุดข้อมูลขนาดใหญ่ ปัจจัยเบย์สจะเข้าใกล้ BIC เมื่ออิทธิพลของไพรเออร์ลดลง ในชุดข้อมูลขนาดเล็ก ค่าความน่าจะเป็นล่วงหน้า (priors) มักมีความสำคัญและต้องไม่ใช่ค่าที่ไม่เหมาะสมเนื่องจากค่า Bayes factor จะไม่สามารถกำหนดได้หากค่าอินทิกรัลใดค่าหนึ่งในอัตราส่วนของค่าดังกล่าวไม่ใช่ค่าจำกัด
คำนิยาม
ปัจจัยเบย์สคืออัตราส่วนของความน่าจะเป็นแบบมาร์จินัลสองค่า นั่นคือความน่าจะเป็นของแบบจำลองทางสถิติสองแบบที่รวมเข้าด้วยกันเหนือความน่าจะเป็นก่อนหน้าของพารามิเตอร์[ 9 ]
ความน่าจะเป็นภายหลัง ของแบบจำลองMเมื่อกำหนดข้อมูลDนั้นได้มาจากทฤษฎีบทของเบย์ส :
ตัวแปรสำคัญที่ขึ้นอยู่กับข้อมูลนั้นแสดงถึงความน่าจะเป็นที่ข้อมูลบางอย่างจะถูกสร้างขึ้นภายใต้สมมติฐานของแบบจำลองMการประเมินค่าตัวแปรนี้อย่างถูกต้องเป็นกุญแจสำคัญในการเปรียบเทียบแบบจำลองแบบเบย์เซียน
เมื่อพิจารณา ปัญหา การเลือกแบบจำลองที่ต้องการเลือกแบบจำลองสองแบบโดยอาศัยข้อมูลที่สังเกตได้Dความน่าเชื่อถือของแบบจำลองสองแบบที่แตกต่างกันM 1และM 2ซึ่งกำหนดพารามิเตอร์โดยเวกเตอร์พารามิเตอร์แบบจำลองและจะถูกประเมินโดยปัจจัยเบย์สKที่กำหนดโดย
เมื่อแบบจำลองทั้งสองมีความน่าจะเป็นก่อนหน้าเท่ากัน ดังนั้นปัจจัยเบย์สจึงเท่ากับอัตราส่วนของความน่าจะเป็นภายหลังของM 1และM 2หากแทนที่จะใช้การอินทิเกรตปัจจัยเบย์ส ใช้ความน่าจะเป็นที่สอดคล้องกับการประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์สำหรับแต่ละแบบจำลองทางสถิติ การทดสอบจะกลายเป็นการทดสอบอัตราส่วนความน่าจะเป็น แบบคลาสสิก ซึ่งแตกต่างจากการทดสอบอัตราส่วนความน่าจะเป็น การเปรียบเทียบแบบจำลองแบบเบย์เซียนนี้ไม่ขึ้นอยู่กับชุดพารามิเตอร์ใด ๆ เนื่องจากเป็นการอินทิเกรตเหนือพารามิเตอร์ทั้งหมดในแต่ละแบบจำลอง (โดยสัมพันธ์กับความน่าจะเป็นก่อนหน้า) ข้อดีของการใช้ปัจจัยเบย์สคือมันจะรวมการลงโทษสำหรับการรวมโครงสร้างแบบจำลองมากเกินไปโดยอัตโนมัติและเป็นธรรมชาติ[ 10 ]ดังนั้นจึงป้องกันการเกิดโอเวอร์ฟิตติ้ง สำหรับแบบจำลองที่ไม่มีเวอร์ชันที่ชัดเจนของความน่าจะเป็นหรือมีค่าใช้จ่ายสูงเกินไปในการประเมินเชิงตัวเลขสามารถใช้การคำนวณแบบเบย์เซียนโดยประมาณ สำหรับการเลือกแบบจำลองในกรอบงานแบบเบย์เซียนได้ [ 11 ] โดยมีข้อแม้ว่าการประมาณค่าแบบเบย์เซียนโดยประมาณของปัจจัยเบย์เซียนมักจะมีความลำเอียง[ 12 ]
แนวทางอื่นๆ ได้แก่:
- เพื่อพิจารณาการเปรียบเทียบแบบจำลองเป็นปัญหาการตัดสินใจโดยคำนวณค่าที่คาดหวังหรือต้นทุนของการเลือกแบบจำลองแต่ละแบบ
- เพื่อใช้ความยาวข้อความขั้นต่ำ (MML)
- เพื่อใช้ความยาวคำอธิบายขั้นต่ำ (MDL)
การตีความ
ค่าK > 1 หมายความว่าM 1ได้รับการสนับสนุนจากข้อมูลที่กำลังพิจารณามากกว่าM 2โปรดทราบว่าการทดสอบสมมติฐาน แบบคลาสสิก จะให้สถานะที่ต้องการแก่สมมติฐาน (หรือแบบจำลอง) หนึ่งข้อ ('สมมติฐานว่าง') และพิจารณาเฉพาะหลักฐานที่ขัดแย้งกับสมมติฐานนั้นเท่านั้น ข้อเท็จจริงที่ว่าปัจจัยเบย์สามารถสร้างหลักฐานสนับสนุนสมมติฐานว่างได้ ไม่ใช่แค่หลักฐานที่ขัดแย้งกับสมมติฐานว่างเท่านั้น เป็นหนึ่งในข้อได้เปรียบที่สำคัญของวิธีการวิเคราะห์นี้[ 13 ]
Harold Jeffreysได้กำหนดมาตราส่วน ( มาตราส่วนของ Jeffreys ) สำหรับการตีความดังนี้: [ 14 ]
| เค | ดีฮาร์ท | บิต | ความแข็งแกร่งของหลักฐาน |
|---|---|---|---|
| < 10 0 | < 0 | < 0 | เชิงลบ (สนับสนุนM 2 ) |
| 10 0ถึง 10 1/2 | 0 ถึง 5 | 0 ถึง 1.6 | แทบไม่คุ้มค่าที่จะกล่าวถึง |
| 10 1/2ถึง 10 1 | 5 ถึง 10 | 1.6 ถึง 3.3 | สำคัญ |
| 10 1ถึง 10 3/2 | 10 ถึง 15 | 3.3 ถึง 5.0 | แข็งแกร่ง |
| 10 3/2ถึง 10 2 | 15 ถึง 20 | 5.0 ถึง 6.6 | แข็งแกร่งมาก |
| > 10 2 | > 20 | > 6.6 | เด็ดขาด |
คอลัมน์ที่สองแสดงน้ำหนักของหลักฐานที่สอดคล้องกันในหน่วยเดซิฮาร์ทลีย์ (หรือที่เรียกว่าเดซิบัน ) โดย มีการเพิ่ม บิตในคอลัมน์ที่สามเพื่อความชัดเจน ตารางจะดำเนินต่อไปในทิศทางตรงกันข้าม ดังนั้น ตัวอย่างเช่น จึงเป็นหลักฐานที่เด็ดขาดสำหรับ
ตารางทางเลือกที่อ้างอิงกันอย่างกว้างขวางนั้นจัดทำโดย Kass และ Raftery (1995): [ 10 ]
| บันทึก10 K | เค | ความแข็งแกร่งของหลักฐาน |
|---|---|---|
| 0 ถึง 1/2 | 1 ถึง 3.2 | ไม่คุ้มค่าที่จะกล่าวถึงมากกว่าแค่การเอ่ยถึงผิวเผิน |
| 1/2 ถึง 1 | 3.2 ถึง 10 | สำคัญ |
| 1 ถึง 2 | 10 ถึง 100 | แข็งแกร่ง |
| > 2 | > 100 | เด็ดขาด |
ตามที่IJ Good กล่าวไว้ ความแตกต่างที่สังเกตได้ของมนุษย์ในชีวิตประจำวัน เมื่อพูดถึงระดับการเปลี่ยนแปลงของความเชื่อในสมมติฐานนั้น อยู่ที่ประมาณ 1.3 เท่า หรือ 1 เดซิบัน หรือ 1/3 ของบิต หรือจาก 1:1 เป็น 5:4 ในอัตราส่วนความน่าจะเป็น[ 15 ]
ตัวอย่าง
สมมติว่าเรามีตัวแปรสุ่ม ที่ ให้ผลลัพธ์เป็นความสำเร็จหรือความล้มเหลว เราต้องการเปรียบเทียบแบบจำลองที่ความน่าจะเป็นของความสำเร็จคือq = 1/2กับแบบจำลองอีกแบบหนึ่งที่ q ไม่ทราบค่า และเราใช้การแจกแจงแบบก่อนหน้าสำหรับqที่เป็นแบบเอกรูปบนช่วง [0,1] เราสุ่มตัวอย่าง 200 ตัวอย่าง พบว่ามีความสำเร็จ 115 ครั้ง และความล้มเหลว 85 ครั้ง ความน่าจะเป็นสามารถคำนวณได้ตามการแจกแจงแบบทวินาม :
ดังนั้นเราจึงมีสำหรับ
ในขณะที่เรามี
ดังนั้นอัตราส่วนจึงเป็น 1.2 ซึ่ง "แทบไม่คุ้มค่าที่จะกล่าวถึง" แม้ว่าจะชี้ไปในทิศทางใดทิศทางหนึ่งเล็กน้อยก็ตาม
การทดสอบสมมติฐานแบบความถี่( ซึ่งในที่นี้ถือเป็นสมมติฐานว่าง ) จะให้ผลลัพธ์ที่แตกต่างกันมาก การทดสอบดังกล่าวระบุว่า ควรปฏิเสธสมมติฐาน ว่างที่ระดับนัยสำคัญ 5% เนื่องจากความน่าจะเป็นที่จะได้ผลลัพธ์ที่ประสบความสำเร็จ 115 ครั้งขึ้นไปจากตัวอย่าง 200 ตัวอย่าง หากq = 1/2คือ 0.02 และการทดสอบแบบสองด้านที่จะได้ตัวเลขที่รุนแรงเท่ากับหรือมากกว่า 115 คือ 0.04 โปรดสังเกตว่า 115 อยู่ห่างจาก 100 มากกว่าสองส่วนเบี่ยงเบนมาตรฐาน ดังนั้น ในขณะที่การทดสอบสมมติฐานแบบความถี่จะให้ผลลัพธ์ที่มีนัยสำคัญที่ระดับนัยสำคัญ 5% แต่ค่า Bayes factor แทบจะไม่ถือว่านี่เป็นผลลัพธ์ที่รุนแรง อย่างไรก็ตาม โปรดทราบว่าค่าความน่าจะเป็นก่อนหน้าที่ไม่สม่ำเสมอ (ตัวอย่างเช่น ค่าที่สะท้อนว่าคุณคาดหวังว่าจำนวนความสำเร็จและความล้มเหลวจะมีขนาดใกล้เคียงกัน) อาจส่งผลให้ค่า Bayes factor สอดคล้องกับการทดสอบสมมติฐานแบบความถี่มากขึ้น
การทดสอบอัตราส่วนความน่าจะเป็นแบบคลาสสิกจะพบ ค่าประมาณ ความน่าจะเป็นสูงสุดสำหรับqนั่นคือซึ่งจากนั้น
(แทนที่จะหาค่าเฉลี่ยของq ที่เป็นไปได้ทั้งหมด) ซึ่ง จะ ให้ค่าอัตราส่วนความน่าจะเป็นเท่ากับ 0.1 และชี้ไปที่M 2
เป็นแบบจำลองที่ซับซ้อนกว่าเนื่องจากมีพารามิเตอร์อิสระที่ช่วยให้สามารถจำลองข้อมูลได้อย่างใกล้ชิดยิ่งขึ้น ความสามารถของปัจจัยเบย์สในการคำนึงถึงสิ่งนี้เป็นเหตุผลหนึ่งที่ทำให้การอนุมานแบบเบย์สถูกนำเสนอเป็นข้ออ้างทางทฤษฎีและการวางนัยทั่วไปของมีดโกนของอ็อกแคมซึ่งช่วยลดข้อผิดพลาดประเภทที่ 1 [ 16 ]
ในทางกลับกัน วิธีความน่าจะเป็นสัมพัทธ์ แบบสมัยใหม่ จะคำนึงถึงจำนวนพารามิเตอร์อิสระในแบบจำลอง ซึ่งแตกต่างจากอัตราส่วนความน่าจะเป็นแบบคลาสสิก วิธีความน่าจะเป็นสัมพัทธ์สามารถนำมาใช้ได้ดังนี้ แบบจำลองM1 มีพารามิเตอร์ 0 ตัว ดังนั้น ค่า เกณฑ์ข้อมูลของ Akaike (AIC) คือแบบจำลองM2มีพารามิเตอร์ 1 ตัว ดังนั้นค่า AIC คือดังนั้นM1 จึงมี ความน่าจะเป็นมากกว่า M2 ประมาณเท่าตัวเพื่อลดการสูญเสียข้อมูลให้น้อยที่สุด ดังนั้นM2 จึงเป็นที่ต้องการมากกว่าเล็กน้อย แต่M1 ก็ไม่สามารถตัดทิ้งได้
ดูเพิ่มเติม
- เกณฑ์ข้อมูลอะไคเกะ
- การคำนวณแบบเบย์เซียนโดยประมาณ
- เกณฑ์ข้อมูลแบบเบย์เซียน
- เกณฑ์ข้อมูลความเบี่ยงเบน
- ความขัดแย้งของลินด์ลีย์
- ความยาวข้อความขั้นต่ำ
- การเลือกแบบจำลอง
- ค่าอี
- อัตราส่วนทางสถิติ
อ่านเพิ่มเติม
- Bernardo, J.; Smith, AFM (1994). ทฤษฎีเบย์เซียน . John Wiley. ISBN 0-471-92416-4.
- Denison, DGT; Holmes, CC; Mallick, BK; Smith, AFM (2002). วิธีการแบบเบย์เซียนสำหรับการจำแนกและการถดถอยแบบไม่เชิงเส้น . John Wiley. ISBN 0-471-49036-9.
- Dienes, Z. (2019). ฉันจะรู้ได้อย่างไรว่าทฤษฎีของฉันทำนายอะไร? ความก้าวหน้าในวิธีการและแนวปฏิบัติในวิทยาศาสตร์จิตวิทยาdoi : 10.1177/2515245919876960
- Duda, Richard O.; Hart, Peter E.; Stork, David G. (2000). "ส่วนที่ 9.6.5". การจำแนกรูปแบบ (ฉบับที่ 2). Wiley. หน้า 487–489 . ISBN 0-471-05669-3.
- Gelman, A.; Carlin, J.; Stern, H.; Rubin, D. (1995). การวิเคราะห์ข้อมูลแบบเบย์เซียน . ลอนดอน: Chapman & Hall . ISBN 0-412-03991-5.
- Jaynes, ET (1994), ทฤษฎีความน่าจะเป็น: ตรรกะของวิทยาศาสตร์เก็บถาวรเมื่อ 2018-10-24 ที่Wayback Machineบทที่ 24
- Kadane, Joseph B.; Dickey, James M. (1980). "ทฤษฎีการตัดสินใจแบบเบย์เซียนและการทำให้แบบจำลองง่ายขึ้น" ใน Kmenta, Jan; Ramsey, James B. (บรรณาธิการ). การประเมินแบบจำลองทางเศรษฐมิติ . นิวยอร์ก: Academic Press. หน้า 245–268 . ISBN 0-12-416550-8.
- ลี, พีเอ็ม (2012). สถิติแบบเบย์เซียน: บทนำ . ไวลีย์. ISBN 9781118332573.
- Richard, Mark; Vecer, Jan (2021). "การทดสอบประสิทธิภาพของตลาดการทำนาย: แนวทางมาร์ติงเกล อัตราส่วนความน่าจะเป็น และการวิเคราะห์ปัจจัยเบย์ส"ความเสี่ยง9 ( 2): 31. doi : 10.3390/risks9020031 . hdl : 10419/258120 .
- วินเคลอร์, โรเบิร์ต (2003). บทนำสู่การอนุมานและการตัดสินใจแบบเบย์เซียน (ฉบับที่ 2). เชิงความน่าจะเป็น. ISBN 0-9647938-4-9.
ลิงก์ภายนอก
- BayesFactor — แพ็กเกจ R สำหรับคำนวณค่า Bayes factor ในการออกแบบการวิจัยทั่วไป
- เครื่องคำนวณค่าเบย์ส — เครื่องคำนวณออนไลน์สำหรับคำนวณค่าเบย์สอย่างแม่นยำ
- เครื่องคำนวณ Bayes Factor ถูกเก็บถาวรเมื่อวันที่ 7 พฤษภาคม 2015 ที่Wayback Machine — เวอร์ชันบนเว็บของแพ็กเกจ BayesFactor ส่วนใหญ่
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ปัจจัยเบย์ส
ปัจจัยเบย์ส คืออัตราส่วนของ แบบจำลองทางสถิติ ที่แข่งขันกันสองแบบ ซึ่งแสดงโดย หลักฐาน ของแบบจำลองเหล่านั้น และใช้ในการวัดปริมาณการสนับสนุนแบบจำลองหนึ่งเหนืออีกแบบจำลองหนึ่ง [ 1 ]...
คำนิยาม
ปัจจัยเบย์สคืออัตราส่วนของความน่าจะเป็นแบบมาร์จินัลสองค่า นั่นคือ ความน่าจะเป็น ของแบบจำลองทางสถิติสองแบบที่รวมเข้าด้วยกันเหนือ ความน่าจะเป็นก่อนหน้า ของพารามิเตอร์ [ 9 ]
การตีความ
ค่า K > 1 หมายความว่า M 1 ได้รับการสนับสนุนจากข้อมูลที่กำลังพิจารณามากกว่า M 2 โปรดทราบว่า การทดสอบสมมติฐาน แบบคลาสสิก จะให้สถานะที่ต้องการแก่สมมติฐาน (หรือแบบจำลอง) หนึ่งข้อ ('สมมติฐานว่าง') และพิจารณาเฉพาะหลักฐาน ที่ขัดแย้งกับ สมมติฐานนั้นเท่านั้น...
ตัวอย่าง
สมมติว่าเรามี ตัวแปรสุ่ม ที่ ให้ ผลลัพธ์เป็นความสำเร็จหรือความล้มเหลว เราต้องการเปรียบเทียบแบบจำลองที่ความน่าจะเป็นของความสำเร็จคือ q = 1/2 กับแบบจำลองอีกแบบหนึ่ง ที่ q ไม่ ทราบค่า และเราใช้ การแจกแจงแบบก่อนหน้า สำหรับ q ที่เป็น แบบเอกรูป บนช่วง [0,1]...