ปัจจัยเบย์ส

ปัจจัยเบย์สคืออัตราส่วนของแบบจำลองทางสถิติ ที่แข่งขันกันสองแบบ ซึ่งแสดงโดยหลักฐาน ของแบบจำลองเหล่านั้น และใช้ในการวัดปริมาณการสนับสนุนแบบจำลองหนึ่งเหนืออีกแบบจำลองหนึ่ง^{[ 1 ]}แบบจำลองที่กล่าวถึงอาจมีชุดพารามิเตอร์ร่วมกัน เช่นสมมติฐานว่างและสมมติฐานทางเลือก แต่ไม่จำเป็นเสมอไป ตัวอย่างเช่น อาจเป็นแบบจำลองที่ไม่เป็นเชิงเส้นเมื่อเทียบกับการประมาณเชิงเส้นปัจจัยเบย์สสามารถคิดได้ว่าเป็นอนาล็อกแบบเบย์สของการทดสอบอัตราส่วนความน่าจะเป็นแม้ว่าจะใช้ความน่าจะเป็นแบบบูรณาการ (เช่น ความน่าจะเป็นแบบมาร์จินัล) แทนที่จะเป็นความน่าจะเป็นสูงสุด ดังนั้น ปริมาณทั้งสองจะตรงกันภายใต้สมมติฐานที่ง่าย (เช่น ค่าพารามิเตอร์เฉพาะสองค่า) ^{[ 2 ]}นอกจากนี้ เมื่อเปรียบเทียบกับการทดสอบความสำคัญของสมมติฐานว่างปัจจัยเบย์สสนับสนุนการประเมินหลักฐานที่สนับสนุนสมมติฐานว่าง แทนที่จะอนุญาตให้ปฏิเสธหรือไม่ปฏิเสธสมมติฐานว่างเท่านั้น^{[ 3 ]}

แม้ว่าในเชิงแนวคิดจะง่าย แต่การคำนวณปัจจัยเบย์สอาจเป็นเรื่องท้าทายขึ้นอยู่กับความซับซ้อนของแบบจำลองและสมมติฐาน^{[ 4 ]}เนื่องจากโดยทั่วไปแล้วไม่มีนิพจน์แบบปิดของความน่าจะเป็นแบบมาร์จินัลจึงมีการเสนอ การประมาณเชิงตัวเลขโดยอาศัย ตัวอย่าง MCMC ^{[ 5 ]} สำหรับกรณีพิเศษบางกรณี สามารถหานิพจน์พีชคณิตแบบง่ายได้ ตัวอย่างเช่น อัตราส่วนความหนาแน่นของ Savage–Dickey ในกรณีของสมมติฐานที่แม่นยำ (ถูกจำกัดด้วยความเท่าเทียมกัน) เทียบกับทางเลือกที่ไม่จำกัด^{[ 6 ]}^{[ 7 ]}การประมาณอีกวิธีหนึ่งที่ได้มาจากการใช้การประมาณของ Laplaceกับความน่าจะเป็นแบบบูรณาการ เรียกว่าเกณฑ์ข้อมูลแบบเบย์ส (BIC) ^{[ 8 ]}ในชุดข้อมูลขนาดใหญ่ ปัจจัยเบย์สจะเข้าใกล้ BIC เมื่ออิทธิพลของไพรเออร์ลดลง ในชุดข้อมูลขนาดเล็ก ค่าความน่าจะเป็นล่วงหน้า (priors) มักมีความสำคัญและต้องไม่ใช่ค่าที่ไม่เหมาะสมเนื่องจากค่า Bayes factor จะไม่สามารถกำหนดได้หากค่าอินทิกรัลใดค่าหนึ่งในอัตราส่วนของค่าดังกล่าวไม่ใช่ค่าจำกัด

คำนิยาม

ปัจจัยเบย์สคืออัตราส่วนของความน่าจะเป็นแบบมาร์จินัลสองค่า นั่นคือความน่าจะเป็นของแบบจำลองทางสถิติสองแบบที่รวมเข้าด้วยกันเหนือความน่าจะเป็นก่อนหน้าของพารามิเตอร์^{[ 9 ]}

ความน่าจะเป็นภายหลัง ของแบบจำลองMเมื่อกำหนดข้อมูลDนั้นได้มาจากทฤษฎีบทของเบย์ส : $\Pr(M|D)$

\Pr(M|D)={\frac {\Pr(D|M)\Pr(M)}{\Pr(D)}}.

ตัวแปรสำคัญที่ขึ้นอยู่กับข้อมูลนั้นแสดงถึงความน่าจะเป็นที่ข้อมูลบางอย่างจะถูกสร้างขึ้นภายใต้สมมติฐานของแบบจำลองMการประเมินค่าตัวแปรนี้อย่างถูกต้องเป็นกุญแจสำคัญในการเปรียบเทียบแบบจำลองแบบเบย์เซียน $\Pr(D|M)$

เมื่อพิจารณา ปัญหา การเลือกแบบจำลองที่ต้องการเลือกแบบจำลองสองแบบโดยอาศัยข้อมูลที่สังเกตได้Dความน่าเชื่อถือของแบบจำลองสองแบบที่แตกต่างกันM ₁และM ₂ซึ่งกำหนดพารามิเตอร์โดยเวกเตอร์พารามิเตอร์แบบจำลองและจะถูกประเมินโดยปัจจัยเบย์สKที่กำหนดโดย $\theta _{1}$ $\theta _{2}$

K={\frac {\Pr(D|M_{1})}{\Pr(D|M_{2})}}={\frac {\int \Pr(\theta _{1}|M_{1})\Pr(D|\theta _{1},M_{1})\,d\theta _{1}}{\int \Pr(\theta _{2}|M_{2})\Pr(D|\theta _{2},M_{2})\,d\theta _{2}}}={\frac {\frac {\Pr(M_{1}|D)\Pr(D)}{\Pr(M_{1})}}{\frac {\Pr(M_{2}|D)\Pr(D)}{\Pr(M_{2})}}}={\frac {\Pr(M_{1}|D)}{\Pr(M_{2}|D)}}{\frac {\Pr(M_{2})}{\Pr(M_{1})}}.

เมื่อแบบจำลองทั้งสองมีความน่าจะเป็นก่อนหน้าเท่ากัน ดังนั้นปัจจัยเบย์สจึงเท่ากับอัตราส่วนของความน่าจะเป็นภายหลังของM ₁และM ₂หากแทนที่จะใช้การอินทิเกรตปัจจัยเบย์ส ใช้ความน่าจะเป็นที่สอดคล้องกับการประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์สำหรับแต่ละแบบจำลองทางสถิติ การทดสอบจะกลายเป็นการทดสอบอัตราส่วนความน่าจะเป็น แบบคลาสสิก ซึ่งแตกต่างจากการทดสอบอัตราส่วนความน่าจะเป็น การเปรียบเทียบแบบจำลองแบบเบย์เซียนนี้ไม่ขึ้นอยู่กับชุดพารามิเตอร์ใด ๆ เนื่องจากเป็นการอินทิเกรตเหนือพารามิเตอร์ทั้งหมดในแต่ละแบบจำลอง (โดยสัมพันธ์กับความน่าจะเป็นก่อนหน้า) ข้อดีของการใช้ปัจจัยเบย์สคือมันจะรวมการลงโทษสำหรับการรวมโครงสร้างแบบจำลองมากเกินไปโดยอัตโนมัติและเป็นธรรมชาติ^[¹⁰^]ดังนั้นจึงป้องกันการเกิดโอเวอร์ฟิตติ้ง สำหรับแบบจำลองที่ไม่มีเวอร์ชันที่ชัดเจนของความน่าจะเป็นหรือมีค่าใช้จ่ายสูงเกินไปในการประเมินเชิงตัวเลขสามารถใช้การคำนวณแบบเบย์เซียนโดยประมาณ สำหรับการเลือกแบบจำลองในกรอบงานแบบเบย์เซียนได้ ^[¹¹^] โดยมีข้อแม้ว่าการประมาณค่าแบบเบย์เซียนโดยประมาณของปัจจัยเบย์เซียนมักจะมีความลำเอียง^[¹²^] $\Pr(M_{1})=\Pr(M_{2})$

แนวทางอื่นๆ ได้แก่:

เพื่อพิจารณาการเปรียบเทียบแบบจำลองเป็นปัญหาการตัดสินใจโดยคำนวณค่าที่คาดหวังหรือต้นทุนของการเลือกแบบจำลองแต่ละแบบ
เพื่อใช้ความยาวข้อความขั้นต่ำ (MML)
เพื่อใช้ความยาวคำอธิบายขั้นต่ำ (MDL)

การตีความ

ค่าK > 1 หมายความว่าM ₁ได้รับการสนับสนุนจากข้อมูลที่กำลังพิจารณามากกว่าM ₂โปรดทราบว่าการทดสอบสมมติฐาน แบบคลาสสิก จะให้สถานะที่ต้องการแก่สมมติฐาน (หรือแบบจำลอง) หนึ่งข้อ ('สมมติฐานว่าง') และพิจารณาเฉพาะหลักฐานที่ขัดแย้งกับสมมติฐานนั้นเท่านั้น ข้อเท็จจริงที่ว่าปัจจัยเบย์สามารถสร้างหลักฐานสนับสนุนสมมติฐานว่างได้ ไม่ใช่แค่หลักฐานที่ขัดแย้งกับสมมติฐานว่างเท่านั้น เป็นหนึ่งในข้อได้เปรียบที่สำคัญของวิธีการวิเคราะห์นี้^{[ 13 ]}

Harold Jeffreysได้กำหนดมาตราส่วน ( มาตราส่วนของ Jeffreys ) สำหรับการตีความดังนี้: ^[¹⁴^] $K$

เค	ดีฮาร์ท	บิต	ความแข็งแกร่งของหลักฐาน
< 10 ⁰	< 0	< 0	เชิงลบ (สนับสนุนM ₂ )
10 ⁰ถึง 10 ^1/2	0 ถึง 5	0 ถึง 1.6	แทบไม่คุ้มค่าที่จะกล่าวถึง
10 ^1/2ถึง 10 ¹	5 ถึง 10	1.6 ถึง 3.3	สำคัญ
10 ¹ถึง 10 ^3/2	10 ถึง 15	3.3 ถึง 5.0	แข็งแกร่ง
10 ^3/2ถึง 10 ²	15 ถึง 20	5.0 ถึง 6.6	แข็งแกร่งมาก
> 10 ²	> 20	> 6.6	เด็ดขาด

คอลัมน์ที่สองแสดงน้ำหนักของหลักฐานที่สอดคล้องกันในหน่วยเดซิฮาร์ทลีย์ (หรือที่เรียกว่าเดซิบัน ) โดย มีการเพิ่ม บิตในคอลัมน์ที่สามเพื่อความชัดเจน ตารางจะดำเนินต่อไปในทิศทางตรงกันข้าม ดังนั้น ตัวอย่างเช่น จึงเป็นหลักฐานที่เด็ดขาดสำหรับ $K\leq 10^{-2}$ $M_{2}$

ตารางทางเลือกที่อ้างอิงกันอย่างกว้างขวางนั้นจัดทำโดย Kass และ Raftery (1995): ^{[ 10 ]}

บันทึก₁₀K	เค	ความแข็งแกร่งของหลักฐาน
0 ถึง 1/2	1 ถึง 3.2	ไม่คุ้มค่าที่จะกล่าวถึงมากกว่าแค่การเอ่ยถึงผิวเผิน
1/2 ถึง 1	3.2 ถึง 10	สำคัญ
1 ถึง 2	10 ถึง 100	แข็งแกร่ง
> 2	> 100	เด็ดขาด

ตามที่IJ Good กล่าวไว้ ความแตกต่างที่สังเกตได้ของมนุษย์ในชีวิตประจำวัน เมื่อพูดถึงระดับการเปลี่ยนแปลงของความเชื่อในสมมติฐานนั้น อยู่ที่ประมาณ 1.3 เท่า หรือ 1 เดซิบัน หรือ 1/3 ของบิต หรือจาก 1:1 เป็น 5:4 ในอัตราส่วนความน่าจะเป็น^{[ 15 ]}

ตัวอย่าง

สมมติว่าเรามีตัวแปรสุ่ม ที่ ให้ผลลัพธ์เป็นความสำเร็จหรือความล้มเหลว เราต้องการเปรียบเทียบแบบจำลองที่ความน่าจะเป็นของความสำเร็จคือq = 1/2กับแบบจำลองอีกแบบหนึ่งที่ q ไม่ทราบค่า และเราใช้การแจกแจงแบบก่อนหน้าสำหรับqที่เป็นแบบเอกรูปบนช่วง [0,1] เราสุ่มตัวอย่าง 200 ตัวอย่าง พบว่ามีความสำเร็จ 115 ครั้ง และความล้มเหลว 85 ครั้ง ความน่าจะเป็นสามารถคำนวณได้ตามการแจกแจงแบบทวินาม : $M_{1}$ $M_{2}$

{{200 \choose 115}q^{115}(1-q)^{85}}.

ดังนั้นเราจึงมีสำหรับ $M_{1}$

P(X=115\mid M_{1})={200 \choose 115}\left({1 \over 2}\right)^{200}\approx 0.006

ในขณะที่เรามี $M_{2}$

P(X=115\mid M_{2})=\int _{0}^{1}{200 \choose 115}q^{115}(1-q)^{85}dq={1 \over 201}\approx 0.005

ดังนั้นอัตราส่วนจึงเป็น 1.2 ซึ่ง "แทบไม่คุ้มค่าที่จะกล่าวถึง" แม้ว่าจะชี้ไปในทิศทางใดทิศทางหนึ่งเล็กน้อยก็ตาม $M_{1}$

การทดสอบสมมติฐานแบบความถี่( ซึ่งในที่นี้ถือเป็นสมมติฐานว่าง ) จะให้ผลลัพธ์ที่แตกต่างกันมาก การทดสอบดังกล่าวระบุว่า ควรปฏิเสธสมมติฐาน ว่างที่ระดับนัยสำคัญ 5% เนื่องจากความน่าจะเป็นที่จะได้ผลลัพธ์ที่ประสบความสำเร็จ 115 ครั้งขึ้นไปจากตัวอย่าง 200 ตัวอย่าง หากq = 1/2คือ 0.02 และการทดสอบแบบสองด้านที่จะได้ตัวเลขที่รุนแรงเท่ากับหรือมากกว่า 115 คือ 0.04 โปรดสังเกตว่า 115 อยู่ห่างจาก 100 มากกว่าสองส่วนเบี่ยงเบนมาตรฐาน ดังนั้น ในขณะที่การทดสอบสมมติฐานแบบ ความถี่จะให้ผลลัพธ์ที่มีนัยสำคัญที่ระดับนัยสำคัญ 5% แต่ค่า Bayes factor แทบจะไม่ถือว่านี่เป็นผลลัพธ์ที่รุนแรง อย่างไรก็ตาม โปรดทราบว่าค่าความน่าจะเป็นก่อนหน้าที่ไม่สม่ำเสมอ (ตัวอย่างเช่น ค่าที่สะท้อนว่าคุณคาดหวังว่าจำนวนความสำเร็จและความล้มเหลวจะมีขนาดใกล้เคียงกัน) อาจส่งผลให้ค่า Bayes factor สอดคล้องกับการทดสอบสมมติฐานแบบความถี่มากขึ้น $M_{1}$ $M_{1}$

การทดสอบอัตราส่วนความน่าจะเป็นแบบคลาสสิกจะพบ ค่าประมาณ ความน่าจะเป็นสูงสุดสำหรับqนั่นคือซึ่งจากนั้น ${\hat {q}}={\frac {115}{200}}=0.575$

\textstyle P(X=115\mid M_{2})={{200 \choose 115}{\hat {q}}^{115}(1-{\hat {q}})^{85}}\approx 0.06

(แทนที่จะหาค่าเฉลี่ยของq ที่เป็นไปได้ทั้งหมด) ซึ่ง จะ ให้ค่าอัตราส่วนความน่าจะเป็นเท่ากับ 0.1 และชี้ไปที่M ₂

$M_{2}$ เป็นแบบจำลองที่ซับซ้อนกว่าเนื่องจากมีพารามิเตอร์อิสระที่ช่วยให้สามารถจำลองข้อมูลได้อย่างใกล้ชิดยิ่งขึ้น ความสามารถของปัจจัยเบย์สในการคำนึงถึงสิ่งนี้เป็นเหตุผลหนึ่งที่ทำให้การอนุมานแบบเบย์สถูกนำเสนอเป็นข้ออ้างทางทฤษฎีและการวางนัยทั่วไปของมีดโกนของอ็อกแคมซึ่งช่วยลดข้อผิดพลาดประเภทที่ 1 ^[¹⁶^] $M_{1}$

ในทางกลับกัน วิธีความน่าจะเป็นสัมพัทธ์ แบบสมัยใหม่ จะคำนึงถึงจำนวนพารามิเตอร์อิสระในแบบจำลอง ซึ่งแตกต่างจากอัตราส่วนความน่าจะเป็นแบบคลาสสิก วิธีความน่าจะเป็นสัมพัทธ์สามารถนำมาใช้ได้ดังนี้ แบบจำลอง_M1มีพารามิเตอร์ 0 ตัว ดังนั้น ค่า เกณฑ์ข้อมูลของ Akaike (AIC) คือแบบจำลองM2มีพารามิเตอร์ 1 ตัว ดังนั้นค่า AIC คือดังนั้น_M1 จึงมี ความน่าจะเป็นมากกว่า M2 ประมาณเท่าตัว_{เพื่อ}ลดการสูญเสียข้อมูลให้น้อยที่สุด ดังนั้น_M2_จึง_เป็นที่ต้องการมากกว่าเล็กน้อย แต่M1 ก็ไม่สามารถตัดทิ้งได้ $2\cdot 0-2\cdot \ln(0.005956)\approx 10.2467$ $2\cdot 1-2\cdot \ln(0.056991)\approx 7.7297$ $\exp \left({\frac {7.7297-10.2467}{2}}\right)\approx 0.284$

ดูเพิ่มเติม

อัตราส่วนทางสถิติ

อ่านเพิ่มเติม

Bernardo, J.; Smith, AFM (1994). ทฤษฎีเบย์เซียน . John Wiley. ISBN 0-471-92416-4.
Denison, DGT; Holmes, CC; Mallick, BK; Smith, AFM (2002). วิธีการแบบเบย์เซียนสำหรับการจำแนกและการถดถอยแบบไม่เชิงเส้น . John Wiley. ISBN 0-471-49036-9.
Dienes, Z. (2019). ฉันจะรู้ได้อย่างไรว่าทฤษฎีของฉันทำนายอะไร? ความก้าวหน้าในวิธีการและแนวปฏิบัติในวิทยาศาสตร์จิตวิทยาdoi : 10.1177/2515245919876960
Duda, Richard O.; Hart, Peter E.; Stork, David G. (2000). "ส่วนที่ 9.6.5". การจำแนกรูปแบบ (ฉบับที่ 2). Wiley. หน้า 487–489 . ISBN 0-471-05669-3.
Gelman, A.; Carlin, J.; Stern, H.; Rubin, D. (1995). การวิเคราะห์ข้อมูลแบบเบย์เซียน . ลอนดอน: Chapman & Hall . ISBN 0-412-03991-5.
Jaynes, ET (1994), ทฤษฎีความน่าจะเป็น: ตรรกะของวิทยาศาสตร์เก็บถาวรเมื่อ 2018-10-24 ที่Wayback Machineบทที่ 24
Kadane, Joseph B.; Dickey, James M. (1980). "ทฤษฎีการตัดสินใจแบบเบย์เซียนและการทำให้แบบจำลองง่ายขึ้น" ใน Kmenta, Jan; Ramsey, James B. (บรรณาธิการ). การประเมินแบบจำลองทางเศรษฐมิติ . นิวยอร์ก: Academic Press. หน้า 245–268 . ISBN 0-12-416550-8.
ลี, พีเอ็ม (2012). สถิติแบบเบย์เซียน: บทนำ . ไวลีย์. ISBN 9781118332573.
Richard, Mark; Vecer, Jan (2021). "การทดสอบประสิทธิภาพของตลาดการทำนาย: แนวทางมาร์ติงเกล อัตราส่วนความน่าจะเป็น และการวิเคราะห์ปัจจัยเบย์ส"ความเสี่ยง9 ( 2): 31. doi : 10.3390/risks9020031 . hdl : 10419/258120 .
วินเคลอร์, โรเบิร์ต (2003). บทนำสู่การอนุมานและการตัดสินใจแบบเบย์เซียน (ฉบับที่ 2). เชิงความน่าจะเป็น. ISBN 0-9647938-4-9.

ลิงก์ภายนอก

BayesFactor — แพ็กเกจ R สำหรับคำนวณค่า Bayes factor ในการออกแบบการวิจัยทั่วไป
เครื่องคำนวณค่าเบย์ส — เครื่องคำนวณออนไลน์สำหรับคำนวณค่าเบย์สอย่างแม่นยำ
เครื่องคำนวณ Bayes Factor ถูกเก็บถาวรเมื่อวันที่ 7 พฤษภาคม 2015 ที่Wayback Machine — เวอร์ชันบนเว็บของแพ็กเกจ BayesFactor ส่วนใหญ่

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[

[

[

[ 13 ]

[

[ 15 ]

[