กลับไปหน้าบทความ

อ่าน 8 นาที

ปัจจัยเบย์ส

ปัจจัยเบย์ส คืออัตราส่วนของ แบบจำลองทางสถิติ ที่แข่งขันกันสองแบบ ซึ่งแสดงโดย หลักฐาน ของแบบจำลองเหล่านั้น และใช้ในการวัดปริมาณการสนับสนุนแบบจำลองหนึ่งเหนืออีกแบบจำลองหนึ่ง [ 1 ]...

ปัจจัยเบย์ส

ปัจจัยเบย์สคืออัตราส่วนของแบบจำลองทางสถิติ ที่แข่งขันกันสองแบบ ซึ่งแสดงโดยหลักฐาน ของแบบจำลองเหล่านั้น และใช้ในการวัดปริมาณการสนับสนุนแบบจำลองหนึ่งเหนืออีกแบบจำลองหนึ่ง[ 1 ]แบบจำลองที่กล่าวถึงอาจมีชุดพารามิเตอร์ร่วมกัน เช่นสมมติฐานว่างและสมมติฐานทางเลือก แต่ไม่จำเป็นเสมอไป ตัวอย่างเช่น อาจเป็นแบบจำลองที่ไม่เป็นเชิงเส้นเมื่อเทียบกับการประมาณเชิงเส้นปัจจัยเบย์สสามารถคิดได้ว่าเป็นอนาล็อกแบบเบย์สของการทดสอบอัตราส่วนความน่าจะเป็นแม้ว่าจะใช้ความน่าจะเป็นแบบบูรณาการ (เช่น ความน่าจะเป็นแบบมาร์จินัล) แทนที่จะเป็นความน่าจะเป็นสูงสุด ดังนั้น ปริมาณทั้งสองจะตรงกันภายใต้สมมติฐานที่ง่าย (เช่น ค่าพารามิเตอร์เฉพาะสองค่า) [ 2 ]นอกจากนี้ เมื่อเปรียบเทียบกับการทดสอบความสำคัญของสมมติฐานว่างปัจจัยเบย์สสนับสนุนการประเมินหลักฐานที่สนับสนุนสมมติฐานว่าง แทนที่จะอนุญาตให้ปฏิเสธหรือไม่ปฏิเสธสมมติฐานว่างเท่านั้น[ 3 ]

แม้ว่าในเชิงแนวคิดจะง่าย แต่การคำนวณปัจจัยเบย์สอาจเป็นเรื่องท้าทายขึ้นอยู่กับความซับซ้อนของแบบจำลองและสมมติฐาน[ 4 ]เนื่องจากโดยทั่วไปแล้วไม่มีนิพจน์แบบปิดของความน่าจะเป็นแบบมาร์จินัลจึงมีการเสนอ การประมาณเชิงตัวเลขโดยอาศัย ตัวอย่าง MCMC [ 5 ] สำหรับกรณีพิเศษบางกรณี สามารถหานิพจน์พีชคณิตแบบง่ายได้ ตัวอย่างเช่น อัตราส่วนความหนาแน่นของ Savage–Dickey ในกรณีของสมมติฐานที่แม่นยำ (ถูกจำกัดด้วยความเท่าเทียมกัน) เทียบกับทางเลือกที่ไม่จำกัด[ 6 ] [ 7 ]การประมาณอีกวิธีหนึ่งที่ได้มาจากการใช้การประมาณของ Laplaceกับความน่าจะเป็นแบบบูรณาการ เรียกว่าเกณฑ์ข้อมูลแบบเบย์ส (BIC) [ 8 ]ในชุดข้อมูลขนาดใหญ่ ปัจจัยเบย์สจะเข้าใกล้ BIC เมื่ออิทธิพลของไพรเออร์ลดลง ในชุดข้อมูลขนาดเล็ก ค่าความน่าจะเป็นล่วงหน้า (priors) มักมีความสำคัญและต้องไม่ใช่ค่าที่ไม่เหมาะสมเนื่องจากค่า Bayes factor จะไม่สามารถกำหนดได้หากค่าอินทิกรัลใดค่าหนึ่งในอัตราส่วนของค่าดังกล่าวไม่ใช่ค่าจำกัด

คำนิยาม

ปัจจัยเบย์สคืออัตราส่วนของความน่าจะเป็นแบบมาร์จินัลสองค่า นั่นคือความน่าจะเป็นของแบบจำลองทางสถิติสองแบบที่รวมเข้าด้วยกันเหนือความน่าจะเป็นก่อนหน้าของพารามิเตอร์[ 9 ]

ความน่าจะเป็นภายหลัง ของแบบจำลองMเมื่อกำหนดข้อมูลDนั้นได้มาจากทฤษฎีบทของเบย์ส :

ตัวแปรสำคัญที่ขึ้นอยู่กับข้อมูลนั้นแสดงถึงความน่าจะเป็นที่ข้อมูลบางอย่างจะถูกสร้างขึ้นภายใต้สมมติฐานของแบบจำลองMการประเมินค่าตัวแปรนี้อย่างถูกต้องเป็นกุญแจสำคัญในการเปรียบเทียบแบบจำลองแบบเบย์เซียน

เมื่อพิจารณา ปัญหา การเลือกแบบจำลองที่ต้องการเลือกแบบจำลองสองแบบโดยอาศัยข้อมูลที่สังเกตได้Dความน่าเชื่อถือของแบบจำลองสองแบบที่แตกต่างกันM 1และM 2ซึ่งกำหนดพารามิเตอร์โดยเวกเตอร์พารามิเตอร์แบบจำลองและจะถูกประเมินโดยปัจจัยเบย์สKที่กำหนดโดย

เมื่อแบบจำลองทั้งสองมีความน่าจะเป็นก่อนหน้าเท่ากัน ดังนั้นปัจจัยเบย์สจึงเท่ากับอัตราส่วนของความน่าจะเป็นภายหลังของM 1และM 2หากแทนที่จะใช้การอินทิเกรตปัจจัยเบย์ส ใช้ความน่าจะเป็นที่สอดคล้องกับการประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์สำหรับแต่ละแบบจำลองทางสถิติ การทดสอบจะกลายเป็นการทดสอบอัตราส่วนความน่าจะเป็น แบบคลาสสิก ซึ่งแตกต่างจากการทดสอบอัตราส่วนความน่าจะเป็น การเปรียบเทียบแบบจำลองแบบเบย์เซียนนี้ไม่ขึ้นอยู่กับชุดพารามิเตอร์ใด ๆ เนื่องจากเป็นการอินทิเกรตเหนือพารามิเตอร์ทั้งหมดในแต่ละแบบจำลอง (โดยสัมพันธ์กับความน่าจะเป็นก่อนหน้า) ข้อดีของการใช้ปัจจัยเบย์สคือมันจะรวมการลงโทษสำหรับการรวมโครงสร้างแบบจำลองมากเกินไปโดยอัตโนมัติและเป็นธรรมชาติ[ 10 ]ดังนั้นจึงป้องกันการเกิดโอเวอร์ฟิตติ้ง สำหรับแบบจำลองที่ไม่มีเวอร์ชันที่ชัดเจนของความน่าจะเป็นหรือมีค่าใช้จ่ายสูงเกินไปในการประเมินเชิงตัวเลขสามารถใช้การคำนวณแบบเบย์เซียนโดยประมาณ สำหรับการเลือกแบบจำลองในกรอบงานแบบเบย์เซียนได้ [ 11 ] โดยมีข้อแม้ว่าการประมาณค่าแบบเบย์เซียนโดยประมาณของปัจจัยเบย์เซียนมักจะมีความลำเอียง[ 12 ]

แนวทางอื่นๆ ได้แก่:

การตีความ

ค่าK > 1 หมายความว่าM 1ได้รับการสนับสนุนจากข้อมูลที่กำลังพิจารณามากกว่าM 2โปรดทราบว่าการทดสอบสมมติฐาน แบบคลาสสิก จะให้สถานะที่ต้องการแก่สมมติฐาน (หรือแบบจำลอง) หนึ่งข้อ ('สมมติฐานว่าง') และพิจารณาเฉพาะหลักฐานที่ขัดแย้งกับสมมติฐานนั้นเท่านั้น ข้อเท็จจริงที่ว่าปัจจัยเบย์สามารถสร้างหลักฐานสนับสนุนสมมติฐานว่างได้ ไม่ใช่แค่หลักฐานที่ขัดแย้งกับสมมติฐานว่างเท่านั้น เป็นหนึ่งในข้อได้เปรียบที่สำคัญของวิธีการวิเคราะห์นี้[ 13 ]

Harold Jeffreysได้กำหนดมาตราส่วน ( มาตราส่วนของ Jeffreys ) สำหรับการตีความดังนี้: [ 14 ]

เคดีฮาร์ทบิตความแข็งแกร่งของหลักฐาน
< 10 0< 0< 0เชิงลบ (สนับสนุนM 2 )
10 0ถึง 10 1/20 ถึง 50 ถึง 1.6แทบไม่คุ้มค่าที่จะกล่าวถึง
10 1/2ถึง 10 15 ถึง 101.6 ถึง 3.3สำคัญ
10 1ถึง 10 3/210 ถึง 153.3 ถึง 5.0แข็งแกร่ง
10 3/2ถึง 10 215 ถึง 205.0 ถึง 6.6แข็งแกร่งมาก
> 10 2> 20> 6.6เด็ดขาด

คอลัมน์ที่สองแสดงน้ำหนักของหลักฐานที่สอดคล้องกันในหน่วยเดซิฮาร์ทลีย์ (หรือที่เรียกว่าเดซิบัน ) โดย มีการเพิ่ม บิตในคอลัมน์ที่สามเพื่อความชัดเจน ตารางจะดำเนินต่อไปในทิศทางตรงกันข้าม ดังนั้น ตัวอย่างเช่น จึงเป็นหลักฐานที่เด็ดขาดสำหรับ

ตารางทางเลือกที่อ้างอิงกันอย่างกว้างขวางนั้นจัดทำโดย Kass และ Raftery (1995): [ 10 ]

บันทึก10 Kเคความแข็งแกร่งของหลักฐาน
0 ถึง 1/21 ถึง 3.2ไม่คุ้มค่าที่จะกล่าวถึงมากกว่าแค่การเอ่ยถึงผิวเผิน
1/2 ถึง 13.2 ถึง 10สำคัญ
1 ถึง 210 ถึง 100แข็งแกร่ง
> 2> 100เด็ดขาด

ตามที่IJ Good กล่าวไว้ ความแตกต่างที่สังเกตได้ของมนุษย์ในชีวิตประจำวัน เมื่อพูดถึงระดับการเปลี่ยนแปลงของความเชื่อในสมมติฐานนั้น อยู่ที่ประมาณ 1.3 เท่า หรือ 1 เดซิบัน หรือ 1/3 ของบิต หรือจาก 1:1 เป็น 5:4 ในอัตราส่วนความน่าจะเป็น[ 15 ]

ตัวอย่าง

สมมติว่าเรามีตัวแปรสุ่ม ที่ ให้ผลลัพธ์เป็นความสำเร็จหรือความล้มเหลว เราต้องการเปรียบเทียบแบบจำลองที่ความน่าจะเป็นของความสำเร็จคือq = 1/2กับแบบจำลองอีกแบบหนึ่งที่ q ไม่ทราบค่า และเราใช้การแจกแจงแบบก่อนหน้าสำหรับqที่เป็นแบบเอกรูปบนช่วง [0,1] เราสุ่มตัวอย่าง 200 ตัวอย่าง พบว่ามีความสำเร็จ 115 ครั้ง และความล้มเหลว 85 ครั้ง ความน่าจะเป็นสามารถคำนวณได้ตามการแจกแจงแบบทวินาม :

ดังนั้นเราจึงมีสำหรับ

ในขณะที่เรามี

ดังนั้นอัตราส่วนจึงเป็น 1.2 ซึ่ง "แทบไม่คุ้มค่าที่จะกล่าวถึง" แม้ว่าจะชี้ไปในทิศทางใดทิศทางหนึ่งเล็กน้อยก็ตาม

การทดสอบสมมติฐานแบบความถี่( ซึ่งในที่นี้ถือเป็นสมมติฐานว่าง ) จะให้ผลลัพธ์ที่แตกต่างกันมาก การทดสอบดังกล่าวระบุว่า ควรปฏิเสธสมมติฐาน ว่างที่ระดับนัยสำคัญ 5% เนื่องจากความน่าจะเป็นที่จะได้ผลลัพธ์ที่ประสบความสำเร็จ 115 ครั้งขึ้นไปจากตัวอย่าง 200 ตัวอย่าง หากq = 1/2คือ 0.02 และการทดสอบแบบสองด้านที่จะได้ตัวเลขที่รุนแรงเท่ากับหรือมากกว่า 115 คือ 0.04 โปรดสังเกตว่า 115 อยู่ห่างจาก 100 มากกว่าสองส่วนเบี่ยงเบนมาตรฐาน ดังนั้น ในขณะที่การทดสอบสมมติฐานแบบความถี่จะให้ผลลัพธ์ที่มีนัยสำคัญที่ระดับนัยสำคัญ 5% แต่ค่า Bayes factor แทบจะไม่ถือว่านี่เป็นผลลัพธ์ที่รุนแรง อย่างไรก็ตาม โปรดทราบว่าค่าความน่าจะเป็นก่อนหน้าที่ไม่สม่ำเสมอ (ตัวอย่างเช่น ค่าที่สะท้อนว่าคุณคาดหวังว่าจำนวนความสำเร็จและความล้มเหลวจะมีขนาดใกล้เคียงกัน) อาจส่งผลให้ค่า Bayes factor สอดคล้องกับการทดสอบสมมติฐานแบบความถี่มากขึ้น

การทดสอบอัตราส่วนความน่าจะเป็นแบบคลาสสิกจะพบ ค่าประมาณ ความน่าจะเป็นสูงสุดสำหรับqนั่นคือซึ่งจากนั้น

(แทนที่จะหาค่าเฉลี่ยของq ที่เป็นไปได้ทั้งหมด) ซึ่ง จะ ให้ค่าอัตราส่วนความน่าจะเป็นเท่ากับ 0.1 และชี้ไปที่M 2

เป็นแบบจำลองที่ซับซ้อนกว่าเนื่องจากมีพารามิเตอร์อิสระที่ช่วยให้สามารถจำลองข้อมูลได้อย่างใกล้ชิดยิ่งขึ้น ความสามารถของปัจจัยเบย์สในการคำนึงถึงสิ่งนี้เป็นเหตุผลหนึ่งที่ทำให้การอนุมานแบบเบย์สถูกนำเสนอเป็นข้ออ้างทางทฤษฎีและการวางนัยทั่วไปของมีดโกนของอ็อกแคมซึ่งช่วยลดข้อผิดพลาดประเภทที่ 1 [ 16 ]

ในทางกลับกัน วิธีความน่าจะเป็นสัมพัทธ์ แบบสมัยใหม่ จะคำนึงถึงจำนวนพารามิเตอร์อิสระในแบบจำลอง ซึ่งแตกต่างจากอัตราส่วนความน่าจะเป็นแบบคลาสสิก วิธีความน่าจะเป็นสัมพัทธ์สามารถนำมาใช้ได้ดังนี้ แบบจำลองM1 มีพารามิเตอร์ 0 ตัว ดังนั้น ค่า เกณฑ์ข้อมูลของ Akaike (AIC) คือแบบจำลองM2มีพารามิเตอร์ 1 ตัว ดังนั้นค่า AIC คือดังนั้นM1 จึงมี ความน่าจะเป็นมากกว่า M2 ประมาณเท่าตัวเพื่อลดการสูญเสียข้อมูลให้น้อยที่สุด ดังนั้นM2 จึงเป็นที่ต้องการมากกว่าเล็กน้อย แต่M1 ก็ไม่สามารถตัดทิ้งได้

ดูเพิ่มเติม

อัตราส่วนทางสถิติ

อ่านเพิ่มเติม

  • Bernardo, J.; Smith, AFM (1994). ทฤษฎีเบย์เซียน . John Wiley. ISBN 0-471-92416-4.
  • Denison, DGT; Holmes, CC; Mallick, BK; Smith, AFM (2002). วิธีการแบบเบย์เซียนสำหรับการจำแนกและการถดถอยแบบไม่เชิงเส้น . John Wiley. ISBN 0-471-49036-9.
  • Dienes, Z. (2019). ฉันจะรู้ได้อย่างไรว่าทฤษฎีของฉันทำนายอะไร? ความก้าวหน้าในวิธีการและแนวปฏิบัติในวิทยาศาสตร์จิตวิทยาdoi : 10.1177/2515245919876960
  • Duda, Richard O.; Hart, Peter E.; Stork, David G. (2000). "ส่วนที่ 9.6.5". การจำแนกรูปแบบ (ฉบับที่ 2). Wiley. หน้า  487–489 . ISBN 0-471-05669-3.
  • Gelman, A.; Carlin, J.; Stern, H.; Rubin, D. (1995). การวิเคราะห์ข้อมูลแบบเบย์เซียน . ลอนดอน: Chapman & Hall . ISBN 0-412-03991-5.
  • Jaynes, ET (1994), ทฤษฎีความน่าจะเป็น: ตรรกะของวิทยาศาสตร์เก็บถาวรเมื่อ 2018-10-24 ที่Wayback Machineบทที่ 24
  • Kadane, Joseph B.; Dickey, James M. (1980). "ทฤษฎีการตัดสินใจแบบเบย์เซียนและการทำให้แบบจำลองง่ายขึ้น" ใน Kmenta, Jan; Ramsey, James B. (บรรณาธิการ). การประเมินแบบจำลองทางเศรษฐมิติ . นิวยอร์ก: Academic Press. หน้า  245–268 . ISBN 0-12-416550-8.
  • ลี, พีเอ็ม (2012). สถิติแบบเบย์เซียน: บทนำ . ไวลีย์. ISBN 9781118332573.
  • Richard, Mark; Vecer, Jan (2021). "การทดสอบประสิทธิภาพของตลาดการทำนาย: แนวทางมาร์ติงเกล อัตราส่วนความน่าจะเป็น และการวิเคราะห์ปัจจัยเบย์ส"ความเสี่ยง9 ( 2): 31. doi : 10.3390/risks9020031 . hdl : 10419/258120 .
  • วินเคลอร์, โรเบิร์ต (2003). บทนำสู่การอนุมานและการตัดสินใจแบบเบย์เซียน (ฉบับที่ 2). เชิงความน่าจะเป็น. ISBN 0-9647938-4-9.
  • BayesFactor — แพ็กเกจ R สำหรับคำนวณค่า Bayes factor ในการออกแบบการวิจัยทั่วไป
  • เครื่องคำนวณค่าเบย์ส — เครื่องคำนวณออนไลน์สำหรับคำนวณค่าเบย์สอย่างแม่นยำ
  • เครื่องคำนวณ Bayes Factor ถูกเก็บถาวรเมื่อวันที่ 7 พฤษภาคม 2015 ที่Wayback Machine — เวอร์ชันบนเว็บของแพ็กเกจ BayesFactor ส่วนใหญ่
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Bayes_factor&oldid=1350119743 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ปัจจัยเบย์ส

ปัจจัยเบย์ส คืออัตราส่วนของ แบบจำลองทางสถิติ ที่แข่งขันกันสองแบบ ซึ่งแสดงโดย หลักฐาน ของแบบจำลองเหล่านั้น และใช้ในการวัดปริมาณการสนับสนุนแบบจำลองหนึ่งเหนืออีกแบบจำลองหนึ่ง [ 1 ]...

คำนิยาม

ปัจจัยเบย์สคืออัตราส่วนของความน่าจะเป็นแบบมาร์จินัลสองค่า นั่นคือ ความน่าจะเป็น ของแบบจำลองทางสถิติสองแบบที่รวมเข้าด้วยกันเหนือ ความน่าจะเป็นก่อนหน้า ของพารามิเตอร์ [ 9 ]

การตีความ

ค่า K > 1 หมายความว่า M 1 ได้รับการสนับสนุนจากข้อมูลที่กำลังพิจารณามากกว่า M 2 โปรดทราบว่า การทดสอบสมมติฐาน แบบคลาสสิก จะให้สถานะที่ต้องการแก่สมมติฐาน (หรือแบบจำลอง) หนึ่งข้อ ('สมมติฐานว่าง') และพิจารณาเฉพาะหลักฐาน ที่ขัดแย้งกับ สมมติฐานนั้นเท่านั้น...

ตัวอย่าง

สมมติว่าเรามี ตัวแปรสุ่ม ที่ ให้ ผลลัพธ์เป็นความสำเร็จหรือความล้มเหลว เราต้องการเปรียบเทียบแบบจำลองที่ความน่าจะเป็นของความสำเร็จคือ q = 1/2 กับแบบจำลองอีกแบบหนึ่ง ที่ q ไม่ ทราบค่า และเราใช้ การแจกแจงแบบก่อนหน้า สำหรับ q ที่เป็น แบบเอกรูป บนช่วง [0,1]...