กลับไปหน้าบทความ

อ่าน 14 นาที

การถดถอยเชิงเส้นแบบเบย์เซียน

การถดถอยเชิงเส้นแบบเบย์เซียนเป็นรูปแบบหนึ่งของการสร้างแบบจำลองแบบมีเงื่อนไขโดยที่ค่าเฉลี่ยของตัวแปรหนึ่งจะถูกอธิบายด้วยการรวมเชิงเส้นของตัวแปรอื่น ๆ...

การถดถอยเชิงเส้นแบบเบย์เซียน

การถดถอยเชิงเส้นแบบเบย์เซียนเป็นรูปแบบหนึ่งของการสร้างแบบจำลองแบบมีเงื่อนไขโดยที่ค่าเฉลี่ยของตัวแปรหนึ่งจะถูกอธิบายด้วยการรวมเชิงเส้นของตัวแปรอื่น ๆ โดยมีเป้าหมายเพื่อหาความน่าจะเป็นภายหลังของสัมประสิทธิ์การถดถอย (รวมถึงพารามิเตอร์อื่น ๆ ที่อธิบายการกระจายของตัวแปรตาม) และในที่สุดก็ทำให้สามารถทำนายตัวแปรตาม (มักเรียกว่า) นอกตัวอย่างได้โดยมีเงื่อนไขจากค่าที่สังเกตได้ของตัวแปรอิสระ (โดยปกติคือ) แบบจำลองที่ง่ายที่สุดและใช้กันอย่างแพร่หลายที่สุดคือแบบจำลองเชิงเส้นปกติซึ่งกำหนดให้ มีการกระจายแบบเกาส์เซียนในแบบจำลองนี้ และภายใต้การเลือกความน่าจะเป็นก่อนหน้าสำหรับพารามิเตอร์ที่เฉพาะเจาะจง—ที่เรียกว่าความน่าจะเป็นก่อนหน้าแบบสังยุค—สามารถหาความน่าจะเป็นภายหลังได้โดยวิธีการวิเคราะห์ หากเลือกความน่าจะเป็นก่อนหน้าโดยพลการมากขึ้น ความน่าจะเป็นภายหลังโดยทั่วไปจะต้องประมาณค่า

การตั้งค่าโมเดล

พิจารณา ปัญหา การถดถอยเชิงเส้น มาตรฐาน ซึ่งเรากำหนดค่าเฉลี่ยของการแจกแจงแบบมีเงื่อนไขของโดยกำหนดเวกเตอร์ตัวทำนาย:

โดยที่เป็นเวกเตอร์ และเป็นตัวแปรสุ่มอิสระและมีการกระจายแบบปกติ เหมือนกัน :

ซึ่งสอดคล้องกับฟังก์ชันความน่าจะเป็น ดังต่อไปนี้ :

ใช้วิธีการหาค่าสัมประสิทธิ์กำลังสองน้อยที่สุดแบบธรรมดาใน การประมาณค่าเวกเตอร์สัมประสิทธิ์โดยใช้ ผกผันเทียมของมัวร์-เพนโรส :

โดยที่คือเมทริกซ์การออกแบบซึ่งแต่ละแถวเป็นเวกเตอร์ตัวทำนายและ คือ เวก เตอร์คอลัมน์

นี่เป็น แนวทาง ความถี่และถือว่ามีการวัดเพียงพอที่จะกล่าวถึงสิ่งที่มีความหมายเกี่ยวกับในแนวทางแบบเบย์เซียน[ 1 ]ข้อมูลจะถูกเสริมด้วยข้อมูลเพิ่มเติมในรูปแบบของการแจกแจงความน่าจะเป็นก่อนหน้าความเชื่อก่อนหน้าเกี่ยวกับพารามิเตอร์จะถูกรวมเข้ากับฟังก์ชันความน่าจะเป็นของข้อมูลตามทฤษฎีบทของเบย์สเพื่อให้ได้ความเชื่อภายหลังเกี่ยวกับพารามิเตอร์และความเชื่อก่อนหน้าสามารถมีรูปแบบฟังก์ชันที่แตกต่างกันได้ขึ้นอยู่กับโดเมนและข้อมูลที่มีอยู่ก่อนหน้า

เนื่องจากข้อมูลประกอบด้วยทั้งและจึงจำเป็นต้องพิจารณาเฉพาะการกระจายตัวของโดยมีเงื่อนไขว่า ต้องมีการให้เหตุผล ในความเป็นจริง การวิเคราะห์แบบเบย์เซียนแบบ "เต็มรูปแบบ" จะต้องใช้ความน่าจะเป็นร่วมพร้อมกับความน่าจะเป็นก่อนหน้าโดยที่แทนพารามิเตอร์ของการกระจายตัวสำหรับ

เราสามารถแยกความน่าจะเป็นร่วมออกได้โดยการสมมติ ความเป็นเอกพันธุ์ อย่างเคร่งครัด[ 2 ] ความเป็นเอกพันธุ์อย่างเคร่งครัดต้องมี:

  • เวกเตอร์พารามิเตอร์สามารถแยกออกเป็นสองส่วน โดยส่วนหนึ่งแสดงความหนาแน่นแบบมีเงื่อนไขของตัวแปรตอบสนองและอีกส่วนหนึ่งแสดงความหนาแน่นแบบมาร์จินัลของตัวแปรอิสระ
  • จุดข้อมูลนั้นไม่ได้ให้ข้อมูลเพิ่มเติมใดๆ เกี่ยวกับจุดข้อมูลนั้นนอกเหนือจากข้อมูลที่มีอยู่ในตัวแปรอิสระและเวกเตอร์พารามิเตอร์

ตามหลักการแล้ว เงื่อนไขแรกกำหนดให้ และและเงื่อนไขที่สองกำหนดให้สำหรับทุกๆ

ภายใต้เงื่อนไขความเป็นอิสระที่เข้มงวด ความน่าจะเป็นร่วมสามารถแยกตัวประกอบได้เป็นส่วนหลังมักจะถูกละเลยภายใต้สมมติฐานของชุดพารามิเตอร์ที่ไม่ทับซ้อนกัน ยิ่งไปกว่านั้นมักจะถือว่าถูกเลือก (ตัวอย่างเช่น ในการทดลองที่ออกแบบไว้) และด้วยเหตุนี้จึงมีความน่าจะเป็นที่ทราบโดยไม่มีพารามิเตอร์[ 3 ]

ด้วยไพรเออร์แบบคอนจูเกต

การแจกแจงความน่าจะเป็นก่อนหน้าแบบคอนจูเกต

สำหรับการแจกแจงความน่าจะเป็นก่อนหน้าแบบใดๆ อาจไม่มีคำตอบเชิงวิเคราะห์สำหรับการแจกแจงความน่าจะเป็นภายหลังในส่วนนี้ เราจะพิจารณาการแจกแจงความน่าจะเป็นก่อนหน้าแบบสังยุค ซึ่งสามารถหาการแจกแจงความน่าจะเป็นภายหลังได้โดยวิธีวิเคราะห์

ความน่าจะเป็นก่อนหน้า (prior) จะเป็นคู่สมกับฟังก์ชันความน่าจะเป็นนี้ ถ้าความน่าจะเป็นภายหลัง (posterior) มีรูปแบบฟังก์ชันเดียวกันเมื่อเทียบกับและเนื่องจากลอการิทึมของความน่าจะเป็นเป็นฟังก์ชันกำลังสองของ ดังนั้นลอการิทึมของความน่าจะเป็นจึงถูกเขียนใหม่เพื่อให้ความน่าจะเป็นกลายเป็นฟังก์ชันปกติของเขียน

ความน่าจะเป็นถูกเขียนใหม่เป็น โดย ที่ คือ จำนวนสัมประสิทธิ์การถดถอย

สิ่งนี้ชี้ให้เห็นรูปแบบของค่าก่อนหน้า: โดยที่คือการแจกแจงแบบอินเวอร์สแกมมา

ในสัญลักษณ์ที่แนะนำใน บทความเกี่ยวกับ การแจกแจงแบบอินเวอร์สแกมมานี่คือความหนาแน่นของการแจกแจงที่มีและโดยมีและเป็นค่าก่อนหน้าของและตามลำดับ หรืออาจอธิบายได้อีกอย่างว่าคือ การแจกแจงแบบอินเวอร์ สไคกำลังสองที่ปรับขนาดแล้ว

นอกจากนี้ ความหนาแน่นความน่าจะเป็นล่วงหน้าแบบมีเงื่อนไขยังเป็นการแจกแจงแบบปกติด้วย

ในสัญลักษณ์ของการแจกแจงปกติการแจกแจงก่อนหน้าแบบมีเงื่อนไขคือ

การกระจายด้านหลัง

เมื่อระบุค่าก่อนหน้าแล้ว การแจกแจงความน่าจะเป็นภายหลังสามารถแสดงได้ดังนี้

ด้วยการจัดเรียงใหม่บางส่วน[ 4 ]สามารถเขียนค่าหลังใหม่ได้เพื่อให้ค่าเฉลี่ยหลังของเวกเตอร์พารามิเตอร์สามารถแสดงได้ในรูปของตัวประมาณค่ากำลังสองน้อยที่สุดและค่าเฉลี่ยก่อนหน้าโดยที่ความแรงของค่าก่อนหน้าระบุโดยเมทริกซ์ความแม่นยำก่อนหน้า

เพื่อพิสูจน์ว่านั่นคือค่าเฉลี่ยภายหลังจริง ๆ พจน์กำลังสองในเลขชี้กำลังสามารถจัดเรียงใหม่เป็น รูป แบบกำลังสองใน[ 5 ]

ตอนนี้ค่าความน่าจะเป็นภายหลังสามารถแสดงได้ในรูป ของ การแจกแจงปกติคูณกับการแจกแจงแกมมาผกผัน :

ดังนั้น การแจกแจงความน่าจะเป็นภายหลังสามารถกำหนดพารามิเตอร์ได้ดังนี้ โดยที่ปัจจัยทั้งสองสอดคล้องกับความหนาแน่นของ การแจกแจง และโดยมีพารามิเตอร์ของการแจกแจงเหล่านี้กำหนดโดย

ซึ่งแสดงให้เห็นว่าการอนุมานแบบเบย์เซียนเป็นการประนีประนอมระหว่างข้อมูลที่มีอยู่ในความน่าจะเป็นก่อนหน้าและข้อมูลที่มีอยู่ในตัวอย่าง

หลักฐานแบบจำลอง

หลักฐาน ของ แบบจำลอง คือความน่าจะเป็นของข้อมูลที่กำหนดโดยแบบจำลองเรียกอีกอย่างว่าความน่าจะเป็นแบบมาร์จินัลและความหนาแน่นของการทำนายแบบก่อนหน้าในที่นี้ แบบจำลองถูกกำหนดโดยฟังก์ชันความน่าจะเป็นและการกระจายแบบก่อนหน้าบนพารามิเตอร์ เช่นหลักฐานของแบบจำลองแสดงให้เห็นในตัวเลขเดียวว่าแบบจำลองดังกล่าวอธิบายการสังเกตได้ดีเพียงใด หลักฐานของแบบจำลองการถดถอยเชิงเส้นแบบเบย์เซียนที่นำเสนอในส่วนนี้สามารถใช้เพื่อเปรียบเทียบแบบจำลองเชิงเส้นที่แข่งขันกันโดยใช้ปัจจัยเบย์แบบจำลองเหล่านี้อาจแตกต่างกันในจำนวนและค่าของตัวแปรทำนาย ตลอดจนความน่าจะเป็นแบบก่อนหน้าบนพารามิเตอร์ของแบบจำลอง ความซับซ้อนของแบบจำลองได้รับการพิจารณาแล้วโดยหลักฐานของแบบจำลอง เนื่องจากเป็นการหาค่ามาร์จินัลของพารามิเตอร์โดยการอินทิเกรตเหนือค่าที่เป็นไปได้ทั้งหมดของและอิน ทิกรัลนี้สามารถคำนวณได้ทางคณิตศาสตร์และคำตอบแสดงอยู่ในสมการต่อไปนี้[ 6 ]

ในที่นี้หมายถึงฟังก์ชันแกมมาเนื่องจากเราได้เลือกไพรเออร์แบบคอนจูเกต ความน่าจะเป็นแบบมาร์จินัลจึงสามารถคำนวณได้ง่ายโดยการประเมินความเท่าเทียมกันต่อไปนี้สำหรับค่าใดๆ ของและ[ 7 ] โปรดทราบว่าสมการนี้ได้มาจากการจัดเรียงใหม่ของทฤษฎีบทของเบย์ส การใส่สูตรสำหรับไพรเออร์ ความน่าจะเป็น และความน่าจะ เป็นภายหลัง และการทำให้การแสดงออกที่ได้นั้นง่ายขึ้น จะนำไปสู่การแสดงออกเชิงวิเคราะห์ที่แสดงไว้ข้างต้น

กรณีอื่นๆ

โดยทั่วไป การหาการแจกแจงความน่าจะ เป็นภายหลังโดยวิธีวิเคราะห์อาจเป็นไปไม่ได้หรือทำได้ยาก อย่างไรก็ตาม เป็นไปได้ที่จะประมาณค่าความน่าจะเป็นภายหลังโดยใช้ วิธี การอนุมานแบบเบย์เซียนโดยประมาณเช่นการสุ่มตัวอย่างแบบมอนเตคาร์โล [ 8 ] INLAหรือ เบย์เซียน แบบ แปรผัน

กรณีพิเศษนี้เรียกว่าการถดถอยแบบสัน (ridge regression )

สามารถทำการวิเคราะห์ที่คล้ายกันได้สำหรับกรณีทั่วไปของการถดถอยหลายตัวแปร และส่วนหนึ่งของการวิเคราะห์นี้จะนำไปสู่การประมาณค่าเมทริกซ์ความแปรปรวนร่วม แบบเบย์เซียน : ดูการถดถอยเชิงเส้นหลายตัวแปรแบบเบย์เซียน

ดูเพิ่มเติม

หมายเหตุ

  1. ^ Huang, Yunfei; Gompper, Gerhard; Sabass, Benedikt (2020). "วิธีการไมโครสโคปีแรงดึงแบบเบย์เซียนพร้อมการลดสัญญาณรบกวนอัตโนมัติในแพ็คเกจซอฟต์แวร์ที่ใช้งานง่าย" Computer Physics Communications . 256 107313. arXiv : 2005.01377 . Bibcode : 2020CoPhC.25607313H . doi : 10.1016/j.cpc.2020.107313 .
  2. ^ดู Jackman (2009), หน้า 101
  3. ^ดู Gelman et al. (2013), หน้า 354
  4. ^ขั้นตอนการคำนวณขั้นกลางนี้สามารถพบได้ใน O'Hagan (1994) ในตอนต้นของบทเกี่ยวกับแบบจำลองเชิงเส้น
  5. ^ขั้นตอนระหว่างกลางอยู่ใน Fahrmeir et al. (2009) หน้า 188
  6. ^ขั้นตอนการคำนวณขั้นกลางนี้สามารถพบได้ใน O'Hagan (1994) หน้า 257
  7. ^ Chib, Siddhartha (1995). "ความน่าจะเป็นส่วนเพิ่มจากผลลัพธ์ของ Gibbs". วารสารสมาคมสถิติอเมริกัน90 (432): 1313– 1321. doi : 10.2307/2291521 .
  8. ^ Carlin และ Louis (2008) และ Gelman และคณะ (2003) อธิบายวิธีการใช้วิธีการสุ่มตัวอย่างสำหรับการถดถอยเชิงเส้นแบบเบย์เซียน
  • การประมาณค่าแบบเบย์เซียนของแบบจำลองเชิงเส้น (วิกิบุ๊กการเขียนโปรแกรม R)การถดถอยเชิงเส้นแบบเบย์เซียนที่นำมาใช้ในR
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Bayesian_linear_regression&oldid=1327833970 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การถดถอยเชิงเส้นแบบเบย์เซียน

การถดถอยเชิงเส้นแบบเบย์เซียนเป็นรูปแบบหนึ่งของการสร้างแบบจำลองแบบมีเงื่อนไขโดยที่ค่าเฉลี่ยของตัวแปรหนึ่งจะถูกอธิบายด้วยการรวมเชิงเส้นของตัวแปรอื่น ๆ...

การตั้งค่าโมเดล

พิจารณา ปัญหา การถดถอยเชิงเส้น มาตรฐาน ซึ่งเรากำหนดค่าเฉลี่ยของ การแจกแจงแบบมีเงื่อนไข ของโดยกำหนดเวกเตอร์ตัวทำนาย: ฉัน = 1 , … , n {\displaystyle i=1,\ldots ,n} y ฉัน {\displaystyle y_{i}} เค × 1 {\displaystyle k\times 1} x ฉัน {\displaystyle \mathbf {x}...

การแจกแจงความน่าจะเป็นก่อนหน้าแบบคอนจูเกต

สำหรับการแจกแจงความน่าจะเป็นก่อนหน้าแบบใดๆ อาจไม่มีคำตอบเชิงวิเคราะห์สำหรับการ แจกแจงความน่าจะเป็นภายหลัง ในส่วนนี้ เราจะพิจารณา การแจกแจงความน่าจะเป็นก่อนหน้า แบบสังยุค ซึ่งสามารถหาการแจกแจงความน่าจะเป็นภายหลังได้โดยวิธีวิเคราะห์

การกระจายด้านหลัง

เมื่อระบุค่าก่อนหน้าแล้ว การแจกแจงความน่าจะเป็นภายหลังสามารถแสดงได้ดังนี้