กลับไปหน้าบทความ

อ่าน 7 นาที

การกระจายการทำนายแบบเบื้องหลัง

ใน สถิติแบบเบย์เซียน การ แจกแจงการทำนายภายหลัง คือการแจกแจงของค่าที่ไม่สามารถสังเกตได้ที่เป็นไปได้โดยมีเงื่อนไขตามค่าที่สังเกตได้ [ 1 ] [ 2 ]

การกระจายการทำนายแบบเบื้องหลัง

( เรียนรู้วิธีและเวลาในการลบข้อความนี้ )

ในสถิติแบบเบย์เซียนการแจกแจงการทำนายภายหลังคือการแจกแจงของค่าที่ไม่สามารถสังเกตได้ที่เป็นไปได้โดยมีเงื่อนไขตามค่าที่สังเกตได้[ 1 ] [ 2 ]

เมื่อมีชุดข้อมูลสังเกตการณ์อิสระและมี การ กระจาย เหมือนกันจำนวน N ชุด ค่าใหม่จะถูกสุ่มจาก1การแจกแจงที่ขึ้นอยู่กับพารามิเตอร์โดยที่คือปริภูมิของพารามิเตอร์

อาจดูน่าสนใจที่จะใช้ค่าประมาณที่ดีที่สุดเพียงค่าเดียวสำหรับแต่การทำเช่นนั้นจะละเลยความไม่แน่นอนเกี่ยวกับและเนื่องจากละเลยแหล่งที่มาของความไม่แน่นอน การแจกแจงการทำนายจึงแคบเกินไป กล่าวอีกนัยหนึ่ง การทำนายค่าสุดขั้วของจะมีโอกาสน้อยกว่าหากพิจารณาความไม่แน่นอนในพารามิเตอร์ตามที่กำหนดโดยการแจกแจงความน่าจะเป็นภายหลัง

การแจกแจงความน่าจะเป็นภายหลัง (posterior predictive distribution) คำนึงถึงความไม่แน่นอนเกี่ยวกับ ค่า การแจกแจงความน่าจะเป็นภายหลังของค่าที่เป็นไปได้ขึ้นอยู่กับ:

และการแจกแจงการทำนายภายหลังของค่าที่กำหนดนั้นคำนวณได้โดยการหาค่าเฉลี่ยของการแจกแจงของค่าที่กำหนดเหนือการแจกแจงภายหลังของค่าที่กำหนด:

เนื่องจากเป็นการคำนึงถึงความไม่แน่นอนเกี่ยวกับค่าดังนั้นโดยทั่วไปแล้ว การแจกแจงการทำนายภายหลังจึงจะกว้างกว่าการแจกแจงการทำนายที่ใช้ค่าประมาณที่ดีที่สุดเพียงค่าเดียวสำหรับค่า

การแจกแจงการทำนายก่อนหน้าเทียบกับการแจกแจงการทำนายภายหลัง

ในบริบทของเบย์เซียน การแจกแจงทำนายก่อนหน้า (prior predictive distribution ) คือการแจกแจงของจุดข้อมูลที่หาค่าเฉลี่ยจากค่าแจกแจงก่อนหน้า (prior distribution) กล่าวคือ ถ้าและแล้ว การแจกแจงทำนายก่อนหน้าคือการแจกแจงที่สอดคล้องกัน โดยที่

วิธีการนี้คล้ายกับการแจกแจงการทำนายภายหลัง (posterior predictive distribution) ยกเว้นว่าการหาค่าเฉลี่ย (หรือเทียบเท่ากับการหาค่าคาดหวัง) นั้นทำโดยอ้างอิงจากการแจกแจงก่อนหน้า (prior distribution) แทนที่จะเป็นการแจกแจงภายหลัง (posterior distribution)

นอกจากนี้ หากการแจกแจงก่อนหน้าเป็นการแจกแจงก่อนหน้าแบบสังยุค (conjugate prior ) การแจกแจงทำนายภายหลัง (posterior predictive distribution) ก็จะอยู่ในตระกูลการแจกแจงเดียวกันกับการแจกแจงทำนายก่อนหน้า ซึ่งเห็นได้ง่าย หากการแจกแจงก่อนหน้าเป็นแบบสังยุคแล้ว

กล่าวคือ การแจกแจงความน่าจะเป็นภายหลังก็เป็นของกลุ่มเดียวกันแต่ใช้พารามิเตอร์ที่แตกต่างออกไปแทนพารามิเตอร์เดิมจากนั้น

ดังนั้น การแจกแจงการทำนายภายหลังจึงเป็นไปตามการแจกแจงH เดียวกัน กับการแจกแจงการทำนายก่อนหน้า แต่ค่าภายหลังของไฮเปอร์พารามิเตอร์จะถูกแทนที่ด้วยค่าก่อนหน้า

การแจกแจงการทำนายก่อนหน้า (prior predictive distribution) อยู่ในรูปแบบของการแจกแจงแบบผสม (compound distribution ) และในความเป็นจริง มักถูกนำมาใช้เพื่อกำหนดการแจกแจงแบบผสมเนื่องจากไม่มีปัจจัยที่ซับซ้อนใดๆ เช่น การพึ่งพาข้อมูลและปัญหาเรื่องความสัมพันธ์แบบคู่ขนาน (conjugacy) ตัวอย่างเช่นการแจกแจง t ของนักเรียน (Student's t-distribution)สามารถกำหนดได้ว่าเป็นการแจกแจงการทำนายก่อนหน้าของการแจกแจงปกติ ที่มี ค่าเฉลี่ยμที่ทราบแต่ความแปรปรวนσ x 2 ที่ไม่ทราบ โดยมีการแจกแจงไคกำลังสองผกผันแบบ ปรับขนาด (scaled-inverse-chi-squared distribution)ก่อนหน้าแบบคู่ขนานวางอยู่บนσ x 2โดยมีพารามิเตอร์νและσ 2การแจกแจงแบบผสมที่ได้นั้นคือการแจกแจง t ของนักเรียน แบบไม่มาตรฐาน และเป็นไปตามหนึ่งในสองรูปแบบการกำหนดพารามิเตอร์ที่พบบ่อยที่สุดของการแจกแจงนี้ จากนั้น การแจกแจงการทำนายภายหลัง (posterior predictive distribution) ที่สอดคล้องกันก็จะเป็นการแจกแจง t ของนักเรียนอีกครั้ง โดยมีพารามิเตอร์ที่อัปเดตแล้วซึ่งปรากฏในการแจกแจงภายหลังก็จะปรากฏโดยตรงในการแจกแจงการทำนายภายหลังด้วย

ในบางกรณี การกำหนดการกระจายแบบผสมที่เหมาะสมนั้นใช้การกำหนดพารามิเตอร์ที่แตกต่างจากที่เหมาะสมที่สุดสำหรับการกระจายเชิงทำนายในปัญหาปัจจุบัน บ่อยครั้งที่เกิดกรณีนี้เนื่องจากการกระจายแบบก่อนหน้า (prior distribution) ที่ใช้ในการกำหนดการกระจายแบบผสมนั้นแตกต่างจากที่ใช้ในปัญหาปัจจุบัน ตัวอย่างเช่น ดังที่กล่าวไว้ข้างต้นการกระจายแบบ t ของนักเรียน (Student's t-distribution)ถูกกำหนดโดยใช้ การกระจายแบบผกผันไคกำลังสอง แบบปรับขนาด (scaled-inverse-chi-squared distribution)ที่วางอยู่บนความแปรปรวน อย่างไรก็ตาม ในสถานการณ์นี้มักใช้การกระจายแบบแกมมาผกผัน (inverse gamma distribution)เป็นการกระจายแบบก่อนหน้าคู่กัน (conjugate prior) มากกว่า ทั้งสองแบบนั้นเทียบเท่ากัน ยกเว้นการกำหนดพารามิเตอร์ ดังนั้น การกระจายแบบ t ของนักเรียนจึงยังสามารถใช้ได้กับการกระจายเชิงทำนายทั้งสองแบบ แต่ต้องกำหนดพารามิเตอร์ใหม่ก่อนที่จะนำไปใช้

ในตระกูลเลขชี้กำลัง

ตระกูลการแจกแจงทั่วไปส่วนใหญ่ แต่ไม่ใช่ทั้งหมด เป็นตระกูลการแจกแจงแบบเอกซ์โปเนนเชียล ตระกูลการแจกแจงแบบเอกซ์โปเนนเชียลมีคุณสมบัติที่มีประโยชน์มากมาย หนึ่งในนั้นคือ สมาชิกทั้งหมดมีฟังก์ชันการแจกแจงก่อนหน้าแบบสังยุค — ในขณะที่การแจกแจงอื่นๆ น้อยมากที่มีฟังก์ชันการแจกแจงก่อนหน้าแบบสังยุค

การแจกแจงการทำนายล่วงหน้าในตระกูลเลขชี้กำลัง

คุณสมบัติที่มีประโยชน์อีกประการหนึ่งคือฟังก์ชันความหนาแน่นความน่าจะเป็นของการแจกแจงแบบผสมที่สอดคล้องกับการแจกแจงทำนายก่อนหน้าของการแจกแจงตระกูลเอก ซ์โพเนนเชีย ลที่หารด้วย การแจกแจง ก่อนหน้าคู่สังยุคสามารถหาได้โดยวิธีวิเคราะห์ สมมติว่าเป็นสมาชิกของตระกูลเอกซ์โพเนนเชียลที่มีพารามิเตอร์ซึ่งกำหนดพารามิเตอร์ตามพารามิเตอร์ธรรมชาติและมีการแจกแจงแบบ

ในขณะที่เป็นการผันคู่ที่เหมาะสมก่อนหน้า ซึ่งมีการกระจายตัวดังนี้

ดังนั้น การแจกแจงการทำนายก่อนหน้า(ผลลัพธ์ของการคำนวณแบบทบต้นด้วย) คือ

บรรทัดสุดท้ายสืบเนื่องมาจากบรรทัดก่อนหน้า โดยตระหนักว่าฟังก์ชันภายในอินทิกรัลคือฟังก์ชันความหนาแน่นของตัวแปรสุ่มที่มีการแจกแจงแบบ โดยไม่รวมฟังก์ชันปรับค่ามาตรฐานดังนั้นผลลัพธ์ของการอินทิเกรตจะเป็นส่วนกลับของฟังก์ชันปรับค่ามาตรฐาน

ผลลัพธ์ข้างต้นไม่ขึ้นอยู่กับการเลือกพารามิเตอร์ของเนื่องจากไม่มีและปรากฏขึ้น ( เป็นฟังก์ชันของพารามิเตอร์ และดังนั้น จะมีรูปแบบที่แตกต่างกันไปขึ้นอยู่กับการเลือกพารามิเตอร์) สำหรับการเลือกและ มาตรฐาน มักจะง่ายกว่าที่จะทำงานโดยตรงกับพารามิเตอร์ปกติมากกว่าที่จะเขียนใหม่ในรูปของพารามิเตอร์ตามธรรมชาติ

เหตุผลที่การคำนวณอินทิกรัลทำได้ง่ายนั้นเป็นเพราะเกี่ยวข้องกับการคำนวณค่าคงที่การทำให้เป็นมาตรฐานของความหนาแน่นที่กำหนดโดยผลคูณของการแจกแจงก่อนหน้าและความน่าจะเป็นเมื่อทั้งสองเป็นคู่กันผลคูณจะเป็นการแจกแจงภายหลังและตามสมมติฐาน ค่าคงที่การทำให้เป็นมาตรฐานของการแจกแจงนี้เป็นที่ทราบแล้ว ดังที่แสดงไว้ข้างต้นฟังก์ชันความหนาแน่นของการแจกแจงแบบผสมมีรูปแบบเฉพาะ ซึ่งประกอบด้วยผลคูณของฟังก์ชันที่เป็นส่วนหนึ่งของฟังก์ชันความหนาแน่นสำหรับกับผลหารของค่าคงที่การทำให้เป็นมาตรฐานสองรูปแบบสำหรับ รูปแบบหนึ่งได้มาจาก1การแจกแจงก่อนหน้าและอีกรูปแบบหนึ่งได้มาจาก1การแจกแจงภายหลังการแจกแจงเบตา-ไบโนเมียลเป็นตัวอย่างที่ดีของวิธีการทำงานของกระบวนการนี้

แม้ว่าการแจกแจงดังกล่าวจะสามารถวิเคราะห์ได้ง่าย แต่โดยทั่วไปแล้วการแจกแจงเหล่านั้นมักไม่ได้เป็นสมาชิกของตระกูลเอกซ์โพเนนเชียล ตัวอย่างเช่น การแจกแจง t ของนักเรียนแบบสามพารามิเตอร์การแจกแจงเบตา-ไบโนเมียลและการแจกแจงดิริชเลต์-มัลติโนเมียลล้วนเป็นการแจกแจงทำนายของการแจกแจงในตระกูลเอกซ์โพเนนเชียล ( การแจกแจงปกติการแจกแจงไบโนเมียลและการแจกแจงมัลติโนเมียลตามลำดับ) แต่ไม่มีตัวใดเป็นสมาชิกของตระกูลเอกซ์โพเนนเชียล สามารถเห็นได้จากข้างต้นเนื่องจากการมีอยู่ของการพึ่งพาเชิงฟังก์ชันในการแจกแจงในตระกูลเอกซ์โพเนนเชียล จะต้องสามารถแยกฟังก์ชันความหนาแน่นทั้งหมดออกเป็นตัวประกอบการคูณสามประเภทได้: (1) ตัวประกอบที่มีเฉพาะตัวแปร (2) ตัวประกอบที่มีเฉพาะพารามิเตอร์ และ (3) ตัวประกอบที่ลอการิทึมแยกตัวประกอบระหว่างตัวแปรและพารามิเตอร์ การมีอยู่ของทำให้สิ่งนี้เป็นไปไม่ได้ เว้นแต่ฟังก์ชัน "การทำให้เป็นมาตรฐาน" จะละเลยอาร์กิวเมนต์ที่เกี่ยวข้องทั้งหมด หรือใช้เฉพาะในเลขชี้กำลังของนิพจน์เท่านั้น

การแจกแจงการทำนายภายหลังในตระกูลเลขชี้กำลัง

เมื่อใช้ไพรเออร์แบบคอนจูเกต การแจกแจงการทำนายภายหลังจะอยู่ในตระกูลเดียวกันกับการแจกแจงการทำนายก่อนหน้า และกำหนดได้ง่ายๆ โดยการแทนค่าไฮเปอร์พารามิเตอร์ที่อัปเดตแล้วสำหรับการแจกแจงภายหลังของพารามิเตอร์ลงในสูตรสำหรับการแจกแจงการทำนายก่อนหน้า โดยใช้รูปแบบทั่วไปของสมการการอัปเดตภายหลังสำหรับการแจกแจงตระกูลเอกซ์โพเนนเชียล (ดูส่วนที่เกี่ยวข้องในบทความเกี่ยวกับตระกูลเอกซ์โพเนนเชียล ) เราสามารถเขียนสูตรที่ชัดเจนสำหรับการแจกแจงการทำนายภายหลังได้:

ที่ไหน

นี่แสดงให้เห็นว่าการแจกแจงการทำนายภายหลังของชุดข้อมูลสังเกตการณ์ ในกรณีที่ข้อมูลสังเกตการณ์เป็นไปตามตระกูลเอกซ์โพ เนนเชียลที่มีการแจกแจง ก่อนหน้าแบบสังยุคที่เหมาะสมจะมีความหนาแน่นของความน่าจะเป็นเท่ากับการแจกแจงแบบผสม โดยมีพารามิเตอร์ตามที่ระบุไว้ข้างต้น ข้อมูลสังเกตการณ์เองจะปรากฏในรูปแบบเท่านั้น

สิ่งนี้เรียกว่าสถิติเพียงพอของการสังเกต เพราะมันบอกทุกสิ่งที่เราจำเป็นต้องรู้เกี่ยวกับการสังเกตเพื่อคำนวณการแจกแจงความน่าจะเป็นภายหลังหรือการแจกแจงทำนายภายหลังโดยอิงจากข้อมูลเหล่านั้น (หรือสิ่งอื่นใดที่อิงจากความน่าจะเป็นของการสังเกต เช่นความน่าจะเป็นแบบมาร์จินัล )

การแจกแจงการทำนายร่วม ความน่าจะเป็นแบบมาร์จินัล

นอกจากนี้ ยังสามารถพิจารณาผลลัพธ์ของการรวมการแจกแจงร่วมกันเหนือตัวอย่างอิสระ ที่มีการแจกแจงเหมือนกันจำนวนคงที่โดยใช้การแจกแจงก่อนหน้าเหนือพารามิเตอร์ร่วมกัน ในบริบทของเบย์เซียน สิ่งนี้เกิดขึ้นในบริบทต่างๆ เช่น การคำนวณการแจกแจงทำนายก่อนหน้าหรือภายหลังของการสังเกตใหม่หลายรายการ และการคำนวณความน่าจะเป็นแบบมาร์จินัลของข้อมูลที่สังเกตได้ (ตัวส่วนในกฎของเบย์ส ) เมื่อการแจกแจงของตัวอย่างมาจากตระกูลเอกซ์โพเนนเชียลและการแจกแจงก่อนหน้าเป็นแบบคอนจูเกต การแจกแจงแบบรวมที่ได้จะจัดการได้ง่ายและมีรูปแบบคล้ายกับนิพจน์ข้างต้น ในความเป็นจริง สามารถแสดงได้ง่ายว่าการแจกแจงแบบรวมร่วมของชุดการสังเกตคือ

ผลลัพธ์นี้และผลลัพธ์ข้างต้นสำหรับการกระจายแบบผสมเดี่ยว สามารถขยายไปสู่กรณีของการกระจายเหนือการสังเกตที่มีค่าเป็นเวกเตอร์ได้อย่างง่ายดาย เช่นการกระจายแบบเกาส์เซียนหลายตัวแปร

ความสัมพันธ์กับการสุ่มตัวอย่างแบบกิบส์

การยุบโหนดในตัวสุ่ม Gibbs ที่ยุบแล้วนั้นเทียบเท่ากับการรวมค่าดังนั้น เมื่อชุดของโหนดอิสระที่มีการแจกแจงเหมือนกัน (iid) ทั้งหมดขึ้นอยู่กับโหนดก่อนหน้าเดียวกัน และโหนดนั้นถูกยุบ โหนด ความน่าจะเป็นแบบมีเงื่อนไข ที่ได้ ของโหนดหนึ่งเมื่อกำหนดโหนดอื่น ๆ รวมถึงโหนดแม่ของโหนดที่ถูกยุบ (แต่ไม่กำหนดเงื่อนไขกับโหนดอื่น ๆ เช่น โหนดลูก) จะเหมือนกับการแจกแจงการทำนายภายหลังของโหนด iid ที่เหลือทั้งหมด (หรือที่ถูกต้องกว่านั้นคือ โหนด iid เดิม เนื่องจากกระบวนการยุบทำให้เกิดการพึ่งพาซึ่งกันและกันระหว่างโหนด) กล่าวคือ โดยทั่วไปแล้วสามารถดำเนินการยุบโหนดได้โดยการเชื่อมต่อโหนดแม่ทั้งหมดของโหนดเข้ากับโหนดลูกทั้งหมดโดยตรง และแทนที่การแจกแจงความน่าจะ เป็นแบบมีเงื่อนไขเดิม ที่เกี่ยวข้องกับโหนดลูกแต่ละโหนดด้วยการแจกแจงการทำนายภายหลังที่สอดคล้องกันสำหรับโหนดลูกโดยกำหนดเงื่อนไขกับโหนดแม่และโหนด iid เดิมอื่น ๆ ที่เป็นโหนดลูกของโหนดที่ถูกลบออกไป ตัวอย่างเช่น สำหรับการอธิบายที่เจาะลึกยิ่งขึ้นและข้อควรระวังเกี่ยวกับประเด็นที่ซับซ้อนบางประการ โปรดดูบทความเกี่ยว กับการแจกแจงแบบ Dirichlet-multinomial

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Ntzoufras, Ioannis (2009). "การแจกแจงเชิงทำนายและการตรวจสอบแบบจำลอง" การสร้างแบบจำลองแบบเบย์เซียนโดยใช้ WinBUGS Wiley. ISBN 978-0-470-14114-4.
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Posterior_predictive_distribution&oldid=1210033585#Prior_vs._posterior_predictive_distribution "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การกระจายการทำนายแบบเบื้องหลัง

ใน สถิติแบบเบย์เซียน การ แจกแจงการทำนายภายหลัง คือการแจกแจงของค่าที่ไม่สามารถสังเกตได้ที่เป็นไปได้โดยมีเงื่อนไขตามค่าที่สังเกตได้ [ 1 ] [ 2 ]

การแจกแจงการทำนายก่อนหน้าเทียบกับการแจกแจงการทำนายภายหลัง

ในบริบทของเบย์เซียน การ แจกแจงทำนายก่อนหน้า (prior predictive distribution ) คือการแจกแจงของจุดข้อมูลที่หาค่าเฉลี่ยจากค่าแจกแจงก่อนหน้า (prior distribution) กล่าวคือ ถ้าและแล้ว การแจกแจงทำนายก่อนหน้าคือการแจกแจงที่สอดคล้องกัน โดยที่ จี {\displaystyle G} x ~ ~...

ในตระกูลเลขชี้กำลัง

ตระกูลการแจกแจงทั่วไปส่วนใหญ่ แต่ไม่ใช่ทั้งหมด เป็น ตระกูลการแจกแจงแบบเอกซ์โปเนน เชียล ตระกูลการแจกแจงแบบเอกซ์โปเนนเชียลมีคุณสมบัติที่มีประโยชน์มากมาย หนึ่งในนั้นคือ สมาชิกทั้งหมดมี ฟังก์ชันการแจกแจงก่อนหน้าแบบสังยุค — ในขณะที่การแจกแจงอื่นๆ...

การแจกแจงการทำนายล่วงหน้าในตระกูลเลขชี้กำลัง

คุณสมบัติที่มีประโยชน์อีกประการหนึ่งคือ ฟังก์ชันความหนาแน่นความน่าจะเป็น ของ การแจกแจงแบบผสม ที่สอดคล้องกับการแจกแจงทำนายก่อนหน้าของการแจกแจง ตระกูลเอก ซ์โพเนนเชีย ลที่หาร ด้วย การแจกแจง ก่อนหน้าคู่สังยุค สามารถหาได้โดยวิธีวิเคราะห์...