อ่าน 7 นาที

การกระจายการทำนายแบบเบื้องหลัง

ใน สถิติแบบเบย์เซียน การ แจกแจงการทำนายภายหลัง คือการแจกแจงของค่าที่ไม่สามารถสังเกตได้ที่เป็นไปได้โดยมีเงื่อนไขตามค่าที่สังเกตได้ [ 1 ] [ 2 ]

การกระจายการทำนายแบบเบื้องหลัง

( เรียนรู้วิธีและเวลาในการลบข้อความนี้ )

สถิติแบบเบย์เซียน
ส่วนหนึ่งของชุดบทความเกี่ยวกับ

ความน่าจะเป็นภายหลัง = ความน่าจะเป็น × ความน่าจะเป็น ก่อนหน้า ÷ หลักฐาน
พื้นหลัง
การอนุมานแบบเบย์เซียน ความน่าจะเป็นแบบเบย์เซียน ทฤษฎีบทของเบย์ส ทฤษฎีบทเบิร์นสไตน์-ฟอน มิเซส ความสอดคล้อง ทฤษฎีบทของค็อกซ์ การปกครองของครอมเวลล์ หลักการความน่าจะเป็น หลักการไม่แยแส หลักการของเอนโทรปีสูงสุด
การสร้างแบบจำลอง
ก่อนหน้าคอนจูเกต การถดถอยเชิงเส้น เอ็มพีริคัลเบย์ส แบบจำลองลำดับชั้น
การประมาณค่าด้านหลัง
โซ่ Markov Monte Carlo การประมาณของลาปลาซ การประมาณค่าลาปลาสแบบซ้อนกันแบบบูรณาการ การอนุมานเชิงแปรผัน การคำนวณแบบเบย์เซียนโดยประมาณ
ผู้ประเมิน
ตัวประมาณค่าแบบเบย์เซียน ช่วงความเชื่อมั่น การประมาณค่าหลังสูงสุด
การประมาณหลักฐาน
หลักฐานขอบเขตล่าง การสุ่มตัวอย่างแบบซ้อนกัน
การประเมินแบบจำลอง
ปัจจัยเบย์ส ( เกณฑ์ชวาร์ซ ) การหาค่าเฉลี่ยของแบบจำลอง การทำนายด้านหลัง
พอร์ทัลคณิตศาสตร์
วี ที อี

ในสถิติแบบเบย์เซียนการแจกแจงการทำนายภายหลังคือการแจกแจงของค่าที่ไม่สามารถสังเกตได้ที่เป็นไปได้โดยมีเงื่อนไขตามค่าที่สังเกตได้^{[ 1 ]}^{[ 2 ]}

เมื่อมีชุดข้อมูลสังเกตการณ์อิสระและมี การ กระจาย เหมือนกันจำนวน N ชุด ค่าใหม่จะถูกสุ่มจาก1การแจกแจงที่ขึ้นอยู่กับพารามิเตอร์โดยที่คือปริภูมิของพารามิเตอร์ $\mathbf {X} =\{x_{1},\dots ,x_{N}\}$ ${\tilde {x}}$ $\theta \in \Theta$ $\Theta$

p({\tilde {x}}|\theta )

อาจดูน่าสนใจที่จะใช้ค่าประมาณที่ดีที่สุดเพียงค่าเดียวสำหรับแต่การทำเช่นนั้นจะละเลยความไม่แน่นอนเกี่ยวกับและเนื่องจากละเลยแหล่งที่มาของความไม่แน่นอน การแจกแจงการทำนายจึงแคบเกินไป กล่าวอีกนัยหนึ่ง การทำนายค่าสุดขั้วของจะมีโอกาสน้อยกว่าหากพิจารณาความไม่แน่นอนในพารามิเตอร์ตามที่กำหนดโดยการแจกแจงความน่าจะเป็นภายหลัง ${\hat {\theta }}$ $\theta$ $\theta$ ${\tilde {x}}$

การแจกแจงความน่าจะเป็นภายหลัง (posterior predictive distribution) คำนึงถึงความไม่แน่นอนเกี่ยวกับ ค่า การแจกแจงความน่าจะเป็นภายหลังของค่าที่เป็นไปได้ขึ้นอยู่กับ: $\theta$ $\theta$ $\mathbf {X}$

p(\theta |\mathbf {X} )

และการแจกแจงการทำนายภายหลังของค่าที่กำหนดนั้นคำนวณได้โดยการหาค่าเฉลี่ยของการแจกแจงของค่าที่กำหนดเหนือการแจกแจงภายหลังของค่าที่กำหนด: ${\tilde {x}}$ $\mathbf {X}$ ${\tilde {x}}$ $\theta$ $\theta$ $\mathbf {X}$

p({\tilde {x}}|\mathbf {X} )=\int _{\Theta }p({\tilde {x}}|\theta )\,p(\theta |\mathbf {X} )\ชื่อผู้ดำเนินการ {d} \!\theta

เนื่องจากเป็นการคำนึงถึงความไม่แน่นอนเกี่ยวกับค่าดังนั้นโดยทั่วไปแล้ว การแจกแจงการทำนายภายหลังจึงจะกว้างกว่าการแจกแจงการทำนายที่ใช้ค่าประมาณที่ดีที่สุดเพียงค่าเดียวสำหรับค่า $\theta$ $\theta$

การแจกแจงการทำนายก่อนหน้าเทียบกับการแจกแจงการทำนายภายหลัง

ในบริบทของเบย์เซียน การแจกแจงทำนายก่อนหน้า (prior predictive distribution ) คือการแจกแจงของจุดข้อมูลที่หาค่าเฉลี่ยจากค่าแจกแจงก่อนหน้า (prior distribution) กล่าวคือ ถ้าและแล้ว การแจกแจงทำนายก่อนหน้าคือการแจกแจงที่สอดคล้องกัน โดยที่ $G$ ${\tilde {x}}\sim F({\tilde {x}}|\theta )$ $\theta \sim G(\theta |\alpha )$ $H({\tilde {x}}|\alpha )$

p_{H}({\tilde {x}}|\alpha )=\int _{\theta }p_{F}({\tilde {x}}|\theta )\,p_{G}(\theta |\alpha )\operatorname {d} \!\theta

วิธีการนี้คล้ายกับการแจกแจงการทำนายภายหลัง (posterior predictive distribution) ยกเว้นว่าการหาค่าเฉลี่ย (หรือเทียบเท่ากับการหาค่าคาดหวัง) นั้นทำโดยอ้างอิงจากการแจกแจงก่อนหน้า (prior distribution) แทนที่จะเป็นการแจกแจงภายหลัง (posterior distribution)

นอกจากนี้ หากการแจกแจงก่อนหน้าเป็นการแจกแจงก่อนหน้าแบบสังยุค (conjugate prior ) การแจกแจงทำนายภายหลัง (posterior predictive distribution) ก็จะอยู่ในตระกูลการแจกแจงเดียวกันกับการแจกแจงทำนายก่อนหน้า ซึ่งเห็นได้ง่าย หากการแจกแจงก่อนหน้าเป็นแบบสังยุคแล้ว $G(\theta |\alpha )$ $G(\theta |\alpha )$

p(\theta |\mathbf {X} ,\alpha )=p_{G}(\theta |\alpha '),

กล่าวคือ การแจกแจงความน่าจะเป็นภายหลังก็เป็นของกลุ่มเดียวกันแต่ใช้พารามิเตอร์ที่แตกต่างออกไปแทนพารามิเตอร์เดิมจากนั้น $G(\theta |\alpha ),$ $\alpha '$ $\alpha .$

{\begin{aligned}p({\tilde {x}}|\mathbf {X} ,\alpha )&=\int _{\theta }p_{F}({\tilde {x}}|\theta )\,p(\theta |\mathbf {X} ,\alpha )\operatorname {d} \!\theta \\&=\int _{\theta }p_{F}({\tilde {x}}|\theta )\,p_{G}(\theta |\alpha ')\operatorname {d} \!\theta \\&=p_{H}({\tilde {x}}|\alpha ')\end{aligned}}

ดังนั้น การแจกแจงการทำนายภายหลังจึงเป็นไปตามการแจกแจงH เดียวกัน กับการแจกแจงการทำนายก่อนหน้า แต่ค่าภายหลังของไฮเปอร์พารามิเตอร์จะถูกแทนที่ด้วยค่าก่อนหน้า

การแจกแจงการทำนายก่อนหน้า (prior predictive distribution) อยู่ในรูปแบบของการแจกแจงแบบผสม (compound distribution ) และในความเป็นจริง มักถูกนำมาใช้เพื่อกำหนดการแจกแจงแบบผสมเนื่องจากไม่มีปัจจัยที่ซับซ้อนใดๆ เช่น การพึ่งพาข้อมูลและปัญหาเรื่องความสัมพันธ์แบบคู่ขนาน (conjugacy) ตัวอย่างเช่นการแจกแจง t ของนักเรียน (Student's t-distribution)สามารถกำหนดได้ว่าเป็นการแจกแจงการทำนายก่อนหน้าของการแจกแจงปกติ ที่มี ค่าเฉลี่ยμที่ทราบแต่ความแปรปรวนσ _x² ที่ไม่ทราบ โดยมีการแจกแจงไคกำลังสองผกผันแบบ ปรับขนาด (scaled-inverse-chi-squared distribution)ก่อนหน้าแบบคู่ขนานวางอยู่บนσ _x²โดยมีพารามิเตอร์νและσ ²การแจกแจงแบบผสมที่ได้นั้นคือการแจกแจง t ของนักเรียน แบบไม่มาตรฐาน และเป็นไปตามหนึ่งในสองรูปแบบการกำหนดพารามิเตอร์ที่พบบ่อยที่สุดของการแจกแจงนี้ จากนั้น การแจกแจงการทำนายภายหลัง (posterior predictive distribution) ที่สอดคล้องกันก็จะเป็นการแจกแจง t ของนักเรียนอีกครั้ง โดยมีพารามิเตอร์ที่อัปเดตแล้วซึ่งปรากฏในการแจกแจงภายหลังก็จะปรากฏโดยตรงในการแจกแจงการทำนายภายหลังด้วย $\mathbf {X}$ $t(x|\mu ,\nu ,\sigma ^{2})$ $\nu ',{\sigma ^{2}}'$

ในบางกรณี การกำหนดการกระจายแบบผสมที่เหมาะสมนั้นใช้การกำหนดพารามิเตอร์ที่แตกต่างจากที่เหมาะสมที่สุดสำหรับการกระจายเชิงทำนายในปัญหาปัจจุบัน บ่อยครั้งที่เกิดกรณีนี้เนื่องจากการกระจายแบบก่อนหน้า (prior distribution) ที่ใช้ในการกำหนดการกระจายแบบผสมนั้นแตกต่างจากที่ใช้ในปัญหาปัจจุบัน ตัวอย่างเช่น ดังที่กล่าวไว้ข้างต้นการกระจายแบบ t ของนักเรียน (Student's t-distribution)ถูกกำหนดโดยใช้ การกระจายแบบผกผันไคกำลังสอง แบบปรับขนาด (scaled-inverse-chi-squared distribution)ที่วางอยู่บนความแปรปรวน อย่างไรก็ตาม ในสถานการณ์นี้มักใช้การกระจายแบบแกมมาผกผัน (inverse gamma distribution)เป็นการกระจายแบบก่อนหน้าคู่กัน (conjugate prior) มากกว่า ทั้งสองแบบนั้นเทียบเท่ากัน ยกเว้นการกำหนดพารามิเตอร์ ดังนั้น การกระจายแบบ t ของนักเรียนจึงยังสามารถใช้ได้กับการกระจายเชิงทำนายทั้งสองแบบ แต่ต้องกำหนดพารามิเตอร์ใหม่ก่อนที่จะนำไปใช้

ในตระกูลเลขชี้กำลัง

ตระกูลการแจกแจงทั่วไปส่วนใหญ่ แต่ไม่ใช่ทั้งหมด เป็นตระกูลการแจกแจงแบบเอกซ์โปเนนเชียล ตระกูลการแจกแจงแบบเอกซ์โปเนนเชียลมีคุณสมบัติที่มีประโยชน์มากมาย หนึ่งในนั้นคือ สมาชิกทั้งหมดมีฟังก์ชันการแจกแจงก่อนหน้าแบบสังยุค — ในขณะที่การแจกแจงอื่นๆ น้อยมากที่มีฟังก์ชันการแจกแจงก่อนหน้าแบบสังยุค

การแจกแจงการทำนายล่วงหน้าในตระกูลเลขชี้กำลัง

คุณสมบัติที่มีประโยชน์อีกประการหนึ่งคือฟังก์ชันความหนาแน่นความน่าจะเป็นของการแจกแจงแบบผสมที่สอดคล้องกับการแจกแจงทำนายก่อนหน้าของการแจกแจงตระกูลเอก ซ์โพเนนเชีย ลที่หารด้วย การแจกแจง ก่อนหน้าคู่สังยุคสามารถหาได้โดยวิธีวิเคราะห์ สมมติว่าเป็นสมาชิกของตระกูลเอกซ์โพเนนเชียลที่มีพารามิเตอร์ซึ่งกำหนดพารามิเตอร์ตามพารามิเตอร์ธรรมชาติและมีการแจกแจงแบบ $F(x|{\boldsymbol {\theta }})$ ${\boldsymbol {\theta }}$ ${\boldsymbol {\eta }}={\boldsymbol {\eta }}({\boldsymbol {\theta }})$

p_{F}(x|{\boldsymbol {\eta }})=h(x)g({\boldsymbol {\eta }})e^{{\boldsymbol {\eta }}^{\rm {T}}\mathbf {T} (x)}

ในขณะที่เป็นการผันคู่ที่เหมาะสมก่อนหน้า ซึ่งมีการกระจายตัวดังนี้ $G({\boldsymbol {\eta }}|{\boldsymbol {\chi }},\nu )$

p_{G}({\boldsymbol {\eta }}|{\boldsymbol {\chi }},\nu )=f({\boldsymbol {\chi }},\nu )g({\boldsymbol {\eta }})^{\nu }e^{{\boldsymbol {\eta }}^{\rm {T}}{\boldsymbol {\chi }}}

ดังนั้น การแจกแจงการทำนายก่อนหน้า(ผลลัพธ์ของการคำนวณแบบทบต้นด้วย) คือ $H$ $F$ $G$

{\begin{aligned}p_{H}(x|{\boldsymbol {\chi }},\nu )&={\displaystyle \int \limits _{\boldsymbol {\eta }}p_{F}(x|{\boldsymbol {\eta }})p_{G}({\boldsymbol {\eta }}|{\boldsymbol {\chi }},\nu )\,\operatorname {d} {\boldsymbol {\eta }}}\\&={\displaystyle \int \limits _{\boldsymbol {\eta }}h(x)g({\boldsymbol {\eta }})e^{{\boldsymbol {\eta }}^{\rm {T}}\mathbf {T} (x)}f({\boldsymbol {\chi }},\nu )g({\boldsymbol {\eta }})^{\nu }e^{{\boldsymbol {\eta }}^{\rm {T}}{\boldsymbol {\chi }}}\,\operatorname {d} {\boldsymbol {\eta }}}\\&={\displaystyle h(x)f({\boldsymbol {\chi }},\nu )\int \limits _{\boldsymbol {\eta }}g({\boldsymbol {\eta }})^{\nu +1}e^{{\boldsymbol {\eta }}^{\rm {T}}({\boldsymbol {\chi }}+\mathbf {T} (x))}\,\operatorname {d} {\boldsymbol {\eta }}}\\&=h(x){\dfrac {f({\boldsymbol {\chi }},\nu )}{f({\boldsymbol {\chi }}+\mathbf {T} (x),\nu +1)}}\end{aligned}}

บรรทัดสุดท้ายสืบเนื่องมาจากบรรทัดก่อนหน้า โดยตระหนักว่าฟังก์ชันภายในอินทิกรัลคือฟังก์ชันความหนาแน่นของตัวแปรสุ่มที่มีการแจกแจงแบบ โดยไม่รวมฟังก์ชันปรับค่ามาตรฐานดังนั้นผลลัพธ์ของการอินทิเกรตจะเป็นส่วนกลับของฟังก์ชันปรับค่ามาตรฐาน $G({\boldsymbol {\eta }}|{\boldsymbol {\chi }}+\mathbf {T} (x),\nu +1)$ $f(\dots )\,$

ผลลัพธ์ข้างต้นไม่ขึ้นอยู่กับการเลือกพารามิเตอร์ของเนื่องจากไม่มีและปรากฏขึ้น ( เป็นฟังก์ชันของพารามิเตอร์ และดังนั้น จะมีรูปแบบที่แตกต่างกันไปขึ้นอยู่กับการเลือกพารามิเตอร์) สำหรับการเลือกและ มาตรฐาน มักจะง่ายกว่าที่จะทำงานโดยตรงกับพารามิเตอร์ปกติมากกว่าที่จะเขียนใหม่ในรูปของพารามิเตอร์ตามธรรมชาติ ${\boldsymbol {\theta }}$ ${\boldsymbol {\theta }}$ ${\boldsymbol {\eta }}$ $g(\dots )\,$ $g(\dots )\,$ $F$ $G$

เหตุผลที่การคำนวณอินทิกรัลทำได้ง่ายนั้นเป็นเพราะเกี่ยวข้องกับการคำนวณค่าคงที่การทำให้เป็นมาตรฐานของความหนาแน่นที่กำหนดโดยผลคูณของการแจกแจงก่อนหน้าและความน่าจะเป็นเมื่อทั้งสองเป็นคู่กันผลคูณจะเป็นการแจกแจงภายหลังและตามสมมติฐาน ค่าคงที่การทำให้เป็นมาตรฐานของการแจกแจงนี้เป็นที่ทราบแล้ว ดังที่แสดงไว้ข้างต้นฟังก์ชันความหนาแน่นของการแจกแจงแบบผสมมีรูปแบบเฉพาะ ซึ่งประกอบด้วยผลคูณของฟังก์ชันที่เป็นส่วนหนึ่งของฟังก์ชันความหนาแน่นสำหรับกับผลหารของค่าคงที่การทำให้เป็นมาตรฐานสองรูปแบบสำหรับ รูปแบบหนึ่งได้มาจาก1การแจกแจงก่อนหน้าและอีกรูปแบบหนึ่งได้มาจาก1การแจกแจงภายหลังการแจกแจงเบตา-ไบโนเมียลเป็นตัวอย่างที่ดีของวิธีการทำงานของกระบวนการนี้ $h(x)$ $F$ $G$

แม้ว่าการแจกแจงดังกล่าวจะสามารถวิเคราะห์ได้ง่าย แต่โดยทั่วไปแล้วการแจกแจงเหล่านั้นมักไม่ได้เป็นสมาชิกของตระกูลเอกซ์โพเนนเชียล ตัวอย่างเช่น การแจกแจง t ของนักเรียนแบบสามพารามิเตอร์การแจกแจงเบตา-ไบโนเมียลและการแจกแจงดิริชเลต์-มัลติโนเมียลล้วนเป็นการแจกแจงทำนายของการแจกแจงในตระกูลเอกซ์โพเนนเชียล ( การแจกแจงปกติการแจกแจงไบโนเมียลและการแจกแจงมัลติโนเมียลตามลำดับ) แต่ไม่มีตัวใดเป็นสมาชิกของตระกูลเอกซ์โพเนนเชียล สามารถเห็นได้จากข้างต้นเนื่องจากการมีอยู่ของการพึ่งพาเชิงฟังก์ชันในการแจกแจงในตระกูลเอกซ์โพเนนเชียล จะต้องสามารถแยกฟังก์ชันความหนาแน่นทั้งหมดออกเป็นตัวประกอบการคูณสามประเภทได้: (1) ตัวประกอบที่มีเฉพาะตัวแปร (2) ตัวประกอบที่มีเฉพาะพารามิเตอร์ และ (3) ตัวประกอบที่ลอการิทึมแยกตัวประกอบระหว่างตัวแปรและพารามิเตอร์ การมีอยู่ของทำให้สิ่งนี้เป็นไปไม่ได้ เว้นแต่ฟังก์ชัน "การทำให้เป็นมาตรฐาน" จะละเลยอาร์กิวเมนต์ที่เกี่ยวข้องทั้งหมด หรือใช้เฉพาะในเลขชี้กำลังของนิพจน์เท่านั้น ${\boldsymbol {\chi }}+\mathbf {T} (x)$ ${\boldsymbol {\chi }}+\mathbf {T} (x){\chi }$ $f(\dots )\,$

การแจกแจงการทำนายภายหลังในตระกูลเลขชี้กำลัง

เมื่อใช้ไพรเออร์แบบคอนจูเกต การแจกแจงการทำนายภายหลังจะอยู่ในตระกูลเดียวกันกับการแจกแจงการทำนายก่อนหน้า และกำหนดได้ง่ายๆ โดยการแทนค่าไฮเปอร์พารามิเตอร์ที่อัปเดตแล้วสำหรับการแจกแจงภายหลังของพารามิเตอร์ลงในสูตรสำหรับการแจกแจงการทำนายก่อนหน้า โดยใช้รูปแบบทั่วไปของสมการการอัปเดตภายหลังสำหรับการแจกแจงตระกูลเอกซ์โพเนนเชียล (ดูส่วนที่เกี่ยวข้องในบทความเกี่ยวกับตระกูลเอกซ์โพเนนเชียล ) เราสามารถเขียนสูตรที่ชัดเจนสำหรับการแจกแจงการทำนายภายหลังได้:

{\begin{array}{lcl}p({\tilde {x}}|\mathbf {X} ,{\boldsymbol {\chi }},\nu )&=&p_{H}\left({\tilde {x}}|{\boldsymbol {\chi }}+\mathbf {T} (\mathbf {X} ),\nu +N\right)\end{array}}

ที่ไหน

\mathbf {T} (\mathbf {X} )=\sum _{i=1}^{N}\mathbf {T} (x_{i})

นี่แสดงให้เห็นว่าการแจกแจงการทำนายภายหลังของชุดข้อมูลสังเกตการณ์ ในกรณีที่ข้อมูลสังเกตการณ์เป็นไปตามตระกูลเอกซ์โพ เนนเชียลที่มีการแจกแจง ก่อนหน้าแบบสังยุคที่เหมาะสมจะมีความหนาแน่นของความน่าจะเป็นเท่ากับการแจกแจงแบบผสม โดยมีพารามิเตอร์ตามที่ระบุไว้ข้างต้น ข้อมูลสังเกตการณ์เองจะปรากฏในรูปแบบเท่านั้น $\mathbf {T} (\mathbf {X} )=\sum _{i=1}^{N}\mathbf {T} (x_{i}).$

สิ่งนี้เรียกว่าสถิติเพียงพอของการสังเกต เพราะมันบอกทุกสิ่งที่เราจำเป็นต้องรู้เกี่ยวกับการสังเกตเพื่อคำนวณการแจกแจงความน่าจะเป็นภายหลังหรือการแจกแจงทำนายภายหลังโดยอิงจากข้อมูลเหล่านั้น (หรือสิ่งอื่นใดที่อิงจากความน่าจะเป็นของการสังเกต เช่นความน่าจะเป็นแบบมาร์จินัล )

การแจกแจงการทำนายร่วม ความน่าจะเป็นแบบมาร์จินัล

นอกจากนี้ ยังสามารถพิจารณาผลลัพธ์ของการรวมการแจกแจงร่วมกันเหนือตัวอย่างอิสระ ที่มีการแจกแจงเหมือนกันจำนวนคงที่โดยใช้การแจกแจงก่อนหน้าเหนือพารามิเตอร์ร่วมกัน ในบริบทของเบย์เซียน สิ่งนี้เกิดขึ้นในบริบทต่างๆ เช่น การคำนวณการแจกแจงทำนายก่อนหน้าหรือภายหลังของการสังเกตใหม่หลายรายการ และการคำนวณความน่าจะเป็นแบบมาร์จินัลของข้อมูลที่สังเกตได้ (ตัวส่วนในกฎของเบย์ส ) เมื่อการแจกแจงของตัวอย่างมาจากตระกูลเอกซ์โพเนนเชียลและการแจกแจงก่อนหน้าเป็นแบบคอนจูเกต การแจกแจงแบบรวมที่ได้จะจัดการได้ง่ายและมีรูปแบบคล้ายกับนิพจน์ข้างต้น ในความเป็นจริง สามารถแสดงได้ง่ายว่าการแจกแจงแบบรวมร่วมของชุดการสังเกตคือ $\mathbf {X} =\{x_{1},\dots ,x_{N}\}$ $N$

p_{H}(\mathbf {X} |{\boldsymbol {\chi }},\nu )=\left(\prod _{i=1}^{N}h(x_{i})\right){\dfrac {f({\boldsymbol {\chi }},\nu )}{f\left({\boldsymbol {\chi }}+\mathbf {T} (\mathbf {X} ),\nu +N\right)}}

ผลลัพธ์นี้และผลลัพธ์ข้างต้นสำหรับการกระจายแบบผสมเดี่ยว สามารถขยายไปสู่กรณีของการกระจายเหนือการสังเกตที่มีค่าเป็นเวกเตอร์ได้อย่างง่ายดาย เช่นการกระจายแบบเกาส์เซียนหลายตัวแปร

ความสัมพันธ์กับการสุ่มตัวอย่างแบบกิบส์

การยุบโหนดในตัวสุ่ม Gibbs ที่ยุบแล้วนั้นเทียบเท่ากับการรวมค่าดังนั้น เมื่อชุดของโหนดอิสระที่มีการแจกแจงเหมือนกัน (iid) ทั้งหมดขึ้นอยู่กับโหนดก่อนหน้าเดียวกัน และโหนดนั้นถูกยุบ โหนด ความน่าจะเป็นแบบมีเงื่อนไข ที่ได้ ของโหนดหนึ่งเมื่อกำหนดโหนดอื่น ๆ รวมถึงโหนดแม่ของโหนดที่ถูกยุบ (แต่ไม่กำหนดเงื่อนไขกับโหนดอื่น ๆ เช่น โหนดลูก) จะเหมือนกับการแจกแจงการทำนายภายหลังของโหนด iid ที่เหลือทั้งหมด (หรือที่ถูกต้องกว่านั้นคือ โหนด iid เดิม เนื่องจากกระบวนการยุบทำให้เกิดการพึ่งพาซึ่งกันและกันระหว่างโหนด) กล่าวคือ โดยทั่วไปแล้วสามารถดำเนินการยุบโหนดได้โดยการเชื่อมต่อโหนดแม่ทั้งหมดของโหนดเข้ากับโหนดลูกทั้งหมดโดยตรง และแทนที่การแจกแจงความน่าจะ เป็นแบบมีเงื่อนไขเดิม ที่เกี่ยวข้องกับโหนดลูกแต่ละโหนดด้วยการแจกแจงการทำนายภายหลังที่สอดคล้องกันสำหรับโหนดลูกโดยกำหนดเงื่อนไขกับโหนดแม่และโหนด iid เดิมอื่น ๆ ที่เป็นโหนดลูกของโหนดที่ถูกลบออกไป ตัวอย่างเช่น สำหรับการอธิบายที่เจาะลึกยิ่งขึ้นและข้อควรระวังเกี่ยวกับประเด็นที่ซับซ้อนบางประการ โปรดดูบทความเกี่ยว กับการแจกแจงแบบ Dirichlet-multinomial

ดูเพิ่มเติม

อ่านเพิ่มเติม

Ntzoufras, Ioannis (2009). "การแจกแจงเชิงทำนายและการตรวจสอบแบบจำลอง" การสร้างแบบจำลองแบบเบย์เซียนโดยใช้ WinBUGS Wiley. ISBN 978-0-470-14114-4.

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Posterior_predictive_distribution&oldid=1210033585#Prior_vs._posterior_predictive_distribution "

การกระจายการทำนายแบบเบื้องหลัง

การแจกแจงการทำนายก่อนหน้าเทียบกับการแจกแจงการทำนายภายหลัง

ในตระกูลเลขชี้กำลัง

การแจกแจงการทำนายล่วงหน้าในตระกูลเลขชี้กำลัง

การแจกแจงการทำนายภายหลังในตระกูลเลขชี้กำลัง

การแจกแจงการทำนายร่วม ความน่าจะเป็นแบบมาร์จินัล

ความสัมพันธ์กับการสุ่มตัวอย่างแบบกิบส์

ดูเพิ่มเติม

อ่านเพิ่มเติม

ข้อมูลสำคัญจากบทความ