ในทฤษฎีความน่า จะเป็น ความเป็นอิสระแบบมีเงื่อนไข อธิบายถึงสถานการณ์ที่การสังเกตการณ์นั้นไม่เกี่ยวข้องหรือไม่มีความจำเป็นเมื่อประเมินความแน่นอนของสมมติฐาน ซึ่งเป็นสิ่งที่ตรงข้ามกับความขึ้นอยู่แบบมีเงื่อนไข โดย ทั่วไปแล้ว ความเป็นอิสระแบบมีเงื่อนไขจะถูกกำหนดในรูปของความน่าจะเป็นแบบมีเงื่อนไข ซึ่งเป็นกรณีพิเศษที่ความน่าจะเป็นของสมมติฐานเมื่อมีการสังเกตการณ์ที่ไม่ให้ข้อมูลนั้นเท่ากับความน่าจะเป็นเมื่อไม่มีการสังเกตการณ์นั้น ถ้าคือสมมติฐาน และ และเป็นการสังเกตการณ์ ความเป็นอิสระแบบมีเงื่อนไขสามารถระบุได้ในรูปของสมการ: เอ {\displaystyle A} บี {\displaystyle B} ซี {\displaystyle C}
พี ( เอ ∣ บี , ซี ) = พี ( เอ ∣ ซี ) {\displaystyle P(A\mid B,C)=P(A\mid C)} โดยที่คือความน่าจะเป็นของเมื่อกำหนดให้ทั้งและเนื่องจากความน่าจะเป็นของ เมื่อกำหนดให้เท่ากับความน่าจะเป็นของเมื่อกำหนดให้ทั้งและความเท่าเทียมกันนี้แสดงว่าไม่ได้มีส่วนช่วยอะไรเลยต่อความแน่นอนของในกรณีนี้และกล่าวได้ว่าเป็นอิสระต่อกันแบบมีเงื่อนไข เมื่อกำหนดให้ เขียนในเชิงสัญลักษณ์ได้ดังนี้: พี ( เอ ∣ บี , ซี ) {\displaystyle P(A\mid B,C)} เอ {\displaystyle A} บี {\displaystyle B} ซี {\displaystyle C} เอ {\displaystyle A} ซี {\displaystyle C} เอ {\displaystyle A} บี {\displaystyle B} ซี {\displaystyle C} บี {\displaystyle B} เอ {\displaystyle A} เอ {\displaystyle A} บี {\displaystyle B} ซี {\displaystyle C} ( เอ ⊥ ⊥ บี ∣ ซี ) {\displaystyle (A\perp \!\!\!\perp B\mid C)}
แนวคิดเรื่องความเป็นอิสระแบบมีเงื่อนไขนั้นมีความสำคัญอย่างยิ่งต่อทฤษฎีการอนุมานทางสถิติที่ใช้กราฟ เนื่องจากเป็นการสร้างความสัมพันธ์ทางคณิตศาสตร์ระหว่างชุดของข้อความเงื่อนไขกับกราฟอย ด์
ความเป็นอิสระแบบมีเงื่อนไขของเหตุการณ์ ให้, , และเป็นเหตุการณ์ และกล่าวได้ว่าเป็นอิสระต่อกันโดยมีเงื่อนไข ก็ต่อเมื่อและคุณสมบัตินี้สมมาตร (รายละเอียดเพิ่มเติมอยู่ด้านล่าง ) และมักเขียนเป็นซึ่งควรอ่านว่า เอ {\displaystyle A} บี {\displaystyle B} ซี {\displaystyle C} เอ {\displaystyle A} บี {\displaystyle B} ซี {\displaystyle C} พี ( ซี ) > 0 {\displaystyle P(C)>0} พี ( เอ ∣ บี , ซี ) = พี ( เอ ∣ ซี ) {\displaystyle P(A\mid B,C)=P(A\mid C)} ( เอ ⊥ ⊥ บี ∣ ซี ) {\displaystyle (A\perp \!\!\!\perp B\mid C)} ( ( เอ ⊥ ⊥ บี ) | ซี ) {\displaystyle ((A\perp \!\!\!\perp B)\vert C)}
ในทำนอง เดียวกัน ความเป็นอิสระแบบมีเงื่อนไขอาจกล่าวได้ว่า โดยที่คือความน่าจะเป็นร่วม ของและเมื่อกำหนดให้สูตรทางเลือกนี้ระบุว่าและเป็นเหตุการณ์อิสระ เมื่อกำหนด ให้ พี ( เอ , บี | ซี ) = พี ( เอ | ซี ) พี ( บี | ซี ) {\displaystyle P(A,B|C)=P(A|C)P(B|C)} พี ( เอ , บี | ซี ) {\displaystyle P(A,B|C)} เอ {\displaystyle A} บี {\displaystyle B} ซี {\displaystyle C} เอ {\displaystyle A} บี {\displaystyle B} ซี {\displaystyle C}
แสดงให้เห็นว่าเทียบเท่ากับ ( เอ ⊥ ⊥ บี ∣ ซี ) {\displaystyle (A\perp \!\!\!\perp B\mid C)} ( บี ⊥ ⊥ เอ ∣ ซี ) {\displaystyle (B\perp \!\!\!\perp A\mid C)}
การพิสูจน์นิยามที่เทียบเท่ากัน พี ( เอ , บี ∣ ซี ) = พี ( เอ ∣ ซี ) พี ( บี ∣ ซี ) ⟺ พี ( เอ , บี , ซี ) พี ( ซี ) = ( พี ( เอ , ซี ) พี ( ซี ) ) ( พี ( บี , ซี ) พี ( ซี ) ) นิยามของความน่าจะเป็นแบบมีเงื่อนไข ⟺ พี ( เอ , บี , ซี ) = พี ( เอ , ซี ) พี ( บี , ซี ) พี ( ซี ) คูณทั้งสองข้างด้วย P(C) ⟺ พี ( เอ , บี , ซี ) พี ( บี , ซี ) = พี ( เอ , ซี ) พี ( ซี ) หารทั้งสองข้างด้วย P(B, C) ⟺ พี ( เอ ∣ บี , ซี ) = พี ( เอ ∣ ซี ) นิยามของความน่าจะเป็นแบบมีเงื่อนไข {\displaystyle {\begin{aligned}P(A,B\mid C)=P(A\mid C)P(B\mid C)&\iff {\frac {P(A,B,C)}{P(C)}}=\left({\frac {P(A,C)}{P(C)}}\right)\left({\frac {P(B,C)}{P(C)}}\right)&{\text{นิยามของความน่าจะเป็นแบบมีเงื่อนไข}}\\&\iff P(A,B,C)={\frac {P(A,C)P(B,C)}{P(C)}}&{\text{คูณทั้งสองข้างด้วย P(C)}}\\&\iff {\frac {P(A,B,C)}{P(B,C)}}={\frac {P(A,C)}{P(C)}}&{\text{หารทั้งสองข้างด้วย P(B, C)}}\\&\iff P(A\mid B,C)=P(A\mid C)&{\text{นิยามของความน่าจะเป็นแบบมีเงื่อนไข}}\end{aligned}}}
ตัวอย่าง
กล่องสี แต่ละช่องแสดงถึงผลลัพธ์ที่เป็นไปได้ เหตุการณ์, และถูกแทนด้วยพื้นที่ที่แรเงาเป็นสีแดง สีน้ำเงินและ สีเหลือง ตามลำดับ ส่วนที่ทับซ้อนกันระหว่างเหตุการณ์และถูกแรเงาเป็น สี ม่วง อาร์ {\displaystyle \color {red}R} บี {\displaystyle \color {blue}B} วาย {\displaystyle \color {gold}Y} อาร์ {\displaystyle \color {red}R} บี {\displaystyle \color {blue}B}
ความน่าจะเป็นของเหตุการณ์เหล่านี้แสดงด้วยพื้นที่แรเงาเมื่อเทียบกับพื้นที่ทั้งหมด ในทั้งสองตัวอย่าง เหตุการณ์และเป็นอิสระต่อกันแบบมีเงื่อนไขเนื่องจาก: อาร์ {\displaystyle \color {red}R} บี {\displaystyle \color {blue}B} วาย {\displaystyle \color {gold}Y}
ปร. ( อาร์ , บี ∣ วาย ) = ปร. ( อาร์ ∣ วาย ) ปร. ( บี ∣ วาย ) {\displaystyle \Pr({\color {red}R},{\color {blue}B}\mid {\color {gold}Y})=\Pr({\color {red}R}\mid {\color {gold}Y})\Pr({\color {blue}B}\mid {\color {gold}Y})} [ 1 ] แต่ไม่เป็นอิสระแบบมีเงื่อนไขเนื่องจาก: [ not Y ] {\displaystyle \left[{\text{not }}{\color {gold}Y}\right]}
Pr ( R , B ∣ not Y ) ≠ Pr ( R ∣ not Y ) Pr ( B ∣ not Y ) {\displaystyle \Pr({\color {red}R},{\color {blue}B}\mid {\text{not }}{\color {gold}Y})\not =\Pr({\color {red}R}\mid {\text{not }}{\color {gold}Y})\Pr({\color {blue}B}\mid {\text{not }}{\color {gold}Y})}
ความใกล้ชิดและความล่าช้า ให้เหตุการณ์ A และ B ถูกกำหนดให้เป็นความน่าจะเป็นที่บุคคล A และบุคคล B จะกลับบ้านทันเวลารับประทานอาหารเย็น โดยที่ทั้งสองคนถูกสุ่มเลือกมาจากทั่วโลก เหตุการณ์ A และ B สามารถถือได้ว่าเป็นอิสระต่อกัน กล่าวคือ ความรู้ที่ว่า A มาสายจะมีผลกระทบต่อความน่าจะเป็นที่ B จะมาสายเพียงเล็กน้อยหรือไม่เปลี่ยนแปลงเลย อย่างไรก็ตาม หากมีเหตุการณ์ที่สามเกิดขึ้น คือ บุคคล A และบุคคล B อาศัยอยู่ในละแวกเดียวกัน เหตุการณ์ทั้งสองจะไม่ถือว่าเป็นอิสระต่อกันแบบมีเงื่อนไขอีกต่อไป สภาพการจราจรและเหตุการณ์ที่เกี่ยวข้องกับสภาพอากาศที่อาจทำให้บุคคล A ล่าช้า อาจทำให้บุคคล B ล่าช้าด้วยเช่นกัน เมื่อมีเหตุการณ์ที่สามและความรู้ที่ว่าบุคคล A มาสาย ความน่าจะเป็นที่บุคคล B จะมาสายจะเปลี่ยนแปลงไปอย่างมีนัยสำคัญ[ 2 ]
การทอยลูกเต๋า ความเป็นอิสระแบบมีเงื่อนไขขึ้นอยู่กับลักษณะของเหตุการณ์ที่สาม หากคุณทอยลูกเต๋า 2 ลูก คุณอาจสันนิษฐานได้ว่าลูกเต๋าทั้งสองลูกเป็นอิสระต่อกัน การดูผลลัพธ์ของลูกเต๋าหนึ่งลูกจะไม่บอกคุณเกี่ยวกับผลลัพธ์ของลูกเต๋าลูกที่สอง (นั่นคือ ลูกเต๋าทั้งสองลูกเป็นอิสระต่อกัน) อย่างไรก็ตาม หากผลลัพธ์ของลูกเต๋าลูกแรกคือ 3 และมีคนบอกคุณเกี่ยวกับเหตุการณ์ที่สาม นั่นคือ ผลรวมของผลลัพธ์ทั้งสองเป็นเลขคู่ ข้อมูลเพิ่มเติมนี้จะจำกัดตัวเลือกสำหรับผลลัพธ์ที่สองให้เป็นเลขคี่ กล่าวอีกนัยหนึ่ง เหตุการณ์สองเหตุการณ์อาจเป็นอิสระต่อกัน แต่ไม่เป็น อิสระต่อกันแบบมีเงื่อนไข[ 2 ]
ส่วนสูงและคำศัพท์ ส่วนสูงและคำศัพท์มีความสัมพันธ์กัน เนื่องจากคนตัวเล็กมักจะเป็นเด็ก ซึ่งมีคำศัพท์พื้นฐานมากกว่า แต่หากเรารู้ว่าคนสองคนอายุ 19 ปีเท่ากัน (กล่าวคือ ขึ้นอยู่กับอายุ) ก็ไม่มีเหตุผลที่จะคิดว่าคำศัพท์ของคนใดคนหนึ่งจะมากกว่า หากเรารู้ว่าเขาสูงกว่า
ความเป็นอิสระแบบมีเงื่อนไขของตัวแปรสุ่ม ตัวแปรสุ่มแบบไม่ต่อ เนื่องสองตัว คือ และจะเป็นอิสระต่อกันแบบมีเงื่อนไข เมื่อกำหนดตัวแปรสุ่มแบบไม่ต่อเนื่องตัวที่สามก็ต่อเมื่อ ตัวแปรสุ่มทั้งสอง เป็นอิสระต่อกัน ในความน่าจะเป็น แบบมีเงื่อนไข เมื่อ กำหนด ตัวแปรสุ่ม ตัวที่สาม นั่นคือและจะเป็นอิสระต่อกันแบบมีเงื่อนไข เมื่อกำหนด ตัวแปรสุ่มตัว ที่สาม ก็ต่อเมื่อ เมื่อกำหนดค่าใดๆ ของความน่าจะเป็นของและ จะเหมือนกันสำหรับทุกค่าของและความน่าจะเป็นของจะเหมือนกันสำหรับทุกค่าของเขียนในเชิงรูปธรรมได้ดังนี้: X {\displaystyle X} Y {\displaystyle Y} Z {\displaystyle Z} Z {\displaystyle Z} X {\displaystyle X} Y {\displaystyle Y} Z {\displaystyle Z} Z {\displaystyle Z} X {\displaystyle X} Y {\displaystyle Y} Y {\displaystyle Y} X {\displaystyle X}
( X ⊥ ⊥ Y ) ∣ Z ⟺ F X , Y ∣ Z = z ( x , y ) = F X ∣ Z = z ( x ) ⋅ F Y ∣ Z = z ( y ) for all x , y , z {\displaystyle (X\perp \!\!\!\perp Y)\mid Z\quad \iff \quad F_{X,Y\,\mid \,Z\,=\,z}(x,y)=F_{X\,\mid \,Z\,=\,z}(x)\cdot F_{Y\,\mid \,Z\,=\,z}(y)\quad {\text{for all }}x,y,z} สมการที่ 2
โดยที่คือฟังก์ชันการกระจายสะสม แบบมีเงื่อนไข ของและเมื่อกำหนดให้ F X , Y ∣ Z = z ( x , y ) = Pr ( X ≤ x , Y ≤ y ∣ Z = z ) {\displaystyle F_{X,Y\,\mid \,Z\,=\,z}(x,y)=\Pr(X\leq x,Y\leq y\mid Z=z)} X {\displaystyle X} Y {\displaystyle Y} Z {\displaystyle Z}
เหตุการณ์สองเหตุการณ์และจะเป็นอิสระต่อกันโดยมีเงื่อนไข เมื่อกำหนดพีชคณิต σ ถ้า R {\displaystyle R} B {\displaystyle B} Σ {\displaystyle \Sigma }
Pr ( R , B ∣ Σ ) = Pr ( R ∣ Σ ) Pr ( B ∣ Σ ) a.s. {\displaystyle \Pr(R,B\mid \Sigma )=\Pr(R\mid \Sigma )\Pr(B\mid \Sigma ){\text{ a.s.}}} โดยที่หมายถึงค่าคาดหวังแบบมีเงื่อนไข ของฟังก์ชันตัวบ่งชี้ ของเหตุการณ์, , เมื่อกำหนดพีชคณิตซิกมานั่นคือ Pr ( A ∣ Σ ) {\displaystyle \Pr(A\mid \Sigma )} A {\displaystyle A} χ A {\displaystyle \chi _{A}} Σ {\displaystyle \Sigma }
Pr ( A ∣ Σ ) := E [ χ A ∣ Σ ] . {\displaystyle \Pr(A\mid \Sigma ):=\operatorname {E} [\chi _{A}\mid \Sigma ].} ตัวแปรสุ่มสองตัวและ จะ เป็น อิสระต่อกันแบบมีเงื่อนไขเมื่อกำหนดพีชคณิต σ หากสมการข้างต้นเป็นจริงสำหรับทุกค่าในและในX {\displaystyle X} Y {\displaystyle Y} Σ {\displaystyle \Sigma } R {\displaystyle R} σ ( X ) {\displaystyle \sigma (X)} B {\displaystyle B} σ ( Y ) {\displaystyle \sigma (Y)}
ตัวแปรสุ่มสองตัวและเป็นอิสระต่อกันแบบมีเงื่อนไขเมื่อกำหนดตัวแปรสุ่มตัวหนึ่งหากตัวแปรสุ่มทั้งสองเป็นอิสระต่อกันเมื่อกำหนดσ ( W ): σ-algebra ที่สร้างขึ้นโดย ซึ่งโดยทั่วไปเขียนได้ดังนี้: X {\displaystyle X} Y {\displaystyle Y} W {\displaystyle W} W {\displaystyle W}
X ⊥ ⊥ Y ∣ W {\displaystyle X\perp \!\!\!\perp Y\mid W} หรือX ⊥ Y ∣ W {\displaystyle X\perp Y\mid W} อ่านว่า " เป็นอิสระจากเมื่อกำหนด " เงื่อนไขนี้ใช้กับประโยคทั้งหมด: "( เป็นอิสระจาก) เมื่อกำหนด" X {\displaystyle X} Y {\displaystyle Y} W {\displaystyle W} X {\displaystyle X} Y {\displaystyle Y} W {\displaystyle W}
( X ⊥ ⊥ Y ) ∣ W {\displaystyle (X\perp \!\!\!\perp Y)\mid W} สัญลักษณ์นี้ขยายความสำหรับ " เป็นอิสระ จาก" X ⊥ ⊥ Y {\displaystyle X\perp \!\!\!\perp Y} X {\displaystyle X} Y {\displaystyle Y}
ถ้าสมมติว่าเป็นเซต ของค่าที่นับได้ นี่จะเทียบเท่ากับความเป็นอิสระแบบมีเงื่อนไขของX และY สำหรับเหตุการณ์ในรูปแบบความเป็นอิสระแบบมีเงื่อนไขของเหตุการณ์มากกว่าสองเหตุการณ์ หรือของตัวแปรสุ่มมากกว่าสองตัว จะถูกกำหนดในทำนองเดียวกัน W {\displaystyle W} [ W = w ] {\displaystyle [W=w]}
ตัวอย่างสองข้อต่อไปนี้แสดงให้เห็นว่า ทั้งสอง ข้อไม่ได้หมายความถึงหรือถูกหมายความถึงโดยข้อใด ข้อหนึ่ง X ⊥ ⊥ Y {\displaystyle X\perp \!\!\!\perp Y} ( X ⊥ ⊥ Y ) ∣ W {\displaystyle (X\perp \!\!\!\perp Y)\mid W}
ก่อนอื่น สมมติว่าW มีค่าเป็น 0 ด้วยความน่าจะเป็น 0.5 และมีค่าเป็น 1 ในกรณีอื่น ๆ เมื่อW = 0 ให้ถือว่าW และ Y เป็นอิสระต่อกัน โดยแต่ละค่ามีค่าเป็น 0 ด้วยความน่าจะเป็น 0.99 และมีค่าเป็น 1 ในกรณีอื่น ๆ เมื่อW = 0 และ Y เป็นอิสระต่อกันอีกครั้ง แต่คราวนี้มีค่าเป็น 1 ด้วยความน่าจะเป็น 0.99 ดังนั้นแต่ W และ Y ขึ้นต่อกัน เพราะ Pr( X = 0) < Pr( X = 0| Y = 0) เนื่องจาก Pr( X = 0) = 0.5 แต่ถ้าY = 0 แล้วมีความเป็นไปได้สูงมากที่W = 0 และดังนั้นX = 0 ด้วย ดังนั้น Pr( X = 0| Y = 0) > 0.5 W {\displaystyle W} X {\displaystyle X} Y {\displaystyle Y} W = 1 {\displaystyle W=1} X {\displaystyle X} Y {\displaystyle Y} ( X ⊥ ⊥ Y ) ∣ W {\displaystyle (X\perp \!\!\!\perp Y)\mid W} X {\displaystyle X} Y {\displaystyle Y}
สำหรับตัวอย่างที่สอง สมมติว่าแต่ละค่าเป็น 0 และ 1 ด้วยความน่าจะเป็น 0.5 ให้เป็นผลคูณจากนั้นเมื่อPr( X = 0) = 2/3 แต่ Pr( X = 0| Y = 0) = 1/2 ดังนั้น จึงเป็นเท็จ นี่เป็นตัวอย่างหนึ่งของการอธิบายให้พ้นทาง ดูบทช่วยสอนของ Kevin Murphy [ 3 ] ที่และมีค่าเป็น "ฉลาด" และ "มีทักษะกีฬา" X ⊥ ⊥ Y {\displaystyle X\perp \!\!\!\perp Y} W {\displaystyle W} X ⋅ Y {\displaystyle X\cdot Y} W = 0 {\displaystyle W=0} ( X ⊥ ⊥ Y ) ∣ W {\displaystyle (X\perp \!\!\!\perp Y)\mid W} X {\displaystyle X} Y {\displaystyle Y}
ความเป็นอิสระแบบมีเงื่อนไขของเวกเตอร์สุ่ม เวกเตอร์สุ่ม สอง ตัว และจะเป็นอิสระต่อกันแบบมีเงื่อนไข เมื่อกำหนดเวกเตอร์สุ่มตัวที่สามก็ต่อเมื่อเวกเตอร์สุ่มทั้งสองเป็นอิสระต่อกันในการกระจายสะสมแบบมีเงื่อนไข เมื่อกำหนดเวกเตอร์สุ่มตัวที่สาม กล่าวอย่างเป็นทางการคือ: X = ( X 1 , … , X l ) T {\displaystyle \mathbf {X} =(X_{1},\ldots ,X_{l})^{\mathrm {T} }} Y = ( Y 1 , … , Y m ) T {\displaystyle \mathbf {Y} =(Y_{1},\ldots ,Y_{m})^{\mathrm {T} }} Z = ( Z 1 , … , Z n ) T {\displaystyle \mathbf {Z} =(Z_{1},\ldots ,Z_{n})^{\mathrm {T} }} Z {\displaystyle \mathbf {Z} }
( X ⊥ ⊥ Y ) ∣ Z ⟺ F X , Y | Z = z ( x , y ) = F X ∣ Z = z ( x ) ⋅ F Y ∣ Z = z ( y ) for all x , y , z {\displaystyle (\mathbf {X} \perp \!\!\!\perp \mathbf {Y} )\mid \mathbf {Z} \quad \iff \quad F_{\mathbf {X} ,\mathbf {Y} |\mathbf {Z} =\mathbf {z} }(\mathbf {x} ,\mathbf {y} )=F_{\mathbf {X} \,\mid \,\mathbf {Z} \,=\,\mathbf {z} }(\mathbf {x} )\cdot F_{\mathbf {Y} \,\mid \,\mathbf {Z} \,=\,\mathbf {z} }(\mathbf {y} )\quad {\text{for all }}\mathbf {x} ,\mathbf {y} ,\mathbf {z} } สมการที่ 3
โดยที่และและการแจกแจงสะสมแบบมีเงื่อนไขถูกกำหนดไว้ดังต่อไปนี้ x = ( x 1 , … , x l ) T {\displaystyle \mathbf {x} =(x_{1},\ldots ,x_{l})^{\mathrm {T} }} y = ( y 1 , … , y m ) T {\displaystyle \mathbf {y} =(y_{1},\ldots ,y_{m})^{\mathrm {T} }} z = ( z 1 , … , z n ) T {\displaystyle \mathbf {z} =(z_{1},\ldots ,z_{n})^{\mathrm {T} }}
F X , Y ∣ Z = z ( x , y ) = Pr ( X 1 ≤ x 1 , … , X l ≤ x l , Y 1 ≤ y 1 , … , Y m ≤ y m ∣ Z 1 = z 1 , … , Z n = z n ) F X ∣ Z = z ( x ) = Pr ( X 1 ≤ x 1 , … , X l ≤ x l ∣ Z 1 = z 1 , … , Z n = z n ) F Y ∣ Z = z ( y ) = Pr ( Y 1 ≤ y 1 , … , Y m ≤ y m ∣ Z 1 = z 1 , … , Z n = z n ) {\displaystyle {\begin{aligned}F_{\mathbf {X} ,\mathbf {Y} \,\mid \,\mathbf {Z} \,=\,\mathbf {z} }(\mathbf {x} ,\mathbf {y} )&=\Pr(X_{1}\leq x_{1},\ldots ,X_{l}\leq x_{l},Y_{1}\leq y_{1},\ldots ,Y_{m}\leq y_{m}\mid Z_{1}=z_{1},\ldots ,Z_{n}=z_{n})\\[6pt]F_{\mathbf {X} \,\mid \,\mathbf {Z} \,=\,\mathbf {z} }(\mathbf {x} )&=\Pr(X_{1}\leq x_{1},\ldots ,X_{l}\leq x_{l}\mid Z_{1}=z_{1},\ldots ,Z_{n}=z_{n})\\[6pt]F_{\mathbf {Y} \,\mid \,\mathbf {Z} \,=\,\mathbf {z} }(\mathbf {y} )&=\Pr(Y_{1}\leq y_{1},\ldots ,Y_{m}\leq y_{m}\mid Z_{1}=z_{1},\ldots ,Z_{n}=z_{n})\end{aligned}}}
การใช้งานในการอนุมานแบบเบย์เซียน ให้p เป็นสัดส่วนของผู้มีสิทธิเลือกตั้งที่จะลงคะแนน "เห็นด้วย" ในการลงประชามติ ที่จะเกิดขึ้น ใน การสำรวจความคิดเห็น นั้น จะเลือก ผู้มีสิทธิเลือกตั้ง n คนแบบสุ่มจากประชากร สำหรับi = 1, ..., n ให้X i = 1 หรือ 0 สอดคล้องกับว่า ผู้มีสิทธิเลือกตั้งคนที่ i ที่ถูกเลือกนั้นจะลงคะแนน "เห็นด้วย" หรือไม่
ในแนวทางการอนุมานทางสถิติ แบบความถี่ เราจะไม่กำหนดการกระจายความน่าจะเป็นใดๆ ให้กับp (เว้นแต่ว่าความน่าจะเป็นเหล่านั้นจะสามารถตีความได้ว่าเป็นความถี่สัมพัทธ์ของการเกิดเหตุการณ์บางอย่าง หรือเป็นสัดส่วนของประชากรบางกลุ่ม) และเราจะกล่าวว่าX 1 , ..., X n เป็นตัวแปรสุ่ม อิสระ
ในทางตรงกันข้าม ใน แนวทางแบบ เบย์เซียน สำหรับการอนุมานทางสถิติ เราจะกำหนดการแจกแจงความน่าจะเป็น ให้กับp โดยไม่คำนึงถึงการไม่มีอยู่ของการตีความ "ความถี่" ดังกล่าว และเราจะตีความความน่าจะเป็นว่าเป็นระดับความเชื่อที่ว่าp อยู่ในช่วงใดช่วงหนึ่งที่กำหนดความน่าจะเป็นให้ ในแบบจำลองนั้น ตัวแปรสุ่มX 1 , ..., X n ไม่เป็น อิสระต่อกัน แต่เป็นอิสระต่อกันแบบมีเงื่อนไข เมื่อกำหนดค่าของp โดยเฉพาะอย่างยิ่ง หากพบว่า X จำนวนมากมีค่าเท่ากับ 1 นั่นจะหมายความว่ามีความน่าจะเป็นแบบมีเงื่อนไข สูง เมื่อพิจารณาจากการสังเกตนั้น ว่าp อยู่ใกล้ 1 และดังนั้นความน่าจะเป็นแบบมีเงื่อนไข สูง เมื่อพิจารณาจากการสังเกตนั้น ว่าX ตัวถัดไป ที่จะสังเกตได้จะมีค่าเท่ากับ 1
กฎแห่งความเป็นอิสระแบบมีเงื่อนไข ชุดกฎที่ควบคุมข้อความของการเป็นอิสระแบบมีเงื่อนไขได้มาจากคำจำกัดความพื้นฐาน[ 4 ] [ 5 ]
กฎเหล่านี้ถูกเรียกว่า " สัจพจน์ กราฟ อยด์" โดย Pearl และ Paz [ 6 ] เนื่องจากกฎเหล่านี้ใช้ได้กับกราฟ ซึ่งตีความได้ว่า "เส้นทางทั้งหมดจากX ไปยังA ถูกตัดโดยเซตB " [ 7 ] X ⊥ ⊥ A ∣ B {\displaystyle X\perp \!\!\!\perp A\mid B}
สมมาตร X ⊥ ⊥ Y ∣ Z ⇔ Y ⊥ ⊥ X ∣ Z {\displaystyle X\perp \!\!\!\perp Y\mid Z\quad \Leftrightarrow \quad Y\perp \!\!\!\perp X\mid Z} การพิสูจน์:
จากนิยามของความเป็นอิสระแบบมีเงื่อนไข
X ⊥ ⊥ Y ∣ Z ⇔ P ( X , Y ∣ Z ) = P ( X ∣ Z ) P ( Y ∣ Z ) ⇔ Y ⊥ ⊥ X ∣ Z {\displaystyle X\perp \!\!\!\perp Y\mid Z\quad \Leftrightarrow \quad P(X,Y\mid Z)=P(X\mid Z)P(Y\mid Z)\quad \Leftrightarrow \quad Y\perp \!\!\!\perp X\mid Z}
การสลายตัว X ⊥ ⊥ Y ∣ Z ⇒ h ( X ) ⊥ ⊥ Y ∣ Z {\displaystyle X\perp \!\!\!\perp Y\mid Z\quad \Rightarrow \quad h(X)\perp \!\!\!\perp Y\mid Z} บทพิสูจน์ จากนิยามของความเป็นอิสระแบบมีเงื่อนไข เราต้องการแสดงให้เห็นว่า:
X ⊥ ⊥ Y ∣ Z ⇒ P ( h ( X ) , Y ∣ Z ) = P ( h ( X ) ∣ Z ) P ( Y ∣ Z ) {\displaystyle X\perp \!\!\!\perp Y\mid Z\quad \Rightarrow \quad P(h(X),Y\mid Z)=P(h(X)\mid Z)P(Y\mid Z)} ด้านซ้ายของสมการนี้คือ:
P ( h ( X ) = a , Y = y ∣ Z = z ) = ∑ X : h ( X ) = a P ( X = x , Y = y ∣ Z = z ) {\displaystyle P(h(X)=a,Y=y\mid Z=z)=\sum _{X\colon h(X)=a}P(X=x,Y=y\mid Z=z)} โดยที่นิพจน์ทางด้านขวาของสมการนี้คือผลรวมของความน่าจะเป็นแบบมีเงื่อนไขของบนเมื่อแยกย่อยเพิ่มเติม X {\displaystyle X} h ( X ) = a {\displaystyle h(X)=a} X , Y {\displaystyle X,Y} Z {\displaystyle Z}
∑ X : h ( X ) = a P ( X = x , Y = y ∣ Z = z ) = ∑ X : h ( X ) = a P ( X = x ∣ Z = z ) P ( Y = y ∣ Z = z ) = P ( Y = y ∣ Z = z ) ∑ X : h ( X ) = a P ( X = x ∣ Z = z ) = P ( Y ∣ Z ) P ( h ( X ) ∣ Z ) {\displaystyle {\begin{aligned}\sum _{X\colon h(X)=a}P(X=x,Y=y\mid Z=z)=&\sum _{X\colon h(X)=a}P(X=x\mid Z=z)P(Y=y\mid Z=z)\\=&P(Y=y\mid Z=z)\sum _{X\colon h(X)=a}P(X=x\mid Z=z)\\=&P(Y\mid Z)P(h(X)\mid Z)\end{aligned}}} กรณีพิเศษของคุณสมบัตินี้ได้แก่
( X , W ) ⊥ ⊥ Y ∣ Z ⇒ X ⊥ ⊥ Y ∣ Z {\displaystyle (X,W)\perp \!\!\!\perp Y\mid Z\quad \Rightarrow \quad X\perp \!\!\!\perp Y\mid Z} บทพิสูจน์: ให้เรากำหนดและเป็นฟังก์ชัน 'การสกัด' จากนั้น:A = ( X , W ) {\displaystyle A=(X,W)} h ( ⋅ ) {\displaystyle h(\cdot )} h ( X , W ) = X {\displaystyle h(X,W)=X} ( X , W ) ⊥ ⊥ Y ∣ Z ⇔ A ⊥ ⊥ Y ∣ Z ⇒ h ( A ) ⊥ ⊥ Y ∣ Z Decomposition ⇔ X ⊥ ⊥ Y ∣ Z {\displaystyle {\begin{aligned}(X,W)\perp \!\!\!\perp Y\mid Z\quad &\Leftrightarrow \quad A\perp \!\!\!\perp Y\mid Z\\&\Rightarrow \quad h(A)\perp \!\!\!\perp Y\mid Z\quad &{\text{Decomposition}}\\&\Leftrightarrow \quad X\perp \!\!\!\perp Y\mid Z\end{aligned}}} X ⊥ ⊥ ( Y , W ) ∣ Z ⇒ X ⊥ ⊥ Y ∣ Z {\displaystyle X\perp \!\!\!\perp (Y,W)\mid Z\quad \Rightarrow \quad X\perp \!\!\!\perp Y\mid Z} พิสูจน์: ให้เรากำหนดและเป็นฟังก์ชัน 'การสกัด' อีกครั้งจากนั้น:V = ( Y , W ) {\displaystyle V=(Y,W)} h ( ⋅ ) {\displaystyle h(\cdot )} h ( Y , W ) = Y {\displaystyle h(Y,W)=Y} X ⊥ ⊥ ( Y , W ) ∣ Z ⇔ X ⊥ ⊥ V ∣ Z ⇔ V ⊥ ⊥ X ∣ Z Symmetry ⇒ h ( V ) ⊥ ⊥ X ∣ Z Decomposition ⇔ Y ⊥ ⊥ X ∣ Z ⇔ X ⊥ ⊥ Y ∣ Z Symmetry {\displaystyle {\begin{aligned}X\perp \!\!\!\perp (Y,W)\mid Z\quad &\Leftrightarrow \quad X\perp \!\!\!\perp V\mid Z\\&\Leftrightarrow \quad V\perp \!\!\!\perp X\mid Z\quad &{\text{Symmetry}}\\&\Rightarrow \quad h(V)\perp \!\!\!\perp X\mid Z\quad &{\text{Decomposition}}\\&\Leftrightarrow \quad Y\perp \!\!\!\perp X\mid Z\\&\Leftrightarrow \quad X\perp \!\!\!\perp Y\mid Z\quad &{\text{Symmetry}}\end{aligned}}}
สหภาพที่อ่อนแอ X ⊥ ⊥ Y ∣ Z ⇒ X ⊥ ⊥ Y ∣ ( Z , h ( X ) ) {\displaystyle X\perp \!\!\!\perp Y\mid Z\quad \Rightarrow \quad X\perp \!\!\!\perp Y\mid (Z,h(X))} การพิสูจน์:
เมื่อกำหนดแล้วเราตั้งเป้าที่จะแสดงให้เห็น X ⊥ ⊥ Y ∣ Z {\displaystyle X\perp \!\!\!\perp Y\mid Z}
X ⊥ ⊥ Y ∣ ( Z , h ( X ) ) ⇔ X ⊥ ⊥ Y ∣ U where U = ( Z , h ( X ) ) ⇔ Y ⊥ ⊥ X ∣ U Symmetry ⇔ P ( Y ∣ X , U ) = P ( Y ∣ U ) ⇔ P ( Y ∣ X , Z , h ( X ) ) = P ( Y ∣ Z , h ( X ) ) {\displaystyle {\begin{aligned}X\perp \!\!\!\perp Y\mid (Z,h(X))\quad &\Leftrightarrow \quad X\perp \!\!\!\perp Y\mid U\quad &{\text{where}}\quad U=(Z,h(X))\\&\Leftrightarrow \quad Y\perp \!\!\!\perp X\mid U\quad &{\text{Symmetry}}\\&\Leftrightarrow \quad P(Y\mid X,U)=P(Y\mid U)\\&\Leftrightarrow \quad P(Y\mid X,Z,h(X))=P(Y\mid Z,h(X))\end{aligned}}} เราเริ่มจากด้านซ้ายของสมการก่อน
P ( Y ∣ X , Z , h ( X ) ) = P ( Y ∣ X , Z ) = P ( Y ∣ Z ) Since by symmetry Y ⊥ ⊥ X ∣ Z {\displaystyle {\begin{aligned}P(Y\mid X,Z,h(X))&=P(Y\mid X,Z)\\&=P(Y\mid Z)&{\text{Since by symmetry }}Y\perp \!\!\!\perp X\mid Z\end{aligned}}} จากเงื่อนไขที่กำหนด
X ⊥ ⊥ Y ∣ Z ⇒ h ( X ) ⊥ ⊥ Y ∣ Z Decomposition ⇔ Y ⊥ ⊥ h ( X ) ∣ Z Symmetry ⇒ P ( Y ∣ Z , h ( X ) ) = P ( Y ∣ Z ) {\displaystyle {\begin{aligned}X\perp \!\!\!\perp Y\mid Z\quad &\Rightarrow \quad h(X)\perp \!\!\!\perp Y\mid Z\quad &{\text{Decomposition}}\\&\Leftrightarrow \quad Y\perp \!\!\!\perp h(X)\mid Z\quad &{\text{Symmetry}}\\&\Rightarrow \quad P(Y\mid Z,h(X))=P(Y\mid Z)\end{aligned}}} ดังนั้นเราจึงได้แสดงให้เห็นว่า P ( Y ∣ X , Z , h ( X ) ) = P ( Y ∣ Z , h ( X ) ) {\displaystyle P(Y\mid X,Z,h(X))=P(Y\mid Z,h(X))} X ⊥ ⊥ Y ∣ ( Z , h ( X ) ) {\displaystyle X\perp \!\!\!\perp Y\mid (Z,h(X))}
กรณีพิเศษ:
ตำราเรียนบางเล่มนำเสนอคุณสมบัตินี้ไว้ดังนี้
X ⊥ ⊥ ( Y , W ) ∣ Z ⇒ X ⊥ ⊥ Y ∣ ( Z , W ) {\displaystyle X\perp \!\!\!\perp (Y,W)\mid Z\quad \Rightarrow \quad X\perp \!\!\!\perp Y\mid (Z,W)} [ 8 ] ( X , W ) ⊥ ⊥ Y ∣ Z ⇒ X ⊥ ⊥ Y ∣ ( Z , W ) {\displaystyle (X,W)\perp \!\!\!\perp Y\mid Z\quad \Rightarrow \quad X\perp \!\!\!\perp Y\mid (Z,W)} .ทั้งสองเวอร์ชันสามารถแสดงให้เห็นว่าเป็นผลมาจากคุณสมบัติการรวมแบบอ่อนที่ระบุไว้ในตอนต้น โดยใช้วิธีเดียวกับในส่วนการแยกส่วนข้างต้น
การหดตัว X ⊥ ⊥ A ∣ B X ⊥ ⊥ B } and ⇒ X ⊥ ⊥ A , B {\displaystyle \left.{\begin{aligned}X\perp \!\!\!\perp A\mid B\\X\perp \!\!\!\perp B\end{aligned}}\right\}{\text{ and }}\quad \Rightarrow \quad X\perp \!\!\!\perp A,B} การพิสูจน์
คุณสมบัตินี้สามารถพิสูจน์ได้โดยการสังเกตซึ่งความเท่าเทียมกันแต่ละข้อได้รับการยืนยันโดยและตามลำดับ Pr ( X ∣ A , B ) = Pr ( X ∣ B ) = Pr ( X ) {\displaystyle \Pr(X\mid A,B)=\Pr(X\mid B)=\Pr(X)} X ⊥ ⊥ A ∣ B {\displaystyle X\perp \!\!\!\perp A\mid B} X ⊥ ⊥ B {\displaystyle X\perp \!\!\!\perp B}
จุดตัด สำหรับการกระจายความน่าจะเป็นที่เป็นบวกอย่างเคร่งครัด[ 5 ] ต่อไปนี้ก็เป็นจริงเช่นกัน:
X ⊥ ⊥ Y ∣ Z , W X ⊥ ⊥ W ∣ Z , Y } and ⇒ X ⊥ ⊥ W , Y ∣ Z {\displaystyle \left.{\begin{aligned}X\perp \!\!\!\perp Y\mid Z,W\\X\perp \!\!\!\perp W\mid Z,Y\end{aligned}}\right\}{\text{ and }}\quad \Rightarrow \quad X\perp \!\!\!\perp W,Y\mid Z} การพิสูจน์
โดยสมมติฐาน:
P ( X | Z , W , Y ) = P ( X | Z , W ) ∧ P ( X | Z , W , Y ) = P ( X | Z , Y ) ⟹ P ( X | Z , Y ) = P ( X | Z , W ) {\displaystyle P(X|Z,W,Y)=P(X|Z,W)\land P(X|Z,W,Y)=P(X|Z,Y)\implies P(X|Z,Y)=P(X|Z,W)} โดยใช้ความเท่าเทียมกันนี้ ร่วมกับกฎความน่าจะเป็นรวม ที่นำมาประยุกต์ใช้กับ: P ( X | Z ) {\displaystyle P(X|Z)}
P ( X | Z ) = ∑ w ∈ W P ( X | Z , W = w ) P ( W = w | Z ) = ∑ w ∈ W P ( X | Y , Z ) P ( W = w | Z ) = P ( X | Z , Y ) ∑ w ∈ W P ( W = w | Z ) = P ( X | Z , Y ) {\displaystyle {\begin{aligned}P(X|Z)&=\sum _{w\in W}P(X|Z,W=w)P(W=w|Z)\\[4pt]&=\sum _{w\in W}P(X|Y,Z)P(W=w|Z)\\[4pt]&=P(X|Z,Y)\sum _{w\in W}P(W=w|Z)\\[4pt]&=P(X|Z,Y)\end{aligned}}} เนื่องจากและดังนั้นจึงสรุปได้ว่า P ( X | Z , W , Y ) = P ( X | Z , Y ) {\displaystyle P(X|Z,W,Y)=P(X|Z,Y)} P ( X | Z , Y ) = P ( X | Z ) {\displaystyle P(X|Z,Y)=P(X|Z)} P ( X | Z , W , Y ) = P ( X | Z ) ⟺ X ⊥ ⊥ Y , W | Z {\displaystyle P(X|Z,W,Y)=P(X|Z)\iff X\perp \!\!\!\perp Y,W|Z}
หมายเหตุทางเทคนิค: เนื่องจากข้อสรุปเหล่านี้ใช้ได้กับปริภูมิความน่าจะ เป็นใดๆ ข้อ สรุปเหล่านี้จึงยังคงใช้ได้อยู่หากเราพิจารณาจักรวาลย่อยโดยกำหนดเงื่อนไขทุกอย่างบนตัวแปรอื่น เช่น K ตัวอย่างเช่น ก็หมายความว่า เช่นกัน X ⊥ ⊥ Y ⇒ Y ⊥ ⊥ X {\displaystyle X\perp \!\!\!\perp Y\Rightarrow Y\perp \!\!\!\perp X} X ⊥ ⊥ Y ∣ K ⇒ Y ⊥ ⊥ X ∣ K {\displaystyle X\perp \!\!\!\perp Y\mid K\Rightarrow Y\perp \!\!\!\perp X\mid K}
ดูเพิ่มเติม
ลิงก์ภายนอก สื่อที่เกี่ยวข้องกับเอกราชแบบมีเงื่อนไขในวิกิมีเดียคอมมอนส์