กลับไปหน้าบทความ

อ่าน 11 นาที

การแจกแจงความน่าจะเป็นร่วม

เมื่อกำหนดตัวแปรสุ่ม ซึ่งกำหนดไว้ในปริภูมิความน่าจะ เป็นเดียวกัน การ แจกแจงความน่าจะ

การแจกแจงความน่าจะเป็นร่วม

แสดงค่าสังเกตตัวอย่างจำนวนมาก (สีดำ) จากการแจกแจงความน่าจะเป็นร่วม นอกจากนี้ยังแสดงความหนาแน่นส่วนย่อย (สีน้ำเงินและสีแดง) ด้วย

เมื่อกำหนดตัวแปรสุ่ม ซึ่งกำหนดไว้ในปริภูมิความน่าจะ เป็นเดียวกัน [ 1 ]การ แจกแจงความน่าจะ เป็นแบบหลายตัวแปรหรือแบบร่วมสำหรับคือการแจกแจงความน่าจะเป็นที่แต่ละจะตกอยู่ในช่วงใดช่วงหนึ่งโดยเฉพาะหรือเซตของค่าที่ไม่ต่อเนื่องที่ระบุสำหรับตัวแปรนั้น ในกรณีที่มีตัวแปรสุ่มเพียงสองตัว จะเรียกว่าการแจกแจงแบบทวิตัวแปรแต่แนวคิดนี้สามารถขยายไปสู่ตัวแปรสุ่มจำนวนใดก็ได้

การแจกแจงความน่าจะเป็นร่วมสามารถแสดงได้ในรูปของฟังก์ชันการแจกแจงสะสม ร่วม และในรูปของฟังก์ชันความหนาแน่นความน่าจะเป็น ร่วม (ในกรณีของตัวแปรต่อเนื่อง ) หรือฟังก์ชันมวลความน่าจะ เป็นร่วม (ในกรณีของ ตัวแปร ไม่ต่อเนื่อง ) ซึ่งสามารถนำมาใช้หาการแจกแจงอีกสองประเภทได้ คือ การแจกแจงแบบมาร์จินัลซึ่งแสดงความน่าจะเป็นสำหรับตัวแปรใดตัวแปรหนึ่งโดยไม่คำนึงถึงช่วงค่าเฉพาะของตัวแปรอื่น และการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขซึ่งแสดงความน่าจะเป็นสำหรับกลุ่มย่อยของตัวแปรใดๆ โดยมีเงื่อนไขขึ้นอยู่กับค่าเฉพาะของตัวแปรที่เหลืออยู่

ตัวอย่าง

หยิบจากโถ

โถสองใบแต่ละใบมีลูกบอลสีแดงเป็นสองเท่าของลูกบอลสีน้ำเงิน และไม่มีลูกบอลสีอื่น และจะสุ่มหยิบลูกบอลหนึ่งลูกจากแต่ละโถ โดยการหยิบทั้งสองครั้งเป็นอิสระต่อกัน ให้และเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่เกี่ยวข้องกับผลลัพธ์ของการหยิบจากโถใบแรกและโถใบที่สองตามลำดับ ความน่าจะเป็นของการหยิบลูกบอลสีแดงจากโถใดโถหนึ่งคือ2/3และความน่าจะเป็นที่จะหยิบลูกบอลสีน้ำเงินได้คือ1/3ตารางต่อไปนี้แสดงการแจกแจงความน่าจะเป็นร่วม :

A = สีแดงA = สีน้ำเงินพี(บี)
B = สีแดง ( 2/3) ( )2/3) =4/9( 1/3) ( )2/3) =2/94/9+2/9=2/3
B = สีน้ำเงิน ( 2/3) ( )1/3) =2/9( 1/3) ( )1/3) =1/92/9+1/9=1/3
พี(เอ) 4/9+2/9=2/32/9+1/9=1/3

แต่ละช่องภายในทั้งสี่ช่องแสดงความน่าจะเป็นของผลลัพธ์ที่ได้จากการสุ่มสองครั้งในรูปแบบต่างๆ ความน่าจะเป็นเหล่านี้คือการแจกแจงความน่าจะเป็นร่วม ในแต่ละช่อง ความน่าจะเป็นของการเกิดผลลัพธ์ในรูปแบบใดรูปแบบหนึ่ง (เนื่องจากการสุ่มเป็นอิสระต่อกัน) คือผลคูณของความน่าจะเป็นของผลลัพธ์ที่ระบุสำหรับ A และความน่าจะเป็นของผลลัพธ์ที่ระบุสำหรับ B ผลรวมของความน่าจะเป็นในสี่ช่องนี้เท่ากับ 1 เช่นเดียวกับการแจกแจงความน่าจะเป็นทั้งหมด

นอกจากนี้ แถวสุดท้ายและคอลัมน์สุดท้ายจะแสดงการแจกแจงความน่าจะเป็นแบบมาร์จินัลสำหรับ A และการแจกแจงความน่าจะเป็นแบบมาร์จินัลสำหรับ B ตามลำดับ ตัวอย่างเช่น สำหรับ A เซลล์แรกจะแสดงผลรวมของความน่าจะเป็นที่ A จะเป็นสีแดง โดยไม่คำนึงถึงความเป็นไปได้ใด ๆ สำหรับ B ในคอลัมน์ด้านบนเซลล์นั้น2/3ดังนั้นการแจกแจงความน่าจะเป็นแบบมาร์จินัลสำหรับจะให้ความน่าจะเป็นของโดยไม่ขึ้นกับเงื่อนไข ของ ในส่วนขอบของตาราง

การโยนเหรียญ

พิจารณาการโยนเหรียญยุติธรรม สองเหรียญ ให้และเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่เกี่ยวข้องกับผลลัพธ์ของการโยนเหรียญครั้งแรกและครั้งที่สองตามลำดับ การโยนเหรียญแต่ละครั้งเป็นการทดลองแบบเบอร์นูลลีและมีการแจกแจงแบบเบอร์นูลลีถ้าเหรียญออก "หัว" ตัวแปรสุ่มที่เกี่ยวข้องจะมีค่าเป็น 1 และจะมีค่าเป็น 0 ในกรณีอื่น ๆ ความน่าจะเป็นของผลลัพธ์แต่ละอย่างคือ1/2ดังนั้นฟังก์ชันความหนาแน่นแบบมาร์จินัล (แบบไม่ขึ้นกับเงื่อนไข) คือ

ฟังก์ชันความน่าจะเป็นร่วมของและกำหนดความน่าจะเป็นสำหรับผลลัพธ์แต่ละคู่ ผลลัพธ์ที่เป็นไปได้ทั้งหมดคือ เนื่องจากแต่ละผลลัพธ์มีโอกาสเกิดขึ้นเท่ากัน ฟังก์ชันความน่าจะเป็นร่วมจึงกลายเป็น

เนื่องจากการโยนเหรียญเป็นอิสระต่อกัน ฟังก์ชันความน่าจะเป็นร่วมจึงเป็นผลคูณของความน่าจะเป็นส่วนย่อย:

การทอยลูกเต๋า

พิจารณาการทอยลูกเต๋า ที่ยุติธรรม และให้ค่า เป็นถ้าเลขที่ได้เป็นเลขคู่ (เช่น 2, 4 หรือ 6) และเป็น ถ้าเป็นเลขอื่น นอกจากนี้ ให้ค่า เป็นถ้าเลขที่ได้เป็นจำนวนเฉพาะ (เช่น 2, 3 หรือ 5) และเป็น ถ้าเป็นเลขอื่น

123456
เอ010101
บี011010

จากนั้น การแจกแจงร่วมของและซึ่งแสดงในรูปของฟังก์ชันความน่าจะเป็นมวล คือ

ผลรวมของความน่าจะเป็นเหล่านี้จะต้องเท่ากับ 1 อย่างแน่นอน เนื่องจากความน่าจะเป็นของการ เกิดเหตุการณ์ ใดๆ ก็ตาม ที่มีค่า เท่ากับ 1

การแจกแจงความน่าจะเป็นแบบมาร์จินัล

หากมีการกำหนดตัวแปรสุ่มมากกว่าหนึ่งตัวในการทดลองสุ่ม สิ่งสำคัญคือต้องแยกแยะความแตกต่างระหว่างการแจกแจงความน่าจะเป็นร่วมของ X และ Y กับการแจกแจงความน่าจะเป็นของแต่ละตัวแปรแยกกัน การแจกแจงความน่าจะเป็นของตัวแปรสุ่มแต่ละตัวเรียกว่าการแจกแจงความน่าจะเป็นแบบมาร์จินัล โดยทั่วไป การแจกแจงความน่าจะเป็นแบบมาร์จินัลของ X สามารถหาได้จากการแจกแจงความน่าจะเป็นร่วมของ X และตัวแปรสุ่มอื่นๆ

ถ้าฟังก์ชันความหนาแน่นความน่าจะเป็นร่วมของตัวแปรสุ่ม X และ Y คือฟังก์ชันความหนาแน่นความน่าจะเป็นส่วนย่อยของ X และ Y ซึ่งกำหนดการแจกแจงส่วนย่อยจะกำหนดโดย:

โดยที่อินทิกรัลแรกครอบคลุมจุดทั้งหมดในช่วง (X,Y) ซึ่ง X=x และอินทิกรัลที่สองครอบคลุมจุดทั้งหมดในช่วง (X,Y) ซึ่ง Y=y [ 2 ]

ฟังก์ชันการกระจายสะสมร่วม

สำหรับตัวแปรสุ่มคู่หนึ่งฟังก์ชันการกระจายสะสมร่วม (CDF) จะได้รับจาก[ 3 ] : 89

   ( สมการที่ 1 )

โดยที่ด้านขวามือแสดงถึงความน่าจะเป็นที่ตัวแปรสุ่มจะมีค่าต่ำกว่าหรือเท่ากับและตัวแปร สุ่มจะมีค่าต่ำกว่าหรือเท่ากับ

สำหรับตัวแปรสุ่ม ฟังก์ชันการกระจายสะสมร่วม (Joint CDF) จะกำหนดโดย

   ( สมการที่ 2 )

การตีความตัวแปรสุ่มเป็นเวกเตอร์สุ่มทำให้ได้สัญลักษณ์ที่สั้นกว่า:

ฟังก์ชันความหนาแน่นร่วมหรือฟังก์ชันมวล

กรณีแยกย่อย

ฟังก์ชันความน่าจะเป็นร่วมของตัวแปรสุ่มแบบไม่ต่อเนื่องสองตัว คือ:

   ( สมการที่ 3 )

หรือเขียนในรูปของการแจกแจงแบบมีเงื่อนไข โดย ที่คือความน่าจะเป็นของเมื่อกำหนดให้

การสรุปทั่วไปของกรณีสองตัวแปรข้างต้นคือการแจกแจงความน่าจะเป็นร่วมของตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งมีดังนี้:

   ( สมการที่ 4 )

หรือเทียบเท่า

เอกลักษณ์นี้เป็นที่รู้จักกันในชื่อกฎลูกโซ่ของความน่าจะเป็น

เนื่องจากสิ่งเหล่านี้เป็นความน่าจะเป็น ในกรณีที่มีตัวแปรสองตัว

ซึ่งสามารถขยายความทั่วไปสำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องได้เป็น

กรณีต่อเนื่อง

ฟังก์ชันความหนาแน่นความน่าจะเป็นร่วม สำหรับตัวแปรสุ่มต่อเนื่อง สองตัว ถูกกำหนดให้เป็นอนุพันธ์ของฟังก์ชันการกระจายสะสมร่วม (ดูสมการที่ 1 ):

   ( สมการที่ 5 )

นี่เท่ากับ:

โดยที่และคือการแจกแจงแบบมีเงื่อนไขของเมื่อกำหนดให้และของเมื่อกำหนดให้ตามลำดับ และและคือการแจกแจงแบบมาร์จินัลสำหรับและตามลำดับ

นิยามนี้สามารถขยายไปสู่ตัวแปรสุ่มมากกว่าสองตัวได้อย่างเป็นธรรมชาติ:

   ( สมการที่ 6 )

อีกครั้ง เนื่องจากสิ่งเหล่านี้คือการแจกแจงความน่าจะเป็น ดังนั้นจึงมี ตามลำดับ

คดีผสม

"ความหนาแน่นร่วมแบบผสม" อาจถูกกำหนดได้ในกรณีที่ตัวแปรสุ่มหนึ่งตัวหรือมากกว่านั้นเป็นแบบต่อเนื่อง และตัวแปรสุ่มอื่นๆ เป็นแบบไม่ต่อเนื่อง ตัวอย่างหนึ่งของสถานการณ์ที่เราอาจต้องการหาการแจกแจงสะสมของตัวแปรสุ่มแบบต่อเนื่องหนึ่งตัวและตัวแปรสุ่มแบบไม่ต่อเนื่องอีกตัวหนึ่ง เกิดขึ้นเมื่อเราต้องการใช้การถดถอยโลจิสติกในการทำนายความน่าจะเป็นของผลลัพธ์แบบไบนารี Y โดยมีเงื่อนไขจากค่าของผลลัพธ์ที่มีการแจกแจงแบบต่อเนื่องเราต้องใช้ความหนาแน่นร่วมแบบ "ผสม" เมื่อหาการแจกแจงสะสมของผลลัพธ์แบบไบนารีนี้ เนื่องจากตัวแปรนำเข้าถูกกำหนดไว้ตั้งแต่แรกในลักษณะที่เราไม่สามารถกำหนดฟังก์ชันความหนาแน่นความน่าจะเป็นหรือฟังก์ชันมวลความน่าจะเป็นให้กับมันได้โดยรวม กล่าวคือคือฟังก์ชันความหนาแน่นความน่าจะเป็นของโดยสัมพันธ์กับการวัดผลคูณบนส่วนรองรับของและ ตามลำดับ การแยกส่วนทั้งสองนี้สามารถใช้เพื่อกู้คืนฟังก์ชันการแจกแจงสะสมร่วมได้ คำจำกัดความนี้สามารถขยายไปสู่ส่วนผสมของตัวแปรสุ่มแบบไม่ต่อเนื่องและแบบต่อเนื่องจำนวน ใดๆ ก็ได้

คุณสมบัติเพิ่มเติม

การแจกแจงร่วมสำหรับตัวแปรอิสระ

โดยทั่วไป ตัวแปรสุ่มสองตัวและจะเป็นอิสระต่อกันก็ต่อเมื่อฟังก์ชันการกระจายสะสมร่วมเป็นไปตามเงื่อนไขต่อไปนี้

ตัวแปรสุ่มแบบไม่ต่อเนื่องสองตัวและ จะ เป็น อิสระต่อกันก็ต่อเมื่อฟังก์ชันความน่าจะเป็นร่วมเป็นไปตามเงื่อนไข สำหรับทุกและ

เมื่อจำนวนเหตุการณ์สุ่มอิสระเพิ่มขึ้น ค่าความน่าจะเป็นร่วมที่เกี่ยวข้องจะลดลงอย่างรวดเร็วจนเป็นศูนย์ ตามกฎเลขชี้กำลังติดลบ

ในทำนองเดียวกัน ตัวแปรสุ่มต่อเนื่องสองตัวจะเป็นอิสระต่อกันก็ต่อเมื่อ สำหรับทุกและซึ่งหมายความว่า การได้มาซึ่งข้อมูลใดๆ เกี่ยวกับค่าของตัวแปรสุ่มหนึ่งตัวหรือมากกว่านั้น จะนำไปสู่การแจกแจงแบบมีเงื่อนไขของตัวแปรอื่นๆ ที่เหมือนกับการแจกแจงแบบไม่มีเงื่อนไข (แบบมาร์จินัล) ดังนั้นจึงไม่มีตัวแปรใดให้ข้อมูลใดๆ เกี่ยวกับตัวแปรอื่น

การแจกแจงร่วมสำหรับตัวแปรที่ขึ้นต่อกันแบบมีเงื่อนไข

ถ้าตัวแปรกลุ่ม หนึ่ง มีความสัมพันธ์แบบมีเงื่อนไขกับตัวแปรอีกกลุ่มหนึ่งฟังก์ชันความน่าจะเป็นของการกระจายร่วมจะเป็น เท่ากับดังนั้นจึงสามารถแสดงได้อย่างมีประสิทธิภาพด้วยการกระจายความน่าจะเป็นที่มีมิติที่ต่ำกว่าและความสัมพันธ์แบบอิสระที่มีเงื่อนไขดังกล่าวสามารถแสดงได้ด้วยเครือข่ายเบย์เซียนหรือฟังก์ชันโคปูลา

ความแปรปรวนร่วม

เมื่อมีการกำหนดตัวแปรสุ่มสองตัวขึ้นไปบนปริภูมิความน่าจะเป็น การอธิบายว่าตัวแปรเหล่านั้นเปลี่ยนแปลงไปอย่างไรด้วยกันนั้นเป็นสิ่งที่มีประโยชน์ กล่าวคือ การวัดความสัมพันธ์ระหว่างตัวแปรเหล่านั้นเป็นสิ่งที่มีประโยชน์ มาตรวัดความสัมพันธ์ระหว่างตัวแปรสุ่มสองตัวที่ใช้กันทั่วไปคือ ค่าความแปรปรวนร่วม (covariance) ค่าความแปรปรวนร่วมเป็นมาตรวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม หากความสัมพันธ์ระหว่างตัวแปรสุ่มไม่ใช่เชิงเส้น ค่าความแปรปรวนร่วมอาจไม่ไวต่อความสัมพันธ์นั้น ซึ่งหมายความว่ามันไม่สามารถแสดงความสัมพันธ์ระหว่างตัวแปรสองตัวได้

ความแปรปรวนร่วมระหว่างตัวแปรสุ่มและคือ[ 2 ]

ความสัมพันธ์

มีมาตรวัดความสัมพันธ์ระหว่างตัวแปรสุ่มสองตัวอีกแบบหนึ่ง ซึ่งมักจะตีความได้ง่ายกว่าค่าความแปรปรวนร่วม

ค่าสัมประสิทธิ์สหสัมพันธ์เป็นการปรับขนาดค่าความแปรปรวนร่วมโดยคูณด้วยค่าเบี่ยงเบนมาตรฐานของแต่ละตัวแปร ดังนั้น ค่าสัมประสิทธิ์สหสัมพันธ์จึงเป็นปริมาณที่ไม่มีมิติ ซึ่งสามารถใช้เปรียบเทียบความสัมพันธ์เชิงเส้นระหว่างตัวแปรคู่ต่างๆ ที่มีหน่วยต่างกันได้ หากจุดในแผนภูมิความน่าจะเป็นร่วมของ X และ Y ที่ได้รับความน่าจะเป็นเป็นบวก มีแนวโน้มที่จะตกอยู่บนเส้นตรงที่มีความชันเป็นบวก (หรือลบ) ค่า ρXY จะอยู่ใกล้ +1 (หรือ −1) ถ้า ρXY เท่ากับ +1 หรือ −1 แสดงว่าจุดในแผนภูมิความน่าจะเป็นร่วมที่ได้รับความน่าจะเป็นเป็นบวกนั้นตกอยู่บนเส้นตรงเดียวกันพอดี ตัวแปรสุ่มสองตัวที่มีค่าสัมประสิทธิ์สหสัมพันธ์ไม่เป็นศูนย์เรียกว่ามีความสัมพันธ์กัน เช่นเดียวกับค่าความแปรปรวนร่วม ค่าสัมประสิทธิ์สหสัมพันธ์เป็นการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม

ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่มและคือ

การแจกแจงชื่อสำคัญ

การแจกแจงร่วมที่มีชื่อซึ่งพบได้บ่อยในทางสถิติ ได้แก่การแจกแจงปกติหลายตัวแปรการแจกแจงเสถียร หลายตัวแปร การแจกแจงพหุนามการแจกแจงพหุนามเชิงลบการแจกแจงไฮเปอร์จีโอเมตริกหลายตัวแปรและ การ แจกแจง วงรี

ดูเพิ่มเติม

  • "การแจกแจงร่วม" , สารานุกรมคณิตศาสตร์ , EMS Press , 2001 [1994]
  • "การแจกแจงแบบหลายมิติ" , สารานุกรมคณิตศาสตร์ , EMS Press , 2001 [1994]
  • บทนำสมัยใหม่เกี่ยวกับความน่าจะเป็นและสถิติ: ทำความเข้าใจว่าทำไมและอย่างไรเดคกิ้ง, มิเชล, 1946-. ลอนดอน: สปริงเกอร์. 2005. ISBN 978-1-85233-896-1. OCLC  262680588.
  • "ฟังก์ชันความหนาแน่นร่วมต่อเนื่อง " PlanetMath
  • Mathworld: ฟังก์ชันการแจกแจงร่วม
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Joint_probability_distribution&oldid=1357699159 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การแจกแจงความน่าจะเป็นร่วม

เมื่อกำหนดตัวแปรสุ่ม ซึ่งกำหนดไว้ในปริภูมิความน่าจะ เป็นเดียวกัน การ แจกแจงความน่าจะ

หยิบจากโถ

โถสองใบแต่ละใบมีลูกบอลสีแดงเป็นสองเท่าของลูกบอลสีน้ำเงิน และไม่มีลูกบอลสีอื่น และจะสุ่มหยิบลูกบอลหนึ่งลูกจากแต่ละโถ โดยการหยิบทั้งสองครั้งเป็นอิสระต่อกัน ให้และเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่เกี่ยวข้องกับผลลัพธ์ของการหยิบจากโถใบแรกและโถใบที่สองตามลำดับ...

การโยนเหรียญ

พิจารณาการโยน เหรียญยุติธรรม สองเหรียญ ให้และเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่เกี่ยวข้องกับผลลัพธ์ของการโยนเหรียญครั้งแรกและครั้งที่สองตามลำดับ การโยนเหรียญแต่ละครั้งเป็นการ ทดลองแบบเบอร์นูลลี และมี การแจกแจงแบบเบอร์นูลลี ถ้าเหรียญออก "หัว"...

การทอยลูกเต๋า

พิจารณาการทอย ลูกเต๋า ที่ยุติธรรม และให้ค่า เป็นถ้าเลขที่ได้เป็นเลขคู่ (เช่น 2, 4 หรือ 6) และเป็น ถ้าเป็นเลขอื่น นอกจากนี้ ให้ค่า เป็นถ้าเลขที่ได้เป็นจำนวนเฉพาะ (เช่น 2, 3 หรือ 5) และเป็น ถ้าเป็นเลขอื่น เอ = 1 {\displaystyle A=1} เอ = 0 {\displaystyle A=0} B...