กลับไปหน้าบทความ

อ่าน 13 นาที

การแจกแจงไฮเปอร์จีโอเมตริก

1nเค(เอ็น−เค)(เอ็น−n)(เอ็น−2)(เอ็น−3)⋅{\displaystyle \left.{\frac {1}{nK(NK)(Nn)(N-2)(N-3)}}\cdot \right.

การแจกแจงไฮเปอร์จีโอเมตริก

ไฮเปอร์จีโอเมตริก
ฟังก์ชันมวลความน่าจะเป็น
พล็อต PDF แบบไฮเปอร์จีโอเมตริก
ฟังก์ชันการกระจายสะสม
พล็อต CDF แบบไฮเปอร์จีโอเมตริก
สัญกรณ์
พารามิเตอร์
สนับสนุน
พีเอ็มเอฟ
ซีดีเอฟฟังก์ชันไฮเปอร์จีโอเมตริกทั่วไปอยู่ที่ไหน
หมายถึง
ค่ามัธยฐานหรือ[ 1 ]
โหมด
ความแปรปรวน
ความเบี่ยงเบน
ความโค้งส่วนเกิน

เอ็มจีเอฟ
ซีเอฟ

ในทฤษฎีความน่าจะเป็นและสถิติการแจกแจงไฮเปอร์จีโอเมตริกเป็นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องที่อธิบายความน่าจะเป็นของความสำเร็จ (การสุ่มเลือกโดยที่วัตถุที่สุ่มได้มีคุณสมบัติที่กำหนด) ในการสุ่มแบบไม่ ใส่คืน จาก ประชากรจำกัดขนาดที่ประกอบด้วยวัตถุที่มีคุณสมบัตินั้นจำนวนหนึ่ง โดยที่ในการสุ่มแต่ละครั้งจะเป็นความสำเร็จหรือความล้มเหลว ในทางตรงกันข้ามการแจกแจงทวินามอธิบายความน่าจะเป็นของความสำเร็จในการสุ่มแบบใส่คืน

คำจำกัดความ

ฟังก์ชันมวลความน่าจะเป็น

เงื่อนไขต่อไปนี้เป็นลักษณะเฉพาะของการแจกแจงแบบไฮเปอร์จีโอเมตริก:

  • ผลลัพธ์ของการจับฉลากแต่ละครั้ง (องค์ประกอบของประชากรที่ถูกสุ่มตัวอย่าง) สามารถจำแนกได้เป็น2 ประเภทที่ไม่ซ้ำซ้อนกัน (เช่น ผ่าน/ไม่ผ่าน หรือ มีงานทำ/ไม่มีงานทำ)
  • ความน่าจะเป็นของความสำเร็จจะเปลี่ยนแปลงไปในแต่ละครั้งที่สุ่ม เนื่องจากแต่ละครั้งที่สุ่มจะทำให้จำนวนประชากรลดลง ( การสุ่มโดยไม่ใส่คืนจากประชากรที่มีจำนวนจำกัด)

ตัวแปรสุ่ม จะปฏิบัติตามการแจกแจงไฮเปอร์จีโอเมตริกหากฟังก์ชันมวลความน่าจะเป็น (pmf) ของมันกำหนดโดย[ 2 ]

ที่ไหน

  • คือขนาดของประชากร
  • คือจำนวนสถานะความสำเร็จในประชากร
  • คือจำนวนครั้งที่จับฉลาก (เช่น จำนวนที่จับได้ในแต่ละครั้ง)
  • คือจำนวนความสำเร็จที่สังเกตได้
  • เป็นสัมประสิทธิ์ทวินาม

ค่าpmfจะเป็นบวกเมื่อ.

ตัวแปรสุ่มที่มีการแจกแจงแบบไฮเปอร์จีโอเมตริกซ์ โดยมีพารามิเตอร์, และเขียนได้ดังนี้และมีฟังก์ชันความน่าจะเป็นดังที่แสดงด้านบน

เอกลักษณ์เชิงการจัดเรียง

ตามความจำเป็น เรามี

ซึ่งโดยพื้นฐานแล้วเป็นผลมาจากเอกลักษณ์ของแวนเดอร์มอนด์จากคณิตศาสตร์เชิงการจัดเรียง

โปรดทราบด้วยว่า

เอกลักษณ์นี้สามารถแสดงได้โดยการแสดงสัมประสิทธิ์ทวินามในรูปของแฟกทอเรียลและจัดเรียงแฟกทอเรียลใหม่ นอกจากนี้ ยังเป็นผลมาจากสมมาตรของปัญหา ซึ่งอธิบายไว้ในสองวิธีที่แตกต่างกันแต่สามารถใช้แทนกันได้

ตัวอย่างเช่น ลองพิจารณาการสุ่มหยิบลูกแก้วสองรอบโดยไม่ใส่คืน ในรอบแรกลูกแก้วที่เป็นกลางจะถูกหยิบออกมาจากโถโดยไม่ใส่คืน และถูกระบายสีเขียว จากนั้นลูกแก้วที่ระบายสีแล้วจะถูกใส่กลับเข้าไป ในรอบที่สองลูกแก้วจะถูกหยิบออกมาโดยไม่ใส่คืน และถูกระบายสีแดง จำนวนลูกแก้วที่มีทั้งสองสี (นั่นคือ จำนวนลูกแก้วที่ถูกหยิบออกมาสองครั้ง) จะมีการแจกแจงแบบไฮเปอร์จีโอเมตริก ความสมมาตรในและมาจากข้อเท็จจริงที่ว่าทั้งสองรอบเป็นอิสระต่อกัน และเราสามารถเริ่มต้นด้วยการหยิบลูกแก้วและระบายสีแดงก่อนก็ได้

โปรดทราบว่าเราสนใจความน่าจะเป็นของความสำเร็จในการหยิบโดยไม่ใส่คืนเนื่องจากความน่าจะเป็นของความสำเร็จในแต่ละครั้งไม่เท่ากัน เพราะขนาดของประชากรที่เหลืออยู่จะเปลี่ยนแปลงไปเมื่อเราหยิบลูกแก้วออกแต่ละลูก อย่าสับสนกับ1 การแจกแจงทวินามซึ่งอธิบายถึงความน่าจะเป็นของความสำเร็จในการหยิบโดยใส่คืน

คุณสมบัติ

ตัวอย่างการทำงาน

การประยุกต์ใช้การแจกแจงไฮเปอร์จีโอเมตริกแบบคลาสสิกคือการสุ่มตัวอย่างโดยไม่ใส่คืนลองนึกถึงโถ ที่มี ลูกแก้วสองสีคือสีแดงและสีเขียว กำหนดให้การหยิบลูกแก้วสีเขียวเป็นการสำเร็จ และการหยิบลูกแก้วสีแดงเป็นการล้มเหลว ให้Nแทนจำนวนลูกแก้วทั้งหมดในโถ (ดูตารางความสัมพันธ์ด้านล่าง) และKแทนจำนวนลูกแก้วสีเขียวดังนั้นN  −  Kคือจำนวนลูกแก้วสีแดงทีนี้ ยืนอยู่ข้างโถ คุณหลับตาแล้วหยิบลูกแก้ว n ลูกโดยไม่ใส่คืน กำหนดให้Xเป็นตัวแปรสุ่มที่มีผลลัพธ์เป็นkซึ่งเป็นจำนวนลูกแก้วสีเขียวที่หยิบได้ในการทดลอง สถานการณ์นี้แสดงโดยตารางความสัมพันธ์ ต่อไปนี้ :

วาดไม่ได้วาดทั้งหมด
ลูกแก้วสีเขียวเคเคเคเค
ลูกแก้วสีแดงnkN + k − n − Kเอ็น − เค
ทั้งหมดnเอ็น − เอ็นเอ็น

ที่จริงแล้ว เราสนใจที่จะคำนวณความน่าจะเป็นของการหยิบลูกแก้วสีเขียวได้ k ลูก ในการหยิบ n ครั้ง โดยที่ลูกแก้วสีเขียวมีจำนวน K ลูก จากลูกแก้วทั้งหมด N ลูก ในตัวอย่างนี้ สมมติว่ามี ลูกแก้วสีเขียว 5 ลูกและ ลูกแก้วสีแดง 45ลูก อยู่ในโถ คุณยืนอยู่ข้างโถ หลับตา แล้วหยิบ ลูกแก้ว 10ลูกโดยไม่ใส่คืน ความน่าจะเป็นที่จะได้ลูกแก้วสีเขียว 4 ลูกจาก10 ลูกนั้นคือเท่าใด

ปัญหาดังกล่าวสามารถสรุปได้ด้วยตารางความสัมพันธ์ต่อไปนี้:

วาดไม่ได้วาดทั้งหมด
ลูกแก้วสีเขียวk = 4Kk = 1เค = 5
ลูกแก้วสีแดงnk = 6N + k − n − K = 39N − K = 45
ทั้งหมดn = 10N − n = 40N = 50

ในการหาความน่าจะเป็นของการหยิบลูกแก้วสีเขียว k ลูก ในการหยิบทั้งหมด n ครั้ง จากการหยิบทั้งหมด N ครั้งเราจะกำหนดให้ X เป็นตัวแปรสุ่มแบบไฮเปอร์จีโอเมตริก เพื่อใช้สูตร

เพื่ออธิบายสูตรที่กำหนดให้ได้อย่างเข้าใจง่าย ลองพิจารณาปัญหาสมมาตรสองข้อที่แสดงโดยเอกลักษณ์ดังกล่าว

  1. ด้านซ้ายมือ - หยิบลูกแก้วทั้งหมด n ลูกออกจากโถ เราต้องการหาความน่าจะเป็นของผลลัพธ์ที่ได้ คือหยิบลูกแก้วสีเขียว k ลูก จากลูกแก้วสีเขียวทั้งหมด K ลูก และหยิบลูกแก้วสีแดง nk ลูก จากลูกแก้วสีแดงทั้งหมด NK ลูก ใน n รอบนี้
  2. ด้านขวามือ - อีกทางเลือกหนึ่งคือ การหยิบลูกแก้วทั้งหมด N ลูกออกจากโถ เราต้องการหาความน่าจะเป็นของการหยิบได้ลูกแก้วสีเขียว k ลูก ในการหยิบ n ครั้ง จากการหยิบทั้งหมด N ครั้ง และได้ลูกแก้วสีเขียว kk ลูก ในการหยิบที่เหลืออีก Nn ครั้ง

กลับมาที่การคำนวณ เราใช้สูตรข้างต้นในการคำนวณความน่าจะเป็นของการหยิบลูกแก้วสีเขียว ได้จำนวน k ลูกพอดี

โดยสัญชาตญาณแล้ว เราคาดว่าโอกาสที่ลูกแก้วสีเขียวทั้ง 5 ลูกจะอยู่ใน 10 ลูกที่หยิบออกมานั้นจะยิ่งน้อยลงไปอีก

อย่างที่คาดไว้ ความน่าจะเป็นที่จะหยิบได้ลูกแก้วสีเขียว 5 ลูกนั้น น้อยกว่าความน่าจะเป็นที่จะหยิบได้ 4 ลูก ประมาณ 35 เท่า

ความสมมาตร

สลับบทบาทของลูกแก้วสีเขียวและสีแดง:

สลับบทบาทของลูกแก้วที่ถูกวาดและลูกแก้วที่ไม่ถูกวาด:

สลับบทบาทของลูกแก้วสีเขียวและลูกแก้วที่วาดลวดลาย:

สมมาตรเหล่านี้ก่อให้เกิดกลุ่มไดเฮดรั

ลำดับการจับฉลาก

ความน่าจะเป็นของการหยิบลูกแก้วสีเขียวและสีแดงชุดใด ๆ (การแจกแจงแบบไฮเปอร์จีโอเมตริก) ขึ้นอยู่กับจำนวนลูกแก้วสีเขียวและสีแดงเท่านั้น ไม่ใช่ลำดับที่ปรากฏ กล่าวคือ เป็นการ แจกแจง แบบสลับเปลี่ยนได้ดังนั้น ความน่าจะเป็นของการหยิบลูกแก้วสีเขียวในการจับคือ[ 3 ]

นี่คือ ความน่าจะ เป็นล่วงหน้า กล่าวคือ เป็นความน่าจะเป็นที่คำนวณโดยไม่ทราบผลลัพธ์ของการสุ่มครั้งก่อนๆ

หางกระเพื่อม

ให้และ. จากนั้นสำหรับเราสามารถหาขอบเขตต่อไปนี้ได้: [ 4 ]

ที่ไหน

คือความแตกต่าง Kullback–Leiblerและใช้เพื่อ[ 5 ]

หมายเหตุ : เพื่อให้ได้ขอบเขตก่อนหน้านี้ จำเป็นต้องเริ่มต้นด้วยการสังเกตว่าเป็นตัวแปรสุ่มที่ขึ้นอยู่กันซึ่ง มีการแจกแจงเฉพาะ เนื่องจากทฤษฎีบทส่วนใหญ่เกี่ยวกับขอบเขตในผลรวมของตัวแปรสุ่มนั้นเกี่ยวข้องกับ ลำดับ ที่เป็นอิสระของตัวแปรสุ่มเหล่านั้น จึงต้องสร้างลำดับของ ตัวแปรสุ่ม อิสระที่มีการแจกแจงเดียวกัน ก่อน แล้ว จึงนำทฤษฎีบทไปใช้กับ จากนั้นพิสูจน์ได้จาก Hoeffding [ 4 ]ว่าผลลัพธ์และขอบเขตที่ได้จากกระบวนการนี้ใช้ได้กับเช่นกัน

ถ้าnมีค่ามากกว่าN /2 การใช้สมมาตรเพื่อ "กลับด้าน" ขอบเขตอาจเป็นประโยชน์ ซึ่งจะให้ผลลัพธ์ดังต่อไปนี้: [ 5 ] [ 6 ]

การอนุมานทางสถิติ

การทดสอบไฮเปอร์จีโอเมตริก

การทดสอบไฮเปอร์จีโอเมตริกใช้การแจกแจงไฮเปอร์จีโอเมตริกเพื่อวัดนัยสำคัญทางสถิติของการสุ่มตัวอย่างที่มีจำนวนความสำเร็จที่เฉพาะเจาะจง (จากจำนวนการสุ่มทั้งหมด) จากประชากรขนาดที่มีความสำเร็จจำนวนหนึ่ง ในการทดสอบการมีจำนวนความสำเร็จมากเกินไปในตัวอย่าง ค่า p ของไฮเปอร์จีโอเมตริกจะคำนวณจากความน่าจะเป็นของการสุ่มได้ความสำเร็จตั้งแต่จำนวนหนึ่งขึ้นไปจากประชากรในจำนวนการสุ่มทั้งหมด ในการทดสอบการมีจำนวนความสำเร็จน้อยเกินไป ค่า p คือความน่าจะเป็นของการสุ่มได้ความสำเร็จน้อยกว่าจำนวนหนึ่ง

โรนัลด์ ฟิชเชอร์นักชีววิทยาและนักสถิติ

การทดสอบตามการแจกแจงไฮเปอร์จีโอเมตริก (การทดสอบไฮเปอร์จีโอเมตริก) เหมือนกับการทดสอบ Fisher's exact test แบบหางเดียว ที่ สอดคล้องกัน [ 7 ]ในทางกลับกัน ค่า p ของการทดสอบ Fisher's exact test แบบสองด้านสามารถคำนวณได้จากผลรวมของการทดสอบไฮเปอร์จีโอเมตริกที่เหมาะสมสองรายการ (สำหรับข้อมูลเพิ่มเติม โปรดดู[ 8 ] )

การทดสอบนี้มักใช้เพื่อระบุว่ากลุ่มประชากรย่อยใดมีจำนวนมากเกินไปหรือน้อยเกินไปในกลุ่มตัวอย่าง การทดสอบนี้มีประโยชน์หลากหลาย ตัวอย่างเช่น ฝ่ายการตลาดสามารถใช้การทดสอบนี้เพื่อทำความเข้าใจฐานลูกค้าของตนโดยการทดสอบกลุ่มลูกค้าที่ทราบแล้วเพื่อตรวจสอบว่ากลุ่มประชากรย่อยต่างๆ (เช่น ผู้หญิง คนอายุต่ำกว่า 30 ปี) มีจำนวนมากเกินไปหรือไม่

ให้และ.

  • ถ้าเช่นนั้นจะมีการแจกแจงแบบเบอร์นูลลีที่มีพารามิเตอร์
  • สมมติให้มีการแจกแจงแบบทวินามที่มีพารามิเตอร์และ; ซึ่งจำลองจำนวนความสำเร็จในปัญหาการสุ่มตัวอย่างแบบมีการคืนกลับที่คล้ายคลึงกัน ถ้าและมีค่ามากเมื่อเทียบกับและไม่ใกล้เคียงกับ 0 หรือ 1 แล้วและจะมีการแจกแจงที่คล้ายคลึงกัน กล่าวคือ
  • ถ้ามีค่ามากและมีค่ามากเมื่อเทียบกับและไม่ได้มีค่าใกล้เคียงกับ 0 หรือ 1 แล้ว

ฟังก์ชันการแจกแจงปกติมาตรฐานอยู่ที่ไหน

ตารางต่อไปนี้อธิบายการแจกแจงสี่แบบที่เกี่ยวข้องกับจำนวนความสำเร็จในลำดับการสุ่ม:

พร้อมอะไหล่ทดแทนไม่มีการเปลี่ยนสินค้า
จำนวนการจับฉลากที่กำหนดการแจกแจงทวินามการแจกแจงไฮเปอร์จีโอเมตริก
จำนวนความล้มเหลวที่กำหนดการแจกแจงทวินามเชิงลบการแจกแจงไฮเปอร์จีโอเมตริกเชิงลบ

การแจกแจงไฮเปอร์จีโอเมตริกแบบหลายตัวแปร

การแจกแจงไฮเปอร์จีโอเมตริกแบบหลายตัวแปร
พารามิเตอร์

สนับสนุน
พีเอ็มเอฟ
หมายถึง
ความแปรปรวน

แบบจำลองของโถที่มีลูกแก้วสีเขียวและสีแดงสามารถขยายไปสู่กรณีที่มีลูกแก้วมากกว่าสองสีได้ หากมีลูกแก้วสีi จำนวน K i ลูก อยู่ในโถ และคุณสุ่มหยิบ ลูกแก้ว nลูกโดยไม่ใส่คืน จำนวนลูกแก้วแต่ละสีในตัวอย่าง ( k1 , k2 , ..., kc ) จะมีการแจกแจง แบบไฮเปอร์จีโอเมตริกหลายตัวแปร:

ความสัมพันธ์ระหว่าง การแจกแจงแบบพหุนาม กับแบบไฮเปอร์จีโอเมตริก นั้นคล้ายคลึงกับความสัมพันธ์ระหว่างการแจกแจงแบบทวินาม กล่าวคือ การแจกแจงแบบพหุนามเป็นการแจกแจงแบบ "มีการแทนที่" และการแจกแจงแบบไฮเปอร์จีโอเมตริกหลายตัวแปรเป็นการแจกแจงแบบ "ไม่มีการแทนที่"

คุณสมบัติของการกระจายนี้แสดงอยู่ในตารางที่อยู่ติดกัน[ 9 ]โดยที่cคือจำนวนสีที่แตกต่างกัน และคือจำนวนลูกแก้วทั้งหมดในโถ

ตัวอย่าง

สมมติว่าในโถมีลูกแก้วสีดำ 5 ลูก สีขาว 10 ลูก และสีแดง 15 ลูก ถ้าสุ่มหยิบลูกแก้ว 6 ลูกโดยไม่ใส่คืน ความน่าจะเป็นที่จะได้ลูกแก้วสีละ 2 ลูกพอดีคือ

การเกิดขึ้นและการประยุกต์ใช้

การยื่นขออนุญาตตรวจสอบการเลือกตั้ง

ตัวอย่างที่ใช้ในการตรวจสอบการเลือกตั้งและโอกาสที่จะพลาดการตรวจจับปัญหา

โดยทั่วไป การตรวจสอบการเลือกตั้งจะทดสอบตัวอย่างของหน่วยเลือกตั้งที่นับด้วยเครื่องจักร เพื่อดูว่าการนับใหม่ด้วยมือหรือเครื่องจักรตรงกับการนับเดิมหรือไม่ หากไม่ตรงกันจะส่งผลให้มีการรายงานหรือการนับใหม่ที่ใหญ่ขึ้น อัตราการสุ่มตัวอย่างมักถูกกำหนดโดยกฎหมาย ไม่ใช่การออกแบบทางสถิติ ดังนั้นสำหรับขนาดตัวอย่างn ที่กำหนดโดยกฎหมาย ความน่าจะเป็นที่จะพลาดปัญหาที่มีอยู่ใน หน่วยเลือกตั้ง Kหน่วย เช่น การแฮ็กหรือข้อผิดพลาดคืออะไร? นี่คือความน่าจะเป็นที่k = 0ข้อผิดพลาดมักจะไม่ชัดเจน และแฮ็กเกอร์สามารถลดการตรวจจับได้โดยส่งผลกระทบต่อหน่วยเลือกตั้งเพียงไม่กี่หน่วย ซึ่งจะยังคงส่งผลกระทบต่อการเลือกตั้งที่สูสี ดังนั้นสถานการณ์ที่เป็นไปได้คือKจะอยู่ในระดับประมาณ 5% ของNการตรวจสอบโดยทั่วไปครอบคลุม 1% ถึง 10% ของหน่วยเลือกตั้ง (มักจะ 3%) [ 10 ] [ 11 ] [ 12 ]ดังนั้นจึงมีโอกาสสูงที่จะพลาดปัญหา ตัวอย่างเช่น หากพบปัญหาใน 5 จาก 100 เขตเลือกตั้ง การสุ่มตัวอย่าง 3% จะมีโอกาส 86% ที่k = 0ซึ่งหมายความว่าจะไม่พบปัญหา และมีโอกาสเพียง 14% ที่ปัญหาจะปรากฏในตัวอย่าง ( k เป็นบวก )

จำเป็นต้องมีเขตเลือกตั้ง 45 แห่งเพื่อให้มีความน่าจะเป็นที่k  = 0 ในกลุ่มตัวอย่างต่ำกว่า 5% และด้วยเหตุนี้จึงมีความน่าจะเป็นมากกว่า 95% ที่จะพบปัญหาดังกล่าว:

ใบสมัครเล่นโป๊กเกอร์เท็กซัสโฮลเด็ม

ใน การเล่นโป๊กเกอร์ โฮลเด็มผู้เล่นจะพยายามสร้างมือที่ดีที่สุดเท่าที่จะเป็นไปได้ โดยการรวมไพ่สองใบในมือของตนเองกับไพ่ 5 ใบ (ไพ่กองกลาง) ที่จะเปิดบนโต๊ะ สำรับไพ่มี 52 ใบ และมีไพ่แต่ละดอก 13 ใบ ในตัวอย่างนี้ สมมติว่าผู้เล่นมีไพ่ดอกคลับ 2 ใบในมือ และมีไพ่ 3 ใบเปิดอยู่บนโต๊ะ ซึ่ง 2 ใบก็เป็นดอกคลับเช่นกัน ผู้เล่นต้องการทราบความน่าจะเป็นที่ไพ่ 1 ใน 2 ใบถัดไปที่จะเปิดออกมาจะเป็นดอกคลับ เพื่อให้ได้ฟลัช ( หมายเหตุ: ความน่าจะเป็นที่คำนวณในตัวอย่างนี้ สมมติว่าไม่ทราบข้อมูลเกี่ยวกับไพ่ในมือของผู้เล่นคนอื่น อย่างไรก็ตาม ผู้เล่นโป๊กเกอร์ที่มีประสบการณ์อาจพิจารณาถึงวิธีการวางเดิมพันของผู้เล่นคนอื่น (เช็ค, คอล, เรส หรือโฟลด์) ในการพิจารณาความน่าจะเป็นสำหรับแต่ละสถานการณ์ โดยทั่วไปแล้ว วิธีการคำนวณความน่าจะเป็นที่สำเร็จตามที่อธิบายไว้ที่นี่นั้นถูกต้องในสถานการณ์ที่มีผู้เล่นเพียงคนเดียวที่โต๊ะ ในเกมที่มีผู้เล่นหลายคน ความน่าจะเป็นนี้อาจมีการปรับเปลี่ยนบ้างตามการวางเดิมพันของคู่ต่อสู้)

มีไพ่ดอกจิกแสดงอยู่ 4 ใบ ดังนั้นจึงยังเหลือไพ่ดอกจิกอีก 9 ใบที่ยังไม่เห็น มีไพ่แสดงอยู่ 5 ใบ (2 ใบในมือและ 3 ใบบนโต๊ะ) ดังนั้นจึงยังเหลือไพ่ที่ยังไม่เห็นอีกจำนวนหนึ่ง

ความน่าจะเป็นที่ไพ่สองใบถัดไปที่เปิดออกมาจะเป็นดอกจิกเพียงใบเดียว สามารถคำนวณได้โดยใช้ความน่าจะเป็นแบบไฮเปอร์จีโอเมตริก โดยมีค่าและ(ประมาณ 31.64%)

ความน่าจะเป็นที่ไพ่สองใบถัดไปที่เปิดออกมาจะเป็นดอกจิกทั้งสองใบ สามารถคำนวณได้โดยใช้ความน่าจะเป็นแบบไฮเปอร์จีโอเมตริก โดยมีค่าและ(ประมาณ 3.33%)

ความน่าจะเป็นที่ไพ่สองใบถัดไปที่เปิดจะไม่ใช่ดอกจิก สามารถคำนวณได้โดยใช้ความน่าจะเป็นแบบไฮเปอร์จีโอเมตริก โดยมีค่าและ(ประมาณ 65.03%)

ใบสมัครเข้าร่วมเล่นคีโน

การแจกแจงแบบไฮเปอร์จีโอเมตริกมีความสำคัญอย่างยิ่งต่อการคำนวณ อัตราต่อรอง ของเกมคีโนในเกมคีโน จะมีการสุ่มหยิบลูกบอล 20 ลูกจากลูกบอลหมายเลข 80 ลูกในภาชนะ คล้ายกับเกมบิงโกของอเมริกาก่อนการจับรางวัลแต่ละครั้ง ผู้เล่นจะเลือกจำนวนช่อง ที่ต้องการ โดยการทำเครื่องหมายในแบบฟอร์มกระดาษที่จัดเตรียมไว้ให้ ตัวอย่างเช่น ผู้เล่นอาจเลือกเล่น 6 ช่องโดยทำเครื่องหมาย 6 หมายเลข ตั้งแต่ 1 ถึง 80 จากนั้น (หลังจากผู้เล่นทุกคนนำแบบฟอร์มไปที่แคชเชียร์และได้รับสำเนาแบบฟอร์มที่ทำเครื่องหมายไว้แล้ว และจ่ายเงินเดิมพัน) จะมีการหยิบลูกบอล 20 ลูก ลูกบอลบางลูกที่หยิบได้อาจตรงกับหมายเลขที่ผู้เล่นเลือกไว้บางส่วนหรือทั้งหมด โดยทั่วไปแล้ว ยิ่งมีจำนวน ลูกที่ตรงกับหมายเลขที่ผู้เล่นเลือกมากเท่าไหร่ (ลูกบอลที่หยิบได้ตรงกับหมายเลขที่ผู้เล่นเลือก) ก็ยิ่งได้รับเงินรางวัลมากขึ้นเท่านั้น

ตัวอย่างเช่น หากลูกค้าเดิมพัน (เล่น) 1 ดอลลาร์สำหรับเลข 6 (ซึ่งเป็นตัวอย่างที่พบได้ไม่บ่อยนัก) และถูก 4 ใน 6 ตัว คาสิโนจะจ่ายเงินรางวัล 4 ดอลลาร์ อัตราการจ่ายเงินรางวัลอาจแตกต่างกันไปในแต่ละคาสิโน แต่ 4 ดอลลาร์เป็นค่าทั่วไป ความน่าจะเป็นของเหตุการณ์นี้คือ:

ในทำนองเดียวกัน โอกาสที่จะถูก 5 หมายเลขจาก 6 หมายเลขที่เลือกนั้นค่อนข้างน้อย ในขณะที่เงินรางวัลโดยทั่วไปอาจอยู่ที่ 88 ดอลลาร์ ส่วนการถูกทั้ง 6 หมายเลขจะได้รับเงินรางวัลประมาณ 1500 ดอลลาร์ (ความน่าจะเป็น ≈ 0.000128985 หรือ 7752 ต่อ 1) เงินรางวัลอื่นที่ไม่ใช่ศูนย์อาจมีเพียง 1 ดอลลาร์สำหรับการถูก 3 หมายเลข (เช่น คุณได้รับเงินเดิมพันคืน) ซึ่งมีความน่าจะเป็นใกล้เคียงกับ 0.129819548

เมื่อนำผลรวมของผลคูณของเงินรางวัลกับความน่าจะเป็นที่สอดคล้องกันมาคำนวณ เราจะได้ผลตอบแทนที่คาดหวังอยู่ที่ 0.70986492 หรือประมาณ 71% สำหรับการเล่น 6 สล็อต ซึ่งหมายความว่าเจ้ามือได้เปรียบ 29% สล็อตอื่นๆ ที่เล่นก็มีผลตอบแทนที่คาดหวังใกล้เคียงกัน ผลตอบแทนที่ต่ำมากนี้ (สำหรับผู้เล่น) มักอธิบายได้จากค่าใช้จ่ายคงที่จำนวนมาก (พื้นที่ อุปกรณ์ บุคลากร) ที่จำเป็นสำหรับการเล่นเกม

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Hypergeometric_distribution&oldid=1355379233#Multivariate_hypergeometric_distribution "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การแจกแจงไฮเปอร์จีโอเมตริก

1nเค(เอ็น−เค)(เอ็น−n)(เอ็น−2)(เอ็น−3)⋅{\displaystyle \left.{\frac {1}{nK(NK)(Nn)(N-2)(N-3)}}\cdot \right.

ฟังก์ชันมวลความน่าจะเป็น

เงื่อนไขต่อไปนี้เป็นลักษณะเฉพาะของการแจกแจงแบบไฮเปอร์จีโอเมตริก:

ตัวอย่างการทำงาน

การประยุกต์ใช้การแจกแจงไฮเปอร์จีโอเมตริกแบบคลาสสิกคือ การสุ่มตัวอย่างโดยไม่ใส่คืน ลองนึกถึง โถ ที่มี ลูกแก้ว สองสีคือสีแดงและสีเขียว กำหนดให้การหยิบลูกแก้วสีเขียวเป็นการสำเร็จ และการหยิบลูกแก้วสีแดงเป็นการล้มเหลว ให้ N แทนจำนวน ลูกแก้วทั้งหมดในโถ...

ลำดับการจับฉลาก

ความน่าจะเป็นของการหยิบลูกแก้วสีเขียวและสีแดงชุดใด ๆ (การแจกแจงแบบไฮเปอร์จีโอเมตริก) ขึ้นอยู่กับจำนวนลูกแก้วสีเขียวและสีแดงเท่านั้น ไม่ใช่ลำดับที่ปรากฏ กล่าวคือ เป็นการ แจกแจง แบบสลับเปลี่ยนได้ ดังนั้น ความน่าจะเป็นของการหยิบลูกแก้วสีเขียวในการจับคือ [ 3 ] i...