อ่าน 38 นาที
การแจกแจงปัวซง
ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจงปัวซง ( / ˈ p w ɑː s ɒ n / ) เป็นการ แจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ที่แสดงความน่าจะเป็นของการเกิด เหตุการณ์...
การแจกแจงปัวซง
| การแจกแจงปัวซง | |||
|---|---|---|---|
ฟังก์ชันมวลความน่าจะเป็น แกนแนวนอนคือดัชนีkซึ่งเป็นจำนวนครั้งที่เกิดขึ้นλคืออัตราการเกิดเหตุการณ์ที่คาดหวัง แกนแนวตั้งคือความน่าจะเป็นของการเกิดเหตุการณ์k ครั้ง เมื่อกำหนดค่า λแล้ว ฟังก์ชันนี้กำหนดได้เฉพาะที่ค่าk เป็นจำนวนเต็ม เท่านั้น เส้นเชื่อมระหว่างแกนเป็นเพียงเส้นนำสายตาเท่านั้น | |||
ฟังก์ชันการกระจายสะสม แกนแนวนอนคือดัชนีkซึ่งเป็นจำนวนครั้งที่เกิดขึ้น ฟังก์ชันการกระจายสะสม (CDF) จะไม่ต่อเนื่องที่จำนวนเต็มkและจะราบเรียบที่จุดอื่นๆ เนื่องจากตัวแปรที่มีการกระจายแบบปัวซงจะมีค่าเป็นจำนวนเต็มเท่านั้น | |||
| สัญกรณ์ | |||
| พารามิเตอร์ | (ประเมิน) | ||
| สนับสนุน | ( จำนวนธรรมชาติเริ่มต้นจาก 0) | ||
| พีเอ็มเอฟ | |||
| ซีดีเอฟ | หรือหรือ (โดยที่คือฟังก์ชันแกมมาไม่สมบูรณ์บนคือฟังก์ชันพื้นและคือฟังก์ชันแกมมาแบบปรับค่า ) | ||
| หมายถึง | |||
| ค่ามัธยฐาน | |||
| โหมด | |||
| ความแปรปรวน | |||
| ความเบี่ยงเบน | |||
| ความโค้งส่วนเกิน | |||
| เอนโทรปี | หรือสำหรับขนาดใหญ่ | ||
| เอ็มจีเอฟ | |||
| ซีเอฟ | |||
| พีจีเอฟ | |||
| ข้อมูลของฟิชเชอร์ | |||
ในทฤษฎีความน่าจะเป็นและสถิติการแจกแจงปัวซง ( / ˈ p w ɑː s ɒ n / ) เป็นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ที่แสดงความน่าจะเป็นของการเกิด เหตุการณ์จำนวนหนึ่งในช่วงเวลาที่กำหนด หากเหตุการณ์เหล่านี้เกิดขึ้นด้วยอัตราเฉลี่ยคงที่ที่ทราบ และเป็นอิสระจากเวลาตั้งแต่เหตุการณ์สุดท้าย[ 1 ]นอกจากนี้ยังสามารถใช้สำหรับจำนวนเหตุการณ์ในช่วงเวลาประเภทอื่นที่ไม่ใช่เวลา และในมิติที่มากกว่า 1 (เช่น จำนวนเหตุการณ์ในพื้นที่หรือปริมาตรที่กำหนด) การแจกแจงปัวซงตั้งชื่อตามนักคณิตศาสตร์ชาวฝรั่งเศสSiméon Denis Poissonมีบทบาทสำคัญในการแจกแจงแบบเสถียรไม่ต่อเนื่อง
ภายใต้การแจกแจงปัวซงที่คาดหวังเหตุการณ์λในช่วงเวลาที่กำหนด ความน่าจะเป็นของเหตุการณ์k ในช่วงเวลาเดียวกันคือ: [ 2 ] : 60 ตัวอย่างเช่น พิจารณาศูนย์บริการลูกค้าที่รับสายโดยเฉลี่ยλ = 3สายต่อนาทีตลอดเวลา หากจำนวนสายที่ได้รับในช่วงเวลาสองช่วงใดๆ ที่ไม่ทับซ้อนกันเป็นอิสระต่อกัน จำนวนสาย k ที่ได้รับในนาทีใดๆ จะมีการแจกแจงความน่าจะเป็นแบบปัวซง การรับสาย k = 1 ถึง 4สายจะมีความน่าจะเป็นประมาณ 0.77 ในขณะที่การรับสาย 0 หรืออย่างน้อย 5 สายจะมีความน่าจะเป็นประมาณ 0.23
ตัวอย่างคลาสสิกที่ใช้เพื่อกระตุ้นให้เกิดการแจกแจงแบบปัวซงคือจำนวน เหตุการณ์ การสลายตัวของกัมมันตรังสีในช่วงระยะเวลาการสังเกตที่กำหนด[ 3 ]
ประวัติศาสตร์
การนำเสนอการแจกแจงปัวซงได้รับการยกย่องให้แก่นักคณิตศาสตร์และนักฟิสิกส์ชาวฝรั่งเศสSiméon Denis Poisson (1781–1840) ซึ่งตีพิมพ์พร้อมกับทฤษฎีความน่าจะเป็นของเขาในRecherches sur la probabilité des jugements en matière criminelle et en matière civile (1837) [ 4 ] : 205-207 งานนี้ตั้งทฤษฎีเกี่ยวกับจำนวนการตัดสินผิดพลาดในประเทศหนึ่งๆ โดยมุ่งเน้นไปที่ตัวแปรสุ่มN บางตัว ที่นับจำนวนเหตุการณ์ที่เกิดขึ้นในช่วงเวลาที่กำหนด อย่างไรก็ตาม ผลลัพธ์ที่คล้ายกันนี้เคยมีมาก่อนแล้วในปี 1711 โดยAbraham de MoivreในDe Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus [ 5 ] : 219 [ 6 ] : 14-15 [ 7 ] : 193 [ 8 ] : 157 สิ่งนี้ทำให้เป็นตัวอย่างของกฎของ Stiglerและกระตุ้นให้ผู้เขียนบางคนโต้แย้งว่าการแจกแจงปัวซงควรใช้ชื่อว่า de Moivre [ 9 ] [ 10 ]
ในปี พ.ศ. 2403 Simon Newcombได้ปรับการแจกแจงแบบปัวซงให้เข้ากับจำนวนดาวที่พบในหน่วยของพื้นที่[ 11 ] การประยุกต์ใช้ในทางปฏิบัติเพิ่มเติมเกิดขึ้นโดยLadislaus Bortkiewiczในปี พ.ศ. 2441 Bortkiewicz แสดงให้เห็นว่าความถี่ที่ทหารในกองทัพปรัสเซียถูกม้าเตะจนเสียชีวิตโดยอุบัติเหตุนั้นสามารถจำลองได้อย่างดีด้วยการแจกแจงแบบปัวซง[ 12 ] : 23-25
คำจำกัดความ
ฟังก์ชันมวลความน่าจะเป็น
ตัวแปรสุ่ม แบบ ไม่ต่อเนื่อง Xกล่าวได้ว่ามีการแจกแจงแบบปัวซงที่มีพารามิเตอร์ถ้ามีฟังก์ชันมวลความน่าจะเป็นที่กำหนดโดย: [ 2 ] : 60 โดยที่
- kคือจำนวนครั้งที่เกิดขึ้น ( )
- eคือจำนวนของออยเลอร์ ( )
- k ! = k ( k– 1) ··· (3)(2)(1)คือแฟกทอเรียล
จำนวนจริง บวกλเท่ากับค่าที่คาดหวังของXและเท่ากับความแปรปรวน ของมัน ด้วย[ 13 ]
การแจกแจงปัวซงสามารถนำไปใช้กับระบบที่มีเหตุการณ์ที่เป็นไปได้จำนวนมาก ซึ่งแต่ละเหตุการณ์เกิดขึ้นได้ยากจำนวนเหตุการณ์ดังกล่าวที่เกิดขึ้นในช่วงเวลาที่กำหนดนั้น ภายใต้เงื่อนไขที่เหมาะสม จะเป็นจำนวนสุ่มที่มีการแจกแจงแบบปัวซง
สมการสามารถปรับเปลี่ยนได้ หากแทนที่จะใช้จำนวนเหตุการณ์เฉลี่ยเราได้รับอัตราเฉลี่ยที่เหตุการณ์เกิดขึ้น จากนั้นและ: [ 14 ]
ตัวอย่าง
การแจกแจงแบบปัวซงอาจมีประโยชน์ในการจำลองเหตุการณ์ต่างๆ เช่น:
- จำนวนอุกกาบาตที่มีเส้นผ่านศูนย์กลางมากกว่าหนึ่งเมตรที่พุ่งชนโลกในหนึ่งปี
- จำนวนโฟตอนเลเซอร์ที่ตกกระทบตัวตรวจจับในช่วงเวลาที่กำหนด
- จำนวนนักเรียนที่ได้คะแนนต่ำและคะแนนสูงในการสอบ และ
- ตำแหน่งของข้อบกพร่องและการเคลื่อนตัวในวัสดุ
ตัวอย่างของการเกิดจุดสุ่มในอวกาศ ได้แก่ ตำแหน่งที่ดาวเคราะห์น้อยพุ่งชนโลก (2 มิติ) ตำแหน่งของความไม่สมบูรณ์ในวัสดุ (3 มิติ) และตำแหน่งของต้นไม้ในป่า (2 มิติ) [ 15 ]
ข้อสมมติฐานและความถูกต้อง
การแจกแจงปัวซงเป็นแบบจำลองที่เหมาะสมหากข้อสมมติฐานต่อไปนี้เป็นจริง:
- kเป็นจำนวนเต็มที่ไม่เป็นลบ ซึ่งระบุจำนวนครั้งที่เหตุการณ์เกิดขึ้นในช่วงเวลาหนึ่ง
- การเกิดเหตุการณ์หนึ่งไม่ได้ส่งผลต่อโอกาสที่จะเกิดเหตุการณ์ที่สอง
- อัตราเฉลี่ยของการเกิดเหตุการณ์นั้นไม่ขึ้นอยู่กับการเกิดเหตุการณ์ใดๆ
- เหตุการณ์สองเหตุการณ์ไม่สามารถเกิดขึ้นพร้อมกันในเวลาเดียวกันได้อย่างแม่นยำ
ถ้าเงื่อนไขเหล่านี้เป็นจริง แสดงว่าkเป็นตัวแปรสุ่มปัวซง และการแจกแจงของkก็เป็นการแจกแจงปัวซงเช่นกัน
การแจกแจงปัวซงยังเป็นลิมิตของการแจกแจงทวินามซึ่งความน่าจะเป็นของความสำเร็จในการทดลองแต่ละครั้งคือโดยที่คือค่าคาดหวัง และคือจำนวนครั้งของการทดลอง ในลิมิตที่โดยที่ คงที่ [ 16 ] [ 17 ] (ดูการแจกแจงที่เกี่ยวข้อง ):
การแจกแจงปัวซงอาจได้มาจากสมการเชิงอนุพันธ์ด้วยเช่นกัน[ 18 ] [ 19 ] [ 20 ]
โดยมีเงื่อนไขเริ่มต้นและประเมินผลที่
ตัวอย่างความน่าจะเป็นสำหรับการแจกแจงปัวซง
ในแม่น้ำสายหนึ่ง น้ำท่วมล้นตลิ่งเกิดขึ้นโดยเฉลี่ยทุกๆ 100 ปี จงคำนวณความน่าจะเป็นของการเกิด น้ำท่วมล้นตลิ่งจำนวน k = 0, 1, 2, 3, 4, 5 หรือ 6 ครั้ง ในช่วงเวลา 100 ปี โดยสมมติว่าแบบจำลองปัวซงเหมาะสม เนื่องจากอัตราการเกิดเหตุการณ์โดยเฉลี่ยคือน้ำท่วมล้นหนึ่งครั้งต่อ 100 ปี ดังนั้นλ = 1 |
ความน่าจะเป็นของการเกิดน้ำท่วมล้นตลิ่ง 0 ถึง 6 ครั้ง ในช่วงเวลา 100 ปี |
ในตัวอย่างนี้ มีรายงานว่าจำนวนประตูเฉลี่ยในการแข่งขันฟุตบอลโลกอยู่ที่ประมาณ 2.5 และแบบจำลองปัวซงมีความเหมาะสม[ 21 ] เนื่องจากอัตราการเกิดเหตุการณ์เฉลี่ยอยู่ที่ 2.5 ประตูต่อแมตช์ ดังนั้นλ = 2.5 |
โอกาสที่จะเกิดประตูตั้งแต่ 0 ถึง 7 ประตูในหนึ่งแมตช์ |
ตัวอย่างที่ละเมิดข้อสมมติฐานของปัวซง
จำนวนนักเรียนที่มาถึงอาคารสโมสรนักศึกษาต่อนาทีนั้น อาจจะไม่เป็นไปตามการแจกแจงแบบปัวซง เนื่องจากอัตราการมาถึงไม่คงที่ (อัตราต่ำในช่วงเวลาเรียน อัตราสูงระหว่างช่วงเวลาเรียน) และการมาถึงของนักเรียนแต่ละคนก็ไม่เป็นอิสระต่อกัน (นักเรียนมักจะมาเป็นกลุ่ม) อัตราการมาถึงที่ไม่คงที่นี้อาจจำลองได้ด้วยการแจกแจงแบบปัวซงผสมและการมาถึงของกลุ่มนักเรียนแทนที่จะเป็นนักเรียนแต่ละคนอาจ จำลองได้ด้วย การแจกแจงแบบปัวซงเชิงประกอบ
จำนวนแผ่นดินไหวขนาด 5 ริกเตอร์ต่อปีในประเทศหนึ่ง อาจไม่เป็นไปตามการกระจายแบบปัวซง หากแผ่นดินไหวขนาดใหญ่ครั้งหนึ่งเพิ่มความน่าจะเป็นของการเกิดแผ่นดินไหวตามมาที่มีขนาดใกล้เคียงกัน
ตัวอย่างที่รับประกันว่าจะมีเหตุการณ์อย่างน้อยหนึ่งเหตุการณ์เกิดขึ้นนั้น ไม่ได้มีการแจกแจงแบบปัวซง แต่สามารถจำลองได้โดยใช้การแจกแจงแบบปัวซงที่ตัดศูนย์ออก
การแจกแจงจำนวนนับที่จำนวนช่วงเวลาที่มีเหตุการณ์เป็นศูนย์สูงกว่าที่คาดการณ์โดยแบบจำลองปัวซง อาจสร้างแบบจำลองได้โดยใช้แบบจำลองที่มีค่าศูนย์มากเกินไป (zero-inflated model )
คุณสมบัติ
สถิติเชิงพรรณนา
- ค่าที่คาดหวังของตัวแปรสุ่มปัวซงคือλ
- ค่าความแปรปรวนของตัวแปรสุ่มปัวซงก็คือλ เช่น กัน
- ค่าสัมประสิทธิ์ความแปรผันคือในขณะที่ดัชนีการกระจายตัวคือ 1 [ 8 ] : 163
- ค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยรอบค่าเฉลี่ยคือ[ 8 ] : 163
- โหมด ของตัวแปรสุ่มที่มีการแจกแจงแบบปัวซง โดยที่ λไม่ใช่จำนวนเต็มจะเท่ากับ ซึ่งเป็นจำนวนเต็มที่มากที่สุด ที่น้อยกว่าหรือเท่ากับ λเขียนได้อีกแบบว่าfloor ( λ )เมื่อλเป็นจำนวนเต็มบวก โหมดจะเป็นλและλ − 1
- ค่า สะสมทั้งหมดของการแจกแจงปัวซงมีค่าเท่ากับค่าคาดหวัง λ โมเมนต์แฟกทอเรียลลำดับที่n ของการแจกแจงปัวซงคือλ n
- ค่าที่คาดหวังของกระบวนการปัวซงบางครั้งจะถูกแยกออกเป็นผลคูณของความเข้มและการสัมผัส (หรือโดยทั่วไปแล้วจะแสดงเป็นปริพันธ์ของ "ฟังก์ชันความเข้ม" ในช่วงเวลาหรือพื้นที่ ซึ่งบางครั้งเรียกว่า "การสัมผัส") [ 22 ]
ค่ามัธยฐาน
ขอบเขตสำหรับค่ามัธยฐาน ( ) ของการกระจายเป็นที่ทราบและมีความแม่นยำ : [ 23 ]
ช่วงเวลาที่สูงกว่า
โมเมนต์ ที่ไม่เป็นศูนย์กลางที่สูงกว่าm kของการแจกแจงปัวซงคือพหุนาม Touchardในλ : โดยที่วงเล็บปีกกา { } หมายถึงจำนวน Stirling ชนิดที่สอง [ 24 ] [ 1 ] : 6 กล่าวอีกนัยหนึ่ง เมื่อค่าที่คาดหวังถูกตั้งค่าเป็นλ = 1สูตรของ Dobinskiบ่งชี้ว่า โมเมนต์ลำดับที่ nเท่ากับจำนวนพาร์ติชันของเซตที่ มีขนาดn
ขอบเขตบนแบบง่ายคือ: [ 25 ]
ผลรวมของตัวแปรสุ่มที่มีการแจกแจงแบบปัวซง
ถ้าสำหรับเป็นอิสระต่อกันแล้ว[ 26 ] : 65 บทกลับคือทฤษฎีบทของ Raikovซึ่งกล่าวว่า ถ้าผลรวมของตัวแปรสุ่มอิสระสองตัวมีการแจกแจงแบบปัวซง ตัวแปรสุ่มอิสระทั้งสองตัวนั้นก็จะมีการแจกแจงแบบปัวซงเช่นกัน[ 27 ] [ 28 ]
เอนโทรปีสูงสุด
เป็นการแจกแจงเอนโทรปีสูงสุดในเซตของการแจกแจงทวินามทั่วไป ที่มี ค่าเฉลี่ยและ[ 29 ]โดยที่การแจกแจงทวินามทั่วไปถูกกำหนดให้เป็นการแจกแจงผลรวมของตัวแปรเบอร์นูลีอิสระจำนวน N ตัวแต่ไม่ได้แจกแจงเหมือนกัน
คุณสมบัติอื่นๆ
- การแจกแจงปัวซงเป็นการแจกแจงความน่าจะเป็นที่แบ่งได้ไม่จำกัด[ 30 ] : 233 [ 8 ] : 164
- ความแตกต่าง แบบKullback–Leibler ที่มีทิศทาง ของจากกำหนดโดย
- ถ้าเป็นจำนวนเต็มจะต้องเป็นไปตามเงื่อนไขและ[ 31 ]
- ขอบเขตสำหรับความน่าจะเป็นส่วนหางของตัวแปรสุ่มปัวซงสามารถหาได้โดยใช้การอ้างเหตุผลขอบเขตของเชอร์นอฟ[ 32 ] : 97-98
- ความน่าจะ เป็นของหางด้านบนสามารถกระชับได้ (อย่างน้อยสองเท่า) ดังนี้: [ 33 ]โดยที่คือความแตกต่างของ Kullback–Leibler จาก
- อสมการที่เชื่อมโยงฟังก์ชันการกระจายสะสมของตัวแปรสุ่มปัวซงกับฟังก์ชันการกระจายสะสมของการกระจายปกติมาตรฐานมีดังนี้: [ 34 ]
โดยที่ค่าความแตกต่างแบบ Kullback–Leibler ของมาจากและค่าความแตกต่างแบบ Kullback–Leibler ของมาจาก
การแข่งขันปัวซง
ให้และเป็นตัวแปรสุ่มอิสระ โดยที่ แล้วเราจะได้ว่า
ขอบเขตบนได้รับการพิสูจน์โดยใช้ขอบเขตเชอร์นอฟมาตรฐาน
ขอบล่างสามารถพิสูจน์ได้โดยสังเกตว่าคือความน่าจะเป็นที่ ซึ่งซึ่งมีขอบเขตล่างโดย โดยที่คือเอนโทรปีสัมพัทธ์ (ดูรายละเอียดในหัวข้อขอบเขตของหางของการแจกแจงแบบทวินาม) นอกจากนี้ การสังเกตว่าและการคำนวณขอบล่างของความน่าจะเป็นแบบไม่มีเงื่อนไขจะให้ผลลัพธ์ รายละเอียดเพิ่มเติมสามารถพบได้ในภาคผนวกของ Kamath et al. [ 35 ]
การแจกแจงที่เกี่ยวข้อง
เป็นการแจกแจงแบบทวินามที่มีช่วงเวลาเล็ก ๆ
การแจกแจงปัวซงสามารถหาได้จากกรณีจำกัดของการแจกแจงทวินามเมื่อจำนวนการทดลองเข้าสู่ค่าอนันต์ และจำนวนความสำเร็จที่คาดหวัง ยังคงคงที่ — ดู หลักการของเหตุการณ์หายากด้านล่าง ดังนั้นจึงสามารถใช้เป็นการประมาณค่าของการแจกแจงทวินามได้หากnมีขนาดใหญ่พอและpมีขนาดเล็กพอ การแจกแจงปัวซงเป็นการประมาณค่าที่ดีของการแจกแจงทวินามหากnมีค่าอย่างน้อย 20 และpมีค่าน้อยกว่าหรือเท่ากับ 0.05 และเป็นการประมาณค่าที่ดีเยี่ยมหากn ≥ 100และnp ≤ 10 [ 36 ] ให้และเป็นฟังก์ชันความหนาแน่นสะสมของการแจกแจงทวินามและการแจกแจงปัวซงตามลำดับ จะได้ว่า: การพิสูจน์อย่างหนึ่งของสิ่งนี้ใช้ฟังก์ชันสร้างความน่าจะเป็น [ 37 ] พิจารณาการทดลองแบบเบอร์นูลลี (การโยนเหรียญ) ซึ่งความน่าจะเป็นของความสำเร็จหนึ่งครั้ง (หรือจำนวนความสำเร็จที่คาดหวัง) อยู่ภายในช่วงเวลาที่กำหนด แบ่งช่วงเวลาออกเป็นnส่วน และทำการทดลองในแต่ละช่วงย่อยด้วยความน่าจะเป็นความน่าจะเป็นของ ความสำเร็จ kครั้งจาก การทดลอง nครั้งตลอดทั้งช่วงเวลาจะกำหนดโดยการแจกแจงทวินาม ซึ่งมีฟังก์ชันก่อกำเนิดคือ: เมื่อพิจารณาลิมิตเมื่อnเพิ่มขึ้นเป็นอนันต์ (โดยที่xคงที่) และใช้คำจำกัดความของลิมิตผลคูณของฟังก์ชันเลขชี้กำลังจะได้ฟังก์ชันก่อกำเนิดของการแจกแจงปัวซง:
ทั่วไป
- ถ้าและเป็นอิสระต่อกัน ผลต่างจะเป็นไปตามการแจกแจงแบบสเกลลัม (Skellam distribution )
- ถ้าและเป็นอิสระต่อกัน การแจกแจงของโดยมีเงื่อนไขว่า เป็นการแจกแจงทวินามโดยเฉพาะอย่างยิ่งถ้าหากว่าโดยทั่วไปแล้ว ถ้าX 1 , X 2 , ..., X nเป็นตัวแปรสุ่มปัวซงอิสระที่มีพารามิเตอร์λ 1 , λ 2 , ..., λ nแล้วเมื่อพิจารณาแล้ว จึงสรุปได้ว่าในความเป็นจริง
- ถ้าการแจกแจงของX = kเป็นการแจกแจงแบบทวินามการแจกแจงของ Y จะเป็นการแจกแจงแบบปัวซงในความเป็นจริง ถ้า การแจกแจงของ Y เป็นการแจกแจงแบบ พหุนาม การแจกแจงของ Y จะเป็นการแจกแจงแบบปัวซงที่เป็นอิสระต่อกัน
- การแจกแจงปัวซงเป็นกรณีพิเศษของการแจกแจงปัวซงแบบผสมแบบไม่ต่อเนื่อง (หรือการแจกแจงปัวซงแบบกระตุก) ที่มีพารามิเตอร์เพียงตัวเดียว[ 38 ] [ 39 ]การแจกแจงปัวซงแบบผสมแบบไม่ต่อเนื่องสามารถอนุมานได้จากการแจกแจงจำกัดของการแจกแจงพหุนามแบบเอกตัวแปร นอกจากนี้ยังเป็นกรณีพิเศษของการแจกแจงปัวซงแบบผสมอีก ด้วย
- สำหรับค่าλ ที่มีขนาดใหญ่เพียงพอ (เช่นλ > 1000 ) การแจกแจงปกติที่มีค่าเฉลี่ยλและความแปรปรวนλ (ส่วนเบี่ยงเบนมาตรฐาน) เป็นการประมาณค่าที่ดีเยี่ยมของการแจกแจงปัวซง หากλมากกว่าประมาณ 10 การแจกแจงปกติจะเป็นการประมาณค่าที่ดีหาก มี การแก้ไขความต่อเนื่อง ที่เหมาะสม กล่าวคือ หากP( X ≤ x )โดยที่xเป็นจำนวนเต็มที่ไม่เป็นลบ ถูกแทนที่ด้วยP( X ≤ x + 0.5 )
- การแปลงที่ทำให้ความแปรปรวนคงที่ : ถ้าเช่นนั้น[ 8 ] : 168 และ[ 40 ] : 196 ภายใต้การแปลงนี้ การลู่เข้าสู่ภาวะปกติ (เมื่อเพิ่มขึ้น) จะเร็วกว่าตัวแปรที่ไม่ได้แปลงมาก การแปลงที่ทำให้ความแปรปรวนคงที่ที่ซับซ้อนกว่าเล็กน้อยก็มีอยู่[ 8 ] : 168 หนึ่งในนั้นคือ การ แปลงAnscombe [ 41 ]ดูการแปลงข้อมูล (สถิติ)สำหรับการใช้งานการแปลงทั่วไปเพิ่มเติม
- ถ้าสำหรับทุกt > 0จำนวนการมาถึงในช่วงเวลา[0, t ]เป็นไปตามการแจกแจงปัวซงที่มีค่าเฉลี่ยλtแล้วลำดับของเวลาระหว่างการมาถึงจะเป็นตัวแปรสุ่มเอกซ์โพเนนเชียลที่เป็นอิสระและมีการแจกแจงเหมือนกัน โดยมีค่าเฉลี่ย 1/ λ [ 42 ] : 317–319
- ฟังก์ชันการกระจายสะสมของการกระจายแบบปัวซงและไคกำลังสองมีความสัมพันธ์กันในลักษณะต่อไปนี้: [ 8 ] : 167 และ[ 8 ] : 158
การประมาณค่าปัวซง
สมมติว่า[ 43 ] มีการแจกแจงแบบพหุนาม โดยมี เงื่อนไขว่า
หมายความว่า[ 32 ] : 101-102 ในบรรดาสิ่งอื่นๆ สำหรับฟังก์ชันที่ไม่เป็นลบใดๆ หากมีการแจกแจงแบบพหุนามแล้ว โดย ที่
สามารถแทนค่าตัวประกอบของ ด้วย 2 ได้ หาก ถือว่า เป็นฟังก์ชันที่เพิ่มขึ้นหรือลดลงอย่างต่อเนื่อง
การแจกแจงปัวซงแบบสองตัวแปร
การแจกแจงนี้ได้รับการขยายไปยังกรณีสองตัวแปร[ 44 ]ฟังก์ชันก่อกำเนิดสำหรับการแจกแจงนี้คือ ด้วย
การแจกแจงแบบมาร์จินัลคือการแจกแจงปัวซง ( θ 1 )และการแจกแจงปัวซง ( θ 2 )และค่าสัมประสิทธิ์สหสัมพันธ์ถูกจำกัดอยู่ในช่วง
วิธีง่ายๆ ในการสร้างการแจกแจงปัวซงแบบสองตัวแปรคือการนำการแจกแจงปัวซงอิสระสามแบบที่มีค่าเฉลี่ยมากำหนดฟังก์ชันความน่าจะเป็นของการแจกแจงปัวซงแบบสองตัวแปรคือ
การแจกแจงปัวซงแบบอิสระ
การแจกแจงปัวซงแบบอิสระ[ 45 ]ที่มีขนาดและอัตราการ กระโดด เกิดขึ้นใน ทฤษฎี ความน่าจะเป็นแบบอิสระเป็นขีดจำกัดของการสังเคราะห์แบบอิสระ ซ้ำๆ เมื่อN → ∞
กล่าว อีกนัยหนึ่ง ให้ และเป็นตัวแปรสุ่ม โดยที่มีค่าด้วยความน่าจะเป็นและมีค่า 0 ด้วยความน่าจะเป็นที่เหลือ สมมติว่า กลุ่มเป็นอิสระต่อกันอย่างอิสระแล้วลิมิตเมื่อของกฎของจะได้จากกฎปัวซงอิสระที่มีพารามิเตอร์
คำจำกัดความนี้คล้ายคลึงกับวิธีการหนึ่งในการได้มาซึ่งการแจกแจงปัวซงแบบคลาสสิกจากกระบวนการปัวซง (แบบคลาสสิก)
มาตรการที่เกี่ยวข้องกับกฎปัวซงอิสระจะได้รับจาก[ 46 ] โดยที่ และมีการรองรับ
กฎนี้ยังปรากฏในทฤษฎีเมทริกซ์สุ่ม ในรูปของ กฎมาร์เชนโก-ปาสตูร์ค่าคุมูลันต์อิสระของกฎนี้เท่ากับ
การแปลงบางส่วนของกฎนี้
เราให้ค่าของการแปลงที่สำคัญบางอย่างของกฎปัวซงอิสระ การคำนวณสามารถพบได้ในหนังสือLectures on the Combinatorics of Free Probabilityโดย A. Nica และ R. Speicher [ 47 ]
การแปลง R ของกฎปัวซงอิสระกำหนดโดย
การแปลงโคชี (ซึ่งเป็นการแปลงกลับของการแปลงสติลต์เจส ) กำหนดโดย
การแปลง S กำหนดโดย ในกรณีที่
การอนุมานทางสถิติ
การประมาณค่าพารามิเตอร์
เมื่อกำหนดตัวอย่าง ค่าที่วัดได้ nค่าสำหรับi = 1, ..., nเราต้องการประมาณค่าพารามิเตอร์λของประชากรปัวซงที่ดึงตัวอย่างมา การประมาณค่า ความน่าจะเป็นสูงสุดคือ[ 48 ]
เนื่องจากแต่ละการสังเกตมีค่าเฉลี่ยλดังนั้นค่าเฉลี่ยของตัวอย่างจึงมีค่าเฉลี่ย λ เช่นกัน ด้วยเหตุนี้ การประมาณค่าความน่าจะเป็นสูงสุดจึงเป็นตัวประมาณค่าที่ไม่เอนเอียงของλนอกจากนี้ยังเป็นตัวประมาณค่าที่มีประสิทธิภาพ เนื่องจากความแปรปรวนของมันบรรลุขอบเขตล่างของ Cramér–Rao (CRLB) [ 49 ]ดังนั้นจึงเป็นตัวประมาณค่าที่ไม่เอนเอียงที่มีความแปรปรวนต่ำสุด นอกจากนี้ยังสามารถพิสูจน์ได้ว่าผลรวม (และด้วยเหตุนี้ค่าเฉลี่ย ของ ตัวอย่าง เนื่องจากเป็นฟังก์ชันหนึ่งต่อหนึ่งของผลรวม) เป็นสถิติที่สมบูรณ์และเพียงพอสำหรับλ
เพื่อพิสูจน์ความเพียงพอ เราอาจใช้ทฤษฎีบทการแยกตัวประกอบพิจารณาการแบ่งฟังก์ชันความน่าจะเป็นมวลของการแจกแจงปัวซงร่วมสำหรับตัวอย่างออกเป็นสองส่วน: ส่วนหนึ่งที่ขึ้นอยู่กับตัวอย่างเท่านั้นเรียกว่าและอีกส่วนหนึ่งที่ขึ้นอยู่กับพารามิเตอร์และตัวอย่างผ่านฟังก์ชันเท่านั้นดังนั้น จึงเป็นสถิติที่เพียงพอสำหรับ
พจน์แรกขึ้นอยู่กับเท่านั้นพจน์ที่สองขึ้นอยู่กับตัวอย่างผ่านทางเท่านั้นดังนั้นจึงเพียงพอแล้ว
ในการหาค่าพารามิเตอร์λที่ทำให้ฟังก์ชันความน่าจะเป็นสำหรับประชากรแบบปัวซงมีค่าสูงสุด เราสามารถใช้ลอการิทึมของฟังก์ชันความน่าจะเป็นได้:
เราหาอนุพันธ์ของเทียบกับλแล้วเปรียบเทียบกับศูนย์:
การแก้สมการหาค่าλจะได้จุดนิ่ง
ดังนั้นλคือค่าเฉลี่ยของ ค่า k iการหาเครื่องหมายของอนุพันธ์อันดับสองของLที่จุดนิ่งจะช่วยกำหนดว่าλเป็น ค่าสุดขั้วประเภทใด
การประเมินอนุพันธ์อันดับสองณ จุดวิเคราะห์จะได้:
ซึ่งเป็นค่าลบของnคูณด้วยส่วนกลับของค่าเฉลี่ยของk iนิพจน์นี้จะมีค่าเป็นลบเมื่อค่าเฉลี่ยเป็นบวก ถ้าเงื่อนไขนี้เป็นจริง จุดนิ่งจะทำให้ฟังก์ชันความน่าจะเป็นมีค่าสูงสุด
เพื่อให้ครบถ้วนสมบูรณ์ตระกูลของการแจกแจงจะเรียกว่าสมบูรณ์ก็ต่อเมื่อหมายความว่าสำหรับทุกถ้าแต่ละบุคคลเป็นอิสระและมี การแจกแจงเหมือนกัน (iid) แล้ว เมื่อทราบการแจกแจงที่เราต้องการตรวจสอบแล้ว ก็เห็นได้ง่ายว่าสถิตินั้นสมบูรณ์
เพื่อให้ความเท่าเทียมกันนี้เป็นจริงต้องเป็น 0 ซึ่งเป็นผลมาจากข้อเท็จจริงที่ว่าไม่มีพจน์อื่นใดจะเป็น 0 สำหรับทุกค่าในผลรวมและสำหรับทุกค่าที่เป็นไปได้ของดังนั้นสำหรับทุก ค่า หมายความว่าและสถิติได้รับการพิสูจน์แล้วว่าสมบูรณ์
ช่วงความเชื่อมั่น
ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของการแจกแจงปัวซงสามารถแสดงได้โดยใช้ความสัมพันธ์ระหว่างฟังก์ชันการแจกแจงสะสมของการแจกแจงปัวซงและการแจกแจงไคกำลังสองการแจกแจงไคกำลังสองมีความสัมพันธ์อย่างใกล้ชิดกับการแจกแจงแกมมาและนี่นำไปสู่การแสดงออกอีกแบบหนึ่ง เมื่อกำหนดค่าสังเกตkจากการแจกแจงปัวซงที่มีค่าเฉลี่ยμช่วงความเชื่อมั่นสำหรับμที่ระดับความเชื่อมั่น1 – αคือ
หรือเทียบเท่า
โดยที่ฟังก์ชันควอนไทล์ (ที่สอดคล้องกับพื้นที่หางล่างp ) ของการแจกแจงไคกำลังสองที่มีองศาอิสระn และ ฟังก์ชันควอนไทล์ของการแจกแจงแกมมาที่มีพารามิเตอร์รูปร่าง n และพารามิเตอร์มาตราส่วน 1 [ 8 ] : 176-178 [ 50 ]ช่วงนี้เป็น ' ช่วงที่แน่นอน ' ในแง่ที่ว่าความน่าจะเป็นของการครอบคลุมจะไม่น้อยกว่าค่าที่กำหนด1 – α
เมื่อควอนไทล์ของการแจกแจงแกมมาไม่พร้อมใช้งาน ได้มีการเสนอการประมาณค่าที่แม่นยำสำหรับช่วงที่แน่นอนนี้ (โดยอิงจากการแปลงวิลสัน-ฮิลเฟอร์ตี้ ) ดังนี้: [ 51 ] โดยที่แสดงถึงค่าเบี่ยงเบนมาตรฐานปกติที่มีพื้นที่หางด้านบนα / 2
สำหรับการประยุกต์ใช้สูตรเหล่านี้ในบริบทเดียวกันกับข้างต้น (โดยกำหนดให้มี ค่าที่วัดได้ nค่าk iแต่ละค่าสุ่มมาจากการแจกแจงแบบปัวซงที่มีค่าเฉลี่ยλ ) จะต้องตั้งค่าดังนี้
คำนวณ ช่วงสำหรับμ = nλจากนั้นหาช่วงสำหรับλ
การอนุมานแบบเบย์เซียน
ในการอนุมานแบบเบย์เซียนไพรเออร์คู่ควบสำหรับพารามิเตอร์อัตราλของการแจกแจงปัวซงคือการแจกแจงแกมมา[ 52 ]ให้
แสดงว่าλมีการกระจายตามความหนาแน่น แกมมา gซึ่งกำหนดโดยพารามิเตอร์รูปร่างαและพารามิเตอร์มาตราส่วน ผกผัน β :
จากนั้น เมื่อกำหนดตัวอย่าง ค่าที่วัดได้ nค่าk i เช่นเดียว กับก่อนหน้านี้และค่าความน่าจะเป็นก่อนหน้าเป็นGamma( α , β )การแจกแจงความน่าจะเป็นภายหลังจะเป็นดังนี้
โปรดทราบว่าค่าเฉลี่ยภายหลังเป็นเชิงเส้นและกำหนดโดย สามารถแสดงได้ว่าการแจกแจงแกมมาเป็นไพรเออร์เพียงอย่างเดียวที่เหนี่ยวนำให้เกิดความเป็นเชิงเส้นของค่าเฉลี่ยแบบมีเงื่อนไข ยิ่งไปกว่านั้น มีผลลัพธ์ตรงกันข้ามที่ระบุว่าหากค่าเฉลี่ยแบบมีเงื่อนไขใกล้เคียงกับฟังก์ชันเชิง เส้นในระยะทาง การแจกแจงไพรเออร์ของλจะต้องใกล้เคียงกับการแจกแจงแกมมาในระยะทาง Levy [ 53 ]
ค่าเฉลี่ยภายหลังE[ λ ]เข้าใกล้ค่าประมาณความน่าจะเป็นสูงสุดในลิมิตเมื่อซึ่งเป็นผลมาจากนิพจน์ทั่วไปของค่าเฉลี่ยของการแจกแจงแกมมาโดยตรง
การแจกแจงการทำนายภายหลังสำหรับการสังเกตเพิ่มเติมเพียงครั้งเดียวคือการแจกแจงทวินามเชิงลบ[ 54 ] : 53 บางครั้งเรียกว่าการแจกแจงแกมมา-ปัวซง
การประมาณค่าเฉลี่ยปัวซงหลายค่าพร้อมกัน
สมมติว่าเป็นเซตของตัวแปรสุ่มอิสระจากเซตของการแจกแจงปัวซง โดยแต่ละตัวแปรมีพารามิเตอร์และเราต้องการประมาณค่าพารามิเตอร์เหล่านี้ จากนั้น Clevenson และ Zidek แสดงให้เห็นว่าภายใต้การสูญเสียความคลาดเคลื่อนกำลังสองแบบปกติเมื่อนั้น คล้ายกับในตัวอย่างของ Steinสำหรับค่าเฉลี่ยปกติ ตัวประมาณค่า MLE จะไม่สามารถยอมรับได้[ 55 ]
ในกรณีนี้ ตระกูลของตัวประมาณค่ามินิแม็กซ์จะถูกกำหนดสำหรับค่าใดๆและดังเช่น[ 56 ]
การเกิดขึ้นและการประยุกต์ใช้
การประยุกต์ใช้การแจกแจงปัวซงกับข้อมูลการนับ (จำนวนเหตุการณ์) บางประการ: [ 57 ]
- โทรคมนาคม : สายโทรศัพท์ที่เข้ามาในระบบ
- ดาราศาสตร์ : โฟตอนที่เดินทางมาถึงกล้องโทรทรรศน์
- เคมี : การกระจายมวลโมลาร์ของ การพอลิเม อไรเซชันที่มีชีวิต [ 58 ]
- ชีววิทยา : จำนวนการกลายพันธุ์บนสายดีเอ็นเอต่อหน่วยความยาว
- การจัดการ : ลูกค้าที่มาถึงเคาน์เตอร์หรือศูนย์บริการ[ 59 ]
- ด้านการเงินและการประกันภัย : จำนวนความเสียหายหรือการเรียกร้องค่าสินไหมทดแทนที่เกิดขึ้นในช่วงเวลาที่กำหนด
- แผ่นดินไหววิทยา : แบบจำลองปัวซงเชิงอะซิมโทติกของความเสี่ยงสำหรับแผ่นดินไหวขนาดใหญ่[ 60 ]
- กัมมันตภาพรังสี : สลายตัวในช่วงเวลาที่กำหนดในตัวอย่างกัมมันตภาพรังสี[ 61 ]
- ทัศนศาสตร์ : จำนวนโฟตอนที่ปล่อยออกมาในพัลส์เลเซอร์เดียว (จุดอ่อนสำคัญของ โปรโตคอล การกระจายกุญแจควอนตัมซึ่งรู้จักกันในชื่อการแบ่งจำนวนโฟตอน)
ตัวอย่างเพิ่มเติมของการนับเหตุการณ์ที่สามารถจำลองได้ด้วยกระบวนการปัวซง ได้แก่:
- ทหารที่เสียชีวิตจากการถูกม้าเตะในแต่ละปีในแต่ละกอง ทหารม้า ของปรัสเซียตัวอย่างนี้ใช้ในหนังสือของLadislaus Bortkiewicz (1868–1931) [ 12 ] : 23-25
- เซลล์ยีสต์ที่ใช้ในการผลิต เบียร์ กินเนสส์ตัวอย่างนี้ใช้โดยWilliam Sealy Gosset (1876–1937) [ 62 ] [ 63 ]
- สายโทรศัพท์ที่มาถึงศูนย์บริการภายในหนึ่งนาที ตัวอย่างนี้ได้รับการอธิบายโดยAK Erlang (1878–1929) [ 64 ]
- เป้าหมายในกีฬาที่เกี่ยวข้องกับทีมแข่งขันสองทีม[ 65 ]
- จำนวนผู้เสียชีวิตต่อปีในกลุ่มอายุที่กำหนด[ 66 ]
- การเปลี่ยนแปลงอย่างฉับพลันของราคาหุ้นในช่วงเวลาที่กำหนด
- จำนวนครั้ง ที่เข้าถึง เว็บเซิร์ฟเวอร์ต่อนาที (ภายใต้สมมติฐานว่ามีความสม่ำเสมอ )
- การกลายพันธุ์ ใน ดีเอ็นเอส่วนหนึ่งหลังจากได้รับรังสีในปริมาณหนึ่ง
- เซลล์ที่ติดเชื้อที่ระดับความเข้มข้นของการติดเชื้อที่ กำหนด
- แบคทีเรียในของเหลวปริมาณหนึ่ง[ 67 ]
- โฟตอนที่มาถึงวงจรพิกเซลภายใต้ความสว่างที่กำหนดในช่วงเวลาที่กำหนด[ 68 ]
- การลงจอดของระเบิดบิน V-1ในลอนดอนระหว่างสงครามโลกครั้งที่ 2 ได้รับการตรวจสอบโดย RD Clarke ในปี พ.ศ. 2489 [ 69 ]
ในทฤษฎีจำนวนเชิงความน่าจะเป็นแกลลาเกอร์แสดงให้เห็นในปี 1976 ว่า หากสมมติฐานr-tuple ของจำนวนเฉพาะ ที่ยังไม่ได้ รับ การพิสูจน์บางเวอร์ชันเป็นจริง [ 70 ] แล้วจำนวนเฉพาะในช่วงเวลาสั้นๆ จะเป็นไปตามการแจกแจงปัวซง[ 71 ]
กฎของเหตุการณ์หายาก

อัตราการเกิดเหตุการณ์มีความสัมพันธ์กับความน่าจะเป็นที่เหตุการณ์นั้นจะเกิดขึ้นในช่วงเวลาย่อยเล็กๆ (ไม่ว่าจะเป็นเวลา สถานที่ หรืออื่นๆ) ในกรณีของการแจกแจงปัวซง เราจะสมมติว่ามีช่วงเวลาย่อยที่เล็กพอซึ่งความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นสองครั้งนั้น "น้อยมาก" ด้วยสมมติฐานนี้ เราสามารถสร้างการแจกแจงปัวซงจากการแจกแจงทวินามได้ โดยอาศัยเพียงข้อมูลเกี่ยวกับจำนวนเหตุการณ์ทั้งหมดที่คาดหวังในช่วงเวลาทั้งหมดเท่านั้น
ให้จำนวนเหตุการณ์ทั้งหมดในช่วงเวลาทั้งหมดแทนด้วยแบ่งช่วงเวลาทั้งหมดออกเป็นช่วงย่อยที่มีขนาดเท่ากัน โดยที่(เนื่องจากเราสนใจเฉพาะส่วนเล็ก ๆ ของช่วงเวลาเท่านั้น สมมติฐานนี้จึงมีความหมาย) ซึ่งหมายความว่าจำนวนเหตุการณ์ที่คาดหวังในแต่ละ ช่วงย่อยทั้ง nช่วงนั้นเท่ากับ
ตอนนี้เราสมมติว่าการเกิดเหตุการณ์ในช่วงเวลาทั้งหมดสามารถมองได้ว่าเป็นลำดับของการทดลองแบบเบอร์นูลลีn ครั้ง โดยที่การทดลองแบบเบอร์นูลลี ครั้งที่ -th สอดคล้องกับการตรวจสอบว่าเหตุการณ์เกิดขึ้นในช่วงเวลาย่อยด้วยความน่าจะเป็น -n หรือ ไม่ จำนวนเหตุการณ์ทั้งหมดที่คาดหวังในการทดลองดังกล่าวจะเป็นจำนวนเหตุการณ์ทั้งหมดที่คาดหวังในช่วงเวลาทั้งหมด ดังนั้นสำหรับแต่ละส่วนย่อยของช่วงเวลา เราได้ประมาณการการเกิดเหตุการณ์เป็นกระบวนการแบบเบอร์นูลลีในรูปแบบดังที่เราได้กล่าวไว้ก่อนหน้านี้ เราต้องการพิจารณาเฉพาะช่วงเวลาย่อยที่เล็กมากเท่านั้น ดังนั้น เราจึงใช้ลิมิตเมื่อ n เข้าสู่∞
ในกรณีนี้การแจกแจงทวินามจะลู่เข้าสู่สิ่งที่เรียกว่าการแจกแจงปัวซงโดยทฤษฎีบทขีดจำกัดของปัวซง
ในตัวอย่างข้างต้นหลายๆ ตัวอย่าง เช่น จำนวนการกลายพันธุ์ในลำดับดีเอ็นเอที่กำหนด เหตุการณ์ที่ถูกนับนั้นแท้จริงแล้วเป็นผลลัพธ์ของการทดลองแบบไม่ต่อเนื่อง และจะสามารถจำลองได้อย่างแม่นยำยิ่งขึ้นโดยใช้การแจกแจงแบบทวินามนั่นคือ
ในกรณีเช่นนี้nจะมีค่ามากและpจะมีค่าน้อยมาก (ดังนั้นค่าเฉลี่ยnpจึงมีขนาดปานกลาง) จากนั้นจึงสามารถประมาณการกระจายตัวได้โดยใช้การกระจายแบบปัวซงซึ่งไม่ซับซ้อนกว่า
บางครั้งการประมาณค่านี้เรียกว่ากฎของเหตุการณ์หายาก [ 72 ] : 5 เนื่องจาก เหตุการณ์เบอร์นูลลีแต่ละรายการ จำนวน n รายการเกิดขึ้นได้ยาก
ชื่อ "กฎของเหตุการณ์หายาก" อาจทำให้เข้าใจผิดได้ เพราะจำนวนรวมของเหตุการณ์ที่ประสบความสำเร็จในกระบวนการปัวซงไม่จำเป็นต้องหายากเสมอไป หากค่าพารามิเตอร์npไม่น้อย ตัวอย่างเช่น จำนวนสายโทรศัพท์ที่โทรเข้ามายังตู้รับสายที่ไม่ว่างในหนึ่งชั่วโมงนั้น เป็นไปตามการแจกแจงแบบปัวซง โดยเหตุการณ์เหล่านั้นดูเหมือนจะเกิดขึ้นบ่อยสำหรับผู้ให้บริการ แต่ถือว่าหายากจากมุมมองของคนทั่วไปที่แทบจะไม่โทรเข้ามายังตู้รับสายนั้นในชั่วโมงดังกล่าวเลย
ความแปรปรวนของการแจกแจงแบบทวินามเป็น1 − pเท่าของความแปรปรวนของการแจกแจงแบบปัวซง ดังนั้นจึงเกือบเท่ากันเมื่อpมีค่าเล็กมาก
บางครั้ง คำว่ากฎถูกใช้เป็นคำพ้องความหมายของการแจกแจงความน่าจะเป็นและการบรรจบกันในกฎหมายถึงการบรรจบกันในการแจกแจงดังนั้น การแจกแจงปัวซงจึงบางครั้งเรียกว่า "กฎของจำนวนน้อย" เพราะเป็นการแจกแจงความน่าจะเป็นของจำนวนครั้งของการเกิดเหตุการณ์ที่เกิดขึ้นไม่บ่อยนัก แต่มีโอกาสเกิดขึ้นมากมายกฎของจำนวนน้อยเป็นหนังสือของ Ladislaus Bortkiewicz เกี่ยวกับการแจกแจงปัวซง ตีพิมพ์ในปี 1898 [ 12 ] [ 73 ]
กระบวนการจุดปัวซง
การแจกแจงปัวซงเกิดขึ้นจากจำนวนจุดของกระบวนการจุดปัวซงที่อยู่ในบริเวณจำกัดบางแห่ง โดยเฉพาะอย่างยิ่ง ถ้าDเป็นปริภูมิบริเวณ เช่น ปริภูมิยุคลิดR dซึ่ง| D |พื้นที่ ปริมาตร หรือโดยทั่วไปแล้ว การวัดแบบเลเบสของบริเวณนั้นมีค่าจำกัด และถ้าN ( D )แทนจำนวนจุดในDแล้ว
การถดถอยปัวซงและการถดถอยทวินามเชิงลบ
การถดถอยแบบปัวซงและ การถดถอยแบบทวิ นามเชิงลบมีประโยชน์สำหรับการวิเคราะห์ที่ตัวแปรตาม (ตัวแปรตอบสนอง) คือจำนวนนับ(0, 1, 2, ... )ของจำนวนเหตุการณ์หรือการเกิดขึ้นในช่วงเวลาหนึ่ง
ชีววิทยา
การทดลอง ของลูเรีย-เดลบรุคได้ทดสอบกับสมมติฐานของการวิวัฒนาการแบบลามาร์ค ซึ่งควรจะส่งผลให้เกิดการแจกแจงแบบปัวซง
Katz และ Miledi วัดศักย์เยื่อหุ้มเซลล์ทั้งที่มีและไม่มีอะเซทิลโคลีน (ACh) [ 74 ]เมื่อมี ACh อยู่ช่องไอออนบนเยื่อหุ้มเซลล์จะเปิดแบบสุ่มในช่วงเวลาสั้นๆ เนื่องจากมีช่องไอออนจำนวนมากที่แต่ละช่องเปิดในช่วงเวลาสั้นๆ จำนวนช่องไอออนทั้งหมดที่เปิดในแต่ละช่วงเวลาจึงมีการกระจายแบบปัวซง เมื่อไม่มี ACh อยู่ ในทางปฏิบัติแล้วจะไม่มีช่องไอออนเปิด ศักย์เยื่อหุ้มเซลล์คือเมื่อหักลบผลกระทบของสัญญาณรบกวนแล้ว Katz และ Miledi พบว่าค่าเฉลี่ยและความแปรปรวนของศักย์เยื่อหุ้มเซลล์คือและตามลำดับ ทำให้ได้(หน้า 94-95 [ 75 ] )
ในระหว่างการจำลองเซลล์แต่ละครั้ง จำนวนการกลายพันธุ์จะกระจายตัวแบบปัวซงโดยประมาณ[ 76 ]ตัวอย่างเช่น ไวรัส HIV มีเบสคู่ 10,000 คู่ และมีอัตราการกลายพันธุ์ประมาณ 1 ต่อเบสคู่ 30,000 คู่ ซึ่งหมายความว่าจำนวนการกลายพันธุ์ต่อการจำลองแต่ละครั้งจะกระจายตัวเป็น. (หน้า 64 [ 75 ] )
การประยุกต์ใช้ในด้านวิทยาศาสตร์อื่นๆ
ในกระบวนการปัวซง จำนวนเหตุการณ์ที่สังเกตได้จะผันผวนรอบค่าเฉลี่ยλโดยมีค่าเบี่ยงเบนมาตรฐาน σ ความผันผวนเหล่านี้เรียกว่าสัญญาณรบกวนปัวซงหรือ (โดยเฉพาะในด้านอิเล็กทรอนิกส์) เรียกว่าสัญญาณรบกวนช็อต
ความสัมพันธ์ระหว่างค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานในการนับเหตุการณ์ที่ไม่ต่อเนื่องกันนั้นมีประโยชน์ทางวิทยาศาสตร์ โดยการสังเกตว่าความผันผวนเปลี่ยนแปลงไปอย่างไรเมื่อเทียบกับสัญญาณเฉลี่ย เราสามารถประมาณการส่วนร่วมของเหตุการณ์แต่ละครั้งได้แม้ว่าส่วนร่วมนั้นจะเล็กเกินกว่าจะตรวจจับได้โดยตรงก็ตาม ตัวอย่างเช่น ประจุeบนอิเล็กตรอนสามารถประมาณได้โดยการหาความสัมพันธ์ระหว่างขนาดของกระแสไฟฟ้ากับสัญญาณรบกวนแบบสุ่ม (shot noise ) ถ้า อิเล็กตรอน Nตัวผ่านจุดหนึ่งในช่วงเวลาtโดยเฉลี่ยกระแสไฟฟ้าเฉลี่ย คือ; เนื่องจากความผันผวนของกระแสไฟฟ้าควรอยู่ในลำดับ(เช่น ค่าเบี่ยงเบนมาตรฐานของกระบวนการปัวซง ) ประจุจึงสามารถประมาณได้จากอัตราส่วน
ตัวอย่างที่พบได้ทั่วไปคือความหยาบที่ปรากฏขึ้นเมื่อขยายภาพถ่าย ความหยาบนั้นเกิดจากความผันผวนแบบปัวซงของจำนวน อนุภาค เงิน ที่ลดลง ไม่ใช่เกิดจากอนุภาคแต่ละอนุภาคเอง การหาความสัมพันธ์ ระหว่าง ความหยาบกับระดับการขยายจะช่วยให้สามารถประเมินสัดส่วนการมีส่วนร่วมของอนุภาคแต่ละอนุภาคได้ (ซึ่งมีขนาดเล็กเกินกว่าจะมองเห็นได้ด้วยตาเปล่า)
ใน ทฤษฎี เซตเชิงสาเหตุองค์ประกอบที่ไม่ต่อเนื่องของปริภูมิเวลาจะเป็นไปตามการแจกแจงแบบปัวซงในปริมาตร
การแจกแจงแบบปัวซงยังปรากฏในกลศาสตร์ควอนตัมโดยเฉพาะอย่างยิ่งในทัศนศาสตร์ควอนตัมกล่าวคือ สำหรับ ระบบ ตัวสั่นฮาร์มอนิกควอนตัมในสถานะโคherentความน่าจะเป็นของการวัดระดับพลังงานเฉพาะนั้นมีการกระจายแบบปัวซง
วิธีการคำนวณ
การแจกแจงแบบปัวซงก่อให้เกิดภารกิจที่แตกต่างกันสองอย่างสำหรับไลบรารีซอฟต์แวร์เฉพาะทาง ได้แก่การประเมินการแจกแจงและการสุ่มตัวเลขตามการแจกแจงนั้น
การประเมินการแจกแจงปัวซง
การคำนวณค่าสำหรับค่าที่กำหนดและนั้นเป็นงานง่ายๆ ที่สามารถทำได้โดยใช้คำจำกัดความมาตรฐานของในรูปของฟังก์ชันเลขชี้กำลัง ฟังก์ชันกำลัง และฟังก์ชันแฟกทอเรียล อย่างไรก็ตาม คำจำกัดความทั่วไปของการแจกแจงปัวซงมีสองพจน์ที่อาจทำให้เกิดค่าเกินขีดจำกัดในคอมพิวเตอร์ได้ง่าย คือλ kและk !เศษส่วนของλ kต่อk !ยังสามารถทำให้เกิดข้อผิดพลาดในการปัดเศษที่ใหญ่มากเมื่อเทียบกับe − λและดังนั้นจึงให้ผลลัพธ์ที่ผิดพลาด เพื่อความเสถียรเชิงตัวเลข ฟังก์ชันความน่าจะเป็นมวลของปัวซงจึงควรได้รับการประเมินเป็น ซึ่งเทียบเท่าทางคณิตศาสตร์แต่มีความเสถียรเชิงตัวเลข ลอการิทึมธรรมชาติของฟังก์ชันแกมมาสามารถหาได้โดยใช้ฟังก์ชันใน ไลบรารีมาตรฐานของภาษา C (เวอร์ชัน C99) หรือRฟังก์ชันในMATLABหรือSciPyหรือฟังก์ชันในFortran 2008 และเวอร์ชันที่ใหม่กว่า lgammagammalnlog_gamma
ภาษาโปรแกรมบางภาษามีฟังก์ชันในตัวสำหรับประเมินการแจกแจงปัวซง ได้แก่
- R : ฟังก์ชัน
dpois(x, lambda); - Excel : ฟังก์ชัน
POISSON( x, mean, cumulative)ที่มีแฟล็กสำหรับระบุการกระจายสะสม - Mathematica : การแจกแจงปัวซงแบบเอกตัวแปรเป็น, [ 77 ]การแจกแจงปัวซงแบบทวิตัวแปรเป็น,. [ 78 ]
PoissonDistribution[]MultivariatePoissonDistribution[{ }]
การสร้างตัวแปรสุ่ม
งานที่ยากกว่าคือการสุ่มเลือกตัวแปรสุ่ม จำนวนเต็ม จาก1การแจกแจงปัวซงโดยกำหนดค่าที่กำหนดให้
โซลูชันนี้จัดทำโดย:
- R : ฟังก์ชัน
rpois(n, lambda); - ไลบรารีวิทยาศาสตร์ GNU (GSL): ฟังก์ชันgsl_ran_poisson
Knuthได้นำเสนออัลกอริธึมง่ายๆ เพื่อสร้างตัวเลขสุ่มที่มีการแจกแจงแบบปัวซง ( การสุ่มตัวอย่างตัวเลขสุ่มเทียม ) : [ 79 ] : 137-138
อัลกอริทึมเลขสุ่มปัวซง (Knuth) : เริ่มต้น : ให้ L ← e − λ , k ← 0 และ p ← 1 ดำเนินการ : k ← k + 1. สร้างเลขสุ่มสม่ำเสมอ u ในช่วง [0,1] และกำหนดให้ p ← p × u ขณะที่ p > L ให้ส่งคืน k − 1
ความซับซ้อนเป็นแบบเชิงเส้นตามค่าที่ส่งคืนkซึ่งโดยเฉลี่ยคือλมีอัลกอริธึมอื่นๆ อีกมากมายที่สามารถปรับปรุงให้ดีขึ้นได้ บางส่วนได้ระบุไว้ในงานของ Ahrens & Dieter โปรดดูหัวข้อ § เอกสารอ้างอิงด้านล่าง
สำหรับค่าλที่มีขนาดใหญ่ ค่าของL = e − λอาจมีขนาดเล็กมากจนยากต่อการแสดงผล ปัญหานี้สามารถแก้ไขได้โดยการปรับเปลี่ยนอัลกอริธึมโดยใช้พารามิเตอร์เพิ่มเติม STEP เพื่อให้e −STEPไม่เกิดภาวะอันเดอร์โฟลว์:
อัลกอริทึมเลขสุ่มปัวซง (จุนฮ่าว อ้างอิงจากคนุธ) : เริ่มต้น : ให้λซ้าย ← λ , k ← 0 และ p ← 1 ทำซ้ำ : k ← k + 1. สร้างเลขสุ่มสม่ำเสมอ u ในช่วง (0,1) และให้ p ← p × u ในขณะที่ p < 1 และλ Left > 0: ถ้าλ Left > STEP: p ← p × e STEP λ Left ← λ Left − STEP else : p ← p × e λ Left λ Left ← 0 ในขณะที่ p > 1 ส่งคืน k − 1
การเลือกค่า STEP ขึ้นอยู่กับค่าขีดจำกัดของการโอเวอร์โฟลว์ สำหรับรูปแบบเลขทศลอยแบบความแม่นยำสองเท่า ค่าขีดจำกัดจะใกล้เคียงกับe 700ดังนั้น 500 น่าจะเป็นค่าSTEP ที่ ปลอดภัย
วิธีแก้ปัญหาอื่นๆ สำหรับค่าλ ที่มีขนาดใหญ่ ได้แก่การสุ่มตัวอย่างแบบปฏิเสธและการใช้การประมาณค่าแบบเกาส์เซียน
การสุ่มตัวอย่างแบบแปลงผกผันนั้นง่ายและมีประสิทธิภาพสำหรับค่าλ ที่มีขนาดเล็ก และต้องการเพียงตัวเลขสุ่มแบบเอกรูปu เพียงตัวเดียวต่อตัวอย่าง โดยจะตรวจสอบความน่าจะเป็นสะสมทีละตัวจนกว่าจะ มี ค่าใดค่าหนึ่งเกินu
อัลกอริธึมเครื่องกำเนิดปัวซองขึ้นอยู่กับการผกผันโดยการค้นหาตามลำดับ : [ 80 ] : 505 init : ให้ x ← 0, p ← e − lad , s ← p สร้างเลขสุ่มแบบเอกรูป u ในช่วง [0,1] ในขณะที่ u > s ทำดังนี้: x ← x + 1. p ← p × λ / x. s ← s + p. ส่งคืนค่า x
ดูเพิ่มเติม
- การแจกแจงทวินาม
- การแจกแจงปัวซงแบบผสม
- การแจกแจงคอนเวย์-แม็กซ์เวลล์-ปัวซง
- การแจกแจงเออร์ลัง
- การแจกแจงแบบเอกซ์โปเนนเชียล
- การแจกแจงแกมมา
- การกระจายเฮอร์ไมต์
- ดัชนีการกระจายตัว
- การแจกแจงทวินามเชิงลบ
- การจับกลุ่มแบบปัวซง
- กระบวนการจุดปัวซง
- การถดถอยปัวซง
- การสุ่มตัวอย่างแบบปัวซง
- เวฟเล็ตปัวซง
- ทฤษฎีการเข้าคิว
- ทฤษฎีการต่ออายุ
- เลมมาของร็อบบินส์
- การจัดจำหน่ายสเกลลัม
- การกระจายตัวของทวีดี้
- แบบจำลองที่มีค่าศูนย์มากเกินไป
- การแจกแจงปัวซงแบบตัดศูนย์
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การแจกแจงปัวซง
ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจงปัวซง ( / ˈ p w ɑː s ɒ n / ) เป็นการ แจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ที่แสดงความน่าจะเป็นของการเกิด เหตุการณ์...
ประวัติศาสตร์
การนำเสนอการแจกแจงปัวซงได้รับการยกย่องให้แก่นักคณิตศาสตร์และนักฟิสิกส์ชาวฝรั่งเศส Siméon Denis Poisson (1781–1840) ซึ่งตีพิมพ์พร้อมกับทฤษฎีความน่าจะเป็นของเขาใน Recherches sur la probabilité des jugements en matière criminelle et en matière civile (1837) [ 4...
ฟังก์ชันมวลความน่าจะเป็น
ตัวแปรสุ่ม แบบ ไม่ต่อเนื่อง X กล่าวได้ว่ามีการแจกแจงแบบปัวซงที่มีพารามิเตอร์ถ้ามี ฟังก์ชันมวลความน่าจะเป็น ที่กำหนดโดย: [ 2 ] : 60 โดยที่ 0}"> λ > 0 {\displaystyle \lambda >0} 0}"> เอฟ ( เค ; λ ) = ปร. ( X = เค ) = λ เค อี − λ เค !
ตัวอย่าง
การแจกแจงแบบปัวซงอาจมีประโยชน์ในการจำลองเหตุการณ์ต่างๆ เช่น: