กลับไปหน้าบทความ

อ่าน 38 นาที

การแจกแจงปัวซง

ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจงปัวซง ( / ˈ p w ɑː s ɒ n / ) เป็นการ แจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ที่แสดงความน่าจะเป็นของการเกิด เหตุการณ์...

การแจกแจงปัวซง

การแจกแจงปัวซง
ฟังก์ชันมวลความน่าจะเป็น
แกนแนวนอนคือดัชนีkซึ่งเป็นจำนวนครั้งที่เกิดขึ้นλคืออัตราการเกิดเหตุการณ์ที่คาดหวัง แกนแนวตั้งคือความน่าจะเป็นของการเกิดเหตุการณ์k ครั้ง เมื่อกำหนดค่า λแล้ว ฟังก์ชันนี้กำหนดได้เฉพาะที่ค่าk เป็นจำนวนเต็ม เท่านั้น เส้นเชื่อมระหว่างแกนเป็นเพียงเส้นนำสายตาเท่านั้น
ฟังก์ชันการกระจายสะสม
แกนแนวนอนคือดัชนีkซึ่งเป็นจำนวนครั้งที่เกิดขึ้น ฟังก์ชันการกระจายสะสม (CDF) จะไม่ต่อเนื่องที่จำนวนเต็มkและจะราบเรียบที่จุดอื่นๆ เนื่องจากตัวแปรที่มีการกระจายแบบปัวซงจะมีค่าเป็นจำนวนเต็มเท่านั้น
สัญกรณ์
พารามิเตอร์ (ประเมิน)
สนับสนุน( จำนวนธรรมชาติเริ่มต้นจาก 0)
พีเอ็มเอฟ
ซีดีเอฟ

หรือหรือ

(โดยที่คือฟังก์ชันแกมมาไม่สมบูรณ์บนคือฟังก์ชันพื้นและคือฟังก์ชันแกมมาแบบปรับค่า )
หมายถึง
ค่ามัธยฐาน
โหมด
ความแปรปรวน
ความเบี่ยงเบน
ความโค้งส่วนเกิน
เอนโทรปี

หรือสำหรับขนาดใหญ่

เอ็มจีเอฟ
ซีเอฟ
พีจีเอฟ
ข้อมูลของฟิชเชอร์

ในทฤษฎีความน่าจะเป็นและสถิติการแจกแจงปัวซง ( / ˈ p w ɑː s ɒ n / ) เป็นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ที่แสดงความน่าจะเป็นของการเกิด เหตุการณ์จำนวนหนึ่งในช่วงเวลาที่กำหนด หากเหตุการณ์เหล่านี้เกิดขึ้นด้วยอัตราเฉลี่ยคงที่ที่ทราบ และเป็นอิสระจากเวลาตั้งแต่เหตุการณ์สุดท้าย[ 1 ]นอกจากนี้ยังสามารถใช้สำหรับจำนวนเหตุการณ์ในช่วงเวลาประเภทอื่นที่ไม่ใช่เวลา และในมิติที่มากกว่า 1 (เช่น จำนวนเหตุการณ์ในพื้นที่หรือปริมาตรที่กำหนด) การแจกแจงปัวซงตั้งชื่อตามนักคณิตศาสตร์ชาวฝรั่งเศสSiméon Denis Poissonมีบทบาทสำคัญในการแจกแจงแบบเสถียรไม่ต่อเนื่อง

ภายใต้การแจกแจงปัวซงที่คาดหวังเหตุการณ์λในช่วงเวลาที่กำหนด ความน่าจะเป็นของเหตุการณ์k ในช่วงเวลาเดียวกันคือ: [ 2 ] : 60 ตัวอย่างเช่น พิจารณาศูนย์บริการลูกค้าที่รับสายโดยเฉลี่ยλ = 3สายต่อนาทีตลอดเวลา หากจำนวนสายที่ได้รับในช่วงเวลาสองช่วงใดๆ ที่ไม่ทับซ้อนกันเป็นอิสระต่อกัน จำนวนสาย k ที่ได้รับในนาทีใดๆ จะมีการแจกแจงความน่าจะเป็นแบบปัวซง การรับสาย k = 1 ถึง 4สายจะมีความน่าจะเป็นประมาณ 0.77 ในขณะที่การรับสาย 0 หรืออย่างน้อย 5 สายจะมีความน่าจะเป็นประมาณ 0.23

ตัวอย่างคลาสสิกที่ใช้เพื่อกระตุ้นให้เกิดการแจกแจงแบบปัวซงคือจำนวน เหตุการณ์ การสลายตัวของกัมมันตรังสีในช่วงระยะเวลาการสังเกตที่กำหนด[ 3 ]

ประวัติศาสตร์

การนำเสนอการแจกแจงปัวซงได้รับการยกย่องให้แก่นักคณิตศาสตร์และนักฟิสิกส์ชาวฝรั่งเศสSiméon Denis Poisson (1781–1840) ซึ่งตีพิมพ์พร้อมกับทฤษฎีความน่าจะเป็นของเขาในRecherches sur la probabilité des jugements en matière criminelle et en matière civile  (1837) [ 4 ] : 205-207 งานนี้ตั้งทฤษฎีเกี่ยวกับจำนวนการตัดสินผิดพลาดในประเทศหนึ่งๆ โดยมุ่งเน้นไปที่ตัวแปรสุ่มN บางตัว ที่นับจำนวนเหตุการณ์ที่เกิดขึ้นในช่วงเวลาที่กำหนด อย่างไรก็ตาม ผลลัพธ์ที่คล้ายกันนี้เคยมีมาก่อนแล้วในปี 1711 โดยAbraham de MoivreในDe Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus [ 5 ] : 219 [ 6 ] : 14-15 [ 7 ] : 193 [ 8 ] : 157 สิ่งนี้ทำให้เป็นตัวอย่างของกฎของ Stiglerและกระตุ้นให้ผู้เขียนบางคนโต้แย้งว่าการแจกแจงปัวซงควรใช้ชื่อว่า de Moivre [ 9 ] [ 10 ]

ในปี พ.ศ. 2403 Simon Newcombได้ปรับการแจกแจงแบบปัวซงให้เข้ากับจำนวนดาวที่พบในหน่วยของพื้นที่[ 11 ] การประยุกต์ใช้ในทางปฏิบัติเพิ่มเติมเกิดขึ้นโดยLadislaus Bortkiewiczในปี พ.ศ. 2441 Bortkiewicz แสดงให้เห็นว่าความถี่ที่ทหารในกองทัพปรัสเซียถูกม้าเตะจนเสียชีวิตโดยอุบัติเหตุนั้นสามารถจำลองได้อย่างดีด้วยการแจกแจงแบบปัวซง[ 12 ] : 23-25

คำจำกัดความ

ฟังก์ชันมวลความน่าจะเป็น

ตัวแปรสุ่ม แบบ ไม่ต่อเนื่อง Xกล่าวได้ว่ามีการแจกแจงแบบปัวซงที่มีพารามิเตอร์ถ้ามีฟังก์ชันมวลความน่าจะเป็นที่กำหนดโดย: [ 2 ] : 60 โดยที่

จำนวนจริง บวกλเท่ากับค่าที่คาดหวังของXและเท่ากับความแปรปรวน ของมัน ด้วย[ 13 ]

การแจกแจงปัวซงสามารถนำไปใช้กับระบบที่มีเหตุการณ์ที่เป็นไปได้จำนวนมาก ซึ่งแต่ละเหตุการณ์เกิดขึ้นได้ยากจำนวนเหตุการณ์ดังกล่าวที่เกิดขึ้นในช่วงเวลาที่กำหนดนั้น ภายใต้เงื่อนไขที่เหมาะสม จะเป็นจำนวนสุ่มที่มีการแจกแจงแบบปัวซง

สมการสามารถปรับเปลี่ยนได้ หากแทนที่จะใช้จำนวนเหตุการณ์เฉลี่ยเราได้รับอัตราเฉลี่ยที่เหตุการณ์เกิดขึ้น จากนั้นและ: [ 14 ]

ตัวอย่าง

หมากฝรั่งถูกทิ้งไว้บนทางเท้าในเมืองเรคยาวิก
หมากฝรั่งบนทางเท้า จำนวนชิ้นหมากฝรั่งบนกระเบื้องแต่ละแผ่นมีลักษณะการกระจายแบบปัวซงโดยประมาณ

การแจกแจงแบบปัวซงอาจมีประโยชน์ในการจำลองเหตุการณ์ต่างๆ เช่น:

  • จำนวนอุกกาบาตที่มีเส้นผ่านศูนย์กลางมากกว่าหนึ่งเมตรที่พุ่งชนโลกในหนึ่งปี
  • จำนวนโฟตอนเลเซอร์ที่ตกกระทบตัวตรวจจับในช่วงเวลาที่กำหนด
  • จำนวนนักเรียนที่ได้คะแนนต่ำและคะแนนสูงในการสอบ และ
  • ตำแหน่งของข้อบกพร่องและการเคลื่อนตัวในวัสดุ

ตัวอย่างของการเกิดจุดสุ่มในอวกาศ ได้แก่ ตำแหน่งที่ดาวเคราะห์น้อยพุ่งชนโลก (2 มิติ) ตำแหน่งของความไม่สมบูรณ์ในวัสดุ (3 มิติ) และตำแหน่งของต้นไม้ในป่า (2 มิติ) [ 15 ]

ข้อสมมติฐานและความถูกต้อง

การแจกแจงปัวซงเป็นแบบจำลองที่เหมาะสมหากข้อสมมติฐานต่อไปนี้เป็นจริง:

  • kเป็นจำนวนเต็มที่ไม่เป็นลบ ซึ่งระบุจำนวนครั้งที่เหตุการณ์เกิดขึ้นในช่วงเวลาหนึ่ง
  • การเกิดเหตุการณ์หนึ่งไม่ได้ส่งผลต่อโอกาสที่จะเกิดเหตุการณ์ที่สอง
  • อัตราเฉลี่ยของการเกิดเหตุการณ์นั้นไม่ขึ้นอยู่กับการเกิดเหตุการณ์ใดๆ
  • เหตุการณ์สองเหตุการณ์ไม่สามารถเกิดขึ้นพร้อมกันในเวลาเดียวกันได้อย่างแม่นยำ

ถ้าเงื่อนไขเหล่านี้เป็นจริง แสดงว่าkเป็นตัวแปรสุ่มปัวซง และการแจกแจงของkก็เป็นการแจกแจงปัวซงเช่นกัน

การแจกแจงปัวซงยังเป็นลิมิตของการแจกแจงทวินามซึ่งความน่าจะเป็นของความสำเร็จในการทดลองแต่ละครั้งคือโดยที่คือค่าคาดหวัง และคือจำนวนครั้งของการทดลอง ในลิมิตที่โดยที่ คงที่ [ 16 ] [ 17 ] (ดูการแจกแจงที่เกี่ยวข้อง ):

การแจกแจงปัวซงอาจได้มาจากสมการเชิงอนุพันธ์ด้วยเช่นกัน[ 18 ] [ 19 ] [ 20 ]

โดยมีเงื่อนไขเริ่มต้นและประเมินผลที่

ตัวอย่างความน่าจะเป็นสำหรับการแจกแจงปัวซง

ตัวอย่างที่ละเมิดข้อสมมติฐานของปัวซง

จำนวนนักเรียนที่มาถึงอาคารสโมสรนักศึกษาต่อนาทีนั้น อาจจะไม่เป็นไปตามการแจกแจงแบบปัวซง เนื่องจากอัตราการมาถึงไม่คงที่ (อัตราต่ำในช่วงเวลาเรียน อัตราสูงระหว่างช่วงเวลาเรียน) และการมาถึงของนักเรียนแต่ละคนก็ไม่เป็นอิสระต่อกัน (นักเรียนมักจะมาเป็นกลุ่ม) อัตราการมาถึงที่ไม่คงที่นี้อาจจำลองได้ด้วยการแจกแจงแบบปัวซงผสมและการมาถึงของกลุ่มนักเรียนแทนที่จะเป็นนักเรียนแต่ละคนอาจ จำลองได้ด้วย การแจกแจงแบบปัวซงเชิงประกอบ

จำนวนแผ่นดินไหวขนาด 5 ริกเตอร์ต่อปีในประเทศหนึ่ง อาจไม่เป็นไปตามการกระจายแบบปัวซง หากแผ่นดินไหวขนาดใหญ่ครั้งหนึ่งเพิ่มความน่าจะเป็นของการเกิดแผ่นดินไหวตามมาที่มีขนาดใกล้เคียงกัน

ตัวอย่างที่รับประกันว่าจะมีเหตุการณ์อย่างน้อยหนึ่งเหตุการณ์เกิดขึ้นนั้น ไม่ได้มีการแจกแจงแบบปัวซง แต่สามารถจำลองได้โดยใช้การแจกแจงแบบปัวซงที่ตัดศูนย์ออก

การแจกแจงจำนวนนับที่จำนวนช่วงเวลาที่มีเหตุการณ์เป็นศูนย์สูงกว่าที่คาดการณ์โดยแบบจำลองปัวซง อาจสร้างแบบจำลองได้โดยใช้แบบจำลองที่มีค่าศูนย์มากเกินไป (zero-inflated model )

คุณสมบัติ

สถิติเชิงพรรณนา

  • ค่าที่คาดหวังของตัวแปรสุ่มปัวซงคือλ
  • ค่าความแปรปรวนของตัวแปรสุ่มปัวซงก็คือλ เช่น กัน
  • ค่าสัมประสิทธิ์ความแปรผันคือในขณะที่ดัชนีการกระจายตัวคือ 1 [ 8 ] : 163
  • ค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยรอบค่าเฉลี่ยคือ[ 8 ] : 163
  • โหมด ของตัวแปรสุ่มที่มีการแจกแจงแบบปัวซง โดยที่ λไม่ใช่จำนวนเต็มจะเท่ากับ ซึ่งเป็นจำนวนเต็มที่มากที่สุด ที่น้อยกว่าหรือเท่ากับ  λเขียนได้อีกแบบว่าfloor ( λ )เมื่อλเป็นจำนวนเต็มบวก โหมดจะเป็นλและλ 1
  • ค่า สะสมทั้งหมดของการแจกแจงปัวซงมีค่าเท่ากับค่าคาดหวัง  λ โมเมนต์แฟกทอเรียลลำดับที่n ของการแจกแจงปัวซงคือλ n
  • ค่าที่คาดหวังของกระบวนการปัวซงบางครั้งจะถูกแยกออกเป็นผลคูณของความเข้มและการสัมผัส (หรือโดยทั่วไปแล้วจะแสดงเป็นปริพันธ์ของ "ฟังก์ชันความเข้ม" ในช่วงเวลาหรือพื้นที่ ซึ่งบางครั้งเรียกว่า "การสัมผัส") [ 22 ]

ค่ามัธยฐาน

ขอบเขตสำหรับค่ามัธยฐาน ( ) ของการกระจายเป็นที่ทราบและมีความแม่นยำ : [ 23 ]

ช่วงเวลาที่สูงกว่า

โมเมนต์ ที่ไม่เป็นศูนย์กลางที่สูงกว่าm kของการแจกแจงปัวซงคือพหุนาม Touchardในλ : โดยที่วงเล็บปีกกา { } หมายถึงจำนวน Stirling ชนิดที่สอง [ 24 ] [ 1 ] : 6 กล่าวอีกนัยหนึ่ง เมื่อค่าที่คาดหวังถูกตั้งค่าเป็นλ = 1สูตรของ Dobinskiบ่งชี้ว่า โมเมนต์ลำดับที่ nเท่ากับจำนวนพาร์ติชันของเซตที่ มีขนาดn

ขอบเขตบนแบบง่ายคือ: [ 25 ]

ผลรวมของตัวแปรสุ่มที่มีการแจกแจงแบบปัวซง

ถ้าสำหรับเป็นอิสระต่อกันแล้ว[ 26 ] : 65 บทกลับคือทฤษฎีบทของ Raikovซึ่งกล่าวว่า ถ้าผลรวมของตัวแปรสุ่มอิสระสองตัวมีการแจกแจงแบบปัวซง ตัวแปรสุ่มอิสระทั้งสองตัวนั้นก็จะมีการแจกแจงแบบปัวซงเช่นกัน[ 27 ] [ 28 ]

เอนโทรปีสูงสุด

เป็นการแจกแจงเอนโทรปีสูงสุดในเซตของการแจกแจงทวินามทั่วไป ที่มี ค่าเฉลี่ยและ[ 29 ]โดยที่การแจกแจงทวินามทั่วไปถูกกำหนดให้เป็นการแจกแจงผลรวมของตัวแปรเบอร์นูลีอิสระจำนวน N ตัวแต่ไม่ได้แจกแจงเหมือนกัน

คุณสมบัติอื่นๆ

  • การแจกแจงปัวซงเป็นการแจกแจงความน่าจะเป็นที่แบ่งได้ไม่จำกัด[ 30 ] : 233 [ 8 ] : 164
  • ความแตกต่าง แบบKullback–Leibler ที่มีทิศทาง ของจากกำหนดโดย
  • ถ้าเป็นจำนวนเต็มจะต้องเป็นไปตามเงื่อนไขและ[ 31 ]
  • ขอบเขตสำหรับความน่าจะเป็นส่วนหางของตัวแปรสุ่มปัวซงสามารถหาได้โดยใช้การอ้างเหตุผลขอบเขตของเชอร์นอฟ[ 32 ] : 97-98
  • ความน่าจะ เป็นของหางด้านบนสามารถกระชับได้ (อย่างน้อยสองเท่า) ดังนี้: [ 33 ]โดยที่คือความแตกต่างของ Kullback–Leibler จาก
  • อสมการที่เชื่อมโยงฟังก์ชันการกระจายสะสมของตัวแปรสุ่มปัวซงกับฟังก์ชันการกระจายสะสมของการกระจายปกติมาตรฐานมีดังนี้: [ 34 ]

โดยที่ค่าความแตกต่างแบบ Kullback–Leibler ของมาจากและค่าความแตกต่างแบบ Kullback–Leibler ของมาจาก

การแข่งขันปัวซง

ให้และเป็นตัวแปรสุ่มอิสระ โดยที่ แล้วเราจะได้ว่า

ขอบเขตบนได้รับการพิสูจน์โดยใช้ขอบเขตเชอร์นอฟมาตรฐาน

ขอบล่างสามารถพิสูจน์ได้โดยสังเกตว่าคือความน่าจะเป็นที่ ซึ่งซึ่งมีขอบเขตล่างโดย โดยที่คือเอนโทรปีสัมพัทธ์ (ดูรายละเอียดในหัวข้อขอบเขตของหางของการแจกแจงแบบทวินาม) นอกจากนี้ การสังเกตว่าและการคำนวณขอบล่างของความน่าจะเป็นแบบไม่มีเงื่อนไขจะให้ผลลัพธ์ รายละเอียดเพิ่มเติมสามารถพบได้ในภาคผนวกของ Kamath et al. [ 35 ]

เป็นการแจกแจงแบบทวินามที่มีช่วงเวลาเล็ก ๆ

การแจกแจงปัวซงสามารถหาได้จากกรณีจำกัดของการแจกแจงทวินามเมื่อจำนวนการทดลองเข้าสู่ค่าอนันต์ และจำนวนความสำเร็จที่คาดหวัง ยังคงคงที่ — ดู หลักการของเหตุการณ์หายากด้านล่าง ดังนั้นจึงสามารถใช้เป็นการประมาณค่าของการแจกแจงทวินามได้หากnมีขนาดใหญ่พอและpมีขนาดเล็กพอ การแจกแจงปัวซงเป็นการประมาณค่าที่ดีของการแจกแจงทวินามหากnมีค่าอย่างน้อย 20 และpมีค่าน้อยกว่าหรือเท่ากับ 0.05 และเป็นการประมาณค่าที่ดีเยี่ยมหากn ≥ 100และnp ≤ 10 [ 36 ] ให้และเป็นฟังก์ชันความหนาแน่นสะสมของการแจกแจงทวินามและการแจกแจงปัวซงตามลำดับ จะได้ว่า: การพิสูจน์อย่างหนึ่งของสิ่งนี้ใช้ฟังก์ชันสร้างความน่าจะเป็น [ 37 ] พิจารณาการทดลองแบบเบอร์นูลลี (การโยนเหรียญ) ซึ่งความน่าจะเป็นของความสำเร็จหนึ่งครั้ง (หรือจำนวนความสำเร็จที่คาดหวัง) อยู่ภายในช่วงเวลาที่กำหนด แบ่งช่วงเวลาออกเป็นnส่วน และทำการทดลองในแต่ละช่วงย่อยด้วยความน่าจะเป็นความน่าจะเป็นของ ความสำเร็จ kครั้งจาก การทดลอง nครั้งตลอดทั้งช่วงเวลาจะกำหนดโดยการแจกแจงทวินาม ซึ่งมีฟังก์ชันก่อกำเนิดคือ: เมื่อพิจารณาลิมิตเมื่อnเพิ่มขึ้นเป็นอนันต์ (โดยที่xคงที่) และใช้คำจำกัดความของลิมิตผลคูณของฟังก์ชันเลขชี้กำลังจะได้ฟังก์ชันก่อกำเนิดของการแจกแจงปัวซง:

ทั่วไป

  • ถ้าและเป็นอิสระต่อกัน ผลต่างจะเป็นไปตามการแจกแจงแบบสเกลลัม (Skellam distribution )
  • ถ้าและเป็นอิสระต่อกัน การแจกแจงของโดยมีเงื่อนไขว่า เป็นการแจกแจงทวินาม
    โดยเฉพาะอย่างยิ่งถ้าหากว่า
    โดยทั่วไปแล้ว ถ้าX 1 , X 2 , ..., X nเป็นตัวแปรสุ่มปัวซงอิสระที่มีพารามิเตอร์λ 1 , λ 2 , ..., λ nแล้ว
    เมื่อพิจารณาแล้ว จึงสรุปได้ว่าในความเป็นจริง
  • ถ้าการแจกแจงของX = kเป็นการแจกแจงแบบทวินามการแจกแจงของ Y จะเป็นการแจกแจงแบบปัวซงในความเป็นจริง ถ้า การแจกแจงของ Y เป็นการแจกแจงแบบ พหุนาม การแจกแจงของ Y จะเป็นการแจกแจงแบบปัวซงที่เป็นอิสระต่อกัน
  • การแจกแจงปัวซงเป็นกรณีพิเศษของการแจกแจงปัวซงแบบผสมแบบไม่ต่อเนื่อง (หรือการแจกแจงปัวซงแบบกระตุก) ที่มีพารามิเตอร์เพียงตัวเดียว[ 38 ] [ 39 ]การแจกแจงปัวซงแบบผสมแบบไม่ต่อเนื่องสามารถอนุมานได้จากการแจกแจงจำกัดของการแจกแจงพหุนามแบบเอกตัวแปร นอกจากนี้ยังเป็นกรณีพิเศษของการแจกแจงปัวซงแบบผสมอีก ด้วย
  • สำหรับค่าλ ที่มีขนาดใหญ่เพียงพอ (เช่นλ > 1000 ) การแจกแจงปกติที่มีค่าเฉลี่ยλและความแปรปรวนλ (ส่วนเบี่ยงเบนมาตรฐาน) เป็นการประมาณค่าที่ดีเยี่ยมของการแจกแจงปัวซง หากλมากกว่าประมาณ 10 การแจกแจงปกติจะเป็นการประมาณค่าที่ดีหาก มี การแก้ไขความต่อเนื่อง ที่เหมาะสม กล่าวคือ หากP( Xx )โดยที่xเป็นจำนวนเต็มที่ไม่เป็นลบ ถูกแทนที่ด้วยP( Xx + 0.5 )
  • การแปลงที่ทำให้ความแปรปรวนคงที่ : ถ้าเช่นนั้น[ 8 ] : 168 และ[ 40 ] : 196 ภายใต้การแปลงนี้ การลู่เข้าสู่ภาวะปกติ (เมื่อเพิ่มขึ้น) จะเร็วกว่าตัวแปรที่ไม่ได้แปลงมาก การแปลงที่ทำให้ความแปรปรวนคงที่ที่ซับซ้อนกว่าเล็กน้อยก็มีอยู่[ 8 ] : 168 หนึ่งในนั้นคือ การ แปลงAnscombe [ 41 ]ดูการแปลงข้อมูล (สถิติ)สำหรับการใช้งานการแปลงทั่วไปเพิ่มเติม
  • ถ้าสำหรับทุกt > 0จำนวนการมาถึงในช่วงเวลา[0, t ]เป็นไปตามการแจกแจงปัวซงที่มีค่าเฉลี่ยλtแล้วลำดับของเวลาระหว่างการมาถึงจะเป็นตัวแปรสุ่มเอกซ์โพเนนเชียลที่เป็นอิสระและมีการแจกแจงเหมือนกัน โดยมีค่าเฉลี่ย  1/ λ [ 42 ] : 317–319
  • ฟังก์ชันการกระจายสะสมของการกระจายแบบปัวซงและไคกำลังสองมีความสัมพันธ์กันในลักษณะต่อไปนี้: [ 8 ] : 167 และ[ 8 ] : 158

การประมาณค่าปัวซง

สมมติว่า[ 43 ] มีการแจกแจงแบบพหุนาม โดยมี เงื่อนไขว่า

หมายความว่า[ 32 ] : 101-102 ในบรรดาสิ่งอื่นๆ สำหรับฟังก์ชันที่ไม่เป็นลบใดๆ หากมีการแจกแจงแบบพหุนามแล้ว โดย ที่

สามารถแทนค่าตัวประกอบของ ด้วย 2 ได้ หาก ถือว่า เป็นฟังก์ชันที่เพิ่มขึ้นหรือลดลงอย่างต่อเนื่อง

การแจกแจงปัวซงแบบสองตัวแปร

การแจกแจงนี้ได้รับการขยายไปยังกรณีสองตัวแปร[ 44 ]ฟังก์ชันก่อกำเนิดสำหรับการแจกแจงนี้คือ ด้วย

การแจกแจงแบบมาร์จินัลคือการแจกแจงปัวซง ( θ 1 )และการแจกแจงปัวซง ( θ 2 )และค่าสัมประสิทธิ์สหสัมพันธ์ถูกจำกัดอยู่ในช่วง

วิธีง่ายๆ ในการสร้างการแจกแจงปัวซงแบบสองตัวแปรคือการนำการแจกแจงปัวซงอิสระสามแบบที่มีค่าเฉลี่ยมากำหนดฟังก์ชันความน่าจะเป็นของการแจกแจงปัวซงแบบสองตัวแปรคือ

การแจกแจงปัวซงแบบอิสระ

การแจกแจงปัวซงแบบอิสระ[ 45 ]ที่มีขนาดและอัตราการ กระโดด เกิดขึ้นใน ทฤษฎี ความน่าจะเป็นแบบอิสระเป็นขีดจำกัดของการสังเคราะห์แบบอิสระ ซ้ำๆ เมื่อN

กล่าว อีกนัยหนึ่ง ให้ และเป็นตัวแปรสุ่ม โดยที่มีค่าด้วยความน่าจะเป็นและมีค่า 0 ด้วยความน่าจะเป็นที่เหลือ สมมติว่า กลุ่มเป็นอิสระต่อกันอย่างอิสระแล้วลิมิตเมื่อของกฎของจะได้จากกฎปัวซงอิสระที่มีพารามิเตอร์

คำจำกัดความนี้คล้ายคลึงกับวิธีการหนึ่งในการได้มาซึ่งการแจกแจงปัวซงแบบคลาสสิกจากกระบวนการปัวซง (แบบคลาสสิก)

มาตรการที่เกี่ยวข้องกับกฎปัวซงอิสระจะได้รับจาก[ 46 ] โดยที่ และมีการรองรับ

กฎนี้ยังปรากฏในทฤษฎีเมทริกซ์สุ่ม ในรูปของ กฎมาร์เชนโก-ปาสตูร์ค่าคุมูลันต์อิสระของกฎนี้เท่ากับ

การแปลงบางส่วนของกฎนี้

เราให้ค่าของการแปลงที่สำคัญบางอย่างของกฎปัวซงอิสระ การคำนวณสามารถพบได้ในหนังสือLectures on the Combinatorics of Free Probabilityโดย A. Nica และ R. Speicher [ 47 ]

การแปลง R ของกฎปัวซงอิสระกำหนดโดย

การแปลงโคชี (ซึ่งเป็นการแปลงกลับของการแปลงสติลต์เจส ) กำหนดโดย

การแปลง S กำหนดโดย ในกรณีที่

การอนุมานทางสถิติ

การประมาณค่าพารามิเตอร์

เมื่อกำหนดตัวอย่าง ค่าที่วัดได้ nค่าสำหรับi = 1, ..., nเราต้องการประมาณค่าพารามิเตอร์λของประชากรปัวซงที่ดึงตัวอย่างมา การประมาณค่า ความน่าจะเป็นสูงสุดคือ[ 48 ]

เนื่องจากแต่ละการสังเกตมีค่าเฉลี่ยλดังนั้นค่าเฉลี่ยของตัวอย่างจึงมีค่าเฉลี่ย λ เช่นกัน ด้วยเหตุนี้ การประมาณค่าความน่าจะเป็นสูงสุดจึงเป็นตัวประมาณค่าที่ไม่เอนเอียงของλนอกจากนี้ยังเป็นตัวประมาณค่าที่มีประสิทธิภาพ เนื่องจากความแปรปรวนของมันบรรลุขอบเขตล่างของ Cramér–Rao (CRLB) [ 49 ]ดังนั้นจึงเป็นตัวประมาณค่าที่ไม่เอนเอียงที่มีความแปรปรวนต่ำสุด นอกจากนี้ยังสามารถพิสูจน์ได้ว่าผลรวม (และด้วยเหตุนี้ค่าเฉลี่ย ของ ตัวอย่าง เนื่องจากเป็นฟังก์ชันหนึ่งต่อหนึ่งของผลรวม) เป็นสถิติที่สมบูรณ์และเพียงพอสำหรับλ

เพื่อพิสูจน์ความเพียงพอ เราอาจใช้ทฤษฎีบทการแยกตัวประกอบพิจารณาการแบ่งฟังก์ชันความน่าจะเป็นมวลของการแจกแจงปัวซงร่วมสำหรับตัวอย่างออกเป็นสองส่วน: ส่วนหนึ่งที่ขึ้นอยู่กับตัวอย่างเท่านั้นเรียกว่าและอีกส่วนหนึ่งที่ขึ้นอยู่กับพารามิเตอร์และตัวอย่างผ่านฟังก์ชันเท่านั้นดังนั้น จึงเป็นสถิติที่เพียงพอสำหรับ

พจน์แรกขึ้นอยู่กับเท่านั้นพจน์ที่สองขึ้นอยู่กับตัวอย่างผ่านทางเท่านั้นดังนั้นจึงเพียงพอแล้ว

ในการหาค่าพารามิเตอร์λที่ทำให้ฟังก์ชันความน่าจะเป็นสำหรับประชากรแบบปัวซงมีค่าสูงสุด เราสามารถใช้ลอการิทึมของฟังก์ชันความน่าจะเป็นได้:

เราหาอนุพันธ์ของเทียบกับλแล้วเปรียบเทียบกับศูนย์:

การแก้สมการหาค่าλจะได้จุดนิ่ง

ดังนั้นλคือค่าเฉลี่ยของ ค่า k iการหาเครื่องหมายของอนุพันธ์อันดับสองของLที่จุดนิ่งจะช่วยกำหนดว่าλเป็น ค่าสุดขั้วประเภทใด

การประเมินอนุพันธ์อันดับสองณ จุดวิเคราะห์จะได้:

ซึ่งเป็นค่าลบของnคูณด้วยส่วนกลับของค่าเฉลี่ยของk iนิพจน์นี้จะมีค่าเป็นลบเมื่อค่าเฉลี่ยเป็นบวก ถ้าเงื่อนไขนี้เป็นจริง จุดนิ่งจะทำให้ฟังก์ชันความน่าจะเป็นมีค่าสูงสุด

เพื่อให้ครบถ้วนสมบูรณ์ตระกูลของการแจกแจงจะเรียกว่าสมบูรณ์ก็ต่อเมื่อหมายความว่าสำหรับทุกถ้าแต่ละบุคคลเป็นอิสระและมี การแจกแจงเหมือนกัน (iid) แล้ว เมื่อทราบการแจกแจงที่เราต้องการตรวจสอบแล้ว ก็เห็นได้ง่ายว่าสถิตินั้นสมบูรณ์

เพื่อให้ความเท่าเทียมกันนี้เป็นจริงต้องเป็น 0 ซึ่งเป็นผลมาจากข้อเท็จจริงที่ว่าไม่มีพจน์อื่นใดจะเป็น 0 สำหรับทุกค่าในผลรวมและสำหรับทุกค่าที่เป็นไปได้ของดังนั้นสำหรับทุก ค่า หมายความว่าและสถิติได้รับการพิสูจน์แล้วว่าสมบูรณ์

ช่วงความเชื่อมั่น

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของการแจกแจงปัวซงสามารถแสดงได้โดยใช้ความสัมพันธ์ระหว่างฟังก์ชันการแจกแจงสะสมของการแจกแจงปัวซงและการแจกแจงไคกำลังสองการแจกแจงไคกำลังสองมีความสัมพันธ์อย่างใกล้ชิดกับการแจกแจงแกมมาและนี่นำไปสู่การแสดงออกอีกแบบหนึ่ง เมื่อกำหนดค่าสังเกตkจากการแจกแจงปัวซงที่มีค่าเฉลี่ยμช่วงความเชื่อมั่นสำหรับμที่ระดับความเชื่อมั่น1 – αคือ

หรือเทียบเท่า

โดยที่ฟังก์ชันควอนไทล์ (ที่สอดคล้องกับพื้นที่หางล่างp ) ของการแจกแจงไคกำลังสองที่มีองศาอิสระn และ ฟังก์ชันควอนไทล์ของการแจกแจงแกมมาที่มีพารามิเตอร์รูปร่าง n และพารามิเตอร์มาตราส่วน 1 [ 8 ] : 176-178 [ 50 ]ช่วงนี้เป็น ' ช่วงที่แน่นอน ' ในแง่ที่ว่าความน่าจะเป็นของการครอบคลุมจะไม่น้อยกว่าค่าที่กำหนด1 α

เมื่อควอนไทล์ของการแจกแจงแกมมาไม่พร้อมใช้งาน ได้มีการเสนอการประมาณค่าที่แม่นยำสำหรับช่วงที่แน่นอนนี้ (โดยอิงจากการแปลงวิลสัน-ฮิลเฟอร์ตี้ ) ดังนี้: [ 51 ] โดยที่แสดงถึงค่าเบี่ยงเบนมาตรฐานปกติที่มีพื้นที่หางด้านบนα / 2

สำหรับการประยุกต์ใช้สูตรเหล่านี้ในบริบทเดียวกันกับข้างต้น (โดยกำหนดให้มี ค่าที่วัดได้ nค่าk iแต่ละค่าสุ่มมาจากการแจกแจงแบบปัวซงที่มีค่าเฉลี่ยλ ) จะต้องตั้งค่าดังนี้

คำนวณ ช่วงสำหรับμ = จากนั้นหาช่วงสำหรับλ

การอนุมานแบบเบย์เซียน

ในการอนุมานแบบเบย์เซียนไพรเออร์คู่ควบสำหรับพารามิเตอร์อัตราλของการแจกแจงปัวซงคือการแจกแจงแกมมา[ 52 ]ให้

แสดงว่าλมีการกระจายตามความหนาแน่น แกมมา gซึ่งกำหนดโดยพารามิเตอร์รูปร่างαและพารามิเตอร์มาตราส่วน ผกผัน β :

จากนั้น เมื่อกำหนดตัวอย่าง ค่าที่วัดได้ nค่าk i เช่นเดียว กับก่อนหน้านี้และค่าความน่าจะเป็นก่อนหน้าเป็นGamma( α , β )การแจกแจงความน่าจะเป็นภายหลังจะเป็นดังนี้

โปรดทราบว่าค่าเฉลี่ยภายหลังเป็นเชิงเส้นและกำหนดโดย สามารถแสดงได้ว่าการแจกแจงแกมมาเป็นไพรเออร์เพียงอย่างเดียวที่เหนี่ยวนำให้เกิดความเป็นเชิงเส้นของค่าเฉลี่ยแบบมีเงื่อนไข ยิ่งไปกว่านั้น มีผลลัพธ์ตรงกันข้ามที่ระบุว่าหากค่าเฉลี่ยแบบมีเงื่อนไขใกล้เคียงกับฟังก์ชันเชิง เส้นในระยะทาง การแจกแจงไพรเออร์ของλจะต้องใกล้เคียงกับการแจกแจงแกมมาในระยะทาง Levy [ 53 ]

ค่าเฉลี่ยภายหลังE[ λ ]เข้าใกล้ค่าประมาณความน่าจะเป็นสูงสุดในลิมิตเมื่อซึ่งเป็นผลมาจากนิพจน์ทั่วไปของค่าเฉลี่ยของการแจกแจงแกมมาโดยตรง

การแจกแจงการทำนายภายหลังสำหรับการสังเกตเพิ่มเติมเพียงครั้งเดียวคือการแจกแจงทวินามเชิงลบ[ 54 ] : 53 บางครั้งเรียกว่าการแจกแจงแกมมา-ปัวซง

การประมาณค่าเฉลี่ยปัวซงหลายค่าพร้อมกัน

สมมติว่าเป็นเซตของตัวแปรสุ่มอิสระจากเซตของการแจกแจงปัวซง โดยแต่ละตัวแปรมีพารามิเตอร์และเราต้องการประมาณค่าพารามิเตอร์เหล่านี้ จากนั้น Clevenson และ Zidek แสดงให้เห็นว่าภายใต้การสูญเสียความคลาดเคลื่อนกำลังสองแบบปกติเมื่อนั้น คล้ายกับในตัวอย่างของ Steinสำหรับค่าเฉลี่ยปกติ ตัวประมาณค่า MLE จะไม่สามารถยอมรับได้[ 55 ]

ในกรณีนี้ ตระกูลของตัวประมาณค่ามินิแม็กซ์จะถูกกำหนดสำหรับค่าใดๆและดังเช่น[ 56 ]

การเกิดขึ้นและการประยุกต์ใช้

การประยุกต์ใช้การแจกแจงปัวซงกับข้อมูลการนับ (จำนวนเหตุการณ์) บางประการ: [ 57 ]

ตัวอย่างเพิ่มเติมของการนับเหตุการณ์ที่สามารถจำลองได้ด้วยกระบวนการปัวซง ได้แก่:

ในทฤษฎีจำนวนเชิงความน่าจะเป็นแกลลาเกอร์แสดงให้เห็นในปี 1976 ว่า หากสมมติฐานr-tuple ของจำนวนเฉพาะ ที่ยังไม่ได้ รับ การพิสูจน์บางเวอร์ชันเป็นจริง [ 70 ] แล้วจำนวนเฉพาะในช่วงเวลาสั้นๆ จะเป็นไปตามการแจกแจงปัวซง[ 71 ]

กฎของเหตุการณ์หายาก

การเปรียบเทียบการแจกแจงปัวซง (เส้นสีดำ) และการแจกแจงทวินามโดยที่n = 10 (วงกลมสีแดง), n = 20 (วงกลมสีน้ำเงิน), n = 1000 (วงกลมสีเขียว) การแจกแจงทั้งหมดมีค่าเฉลี่ยเท่ากับ 5 แกนแนวนอนแสดงจำนวนเหตุการณ์  kยิ่งnมีค่ามากขึ้น การแจกแจงปัวซงก็ยิ่งเป็นการประมาณค่าที่ดีขึ้นสำหรับการแจกแจงทวินามที่มีค่าเฉลี่ยเท่ากัน

อัตราการเกิดเหตุการณ์มีความสัมพันธ์กับความน่าจะเป็นที่เหตุการณ์นั้นจะเกิดขึ้นในช่วงเวลาย่อยเล็กๆ (ไม่ว่าจะเป็นเวลา สถานที่ หรืออื่นๆ) ในกรณีของการแจกแจงปัวซง เราจะสมมติว่ามีช่วงเวลาย่อยที่เล็กพอซึ่งความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นสองครั้งนั้น "น้อยมาก" ด้วยสมมติฐานนี้ เราสามารถสร้างการแจกแจงปัวซงจากการแจกแจงทวินามได้ โดยอาศัยเพียงข้อมูลเกี่ยวกับจำนวนเหตุการณ์ทั้งหมดที่คาดหวังในช่วงเวลาทั้งหมดเท่านั้น

ให้จำนวนเหตุการณ์ทั้งหมดในช่วงเวลาทั้งหมดแทนด้วยแบ่งช่วงเวลาทั้งหมดออกเป็นช่วงย่อยที่มีขนาดเท่ากัน โดยที่(เนื่องจากเราสนใจเฉพาะส่วนเล็ก ๆ ของช่วงเวลาเท่านั้น สมมติฐานนี้จึงมีความหมาย) ซึ่งหมายความว่าจำนวนเหตุการณ์ที่คาดหวังในแต่ละ ช่วงย่อยทั้ง nช่วงนั้นเท่ากับ

ตอนนี้เราสมมติว่าการเกิดเหตุการณ์ในช่วงเวลาทั้งหมดสามารถมองได้ว่าเป็นลำดับของการทดลองแบบเบอร์นูลลีn ครั้ง โดยที่การทดลองแบบเบอร์นูลลี ครั้งที่ -th สอดคล้องกับการตรวจสอบว่าเหตุการณ์เกิดขึ้นในช่วงเวลาย่อยด้วยความน่าจะเป็น -n หรือ ไม่ จำนวนเหตุการณ์ทั้งหมดที่คาดหวังในการทดลองดังกล่าวจะเป็นจำนวนเหตุการณ์ทั้งหมดที่คาดหวังในช่วงเวลาทั้งหมด ดังนั้นสำหรับแต่ละส่วนย่อยของช่วงเวลา เราได้ประมาณการการเกิดเหตุการณ์เป็นกระบวนการแบบเบอร์นูลลีในรูปแบบดังที่เราได้กล่าวไว้ก่อนหน้านี้ เราต้องการพิจารณาเฉพาะช่วงเวลาย่อยที่เล็กมากเท่านั้น ดังนั้น เราจึงใช้ลิมิตเมื่อ n เข้าสู่∞

ในกรณีนี้การแจกแจงทวินามจะลู่เข้าสู่สิ่งที่เรียกว่าการแจกแจงปัวซงโดยทฤษฎีบทขีดจำกัดของปัวซ

ในตัวอย่างข้างต้นหลายๆ ตัวอย่าง เช่น จำนวนการกลายพันธุ์ในลำดับดีเอ็นเอที่กำหนด เหตุการณ์ที่ถูกนับนั้นแท้จริงแล้วเป็นผลลัพธ์ของการทดลองแบบไม่ต่อเนื่อง และจะสามารถจำลองได้อย่างแม่นยำยิ่งขึ้นโดยใช้การแจกแจงแบบทวินามนั่นคือ

ในกรณีเช่นนี้nจะมีค่ามากและpจะมีค่าน้อยมาก (ดังนั้นค่าเฉลี่ยnpจึงมีขนาดปานกลาง) จากนั้นจึงสามารถประมาณการกระจายตัวได้โดยใช้การกระจายแบบปัวซงซึ่งไม่ซับซ้อนกว่า

บางครั้งการประมาณค่านี้เรียกว่ากฎของเหตุการณ์หายาก [ 72 ] : 5 เนื่องจาก เหตุการณ์เบอร์นูลลีแต่ละรายการ จำนวน n รายการเกิดขึ้นได้ยาก

ชื่อ "กฎของเหตุการณ์หายาก" อาจทำให้เข้าใจผิดได้ เพราะจำนวนรวมของเหตุการณ์ที่ประสบความสำเร็จในกระบวนการปัวซงไม่จำเป็นต้องหายากเสมอไป หากค่าพารามิเตอร์npไม่น้อย ตัวอย่างเช่น จำนวนสายโทรศัพท์ที่โทรเข้ามายังตู้รับสายที่ไม่ว่างในหนึ่งชั่วโมงนั้น เป็นไปตามการแจกแจงแบบปัวซง โดยเหตุการณ์เหล่านั้นดูเหมือนจะเกิดขึ้นบ่อยสำหรับผู้ให้บริการ แต่ถือว่าหายากจากมุมมองของคนทั่วไปที่แทบจะไม่โทรเข้ามายังตู้รับสายนั้นในชั่วโมงดังกล่าวเลย

ความแปรปรวนของการแจกแจงแบบทวินามเป็น1 − pเท่าของความแปรปรวนของการแจกแจงแบบปัวซง ดังนั้นจึงเกือบเท่ากันเมื่อpมีค่าเล็กมาก

บางครั้ง คำว่ากฎถูกใช้เป็นคำพ้องความหมายของการแจกแจงความน่าจะเป็นและการบรรจบกันในกฎหมายถึงการบรรจบกันในการแจกแจงดังนั้น การแจกแจงปัวซงจึงบางครั้งเรียกว่า "กฎของจำนวนน้อย" เพราะเป็นการแจกแจงความน่าจะเป็นของจำนวนครั้งของการเกิดเหตุการณ์ที่เกิดขึ้นไม่บ่อยนัก แต่มีโอกาสเกิดขึ้นมากมายกฎของจำนวนน้อยเป็นหนังสือของ Ladislaus Bortkiewicz เกี่ยวกับการแจกแจงปัวซง ตีพิมพ์ในปี 1898 [ 12 ] [ 73 ]

กระบวนการจุดปัวซง

การแจกแจงปัวซงเกิดขึ้นจากจำนวนจุดของกระบวนการจุดปัวซงที่อยู่ในบริเวณจำกัดบางแห่ง โดยเฉพาะอย่างยิ่ง ถ้าDเป็นปริภูมิบริเวณ เช่น ปริภูมิยุคลิดR dซึ่ง| D |พื้นที่ ปริมาตร หรือโดยทั่วไปแล้ว การวัดแบบเลเบสของบริเวณนั้นมีค่าจำกัด และถ้าN ( D )แทนจำนวนจุดในDแล้ว

การถดถอยปัวซงและการถดถอยทวินามเชิงลบ

การถดถอยแบบปัวซงและ การถดถอยแบบทวิ นามเชิงลบมีประโยชน์สำหรับการวิเคราะห์ที่ตัวแปรตาม (ตัวแปรตอบสนอง) คือจำนวนนับ(0, 1, 2, ... )ของจำนวนเหตุการณ์หรือการเกิดขึ้นในช่วงเวลาหนึ่ง

ชีววิทยา

การทดลอง ของลูเรีย-เดลบรุคได้ทดสอบกับสมมติฐานของการวิวัฒนาการแบบลามาร์ค ซึ่งควรจะส่งผลให้เกิดการแจกแจงแบบปัวซง

Katz และ Miledi วัดศักย์เยื่อหุ้มเซลล์ทั้งที่มีและไม่มีอะเซทิลโคลีน (ACh) [ 74 ]เมื่อมี ACh อยู่ช่องไอออนบนเยื่อหุ้มเซลล์จะเปิดแบบสุ่มในช่วงเวลาสั้นๆ เนื่องจากมีช่องไอออนจำนวนมากที่แต่ละช่องเปิดในช่วงเวลาสั้นๆ จำนวนช่องไอออนทั้งหมดที่เปิดในแต่ละช่วงเวลาจึงมีการกระจายแบบปัวซง เมื่อไม่มี ACh อยู่ ในทางปฏิบัติแล้วจะไม่มีช่องไอออนเปิด ศักย์เยื่อหุ้มเซลล์คือเมื่อหักลบผลกระทบของสัญญาณรบกวนแล้ว Katz และ Miledi พบว่าค่าเฉลี่ยและความแปรปรวนของศักย์เยื่อหุ้มเซลล์คือและตามลำดับ ทำให้ได้(หน้า 94-95 [ 75 ] )

ในระหว่างการจำลองเซลล์แต่ละครั้ง จำนวนการกลายพันธุ์จะกระจายตัวแบบปัวซงโดยประมาณ[ 76 ]ตัวอย่างเช่น ไวรัส HIV มีเบสคู่ 10,000 คู่ และมีอัตราการกลายพันธุ์ประมาณ 1 ต่อเบสคู่ 30,000 คู่ ซึ่งหมายความว่าจำนวนการกลายพันธุ์ต่อการจำลองแต่ละครั้งจะกระจายตัวเป็น. (หน้า 64 [ 75 ] )

การประยุกต์ใช้ในด้านวิทยาศาสตร์อื่นๆ

ในกระบวนการปัวซง จำนวนเหตุการณ์ที่สังเกตได้จะผันผวนรอบค่าเฉลี่ยλโดยมีค่าเบี่ยงเบนมาตรฐาน σ ความผันผวนเหล่านี้เรียกว่าสัญญาณรบกวนปัวซงหรือ (โดยเฉพาะในด้านอิเล็กทรอนิกส์) เรียกว่าสัญญาณรบกวนช็อ

ความสัมพันธ์ระหว่างค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานในการนับเหตุการณ์ที่ไม่ต่อเนื่องกันนั้นมีประโยชน์ทางวิทยาศาสตร์ โดยการสังเกตว่าความผันผวนเปลี่ยนแปลงไปอย่างไรเมื่อเทียบกับสัญญาณเฉลี่ย เราสามารถประมาณการส่วนร่วมของเหตุการณ์แต่ละครั้งได้แม้ว่าส่วนร่วมนั้นจะเล็กเกินกว่าจะตรวจจับได้โดยตรงก็ตาม ตัวอย่างเช่น ประจุeบนอิเล็กตรอนสามารถประมาณได้โดยการหาความสัมพันธ์ระหว่างขนาดของกระแสไฟฟ้ากับสัญญาณรบกวนแบบสุ่ม (shot noise ) ถ้า อิเล็กตรอน Nตัวผ่านจุดหนึ่งในช่วงเวลาtโดยเฉลี่ยกระแสไฟฟ้าเฉลี่ย คือ; เนื่องจากความผันผวนของกระแสไฟฟ้าควรอยู่ในลำดับ(เช่น ค่าเบี่ยงเบนมาตรฐานของกระบวนการปัวซง ) ประจุจึงสามารถประมาณได้จากอัตราส่วน

ตัวอย่างที่พบได้ทั่วไปคือความหยาบที่ปรากฏขึ้นเมื่อขยายภาพถ่าย ความหยาบนั้นเกิดจากความผันผวนแบบปัวซงของจำนวน อนุภาค เงิน ที่ลดลง ไม่ใช่เกิดจากอนุภาคแต่ละอนุภาคเอง การหาความสัมพันธ์ ระหว่าง ความหยาบกับระดับการขยายจะช่วยให้สามารถประเมินสัดส่วนการมีส่วนร่วมของอนุภาคแต่ละอนุภาคได้ (ซึ่งมีขนาดเล็กเกินกว่าจะมองเห็นได้ด้วยตาเปล่า)

ใน ทฤษฎี เซตเชิงสาเหตุองค์ประกอบที่ไม่ต่อเนื่องของปริภูมิเวลาจะเป็นไปตามการแจกแจงแบบปัวซงในปริมาตร

การแจกแจงแบบปัวซงยังปรากฏในกลศาสตร์ควอนตัมโดยเฉพาะอย่างยิ่งในทัศนศาสตร์ควอนตัมกล่าวคือ สำหรับ ระบบ ตัวสั่นฮาร์มอนิกควอนตัมในสถานะโคherentความน่าจะเป็นของการวัดระดับพลังงานเฉพาะนั้นมีการกระจายแบบปัวซง

วิธีการคำนวณ

การแจกแจงแบบปัวซงก่อให้เกิดภารกิจที่แตกต่างกันสองอย่างสำหรับไลบรารีซอฟต์แวร์เฉพาะทาง ได้แก่การประเมินการแจกแจงและการสุ่มตัวเลขตามการแจกแจงนั้น

การประเมินการแจกแจงปัวซง

การคำนวณค่าสำหรับค่าที่กำหนดและนั้นเป็นงานง่ายๆ ที่สามารถทำได้โดยใช้คำจำกัดความมาตรฐานของในรูปของฟังก์ชันเลขชี้กำลัง ฟังก์ชันกำลัง และฟังก์ชันแฟกทอเรียล อย่างไรก็ตาม คำจำกัดความทั่วไปของการแจกแจงปัวซงมีสองพจน์ที่อาจทำให้เกิดค่าเกินขีดจำกัดในคอมพิวเตอร์ได้ง่าย คือλ kและk !เศษส่วนของλ kต่อk !ยังสามารถทำให้เกิดข้อผิดพลาดในการปัดเศษที่ใหญ่มากเมื่อเทียบกับe λและดังนั้นจึงให้ผลลัพธ์ที่ผิดพลาด เพื่อความเสถียรเชิงตัวเลข ฟังก์ชันความน่าจะเป็นมวลของปัวซงจึงควรได้รับการประเมินเป็น ซึ่งเทียบเท่าทางคณิตศาสตร์แต่มีความเสถียรเชิงตัวเลข ลอการิทึมธรรมชาติของฟังก์ชันแกมมาสามารถหาได้โดยใช้ฟังก์ชันใน ไลบรารีมาตรฐานของภาษา C (เวอร์ชัน C99) หรือRฟังก์ชันในMATLABหรือSciPyหรือฟังก์ชันในFortran  2008 และเวอร์ชันที่ใหม่กว่า lgammagammalnlog_gamma

ภาษาโปรแกรมบางภาษามีฟังก์ชันในตัวสำหรับประเมินการแจกแจงปัวซง ได้แก่

  • R : ฟังก์ชันdpois(x, lambda);
  • Excel : ฟังก์ชันPOISSON( x, mean, cumulative)ที่มีแฟล็กสำหรับระบุการกระจายสะสม
  • Mathematica : การแจกแจงปัวซงแบบเอกตัวแปรเป็น, [ 77 ]การแจกแจงปัวซงแบบทวิตัวแปรเป็น,. [ 78 ]PoissonDistribution[]MultivariatePoissonDistribution[{ }]

การสร้างตัวแปรสุ่ม

งานที่ยากกว่าคือการสุ่มเลือกตัวแปรสุ่ม จำนวนเต็ม จาก1การแจกแจงปัวซงโดยกำหนดค่าที่กำหนดให้

โซลูชันนี้จัดทำโดย:

Knuthได้นำเสนออัลกอริธึมง่ายๆ เพื่อสร้างตัวเลขสุ่มที่มีการแจกแจงแบบปัวซง ( การสุ่มตัวอย่างตัวเลขสุ่มเทียม ) : [ 79 ] : 137-138

อัลกอริทึมเลขสุ่มปัวซง (Knuth) : เริ่มต้น : ให้ L ← e λ , k ← 0 และ p ← 1 ดำเนินการ : k ← k + 1. สร้างเลขสุ่มสม่ำเสมอ u ในช่วง [0,1] และกำหนดให้ p ← p × u ขณะที่ p > L ให้ส่งคืน k − 1 

ความซับซ้อนเป็นแบบเชิงเส้นตามค่าที่ส่งคืนkซึ่งโดยเฉลี่ยคือλมีอัลกอริธึมอื่นๆ อีกมากมายที่สามารถปรับปรุงให้ดีขึ้นได้ บางส่วนได้ระบุไว้ในงานของ Ahrens & Dieter โปรดดูหัวข้อ § เอกสารอ้างอิงด้านล่าง

สำหรับค่าλที่มีขนาดใหญ่ ค่าของL = e λอาจมีขนาดเล็กมากจนยากต่อการแสดงผล ปัญหานี้สามารถแก้ไขได้โดยการปรับเปลี่ยนอัลกอริธึมโดยใช้พารามิเตอร์เพิ่มเติม STEP เพื่อให้e −STEPไม่เกิดภาวะอันเดอร์โฟลว์:

อัลกอริทึมเลขสุ่มปัวซง (จุนฮ่าว อ้างอิงจากคนุธ) : เริ่มต้น : ให้λซ้าย ← λ , k ← 0 และ p ← 1 ทำซ้ำ : k ← k + 1. สร้างเลขสุ่มสม่ำเสมอ u ในช่วง (0,1) และให้ p ← p × u ในขณะที่ p < 1 และλ Left > 0: ถ้าλ Left > STEP: p ← p × e STEP λ Left ← λ Left − STEP else : p ← p × e λ Left λ Left ← 0 ในขณะที่ p > 1 ส่งคืน k − 1 

การเลือกค่า STEP ขึ้นอยู่กับค่าขีดจำกัดของการโอเวอร์โฟลว์ สำหรับรูปแบบเลขทศลอยแบบความแม่นยำสองเท่า ค่าขีดจำกัดจะใกล้เคียงกับe 700ดังนั้น 500 น่าจะเป็นค่าSTEP ที่ ปลอดภัย

วิธีแก้ปัญหาอื่นๆ สำหรับค่าλ ที่มีขนาดใหญ่ ได้แก่การสุ่มตัวอย่างแบบปฏิเสธและการใช้การประมาณค่าแบบเกาส์เซียน

การสุ่มตัวอย่างแบบแปลงผกผันนั้นง่ายและมีประสิทธิภาพสำหรับค่าλ ที่มีขนาดเล็ก และต้องการเพียงตัวเลขสุ่มแบบเอกรูปu เพียงตัวเดียวต่อตัวอย่าง โดยจะตรวจสอบความน่าจะเป็นสะสมทีละตัวจนกว่าจะ มี ค่าใดค่าหนึ่งเกินu

อัลกอริธึมเครื่องกำเนิดปัวซองขึ้นอยู่กับการผกผันโดยการค้นหาตามลำดับ : [ 80 ] : 505  init : ให้ x ← 0, p ← e lad , s ← p สร้างเลขสุ่มแบบเอกรูป u ในช่วง [0,1] ในขณะที่ u > s ทำดังนี้: x ← x + 1. p ← p × λ / x. s ← s + p. ส่งคืนค่า x 

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Poisson_distribution&oldid=1355788475 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การแจกแจงปัวซง

ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจงปัวซง ( / ˈ p w ɑː s ɒ n / ) เป็นการ แจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ที่แสดงความน่าจะเป็นของการเกิด เหตุการณ์...

ประวัติศาสตร์

การนำเสนอการแจกแจงปัวซงได้รับการยกย่องให้แก่นักคณิตศาสตร์และนักฟิสิกส์ชาวฝรั่งเศส Siméon Denis Poisson (1781–1840) ซึ่งตีพิมพ์พร้อมกับทฤษฎีความน่าจะเป็นของเขาใน Recherches sur la probabilité des jugements en matière criminelle et en matière civile (1837) [ 4...

ฟังก์ชันมวลความน่าจะเป็น

ตัวแปรสุ่ม แบบ ไม่ต่อเนื่อง X กล่าวได้ว่ามีการแจกแจงแบบปัวซงที่มีพารามิเตอร์ถ้ามี ฟังก์ชันมวลความน่าจะเป็น ที่กำหนดโดย: [ 2 ] : 60 โดยที่ 0}"> λ > 0 {\displaystyle \lambda >0} 0}"> เอฟ ( เค ; λ ) = ปร. ( X = เค ) = λ เค อี − λ เค !

ตัวอย่าง

การแจกแจงแบบปัวซงอาจมีประโยชน์ในการจำลองเหตุการณ์ต่างๆ เช่น: