การแจกแจงปัวซง

Q: ฟังก์ชันมวลความน่าจะเป็น

ตัวแปรสุ่ม แบบ ไม่ต่อเนื่อง X กล่าวได้ว่ามีการแจกแจงแบบปัวซงที่มีพารามิเตอร์ถ้ามี ฟังก์ชันมวลความน่าจะเป็น ที่กำหนดโดย: [ 2 ] : 60 โดยที่ 0}"> λ > 0 {\displaystyle \lambda >0} 0}"> เอฟ ( เค ; λ ) = ปร. ( X = เค ) = λ เค อี − λ เค !

การแจกแจงปัวซง
การแจกแจงปัวซง
	ฟังก์ชันมวลความน่าจะเป็น แกนแนวนอนคือดัชนีkซึ่งเป็นจำนวนครั้งที่เกิดขึ้นλคืออัตราการเกิดเหตุการณ์ที่คาดหวัง แกนแนวตั้งคือความน่าจะเป็นของการเกิดเหตุการณ์k ครั้ง เมื่อกำหนดค่า λแล้ว ฟังก์ชันนี้กำหนดได้เฉพาะที่ค่าk เป็นจำนวนเต็ม เท่านั้น เส้นเชื่อมระหว่างแกนเป็นเพียงเส้นนำสายตาเท่านั้น
	ฟังก์ชันการกระจายสะสม แกนแนวนอนคือดัชนีkซึ่งเป็นจำนวนครั้งที่เกิดขึ้น ฟังก์ชันการกระจายสะสม (CDF) จะไม่ต่อเนื่องที่จำนวนเต็มkและจะราบเรียบที่จุดอื่นๆ เนื่องจากตัวแปรที่มีการกระจายแบบปัวซงจะมีค่าเป็นจำนวนเต็มเท่านั้น
สัญกรณ์
พารามิเตอร์	(ประเมิน)
สนับสนุน	( จำนวนธรรมชาติเริ่มต้นจาก 0)
พีเอ็มเอฟ
ซีดีเอฟ	หรือหรือ (โดยที่คือฟังก์ชันแกมมาไม่สมบูรณ์บนคือฟังก์ชันพื้นและคือฟังก์ชันแกมมาแบบปรับค่า )
หมายถึง
ค่ามัธยฐาน
โหมด
ความแปรปรวน
ความเบี่ยงเบน
ความโค้งส่วนเกิน
เอนโทรปี	หรือสำหรับขนาดใหญ่
เอ็มจีเอฟ
ซีเอฟ
พีจีเอฟ
ข้อมูลของฟิชเชอร์

ในทฤษฎีความน่าจะเป็นและสถิติการแจกแจงปัวซง ( / ˈ p w ɑː s ɒ n / ) เป็นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ที่แสดงความน่าจะเป็นของการเกิด เหตุการณ์จำนวนหนึ่งในช่วงเวลาที่กำหนด หากเหตุการณ์เหล่านี้เกิดขึ้นด้วยอัตราเฉลี่ยคงที่ที่ทราบ และเป็นอิสระจากเวลาตั้งแต่เหตุการณ์สุดท้าย^{[ 1 ]}นอกจากนี้ยังสามารถใช้สำหรับจำนวนเหตุการณ์ในช่วงเวลาประเภทอื่นที่ไม่ใช่เวลา และในมิติที่มากกว่า 1 (เช่น จำนวนเหตุการณ์ในพื้นที่หรือปริมาตรที่กำหนด) การแจกแจงปัวซงตั้งชื่อตามนักคณิตศาสตร์ชาวฝรั่งเศส Siméon Denis Poissonมีบทบาทสำคัญในการแจกแจงแบบเสถียรไม่ต่อเนื่อง

ภายใต้การแจกแจงปัวซงที่คาดหวังเหตุการณ์ $λ$ ในช่วงเวลาที่กำหนด ความน่าจะเป็นของเหตุการณ์ $k ในช่วงเวลาเดียวกันคือ:$ ^{[ 2 ]}^{: 60} ตัวอย่างเช่น พิจารณาศูนย์บริการลูกค้าที่รับสายโดยเฉลี่ย $λ$ $= 3$ สายต่อนาทีตลอดเวลา หากจำนวนสายที่ได้รับในช่วงเวลาสองช่วงใดๆ ที่ไม่ทับซ้อนกันเป็นอิสระต่อกัน จำนวนสาย $k ที่ได้รับในนาทีใดๆ จะมีการแจกแจงความน่าจะเป็นแบบปัวซง การรับสาย$ $k$ $= 1 ถึง 4$ สายจะมีความน่าจะเป็นประมาณ 0.77 ในขณะที่การรับสาย 0 หรืออย่างน้อย 5 สายจะมีความน่าจะเป็นประมาณ 0.23 ${\frac {\แลมบ์ดา ^{k}e^{-\lambda }}{k!}}.$

ตัวอย่างคลาสสิกที่ใช้เพื่อกระตุ้นให้เกิดการแจกแจงแบบปัวซงคือจำนวน เหตุการณ์ การสลายตัวของกัมมันตรังสีในช่วงระยะเวลาการสังเกตที่กำหนด^{[ 3 ]}

ประวัติศาสตร์

การนำเสนอการแจกแจงปัวซงได้รับการยกย่องให้แก่นักคณิตศาสตร์และนักฟิสิกส์ชาวฝรั่งเศสSiméon Denis Poisson (1781–1840) ซึ่งตีพิมพ์พร้อมกับทฤษฎีความน่าจะเป็นของเขาในRecherches sur la probabilité des jugements en matière criminelle et en matière civile (1837) ^{[ 4 ]}^{: 205-207}งานนี้ตั้งทฤษฎีเกี่ยวกับจำนวนการตัดสินผิดพลาดในประเทศหนึ่งๆ โดยมุ่งเน้นไปที่ตัวแปรสุ่ม $N$ บางตัว ที่นับจำนวนเหตุการณ์ที่เกิดขึ้นในช่วงเวลาที่กำหนด อย่างไรก็ตาม ผลลัพธ์ที่คล้ายกันนี้เคยมีมาก่อนแล้วในปี 1711 โดยAbraham de MoivreในDe Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus ^{[ 5 ]}^{: 219}^{[ 6 ]}^{: 14-15}^{[ 7 ]}^{: 193}^{[ 8 ]}^{: 157}สิ่งนี้ทำให้เป็นตัวอย่างของกฎของ Stiglerและกระตุ้นให้ผู้เขียนบางคนโต้แย้งว่าการแจกแจงปัวซงควรใช้ชื่อว่า de Moivre ^{[ 9 ]}^{[ 10 ]}

ในปี พ.ศ. 2403 Simon Newcombได้ปรับการแจกแจงแบบปัวซงให้เข้ากับจำนวนดาวที่พบในหน่วยของพื้นที่^{[ 11 ]} การประยุกต์ใช้ในทางปฏิบัติเพิ่มเติมเกิดขึ้นโดยLadislaus Bortkiewiczในปี พ.ศ. 2441 Bortkiewicz แสดงให้เห็นว่าความถี่ที่ทหารในกองทัพปรัสเซียถูกม้าเตะจนเสียชีวิตโดยอุบัติเหตุนั้นสามารถจำลองได้อย่างดีด้วยการแจกแจงแบบปัวซง^{[ 12 ]}^: 23-25

คำจำกัดความ

ฟังก์ชันมวลความน่าจะเป็น

ตัวแปรสุ่ม แบบ ไม่ต่อเนื่อง $X$ กล่าวได้ว่ามีการแจกแจงแบบปัวซงที่มีพารามิเตอร์ถ้ามีฟังก์ชันมวลความน่าจะเป็นที่กำหนดโดย: ^[²^]^{: 60} โดยที่ $\lambda >0$ $f(k;\lambda )=\Pr(X{=}k)={\frac {\lambda ^{k}e^{-\lambda }}{k!}},$

$k$ คือจำนวนครั้งที่เกิดขึ้น ( ) $k=0,1,2,\ldots$
$e$ คือจำนวนของออยเลอร์ ( ) $e=2.71828\ldots$
$k! = k (k- 1) \cdot\cdot\cdot (3)(2)(1)$ คือแฟกทอเรียล

จำนวนจริง บวก $λ$ เท่ากับค่าที่คาดหวังของ $X$ และเท่ากับความแปรปรวน ของมัน ด้วย^{[ 13 ]} $\lambda =\operatorname {E} (X)=\operatorname {Var} (X).$

การแจกแจงปัวซงสามารถนำไปใช้กับระบบที่มีเหตุการณ์ที่เป็นไปได้จำนวนมาก ซึ่งแต่ละเหตุการณ์เกิดขึ้นได้ยากจำนวนเหตุการณ์ดังกล่าวที่เกิดขึ้นในช่วงเวลาที่กำหนดนั้น ภายใต้เงื่อนไขที่เหมาะสม จะเป็นจำนวนสุ่มที่มีการแจกแจงแบบปัวซง

สมการสามารถปรับเปลี่ยนได้ หากแทนที่จะใช้จำนวนเหตุการณ์เฉลี่ยเราได้รับอัตราเฉลี่ยที่เหตุการณ์เกิดขึ้น จากนั้นและ: ^[¹⁴^] $\lambda ,$ $r$ $\lambda =rt,$ $P(k{\text{ เหตุการณ์ในช่วงเวลา }}t)={\frac {(rt)^{k}e^{-rt}}{k!}}.$

ตัวอย่าง

การแจกแจงแบบปัวซงอาจมีประโยชน์ในการจำลองเหตุการณ์ต่างๆ เช่น:

จำนวนอุกกาบาตที่มีเส้นผ่านศูนย์กลางมากกว่าหนึ่งเมตรที่พุ่งชนโลกในหนึ่งปี
จำนวนโฟตอนเลเซอร์ที่ตกกระทบตัวตรวจจับในช่วงเวลาที่กำหนด
จำนวนนักเรียนที่ได้คะแนนต่ำและคะแนนสูงในการสอบ และ
ตำแหน่งของข้อบกพร่องและการเคลื่อนตัวในวัสดุ

ตัวอย่างของการเกิดจุดสุ่มในอวกาศ ได้แก่ ตำแหน่งที่ดาวเคราะห์น้อยพุ่งชนโลก (2 มิติ) ตำแหน่งของความไม่สมบูรณ์ในวัสดุ (3 มิติ) และตำแหน่งของต้นไม้ในป่า (2 มิติ) ^{[ 15 ]}

ข้อสมมติฐานและความถูกต้อง

การแจกแจงปัวซงเป็นแบบจำลองที่เหมาะสมหากข้อสมมติฐานต่อไปนี้เป็นจริง:

$k$ เป็นจำนวนเต็มที่ไม่เป็นลบ ซึ่งระบุจำนวนครั้งที่เหตุการณ์เกิดขึ้นในช่วงเวลาหนึ่ง
การเกิดเหตุการณ์หนึ่งไม่ได้ส่งผลต่อโอกาสที่จะเกิดเหตุการณ์ที่สอง
อัตราเฉลี่ยของการเกิดเหตุการณ์นั้นไม่ขึ้นอยู่กับการเกิดเหตุการณ์ใดๆ
เหตุการณ์สองเหตุการณ์ไม่สามารถเกิดขึ้นพร้อมกันในเวลาเดียวกันได้อย่างแม่นยำ

ถ้าเงื่อนไขเหล่านี้เป็นจริง แสดงว่า $k$ เป็นตัวแปรสุ่มปัวซง และการแจกแจงของ $k$ ก็เป็นการแจกแจงปัวซงเช่นกัน

การแจกแจงปัวซงยังเป็นลิมิตของการแจกแจงทวินามซึ่งความน่าจะเป็นของความสำเร็จในการทดลองแต่ละครั้งคือโดยที่คือค่าคาดหวัง และคือจำนวนครั้งของการทดลอง ในลิมิตที่โดยที่ คงที่ ^[¹⁶^]^[¹⁷^] (ดูการแจกแจงที่เกี่ยวข้อง ): $p={\frac {\แลมบ์ดา }{n}}$ $\lambda$ $n$ $n\to \infty$ $\lambda$

$\lim _{n\to \infty }{\dbinom {n}{k}}\left({\frac {\lambda }{n}}\right)^{k}\,\left(1-{\frac {\lambda }{n}}\right)^{nk}={\frac {\lambda ^{k}}{k!}}\,e^{-\lambda }$

การแจกแจงปัวซงอาจได้มาจากสมการเชิงอนุพันธ์ด้วยเช่นกัน^{[ 18 ]}^{[ 19 ]}^{[ 20 ]}

${\frac {d\,P_{k}(t)}{dt}}=\lambda \,{\Big (}P_{k-1}(t)-P_{k}(t){\Big )}$

โดยมีเงื่อนไขเริ่มต้นและประเมินผลที่ $P_{k}(0)=\เดลต้า _{k0}$ $t=1$

ตัวอย่างความน่าจะเป็นสำหรับการแจกแจงปัวซง

ในแม่น้ำสายหนึ่ง น้ำท่วมล้นตลิ่งเกิดขึ้นโดยเฉลี่ยทุกๆ 100 ปี จงคำนวณความน่าจะเป็นของการเกิด น้ำท่วมล้นตลิ่งจำนวน $k$ = 0, 1, 2, 3, 4, 5 หรือ 6 ครั้ง ในช่วงเวลา 100 ปี โดยสมมติว่าแบบจำลองปัวซงเหมาะสม

เนื่องจากอัตราการเกิดเหตุการณ์โดยเฉลี่ยคือน้ำท่วมล้นหนึ่งครั้งต่อ 100 ปี ดังนั้น $λ = 1$

${\begin{aligned}P(k{\text{ overflow floods in 100 years}})&={\frac {\lambda ^{k}e^{-\lambda }}{k!}}={\frac {1^{k}e^{-1}}{k!}}\\P(k=0{\text{ overflow floods in 100 years}})&={\frac {1^{0}e^{-1}}{0!}}={\frac {e^{-1}}{1}}\approx 0.368\\P(k=1{\text{ overflow flood in 100 years}})&={\frac {1^{1}e^{-1}}{1!}}={\frac {e^{-1}}{1}}\approx 0.368\\P(k=2{\text{ overflow floods in 100 years}})&={\frac {1^{2}e^{-1}}{2!}}={\frac {e^{-1}}{2}}\approx 0.184\end{aligned}}$

$เค$	$P (k จำนวนน้ำท่วมล้นใน 100 ปี)$
0	0.368
1	0.368
2	0.184
3	0.061
4	0.015
5	0.003
6	0.0005

ความน่าจะเป็นของการเกิดน้ำท่วมล้นตลิ่ง 0 ถึง 6 ครั้ง ในช่วงเวลา 100 ปี

ในตัวอย่างนี้ มีรายงานว่าจำนวนประตูเฉลี่ยในการแข่งขันฟุตบอลโลกอยู่ที่ประมาณ 2.5 และแบบจำลองปัวซงมีความเหมาะสม^{[ 21 ]} เนื่องจากอัตราการเกิดเหตุการณ์เฉลี่ยอยู่ที่ 2.5 ประตูต่อแมตช์ ดังนั้น $λ = 2.5$

${\begin{aligned}P(k{\text{ goals in a match}})&={\frac {2.5^{k}e^{-2.5}}{k!}}\\P(k=0{\text{ goals in a match}})&={\frac {2.5^{0}e^{-2.5}}{0!}}={\frac {e^{-2.5}}{1}}\approx 0.082\\P(k=1{\text{ goal in a match}})&={\frac {2.5^{1}e^{-2.5}}{1!}}={\frac {2.5e^{-2.5}}{1}}\approx 0.205\\P(k=2{\text{ goals in a match}})&={\frac {2.5^{2}e^{-2.5}}{2!}}={\frac {6.25e^{-2.5}}{2}}\approx 0.257\end{aligned}}$

$เค$	$P ( จำนวนประตู k ในการแข่งขันฟุตบอลโลก)$
0	0.082
1	0.205
2	0.257
3	0.213
4	0.133
5	0.067
6	0.028
7	0.010

โอกาสที่จะเกิดประตูตั้งแต่ 0 ถึง 7 ประตูในหนึ่งแมตช์

ตัวอย่างที่ละเมิดข้อสมมติฐานของปัวซง

จำนวนนักเรียนที่มาถึงอาคารสโมสรนักศึกษาต่อนาทีนั้น อาจจะไม่เป็นไปตามการแจกแจงแบบปัวซง เนื่องจากอัตราการมาถึงไม่คงที่ (อัตราต่ำในช่วงเวลาเรียน อัตราสูงระหว่างช่วงเวลาเรียน) และการมาถึงของนักเรียนแต่ละคนก็ไม่เป็นอิสระต่อกัน (นักเรียนมักจะมาเป็นกลุ่ม) อัตราการมาถึงที่ไม่คงที่นี้อาจจำลองได้ด้วยการแจกแจงแบบปัวซงผสมและการมาถึงของกลุ่มนักเรียนแทนที่จะเป็นนักเรียนแต่ละคนอาจ จำลองได้ด้วย การแจกแจงแบบปัวซงเชิงประกอบ

จำนวนแผ่นดินไหวขนาด 5 ริกเตอร์ต่อปีในประเทศหนึ่ง อาจไม่เป็นไปตามการกระจายแบบปัวซง หากแผ่นดินไหวขนาดใหญ่ครั้งหนึ่งเพิ่มความน่าจะเป็นของการเกิดแผ่นดินไหวตามมาที่มีขนาดใกล้เคียงกัน

ตัวอย่างที่รับประกันว่าจะมีเหตุการณ์อย่างน้อยหนึ่งเหตุการณ์เกิดขึ้นนั้น ไม่ได้มีการแจกแจงแบบปัวซง แต่สามารถจำลองได้โดยใช้การแจกแจงแบบปัวซงที่ตัดศูนย์ออก

การแจกแจงจำนวนนับที่จำนวนช่วงเวลาที่มีเหตุการณ์เป็นศูนย์สูงกว่าที่คาดการณ์โดยแบบจำลองปัวซง อาจสร้างแบบจำลองได้โดยใช้แบบจำลองที่มีค่าศูนย์มากเกินไป (zero-inflated model )

คุณสมบัติ

สถิติเชิงพรรณนา

ค่าที่คาดหวังของตัวแปรสุ่มปัวซงคือ $λ$
ค่าความแปรปรวนของตัวแปรสุ่มปัวซงก็คือ $λ$ เช่น กัน
ค่าสัมประสิทธิ์ความแปรผันคือในขณะที่ดัชนีการกระจายตัวคือ 1 ^[⁸^]^{: 163} ${\textstyle \lambda ^{-1/2},}$
ค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยรอบค่าเฉลี่ยคือ^{[ 8 ]}^{: 163} $\operatorname {E} [\ |X-\lambda |\ ]={\frac {2\lambda ^{\lfloor \lambda \rfloor +1}e^{-\lambda }}{\lfloor \lambda \rfloor !}}.$
โหมด ของตัวแปรสุ่มที่มีการแจกแจงแบบปัวซง โดยที่ $λ$ ไม่ใช่จำนวนเต็มจะเท่ากับ ซึ่งเป็นจำนวนเต็มที่มากที่สุด ที่น้อยกว่าหรือเท่ากับ $λ$ เขียนได้อีกแบบว่า $floor$ $($ $λ$ $)$ เมื่อ $λ$ เป็นจำนวนเต็มบวก โหมดจะเป็น $λ$ และ $λ$ $-$ 1 $\lfloor \lambda \rfloor ,$
ค่า สะสมทั้งหมดของการแจกแจงปัวซงมีค่าเท่ากับค่าคาดหวัง $λ$ โมเมนต์แฟกทอเรียลลำดับที่n $ของ$ การแจกแจงปัวซงคือ $λ$ $n$
ค่าที่คาดหวังของกระบวนการปัวซงบางครั้งจะถูกแยกออกเป็นผลคูณของความเข้มและการสัมผัส (หรือโดยทั่วไปแล้วจะแสดงเป็นปริพันธ์ของ "ฟังก์ชันความเข้ม" ในช่วงเวลาหรือพื้นที่ ซึ่งบางครั้งเรียกว่า "การสัมผัส") ^{[ 22 ]}

ค่ามัธยฐาน

ขอบเขตสำหรับค่ามัธยฐาน ( ) ของการกระจายเป็นที่ทราบและมีความแม่นยำ : ^[²³^] $\nu$ $\lambda -\ln 2\leq \nu <\lambda +{\frac {1}{3}}.$

ช่วงเวลาที่สูงกว่า

โมเมนต์ ที่ไม่เป็นศูนย์กลางที่สูงกว่า $m k$ ของการแจกแจงปัวซงคือพหุนาม Touchardใน $λ$ : โดยที่วงเล็บปีกกา { } หมายถึงจำนวน Stirling ชนิดที่สอง [ ²⁴^]^[¹^]^:⁶กล่าวอีกนัยหนึ่ง เมื่อค่าที่คาดหวังถูกตั้งค่าเป็น $λ$ $= 1$ สูตรของ Dobinskiบ่งชี้ว่า โมเมนต์ลำดับที่ $n$ เท่ากับจำนวนพาร์ติชันของเซตที่ มีขนาด $n$ $m_{k}=\sum _{i=0}^{k}\lambda ^{i}{\begin{Bmatrix}k\\i\end{Bmatrix}},$ $E[X]=\lambda ,\quad E[X(X-1)]=\lambda ^{2},\quad E[X(X-1)(X-2)]=\lambda ^{3},\cdots$

ขอบเขตบนแบบง่ายคือ: ^{[ 25 ]} $m_{k}=E[X^{k}]\leq \left({\frac {k}{\log(k/\lambda +1)}}\right)^{k}\leq \lambda ^{k}\exp \left({\frac {k^{2}}{2\lambda }}\right).$

ผลรวมของตัวแปรสุ่มที่มีการแจกแจงแบบปัวซง

ถ้าสำหรับเป็นอิสระต่อกันแล้ว^[²⁶^]^{: 65}บทกลับคือทฤษฎีบทของ Raikovซึ่งกล่าวว่า ถ้าผลรวมของตัวแปรสุ่มอิสระสองตัวมีการแจกแจงแบบปัวซง ตัวแปรสุ่มอิสระทั้งสองตัวนั้นก็จะมีการแจกแจงแบบปัวซงเช่นกัน^[²⁷^]^[²⁸^] $X_{i}\sim \operatorname {Pois} (\lambda _{i})$ $i=1,\dotsc ,n$ ${\textstyle \sum _{i=1}^{n}X_{i}\sim \operatorname {Pois} \left(\sum _{i=1}^{n}\lambda _{i}\right).}$

เอนโทรปีสูงสุด

เป็นการแจกแจงเอนโทรปีสูงสุดในเซตของการแจกแจงทวินามทั่วไป ที่มี ^ค่าเฉลี่ยและ[ ²⁹^]โดยที่การแจกแจงทวินามทั่วไปถูกกำหนดให้เป็นการแจกแจงผลรวมของตัวแปรเบอร์นูลีอิสระจำนวน N ตัวแต่ไม่ได้แจกแจงเหมือนกัน $B_{n}(\lambda )$ $\lambda$ $n\to \infty$

คุณสมบัติอื่นๆ

การแจกแจงปัวซงเป็นการแจกแจงความน่าจะเป็นที่แบ่งได้ไม่จำกัด^{[ 30 ]}^{: 233}^{[ 8 ]}^{: 164}
ความแตกต่าง แบบKullback–Leibler ที่มีทิศทาง ของจากกำหนดโดย $P=\operatorname {Pois} (\lambda )$ $P_{0}=\operatorname {Pois} (\lambda _{0})$ $\operatorname {D} _{\text{KL}}(P\parallel P_{0})=\lambda _{0}-\lambda +\lambda \log {\frac {\lambda }{\lambda _{0}}}.$
ถ้าเป็นจำนวนเต็มจะต้องเป็นไปตามเงื่อนไขและ^[³¹^] $\lambda \geq 1$ $Y\sim \operatorname {Pois} (\lambda )$ $\Pr(Y\geq E[Y])\geq {\frac {1}{2}}$ $\Pr(Y\leq E[Y])\geq {\frac {1}{2}}.$
ขอบเขตสำหรับความน่าจะเป็นส่วนหางของตัวแปรสุ่มปัวซงสามารถหาได้โดยใช้การอ้างเหตุผลขอบเขตของเชอร์นอฟ^[³²^]^{: 97-98} $X\sim \operatorname {Pois} (\lambda )$ ${\begin{aligned}P(X\geq x)&\leq {\frac {\left(e\lambda \right)^{x}e^{-\lambda }}{x^{x}}},&{\text{ for }}x>\lambda ,\\[1ex]P(X\leq x)&\leq {\frac {\left(e\lambda \right)^{x}e^{-\lambda }}{x^{x}}},&{\text{ for }}x<\lambda .\end{aligned}}$
ความน่าจะ เป็นของหางด้านบนสามารถกระชับได้ (อย่างน้อยสองเท่า) ดังนี้: ^{[ 33 ]}โดยที่คือความแตกต่างของ Kullback–Leibler จาก $P(X\geq x)\leq {\frac {e^{-\operatorname {D} _{\text{KL}}(Q\parallel P)}}{\max {(2,{\sqrt {4\pi \operatorname {D} _{\text{KL}}(Q\parallel P)}}})}},{\text{ for }}x>\lambda ,$ $\operatorname {D} _{\text{KL}}(Q\parallel P)$ $Q=\operatorname {Pois} (x)$ $P=\operatorname {Pois} (\lambda )$
อสมการที่เชื่อมโยงฟังก์ชันการกระจายสะสมของตัวแปรสุ่มปัวซงกับฟังก์ชันการกระจายสะสมของการกระจายปกติมาตรฐานมีดังนี้: ^[³⁴^] $X\sim \operatorname {Pois} (\lambda )$ $\Phi$

$\Phi {\left(\operatorname {sign} (k-\lambda ){\sqrt {2\operatorname {D} _{\text{KL}}(Q_{-}\parallel P)}}\right)}<P(X\leq k)<\Phi {\left(\operatorname {sign} (k+1-\lambda ){\sqrt {2\operatorname {D} _{\text{KL}}(Q_{+}\parallel P)}}\right)},{\text{ for }}k>0,$ โดยที่ค่าความแตกต่างแบบ Kullback–Leibler ของมาจากและค่าความแตกต่างแบบ Kullback–Leibler ของมาจาก $\operatorname {D} _{\text{KL}}(Q_{-}\parallel P)$ $Q_{-}=\operatorname {Pois} (k)$ $P=\operatorname {Pois} (\lambda )$ $\operatorname {D} _{\text{KL}}(Q_{+}\parallel P)$ $Q_{+}=\operatorname {Pois} (k+1)$ $P$

การแข่งขันปัวซง

ให้และเป็นตัวแปรสุ่มอิสระ โดยที่ แล้วเราจะได้ว่า $X\sim \operatorname {Pois} (\lambda )$ $Y\sim \operatorname {Pois} (\mu )$ $\lambda <\mu ,$ ${\frac {e^{-({\sqrt {\mu }}-{\sqrt {\lambda }})^{2}}}{(\lambda +\mu )^{2}}}-{\frac {e^{-(\lambda +\mu )}}{2{\sqrt {\lambda \mu }}}}-{\frac {e^{-(\lambda +\mu )}}{4\lambda \mu }}\leq P(X-Y\geq 0)\leq e^{-({\sqrt {\mu }}-{\sqrt {\lambda }})^{2}}$

ขอบเขตบนได้รับการพิสูจน์โดยใช้ขอบเขตเชอร์นอฟมาตรฐาน

ขอบล่างสามารถพิสูจน์ได้โดยสังเกตว่าคือความน่าจะเป็นที่ ซึ่งซึ่งมีขอบเขตล่างโดย โดยที่คือเอนโทรปีสัมพัทธ์ (ดูรายละเอียดในหัวข้อขอบเขตของหางของการแจกแจงแบบทวินาม) นอกจากนี้ การสังเกตว่าและการคำนวณขอบล่างของความน่าจะเป็นแบบไม่มีเงื่อนไขจะให้ผลลัพธ์ รายละเอียดเพิ่มเติมสามารถพบได้ในภาคผนวกของ Kamath et al. ^[³⁵^] $P(X-Y\geq 0\mid X+Y=i)$ ${\textstyle Z\geq {\frac {i}{2}},}$ ${\textstyle Z\sim \operatorname {Bin} \left(i,{\frac {\lambda }{\lambda +\mu }}\right),}$ ${\textstyle {\frac {1}{(i+1)^{2}}}e^{-iD\left(0.5\|{\frac {\lambda }{\lambda +\mu }}\right)},}$ $D$ $X+Y\sim \operatorname {Pois} (\lambda +\mu ),$

การแจกแจงที่เกี่ยวข้อง

เป็นการแจกแจงแบบทวินามที่มีช่วงเวลาเล็ก ๆ

การแจกแจงปัวซงสามารถหาได้จากกรณีจำกัดของการแจกแจงทวินามเมื่อจำนวนการทดลองเข้าสู่ค่าอนันต์ และจำนวนความสำเร็จที่คาดหวัง ยังคงคงที่ — ดู หลักการของเหตุการณ์หายากด้านล่าง ดังนั้นจึงสามารถใช้เป็นการประมาณค่าของการแจกแจงทวินามได้หาก $n$ มีขนาดใหญ่พอและ $p$ มีขนาดเล็กพอ การแจกแจงปัวซงเป็นการประมาณค่าที่ดีของการแจกแจงทวินามหาก $n$ มีค่าอย่างน้อย 20 และ $p$ มีค่าน้อยกว่าหรือเท่ากับ 0.05 และเป็นการประมาณค่าที่ดีเยี่ยมหาก $n \geq 100$ และ $np \leq 10$ [ ^{36 ] ให้}และเป็นฟังก์ชันความหนาแน่นสะสมของการแจกแจงทวินามและการแจกแจงปัวซงตามลำดับ จะได้ว่า: การพิสูจน์อย่างหนึ่งของสิ่งนี้ใช้ฟังก์ชันสร้างความน่าจะเป็น [ ³⁷^]^{พิจารณา}การทดลองแบบเบอร์นูลลี (การโยนเหรียญ) ซึ่งความน่าจะเป็นของความสำเร็จหนึ่งครั้ง (หรือจำนวนความสำเร็จที่คาดหวัง) อยู่ภายในช่วงเวลาที่กำหนด แบ่งช่วงเวลาออกเป็น $n$ ส่วน และทำการทดลองในแต่ละช่วงย่อยด้วยความน่าจะเป็นความน่าจะเป็นของ ความสำเร็จ $k$ ครั้งจาก การทดลอง $n$ ครั้งตลอดทั้งช่วงเวลาจะกำหนดโดยการแจกแจงทวินาม ซึ่งมีฟังก์ชันก่อกำเนิดคือ: เมื่อพิจารณาลิมิตเมื่อ $n$ เพิ่มขึ้นเป็นอนันต์ (โดยที่ $x$ คงที่) และใช้คำจำกัดความของลิมิตผลคูณของฟังก์ชันเลขชี้กำลังจะได้ฟังก์ชันก่อกำเนิดของการแจกแจงปัวซง: $F_{\mathrm {B} }$ $F_{\mathrm {P} }$ $F_{\mathrm {B} }(k;n,p)\ \approx \ F_{\mathrm {P} }(k;\lambda =np).$ $\lambda \leq 1$ ${\tfrac {\lambda }{n}}$ $p_{k}^{(n)}={\binom {n}{k}}\left({\frac {\lambda }{n}}\right)^{\!k}\left(1{-}{\frac {\lambda }{n}}\right)^{\!n-k},$ $P^{(n)}(x)=\sum _{k=0}^{n}p_{k}^{(n)}x^{k}=\left(1-{\frac {\lambda }{n}}+{\frac {\lambda }{n}}x\right)^{n}.$ $\lim _{n\to \infty }P^{(n)}(x)=\lim _{n\to \infty }\left(1{+}{\tfrac {\lambda (x-1)}{n}}\right)^{n}=e^{\lambda (x-1)}=\sum _{k=0}^{\infty }e^{-\lambda }{\frac {\lambda ^{k}}{k!}}x^{k}.$

ทั่วไป

ถ้าและเป็นอิสระต่อกัน ผลต่างจะเป็นไปตามการแจกแจงแบบสเกลลัม (Skellam distribution ) $X_{1}\sim \mathrm {Pois} (\lambda _{1})\,$ $X_{2}\sim \mathrm {Pois} (\lambda _{2})\,$ $Y=X_{1}-X_{2}$
ถ้าและเป็นอิสระต่อกัน การแจกแจงของโดยมีเงื่อนไขว่า เป็นการแจกแจงทวินาม $X_{1}\sim \mathrm {Pois} (\lambda _{1})\,$ $X_{2}\sim \mathrm {Pois} (\lambda _{2})\,$ $X_{1}$ $X_{1}+X_{2}$
โดยเฉพาะอย่างยิ่งถ้าหากว่า $X_{1}+X_{2}=k,$ $X_{1}|X_{1}+X_{2}=k\sim \mathrm {Binom} (k,\lambda _{1}/(\lambda _{1}+\lambda _{2})).$
โดยทั่วไปแล้ว ถ้า $X 1$ , $X 2$ , ..., $X n$ เป็นตัวแปรสุ่มปัวซงอิสระที่มีพารามิเตอร์ $λ 1$ , $λ 2$ , ..., $λ n$ แล้ว
เมื่อพิจารณาแล้ว จึงสรุปได้ว่าในความเป็นจริง $\sum _{j=1}^{n}X_{j}=k,$ $X_{i}{\Big |}\sum _{j=1}^{n}X_{j}=k\sim \mathrm {Binom} \left(k,{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right).$ $\{X_{i}\}\sim \mathrm {Multinom} \left(k,\left\{{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right\}\right).$
ถ้าการแจกแจงของ $X$ $=$ $k$ เป็นการแจกแจงแบบทวินามการแจกแจงของ Y จะเป็นการแจกแจงแบบปัวซงในความเป็นจริง ถ้า การแจกแจงของ Y เป็นการแจกแจงแบบ พหุนาม การแจกแจงของ Y จะเป็นการแจกแจงแบบปัวซงที่เป็นอิสระต่อกัน $X\sim \mathrm {Pois} (\lambda )\,$ $Y$ $Y\mid (X=k)\sim \mathrm {Binom} (k,p),$ $Y\sim \mathrm {Pois} (\lambda \cdot p).$ $\{X=k\},$ $\{Y_{i}\}$ $\{Y_{i}\}\mid (X=k)\sim \mathrm {Multinom} \left(k,p_{i}\right),$ $Y_{i}$ $Y_{i}\sim \mathrm {Pois} (\lambda \cdot p_{i}),\rho (Y_{i},Y_{j})=0.$
การแจกแจงปัวซงเป็นกรณีพิเศษของการแจกแจงปัวซงแบบผสมแบบไม่ต่อเนื่อง (หรือการแจกแจงปัวซงแบบกระตุก) ที่มีพารามิเตอร์เพียงตัวเดียว^{[ 38 ]}^{[ 39 ]}การแจกแจงปัวซงแบบผสมแบบไม่ต่อเนื่องสามารถอนุมานได้จากการแจกแจงจำกัดของการแจกแจงพหุนามแบบเอกตัวแปร นอกจากนี้ยังเป็นกรณีพิเศษของการแจกแจงปัวซงแบบผสมอีก ด้วย
สำหรับค่า $λ$ ที่มีขนาดใหญ่เพียงพอ (เช่น $λ > 1000$ ) การแจกแจงปกติที่มีค่าเฉลี่ย $λ$ และความแปรปรวน $λ$ (ส่วนเบี่ยงเบนมาตรฐาน) เป็นการประมาณค่าที่ดีเยี่ยมของการแจกแจงปัวซง หาก $λ$ มากกว่าประมาณ 10 การแจกแจงปกติจะเป็นการประมาณค่าที่ดีหาก มี การแก้ไขความต่อเนื่อง ที่เหมาะสม กล่าวคือ หาก $P($ $X$ $\leq$ $x$ $)$ โดยที่ $x$ เป็นจำนวนเต็มที่ไม่เป็นลบ ถูกแทนที่ด้วย $P($ $X$ $\leq$ $x$ $+ 0.5$ ) ${\sqrt {\lambda }}$ $F_{\mathrm {Poisson} }(x;\lambda )\approx F_{\mathrm {normal} }(x;\mu =\lambda ,\sigma ^{2}=\lambda )$
การแปลงที่ทำให้ความแปรปรวนคงที่ : ถ้าเช่นนั้น^[⁸^]^{: 168}และ^[⁴⁰^]^{: 196}ภายใต้การแปลงนี้ การลู่เข้าสู่ภาวะปกติ (เมื่อเพิ่มขึ้น) จะเร็วกว่าตัวแปรที่ไม่ได้แปลงมาก การแปลงที่ทำให้ความแปรปรวนคงที่ที่ซับซ้อนกว่าเล็กน้อยก็มีอยู่^[⁸^]^{: 168}หนึ่งในนั้นคือ การ แปลงAnscombe ^[⁴¹^]ดูการแปลงข้อมูล (สถิติ)สำหรับการใช้งานการแปลงทั่วไปเพิ่มเติม $X\sim \mathrm {Pois} (\lambda ),$ $Y=2{\sqrt {X}}\approx {\mathcal {N}}(2{\sqrt {\lambda }};1),$ $Y={\sqrt {X}}\approx {\mathcal {N}}({\sqrt {\lambda }};1/4).$ $\lambda$
ถ้าสำหรับทุก $t > 0$ จำนวนการมาถึงในช่วงเวลา $[0, t]$ เป็นไปตามการแจกแจงปัวซงที่มีค่าเฉลี่ย $λt$ แล้วลำดับของเวลาระหว่างการมาถึงจะเป็นตัวแปรสุ่มเอกซ์โพเนนเชียลที่เป็นอิสระและมีการแจกแจงเหมือนกัน โดยมีค่าเฉลี่ย $1/ λ$ ^{[ 42 ]} : ^317–319
ฟังก์ชันการกระจายสะสมของการกระจายแบบปัวซงและไคกำลังสองมีความสัมพันธ์กันในลักษณะต่อไปนี้: ^{[ 8 ]}^{: 167} และ^[⁸^]^{: 158} $F_{\text{Poisson}}(k;\lambda )=1-F_{\chi ^{2}}(2\lambda ;2(k+1))\quad \quad {\text{ integer }}k,$ $P(X=k)=F_{\chi ^{2}}(2\lambda ;2(k+1))-F_{\chi ^{2}}(2\lambda ;2k).$

การประมาณค่าปัวซง

สมมติว่า[ ⁴³^]^มีการแจกแจงแบบพหุนาม โดยมี เงื่อนไขว่า $X_{1}\sim \operatorname {Pois} (\lambda _{1}),X_{2}\sim \operatorname {Pois} (\lambda _{2}),\dots ,X_{n}\sim \operatorname {Pois} (\lambda _{n})$ $\lambda _{1}+\lambda _{2}+\dots +\lambda _{n}=1,$ $(X_{1},X_{2},\dots ,X_{n})$ $(X_{1},X_{2},\dots ,X_{n})\sim \operatorname {Mult} (N,\lambda _{1},\lambda _{2},\dots ,\lambda _{n})$ $N=X_{1}+X_{2}+\dots X_{n}.$

หมายความว่า^{[ 32 ]}^{: 101-102}ในบรรดาสิ่งอื่นๆ สำหรับฟังก์ชันที่ไม่เป็นลบใดๆ หากมีการแจกแจงแบบพหุนามแล้ว โดย ที่ $f(x_{1},x_{2},\dots ,x_{n}),$ $(Y_{1},Y_{2},\dots ,Y_{n})\sim \operatorname {Mult} (m,\mathbf {p} )$ $\operatorname {E} [f(Y_{1},Y_{2},\dots ,Y_{n})]\leq e{\sqrt {m}}\operatorname {E} [f(X_{1},X_{2},\dots ,X_{n})]$ $(X_{1},X_{2},\dots ,X_{n})\sim \operatorname {Pois} (\mathbf {p} ).$

สามารถแทนค่าตัวประกอบของ ด้วย 2 ได้ หาก ถือว่า เป็นฟังก์ชันที่เพิ่มขึ้นหรือลดลงอย่างต่อเนื่อง $e{\sqrt {m}}$ $f$

การแจกแจงปัวซงแบบสองตัวแปร

การแจกแจงนี้ได้รับการขยายไปยังกรณีสองตัวแปร^{[ 44 ]}ฟังก์ชันก่อกำเนิดสำหรับการแจกแจงนี้คือ ด้วย $g(u,v)=\exp[(\theta _{1}-\theta _{12})(u-1)+(\theta _{2}-\theta _{12})(v-1)+\theta _{12}(uv-1)]$ $\theta _{1},\theta _{2}>\theta _{12}>0$

การแจกแจงแบบมาร์จินัลคือ $การแจกแจงปัวซง (θ 1)$ และ $การแจกแจงปัวซง (θ 2)$ และค่าสัมประสิทธิ์สหสัมพันธ์ถูกจำกัดอยู่ในช่วง $0\leq \rho \leq \min \left\{{\sqrt {\frac {\theta _{1}}{\theta _{2}}}},{\sqrt {\frac {\theta _{2}}{\theta _{1}}}}\right\}$

วิธีง่ายๆ ในการสร้างการแจกแจงปัวซงแบบสองตัวแปรคือการนำการแจกแจงปัวซงอิสระสามแบบที่มีค่าเฉลี่ยมากำหนดฟังก์ชันความน่าจะเป็นของการแจกแจงปัวซงแบบสองตัวแปรคือ $X_{1},X_{2}$ $Y_{1},Y_{2},Y_{3}$ $\lambda _{1},\lambda _{2},\lambda _{3}$ $X_{1}=Y_{1}+Y_{3},X_{2}=Y_{2}+Y_{3}.$ $\Pr(X_{1}=k_{1},X_{2}=k_{2})=\exp \left(-\lambda _{1}-\lambda _{2}-\lambda _{3}\right){\frac {\lambda _{1}^{k_{1}}}{k_{1}!}}{\frac {\lambda _{2}^{k_{2}}}{k_{2}!}}\sum _{k=0}^{\min(k_{1},k_{2})}{\binom {k_{1}}{k}}{\binom {k_{2}}{k}}k!\left({\frac {\lambda _{3}}{\lambda _{1}\lambda _{2}}}\right)^{k}$

การแจกแจงปัวซงแบบอิสระ

การแจกแจงปัวซงแบบอิสระ^{[ 45 ]}ที่มีขนาดและอัตราการ กระโดด เกิดขึ้นใน ทฤษฎี ความน่าจะเป็นแบบอิสระเป็นขีดจำกัดของการสังเคราะห์แบบอิสระ ซ้ำๆ เมื่อ $N$ $\to$ ∞ $\alpha$ $\lambda$ $\left(\left(1-{\frac {\lambda }{N}}\right)\delta _{0}+{\frac {\lambda }{N}}\delta _{\alpha }\right)^{\boxplus N}$

กล่าว อีกนัยหนึ่ง ให้ และเป็นตัวแปรสุ่ม โดยที่มีค่าด้วยความน่าจะเป็นและมีค่า 0 ด้วยความน่าจะเป็นที่เหลือ สมมติว่า กลุ่มเป็นอิสระต่อกันอย่างอิสระแล้วลิมิตเมื่อของกฎของจะได้จากกฎปัวซงอิสระที่มีพารามิเตอร์ $X_{N}$ $X_{N}$ $\alpha$ ${\textstyle {\frac {\lambda }{N}}}$ $X_{1},X_{2},\ldots$ $N\to \infty$ $X_{1}+\cdots +X_{N}$ $\lambda ,\alpha .$

คำจำกัดความนี้คล้ายคลึงกับวิธีการหนึ่งในการได้มาซึ่งการแจกแจงปัวซงแบบคลาสสิกจากกระบวนการปัวซง (แบบคลาสสิก)

มาตรการที่เกี่ยวข้องกับกฎปัวซงอิสระจะได้รับจาก^{[ 46 ]} โดยที่ และมีการรองรับ $\mu ={\begin{cases}(1-\lambda )\delta _{0}+\nu ,&{\text{if }}0\leq \lambda \leq 1\\\nu ,&{\text{if }}\lambda >1,\end{cases}}$ $\nu ={\frac {1}{2\pi \alpha t}}{\sqrt {4\lambda \alpha ^{2}-(t-\alpha (1+\lambda ))^{2}}}\,dt$ $[\alpha (1-{\sqrt {\lambda }})^{2},\alpha (1+{\sqrt {\lambda }})^{2}].$

กฎนี้ยังปรากฏในทฤษฎีเมทริกซ์สุ่ม ในรูปของ กฎมาร์เชนโก-ปาสตูร์ค่าคุมูลันต์อิสระของกฎนี้เท่ากับ $\kappa _{n}=\lambda \alpha ^{n}.$

การแปลงบางส่วนของกฎนี้

เราให้ค่าของการแปลงที่สำคัญบางอย่างของกฎปัวซงอิสระ การคำนวณสามารถพบได้ในหนังสือLectures on the Combinatorics of Free Probabilityโดย A. Nica และ R. Speicher ^{[ 47 ]}

การแปลง R ของกฎปัวซงอิสระกำหนดโดย $R(z)={\frac {\lambda \alpha }{1-\alpha z}}.$

การแปลงโคชี (ซึ่งเป็นการแปลงกลับของการแปลงสติลต์เจส ) กำหนดโดย $G(z)={\frac {z+\alpha -\lambda \alpha -{\sqrt {(z-\alpha (1+\lambda ))^{2}-4\lambda \alpha ^{2}}}}{2\alpha z}}$

การแปลง S กำหนดโดย ในกรณีที่ $S(z)={\frac {1}{z+\lambda }}$ $\alpha =1.$

การอนุมานทางสถิติ

การประมาณค่าพารามิเตอร์

เมื่อกำหนดตัวอย่าง ค่าที่วัดได้ $n$ ค่าสำหรับ $i$ $= 1, ...,$ $n$ เราต้องการประมาณค่าพารามิเตอร์ $λ$ ของประชากรปัวซงที่ดึงตัวอย่างมา การประมาณค่า ความน่าจะเป็นสูงสุดคือ^[⁴⁸^] $k_{i}\in \{0,1,\dots \},$

${\widehat {\lambda }}_{\mathrm {MLE} }={\frac {1}{n}}\sum _{i=1}^{n}k_{i}\ .$

เนื่องจากแต่ละการสังเกตมีค่าเฉลี่ย $λ$ ดังนั้นค่าเฉลี่ยของตัวอย่างจึงมีค่าเฉลี่ย λ เช่นกัน ด้วยเหตุนี้ การประมาณค่าความน่าจะเป็นสูงสุดจึงเป็นตัวประมาณค่าที่ไม่เอนเอียงของ $λ$ นอกจากนี้ยังเป็นตัวประมาณค่าที่มีประสิทธิภาพ เนื่องจากความแปรปรวนของมันบรรลุขอบเขตล่างของ Cramér–Rao (CRLB) ^{[ 49 ]}ดังนั้นจึงเป็นตัวประมาณค่าที่ไม่เอนเอียงที่มีความแปรปรวนต่ำสุด นอกจากนี้ยังสามารถพิสูจน์ได้ว่าผลรวม (และด้วยเหตุนี้ค่าเฉลี่ย ของ ตัวอย่าง เนื่องจากเป็นฟังก์ชันหนึ่งต่อหนึ่งของผลรวม) เป็นสถิติที่สมบูรณ์และเพียงพอสำหรับ $λ$

เพื่อพิสูจน์ความเพียงพอ เราอาจใช้ทฤษฎีบทการแยกตัวประกอบพิจารณาการแบ่งฟังก์ชันความน่าจะเป็นมวลของการแจกแจงปัวซงร่วมสำหรับตัวอย่างออกเป็นสองส่วน: ส่วนหนึ่งที่ขึ้นอยู่กับตัวอย่างเท่านั้นเรียกว่าและอีกส่วนหนึ่งที่ขึ้นอยู่กับพารามิเตอร์และตัวอย่างผ่านฟังก์ชันเท่านั้นดังนั้น จึงเป็นสถิติที่เพียงพอสำหรับ $\mathbf {x}$ $h(\mathbf {x} )$ $\lambda$ $\mathbf {x}$ $T(\mathbf {x} ).$ $T(\mathbf {x} )$ $\lambda .$

$P(\mathbf {x} )=\prod _{i=1}^{n}{\frac {\lambda ^{x_{i}}e^{-\lambda }}{x_{i}!}}={\frac {1}{\prod _{i=1}^{n}x_{i}!}}\times \lambda ^{\sum _{i=1}^{n}x_{i}}e^{-n\lambda }$

พจน์แรกขึ้นอยู่กับเท่านั้นพจน์ที่สองขึ้นอยู่กับตัวอย่างผ่านทางเท่านั้นดังนั้นจึงเพียงพอแล้ว $h(\mathbf {x} )$ $\mathbf {x}$ $g(T(\mathbf {x} )|\lambda )$ ${\textstyle T(\mathbf {x} )=\sum _{i=1}^{n}x_{i}.}$ $T(\mathbf {x} )$

ในการหาค่าพารามิเตอร์ $λ$ ที่ทำให้ฟังก์ชันความน่าจะเป็นสำหรับประชากรแบบปัวซงมีค่าสูงสุด เราสามารถใช้ลอการิทึมของฟังก์ชันความน่าจะเป็นได้:

${\begin{aligned}\ell (\lambda )&=\ln \prod _{i=1}^{n}f(k_{i}\mid \lambda )\\&=\sum _{i=1}^{n}\ln \!\left({\frac {e^{-\lambda }\lambda ^{k_{i}}}{k_{i}!}}\right)\\&=-n\lambda +\left(\sum _{i=1}^{n}k_{i}\right)\ln(\lambda )-\sum _{i=1}^{n}\ln(k_{i}!).\end{aligned}}$

เราหาอนุพันธ์ของเทียบกับ $λ$ แล้วเปรียบเทียบกับศูนย์: $\ell$

${\frac {\mathrm {d} }{\mathrm {d} \lambda }}\ell (\lambda )=0\iff -n+\left(\sum _{i=1}^{n}k_{i}\right){\frac {1}{\lambda }}=0.\!$

การแก้สมการหาค่า $λ$ จะได้จุดนิ่ง

$\lambda ={\frac {\sum _{i=1}^{n}k_{i}}{n}}$

ดังนั้น $λ$ คือค่าเฉลี่ยของ ค่า $k i$ การหาเครื่องหมายของอนุพันธ์อันดับสองของ $L$ ที่จุดนิ่งจะช่วยกำหนดว่า $λ$ เป็น ค่าสุดขั้วประเภทใด

${\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-\lambda ^{-2}\sum _{i=1}^{n}k_{i}$

การประเมินอนุพันธ์อันดับสองณ จุดวิเคราะห์จะได้:

${\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-{\frac {n^{2}}{\sum _{i=1}^{n}k_{i}}}$

ซึ่งเป็นค่าลบของ $n$ คูณด้วยส่วนกลับของค่าเฉลี่ยของ $k i$ นิพจน์นี้จะมีค่าเป็นลบเมื่อค่าเฉลี่ยเป็นบวก ถ้าเงื่อนไขนี้เป็นจริง จุดนิ่งจะทำให้ฟังก์ชันความน่าจะเป็นมีค่าสูงสุด

เพื่อให้ครบถ้วนสมบูรณ์ตระกูลของการแจกแจงจะเรียกว่าสมบูรณ์ก็ต่อเมื่อหมายความว่าสำหรับทุกถ้าแต่ละบุคคลเป็นอิสระและมี การแจกแจงเหมือนกัน (iid) แล้ว เมื่อทราบการแจกแจงที่เราต้องการตรวจสอบแล้ว ก็เห็นได้ง่ายว่าสถิตินั้นสมบูรณ์ $E(g(T))=0$ $P_{\lambda }(g(T)=0)=1$ $\lambda .$ $X_{i}$ $\mathrm {Po} (\lambda ),$ ${\textstyle T(\mathbf {x} )=\sum _{i=1}^{n}X_{i}\sim \mathrm {Po} (n\lambda ).}$

$E(g(T))=\sum _{t=0}^{\infty }g(t){\frac {(n\lambda )^{t}e^{-n\lambda }}{t!}}=0$

เพื่อให้ความเท่าเทียมกันนี้เป็นจริงต้องเป็น 0 ซึ่งเป็นผลมาจากข้อเท็จจริงที่ว่าไม่มีพจน์อื่นใดจะเป็น 0 สำหรับทุกค่าในผลรวมและสำหรับทุกค่าที่เป็นไปได้ของดังนั้นสำหรับทุก ค่า หมายความว่าและสถิติได้รับการพิสูจน์แล้วว่าสมบูรณ์ $g(t)$ $t$ $\lambda .$ $E(g(T))=0$ $\lambda$ $P_{\lambda }(g(T)=0)=1,$

ช่วงความเชื่อมั่น

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของการแจกแจงปัวซงสามารถแสดงได้โดยใช้ความสัมพันธ์ระหว่างฟังก์ชันการแจกแจงสะสมของการแจกแจงปัวซงและการแจกแจงไคกำลังสองการแจกแจงไคกำลังสองมีความสัมพันธ์อย่างใกล้ชิดกับการแจกแจงแกมมาและนี่นำไปสู่การแสดงออกอีกแบบหนึ่ง เมื่อกำหนดค่าสังเกต $k$ จากการแจกแจงปัวซงที่มีค่าเฉลี่ย $μ$ ช่วงความเชื่อมั่นสำหรับ $μ$ ที่ระดับความเชื่อมั่น $1 - α$ คือ

${\tfrac {1}{2}}\chi ^{2}(\alpha /2;2k)\leq \mu \leq {\tfrac {1}{2}}\chi ^{2}(1-\alpha /2;2k+2),$

หรือเทียบเท่า

$F^{-1}(\alpha /2;k,1)\leq \mu \leq F^{-1}(1-\alpha /2;k+1,1),$

โดยที่ฟังก์ชันควอนไทล์ (ที่สอดคล้องกับพื้นที่หางล่าง $p$ ) ของการแจกแจงไคกำลังสองที่มีองศาอิสระ $n$ และ ฟังก์ชันควอนไทล์ของการแจกแจงแกมมาที่มีพารามิเตอร์รูปร่าง n และพารามิเตอร์มาตราส่วน 1 ^[⁸^]^{: 176-178}^[⁵⁰^]ช่วงนี้เป็น ' ช่วงที่แน่นอน ' ในแง่ที่ว่าความน่าจะเป็นของการครอบคลุมจะไม่น้อยกว่าค่าที่กำหนด1 $-$ $α$ $\chi ^{2}(p;n)$ $F^{-1}(p;n,1)$

เมื่อควอนไทล์ของการแจกแจงแกมมาไม่พร้อมใช้งาน ได้มีการเสนอการประมาณค่าที่แม่นยำสำหรับช่วงที่แน่นอนนี้ (โดยอิงจากการแปลงวิลสัน-ฮิลเฟอร์ตี้ ) ดังนี้: ^{[ 51 ]} โดยที่แสดงถึงค่าเบี่ยงเบนมาตรฐานปกติที่มีพื้นที่หางด้านบน $α /$ 2 $k\left(1-{\frac {1}{9k}}-{\frac {z_{\alpha /2}}{3{\sqrt {k}}}}\right)^{3}\leq \mu \leq (k+1)\left(1-{\frac {1}{9(k+1)}}+{\frac {z_{\alpha /2}}{3{\sqrt {k+1}}}}\right)^{3},$ $z_{\alpha /2}$

สำหรับการประยุกต์ใช้สูตรเหล่านี้ในบริบทเดียวกันกับข้างต้น (โดยกำหนดให้มี ค่าที่วัดได้ $n$ ค่า $k i$ แต่ละค่าสุ่มมาจากการแจกแจงแบบปัวซงที่มีค่าเฉลี่ย $λ$ ) จะต้องตั้งค่าดังนี้

$k=\sum _{i=1}^{n}k_{i},$ คำนวณ ช่วงสำหรับ $μ = nλ$ จากนั้นหาช่วงสำหรับ $λ$

การอนุมานแบบเบย์เซียน

ในการอนุมานแบบเบย์เซียนไพรเออร์คู่ควบสำหรับพารามิเตอร์อัตรา $λ$ ของการแจกแจงปัวซงคือการแจกแจงแกมมา^{[ 52 ]}ให้

$\lambda \sim \mathrm {Gamma} (\alpha ,\beta )$

แสดงว่า $λ$ มีการกระจายตามความหนาแน่น แกมมา $g$ ซึ่งกำหนดโดยพารามิเตอร์รูปร่าง $α$ และพารามิเตอร์มาตราส่วน ผกผัน $β$ :

$g(\lambda \mid \alpha ,\beta )={\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\;\lambda ^{\alpha -1}\;e^{-\beta \,\lambda }\qquad {\text{ for }}\lambda >0\,\!.$

จากนั้น เมื่อกำหนดตัวอย่าง ค่าที่วัดได้ $n$ ค่า $k i$ เช่นเดียว กับก่อนหน้านี้และค่าความน่าจะเป็นก่อนหน้าเป็น $Gamma(α, β)$ การแจกแจงความน่าจะเป็นภายหลังจะเป็นดังนี้

$\lambda \sim \mathrm {Gamma} {\left(\alpha +\sum _{i=1}^{n}k_{i},\beta +n\right)}.$

โปรดทราบว่าค่าเฉลี่ยภายหลังเป็นเชิงเส้นและกำหนดโดย สามารถแสดงได้ว่าการแจกแจงแกมมาเป็นไพรเออร์เพียงอย่างเดียวที่เหนี่ยวนำให้เกิดความเป็นเชิงเส้นของค่าเฉลี่ยแบบมีเงื่อนไข ยิ่งไปกว่านั้น มีผลลัพธ์ตรงกันข้ามที่ระบุว่าหากค่าเฉลี่ยแบบมีเงื่อนไขใกล้เคียงกับฟังก์ชันเชิง เส้นในระยะทาง การแจกแจงไพรเออร์ของ $λ$ จะต้องใกล้เคียงกับการแจกแจงแกมมาในระยะทาง Levy ^[⁵³^] $E[\lambda \mid k_{1},\ldots ,k_{n}]={\frac {\alpha +\sum _{i=1}^{n}k_{i}}{\beta +n}}.$ $L_{2}$

ค่าเฉลี่ยภายหลัง $E[λ]$ เข้าใกล้ค่าประมาณความน่าจะเป็นสูงสุดในลิมิตเมื่อซึ่งเป็นผลมาจากนิพจน์ทั่วไปของค่าเฉลี่ยของการแจกแจงแกมมาโดยตรง ${\widehat {\lambda }}_{\mathrm {MLE} }$ $\alpha \to 0,\beta \to 0,$

การแจกแจงการทำนายภายหลังสำหรับการสังเกตเพิ่มเติมเพียงครั้งเดียวคือการแจกแจงทวินามเชิงลบ^{[ 54 ]} : ⁵³บางครั้งเรียกว่าการแจกแจงแกมมา-ปัวซง

การประมาณค่าเฉลี่ยปัวซงหลายค่าพร้อมกัน

สมมติว่าเป็นเซตของตัวแปรสุ่มอิสระจากเซตของการแจกแจงปัวซง โดยแต่ละตัวแปรมีพารามิเตอร์และเราต้องการประมาณค่าพารามิเตอร์เหล่านี้ จากนั้น Clevenson และ Zidek แสดงให้เห็นว่าภายใต้การสูญเสียความคลาดเคลื่อนกำลังสองแบบปกติเมื่อนั้น คล้ายกับในตัวอย่างของ Steinสำหรับค่าเฉลี่ยปกติ ตัวประมาณค่า MLE จะไม่สามารถยอมรับได้^[⁵⁵^] $X_{1},X_{2},\dots ,X_{p}$ $p$ $\lambda _{i},$ $i=1,\dots ,p,$ ${\textstyle L(\lambda ,{\hat {\lambda }})=\sum _{i=1}^{p}\lambda _{i}^{-1}({\hat {\lambda }}_{i}-\lambda _{i})^{2},}$ $p>1,$ ${\hat {\lambda }}_{i}=X_{i}$

ในกรณีนี้ ตระกูลของตัวประมาณค่ามินิแม็กซ์จะถูกกำหนดสำหรับค่าใดๆและดังเช่น^[⁵⁶^] $0<c\leq 2(p-1)$ $b\geq (p-2+p^{-1})$ ${\hat {\lambda }}_{i}=\left(1-{\frac {c}{b+\sum _{i=1}^{p}X_{i}}}\right)X_{i},\qquad i=1,\dots ,p.$

การเกิดขึ้นและการประยุกต์ใช้

การประยุกต์ใช้การแจกแจงปัวซงกับข้อมูลการนับ (จำนวนเหตุการณ์) บางประการ: ^{[ 57 ]}

โทรคมนาคม : สายโทรศัพท์ที่เข้ามาในระบบ
ดาราศาสตร์ : โฟตอนที่เดินทางมาถึงกล้องโทรทรรศน์
เคมี : การกระจายมวลโมลาร์ของ การพอลิเม ^อไรเซชันที่มีชีวิต [ ^{58 ]}
ชีววิทยา : จำนวนการกลายพันธุ์บนสายดีเอ็นเอต่อหน่วยความยาว
การจัดการ : ลูกค้าที่มาถึงเคาน์เตอร์หรือศูนย์บริการ^{[ 59 ]}
ด้านการเงินและการประกันภัย : จำนวนความเสียหายหรือการเรียกร้องค่าสินไหมทดแทนที่เกิดขึ้นในช่วงเวลาที่กำหนด
แผ่นดินไหววิทยา : แบบจำลองปัวซงเชิงอะซิมโทติกของความเสี่ยงสำหรับแผ่นดินไหวขนาดใหญ่^{[ 60 ]}
กัมมันตภาพรังสี : สลายตัวในช่วงเวลาที่กำหนดในตัวอย่างกัมมันตภาพรังสี^{[ 61 ]}
ทัศนศาสตร์ : จำนวนโฟตอนที่ปล่อยออกมาในพัลส์เลเซอร์เดียว (จุดอ่อนสำคัญของ โปรโตคอล การกระจายกุญแจควอนตัมซึ่งรู้จักกันในชื่อการแบ่งจำนวนโฟตอน)

ตัวอย่างเพิ่มเติมของการนับเหตุการณ์ที่สามารถจำลองได้ด้วยกระบวนการปัวซง ได้แก่:

ทหารที่เสียชีวิตจากการถูกม้าเตะในแต่ละปีในแต่ละกอง ทหารม้า ของปรัสเซียตัวอย่างนี้ใช้ในหนังสือของLadislaus Bortkiewicz (1868–1931) ^{[ 12 ]}^{: 23-25}
เซลล์ยีสต์ที่ใช้ในการผลิต เบียร์ กินเนสส์ตัวอย่างนี้ใช้โดยWilliam Sealy Gosset (1876–1937) ^{[ 62 ]}^{[ 63 ]}
สายโทรศัพท์ที่มาถึงศูนย์บริการภายในหนึ่งนาที ตัวอย่างนี้ได้รับการอธิบายโดยAK Erlang (1878–1929) ^{[ 64 ]}
เป้าหมายในกีฬาที่เกี่ยวข้องกับทีมแข่งขันสองทีม^{[ 65 ]}
จำนวนผู้เสียชีวิตต่อปีในกลุ่มอายุที่กำหนด^{[ 66 ]}
การเปลี่ยนแปลงอย่างฉับพลันของราคาหุ้นในช่วงเวลาที่กำหนด
จำนวนครั้ง ที่เข้าถึง เว็บเซิร์ฟเวอร์ต่อนาที (ภายใต้สมมติฐานว่ามีความสม่ำเสมอ )
การกลายพันธุ์ ใน ดีเอ็นเอส่วนหนึ่งหลังจากได้รับรังสีในปริมาณหนึ่ง
เซลล์ที่ติดเชื้อที่ระดับความเข้มข้นของการติดเชื้อที่ กำหนด
แบคทีเรียในของเหลวปริมาณหนึ่ง^{[ 67 ]}
โฟตอนที่มาถึงวงจรพิกเซลภายใต้ความสว่างที่กำหนดในช่วงเวลาที่กำหนด^{[ 68 ]}
การลงจอดของระเบิดบิน V-1ในลอนดอนระหว่างสงครามโลกครั้งที่ 2 ได้รับการตรวจสอบโดย RD Clarke ในปี พ.ศ. 2489 ^{[ 69 ]}

ในทฤษฎีจำนวนเชิงความน่าจะเป็นแกลลาเกอร์แสดงให้เห็นในปี 1976 ว่า หากสมมติฐานr-tuple ของจำนวนเฉพาะ ที่ยังไม่ได้ รับ การพิสูจน์บางเวอร์ชันเป็นจริง ^{[ 70 ]} แล้วจำนวนเฉพาะในช่วงเวลาสั้นๆ จะเป็นไปตามการแจกแจงปัวซง^{[ 71 ]}

กฎของเหตุการณ์หายาก

อัตราการเกิดเหตุการณ์มีความสัมพันธ์กับความน่าจะเป็นที่เหตุการณ์นั้นจะเกิดขึ้นในช่วงเวลาย่อยเล็กๆ (ไม่ว่าจะเป็นเวลา สถานที่ หรืออื่นๆ) ในกรณีของการแจกแจงปัวซง เราจะสมมติว่ามีช่วงเวลาย่อยที่เล็กพอซึ่งความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นสองครั้งนั้น "น้อยมาก" ด้วยสมมติฐานนี้ เราสามารถสร้างการแจกแจงปัวซงจากการแจกแจงทวินามได้ โดยอาศัยเพียงข้อมูลเกี่ยวกับจำนวนเหตุการณ์ทั้งหมดที่คาดหวังในช่วงเวลาทั้งหมดเท่านั้น

ให้จำนวนเหตุการณ์ทั้งหมดในช่วงเวลาทั้งหมดแทนด้วยแบ่งช่วงเวลาทั้งหมดออกเป็นช่วงย่อยที่มีขนาดเท่ากัน โดยที่(เนื่องจากเราสนใจเฉพาะส่วนเล็ก ๆ ของช่วงเวลาเท่านั้น สมมติฐานนี้จึงมีความหมาย) ซึ่งหมายความว่าจำนวนเหตุการณ์ที่คาดหวังในแต่ละ ช่วงย่อยทั้ง $n$ ช่วงนั้นเท่ากับ $\lambda .$ $n$ $I_{1},\dots ,I_{n}$ $n>\lambda$ $\lambda /n.$

ตอนนี้เราสมมติว่าการเกิดเหตุการณ์ในช่วงเวลาทั้งหมดสามารถมองได้ว่าเป็นลำดับของการทดลองแบบเบอร์นูลลี $n$ ครั้ง โดยที่การทดลองแบบเบอร์นูลลี ครั้งที่ -th สอดคล้องกับการตรวจสอบว่าเหตุการณ์เกิดขึ้นในช่วงเวลาย่อยด้วยความน่าจะเป็น -n หรือ ไม่ จำนวนเหตุการณ์ทั้งหมดที่คาดหวังในการทดลองดังกล่าวจะเป็นจำนวนเหตุการณ์ทั้งหมดที่คาดหวังในช่วงเวลาทั้งหมด ดังนั้นสำหรับแต่ละส่วนย่อยของช่วงเวลา เราได้ประมาณการการเกิดเหตุการณ์เป็นกระบวนการแบบเบอร์นูลลีในรูปแบบดังที่เราได้กล่าวไว้ก่อนหน้านี้ เราต้องการพิจารณาเฉพาะช่วงเวลาย่อยที่เล็กมากเท่านั้น ดังนั้น เราจึงใช้ลิมิตเมื่อ n เข้าสู่∞ $i$ $I_{i}$ $\lambda /n.$ $n$ $\lambda ,$ ${\textrm {B}}(n,\lambda /n).$ $n$

ในกรณีนี้การแจกแจงทวินามจะลู่เข้าสู่สิ่งที่เรียกว่าการแจกแจงปัวซงโดยทฤษฎีบทขีดจำกัดของปัวซง

ในตัวอย่างข้างต้นหลายๆ ตัวอย่าง เช่น จำนวนการกลายพันธุ์ในลำดับดีเอ็นเอที่กำหนด เหตุการณ์ที่ถูกนับนั้นแท้จริงแล้วเป็นผลลัพธ์ของการทดลองแบบไม่ต่อเนื่อง และจะสามารถจำลองได้อย่างแม่นยำยิ่งขึ้นโดยใช้การแจกแจงแบบทวินามนั่นคือ $X\sim {\textrm {B}}(n,p).$

ในกรณีเช่นนี้ $n$ จะมีค่ามากและ $p$ จะมีค่าน้อยมาก (ดังนั้นค่าเฉลี่ย $np$ จึงมีขนาดปานกลาง) จากนั้นจึงสามารถประมาณการกระจายตัวได้โดยใช้การกระจายแบบปัวซงซึ่งไม่ซับซ้อนกว่า $X\sim {\textrm {Pois}}(np).$

บางครั้งการประมาณค่านี้เรียกว่ากฎของเหตุการณ์หายาก [ ⁷²^]^{: 5} เนื่องจาก เหตุการณ์เบอร์นูลลีแต่ละรายการ จำนวน $n$ ^{รายการ}เกิดขึ้นได้ยาก

ชื่อ "กฎของเหตุการณ์หายาก" อาจทำให้เข้าใจผิดได้ เพราะจำนวนรวมของเหตุการณ์ที่ประสบความสำเร็จในกระบวนการปัวซงไม่จำเป็นต้องหายากเสมอไป หากค่าพารามิเตอร์ $np$ ไม่น้อย ตัวอย่างเช่น จำนวนสายโทรศัพท์ที่โทรเข้ามายังตู้รับสายที่ไม่ว่างในหนึ่งชั่วโมงนั้น เป็นไปตามการแจกแจงแบบปัวซง โดยเหตุการณ์เหล่านั้นดูเหมือนจะเกิดขึ้นบ่อยสำหรับผู้ให้บริการ แต่ถือว่าหายากจากมุมมองของคนทั่วไปที่แทบจะไม่โทรเข้ามายังตู้รับสายนั้นในชั่วโมงดังกล่าวเลย

ความแปรปรวนของการแจกแจงแบบทวินามเป็น $1 - p$ เท่าของความแปรปรวนของการแจกแจงแบบปัวซง ดังนั้นจึงเกือบเท่ากันเมื่อ $p$ มีค่าเล็กมาก

บางครั้ง คำว่ากฎถูกใช้เป็นคำพ้องความหมายของการแจกแจงความน่าจะเป็นและการบรรจบกันในกฎหมายถึงการบรรจบกันในการแจกแจงดังนั้น การแจกแจงปัวซงจึงบางครั้งเรียกว่า "กฎของจำนวนน้อย" เพราะเป็นการแจกแจงความน่าจะเป็นของจำนวนครั้งของการเกิดเหตุการณ์ที่เกิดขึ้นไม่บ่อยนัก แต่มีโอกาสเกิดขึ้นมากมายกฎของจำนวนน้อยเป็นหนังสือของ Ladislaus Bortkiewicz เกี่ยวกับการแจกแจงปัวซง ตีพิมพ์ในปี 1898 ^{[ 12 ]}^{[ 73 ]}

กระบวนการจุดปัวซง

การแจกแจงปัวซงเกิดขึ้นจากจำนวนจุดของกระบวนการจุดปัวซงที่อยู่ในบริเวณจำกัดบางแห่ง โดยเฉพาะอย่างยิ่ง ถ้า $D$ เป็นปริภูมิบริเวณ เช่น ปริภูมิยุคลิด $R d$ ซึ่ง $| D |$ พื้นที่ ปริมาตร หรือโดยทั่วไปแล้ว การวัดแบบเลเบสของบริเวณนั้นมีค่าจำกัด และถ้า $N (D)$ แทนจำนวนจุดใน $D$ แล้ว

$P(N(D)=k)={\frac {(\lambda |D|)^{k}e^{-\lambda |D|}}{k!}}.$

การถดถอยปัวซงและการถดถอยทวินามเชิงลบ

การถดถอยแบบปัวซงและ การถดถอยแบบทวิ นามเชิงลบมีประโยชน์สำหรับการวิเคราะห์ที่ตัวแปรตาม (ตัวแปรตอบสนอง) คือจำนวนนับ $(0, 1, 2, ... )$ ของจำนวนเหตุการณ์หรือการเกิดขึ้นในช่วงเวลาหนึ่ง

ชีววิทยา

การทดลอง ของลูเรีย-เดลบรุคได้ทดสอบกับสมมติฐานของการวิวัฒนาการแบบลามาร์ค ซึ่งควรจะส่งผลให้เกิดการแจกแจงแบบปัวซง

Katz และ Miledi วัดศักย์เยื่อหุ้มเซลล์ทั้งที่มีและไม่มีอะเซทิลโคลีน (ACh) ^{[ 74 ]}เมื่อมี ACh อยู่ช่องไอออนบนเยื่อหุ้มเซลล์จะเปิดแบบสุ่มในช่วงเวลาสั้นๆ เนื่องจากมีช่องไอออนจำนวนมากที่แต่ละช่องเปิดในช่วงเวลาสั้นๆ จำนวนช่องไอออนทั้งหมดที่เปิดในแต่ละช่วงเวลาจึงมีการกระจายแบบปัวซง เมื่อไม่มี ACh อยู่ ในทางปฏิบัติแล้วจะไม่มีช่องไอออนเปิด ศักย์เยื่อหุ้มเซลล์คือเมื่อหักลบผลกระทบของสัญญาณรบกวนแล้ว Katz และ Miledi พบว่าค่าเฉลี่ยและความแปรปรวนของศักย์เยื่อหุ้มเซลล์คือและตามลำดับ ทำให้ได้(หน้า 94-95 ^[⁷⁵^] ) $V=N_{\text{open}}V_{\text{ion}}+V_{0}+V_{\text{noise}}$ $8.5\times 10^{-3}\;\mathrm {V}$ $(29.2\times 10^{-6}\;\mathrm {V} )^{2}$ $V_{\text{ion}}=10^{-7}\;\mathrm {V}$

ในระหว่างการจำลองเซลล์แต่ละครั้ง จำนวนการกลายพันธุ์จะกระจายตัวแบบปัวซงโดยประมาณ^{[ 76 ]}ตัวอย่างเช่น ไวรัส HIV มีเบสคู่ 10,000 คู่ และมีอัตราการกลายพันธุ์ประมาณ 1 ต่อเบสคู่ 30,000 คู่ ซึ่งหมายความว่าจำนวนการกลายพันธุ์ต่อการจำลองแต่ละครั้งจะกระจายตัวเป็น. (หน้า 64 ^[⁷⁵^] ) $\mathrm {Pois} (1/3)$

การประยุกต์ใช้ในด้านวิทยาศาสตร์อื่นๆ

ในกระบวนการปัวซง จำนวนเหตุการณ์ที่สังเกตได้จะผันผวนรอบค่าเฉลี่ย $λ$ โดยมีค่าเบี่ยงเบนมาตรฐาน σ ความผันผวนเหล่านี้เรียกว่าสัญญาณรบกวนปัวซงหรือ (โดยเฉพาะในด้านอิเล็กทรอนิกส์) เรียกว่าสัญญาณรบกวนช็อต $\sigma _{k}={\sqrt {\lambda }}.$

ความสัมพันธ์ระหว่างค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานในการนับเหตุการณ์ที่ไม่ต่อเนื่องกันนั้นมีประโยชน์ทางวิทยาศาสตร์ โดยการสังเกตว่าความผันผวนเปลี่ยนแปลงไปอย่างไรเมื่อเทียบกับสัญญาณเฉลี่ย เราสามารถประมาณการส่วนร่วมของเหตุการณ์แต่ละครั้งได้แม้ว่าส่วนร่วมนั้นจะเล็กเกินกว่าจะตรวจจับได้โดยตรงก็ตาม ตัวอย่างเช่น ประจุ $e$ บนอิเล็กตรอนสามารถประมาณได้โดยการหาความสัมพันธ์ระหว่างขนาดของกระแสไฟฟ้ากับสัญญาณรบกวนแบบสุ่ม (shot noise ) ถ้า อิเล็กตรอน $N$ ตัวผ่านจุดหนึ่งในช่วงเวลา $t$ โดยเฉลี่ยกระแสไฟฟ้า เฉลี่ย คือ; เนื่องจากความผันผวนของกระแสไฟฟ้าควรอยู่ในลำดับ(เช่น ค่าเบี่ยงเบนมาตรฐานของกระบวนการปัวซง ) ประจุจึงสามารถประมาณได้จากอัตราส่วน $I=eN/t$ $\sigma _{I}=e{\sqrt {N}}/t$ $e$ $t\sigma _{I}^{2}/I.$

ตัวอย่างที่พบได้ทั่วไปคือความหยาบที่ปรากฏขึ้นเมื่อขยายภาพถ่าย ความหยาบนั้นเกิดจากความผันผวนแบบปัวซงของจำนวน อนุภาค เงิน ที่ลดลง ไม่ใช่เกิดจากอนุภาคแต่ละอนุภาคเอง การหาความสัมพันธ์ ระหว่าง ความหยาบกับระดับการขยายจะช่วยให้สามารถประเมินสัดส่วนการมีส่วนร่วมของอนุภาคแต่ละอนุภาคได้ (ซึ่งมีขนาดเล็กเกินกว่าจะมองเห็นได้ด้วยตาเปล่า)

ใน ทฤษฎี เซตเชิงสาเหตุองค์ประกอบที่ไม่ต่อเนื่องของปริภูมิเวลาจะเป็นไปตามการแจกแจงแบบปัวซงในปริมาตร

การแจกแจงแบบปัวซงยังปรากฏในกลศาสตร์ควอนตัมโดยเฉพาะอย่างยิ่งในทัศนศาสตร์ควอนตัมกล่าวคือ สำหรับ ระบบ ตัวสั่นฮาร์มอนิกควอนตัมในสถานะโคherentความน่าจะเป็นของการวัดระดับพลังงานเฉพาะนั้นมีการกระจายแบบปัวซง

วิธีการคำนวณ

การแจกแจงแบบปัวซงก่อให้เกิดภารกิจที่แตกต่างกันสองอย่างสำหรับไลบรารีซอฟต์แวร์เฉพาะทาง ได้แก่การประเมินการแจกแจงและการสุ่มตัวเลขตามการแจกแจงนั้น $P(k;\lambda )$

การประเมินการแจกแจงปัวซง

การคำนวณค่าสำหรับค่าที่กำหนดและนั้นเป็นงานง่ายๆ ที่สามารถทำได้โดยใช้คำจำกัดความมาตรฐานของในรูปของฟังก์ชันเลขชี้กำลัง ฟังก์ชันกำลัง และฟังก์ชันแฟกทอเรียล อย่างไรก็ตาม คำจำกัดความทั่วไปของการแจกแจงปัวซงมีสองพจน์ที่อาจทำให้เกิดค่าเกินขีดจำกัดในคอมพิวเตอร์ได้ง่าย คือ $λ$ $k$ และ $k$ $!$ เศษส่วนของ $λ$ $k$ ต่อ $k$ $!$ ยังสามารถทำให้เกิดข้อผิดพลาดในการปัดเศษที่ใหญ่มากเมื่อเทียบกับ $e$ $-$ $λ$ และดังนั้นจึงให้ผลลัพธ์ที่ผิดพลาด เพื่อความเสถียรเชิงตัวเลข ฟังก์ชันความน่าจะเป็นมวลของปัวซงจึงควรได้รับการประเมินเป็น ซึ่งเทียบเท่าทางคณิตศาสตร์แต่มีความเสถียรเชิงตัวเลข ลอการิทึมธรรมชาติของฟังก์ชันแกมมาสามารถหาได้โดยใช้ฟังก์ชันใน ไลบรารีมาตรฐานของภาษา C (เวอร์ชัน C99) หรือRฟังก์ชันในMATLABหรือSciPyหรือฟังก์ชันในFortran 2008 และเวอร์ชันที่ใหม่กว่า $P(k;\lambda )$ $k$ $\lambda$ $P(k;\lambda )$ $\!f(k;\lambda )=\exp \left[k\ln \lambda -\lambda -\ln \Gamma (k+1)\right],$ lgammagammalnlog_gamma

ภาษาโปรแกรมบางภาษามีฟังก์ชันในตัวสำหรับประเมินการแจกแจงปัวซง ได้แก่

R : ฟังก์ชันdpois(x, lambda);
Excel : ฟังก์ชันPOISSON( x, mean, cumulative)ที่มีแฟล็กสำหรับระบุการกระจายสะสม
Mathematica : การแจกแจงปัวซงแบบเอกตัวแปรเป็น, ^[⁷⁷^]การแจกแจงปัวซงแบบทวิตัวแปรเป็น,. ^[⁷⁸^]PoissonDistribution[ $\lambda$ ]MultivariatePoissonDistribution[ $\theta _{12},$ { $\theta _{1}-\theta _{12},$ $\theta _{2}-\theta _{12}$ }]

การสร้างตัวแปรสุ่ม

งานที่ยากกว่าคือการสุ่มเลือกตัวแปรสุ่ม จำนวนเต็ม จาก1การแจกแจงปัวซงโดยกำหนดค่าที่กำหนดให้ $\lambda .$

โซลูชันนี้จัดทำโดย:

R : ฟังก์ชันrpois(n, lambda);
ไลบรารีวิทยาศาสตร์ GNU (GSL): ฟังก์ชันgsl_ran_poisson

Knuthได้นำเสนออัลกอริธึมง่ายๆ เพื่อสร้างตัวเลขสุ่มที่มีการแจกแจงแบบปัวซง ( การสุ่มตัวอย่างตัวเลขสุ่มเทียม ) : ^[⁷⁹^]^{: 137-138}

อัลกอริทึมเลขสุ่มปัวซง (Knuth) : เริ่มต้น : ให้ L ← e ^{− λ} , k ← 0 และ p ← 1 ดำเนินการ : k ← k + 1. สร้างเลขสุ่มสม่ำเสมอ u ในช่วง [0,1] และกำหนดให้ p ← p × u ขณะที่ p > L ให้ส่งคืน k − 1

ความซับซ้อนเป็นแบบเชิงเส้นตามค่าที่ส่งคืน $k$ ซึ่งโดยเฉลี่ยคือ $λ$ มีอัลกอริธึมอื่นๆ อีกมากมายที่สามารถปรับปรุงให้ดีขึ้นได้ บางส่วนได้ระบุไว้ในงานของ Ahrens & Dieter โปรดดูหัวข้อ § เอกสารอ้างอิงด้านล่าง

สำหรับค่า $λ$ ที่มีขนาดใหญ่ ค่าของ $L = e - λ$ อาจมีขนาดเล็กมากจนยากต่อการแสดงผล ปัญหานี้สามารถแก้ไขได้โดยการปรับเปลี่ยนอัลกอริธึมโดยใช้พารามิเตอร์เพิ่มเติม STEP เพื่อให้ $e -STEP$ ไม่เกิดภาวะอันเดอร์โฟลว์:

อัลกอริทึมเลขสุ่มปัวซง (จุนฮ่าว อ้างอิงจากคนุธ) : เริ่มต้น : ให้ $λ$ ซ้าย ←  $λ$  , k ← 0 และ p ← 1 ทำซ้ำ : k ← k + 1. สร้างเลขสุ่มสม่ำเสมอ u ในช่วง (0,1) และให้ p ← p × u ในขณะที่ p < 1 และ $λ$  Left > 0: ถ้า $λ$  Left > STEP: p ← p × e ^STEP $λ$  Left ←  $λ$  Left − STEP else : p ← p × e ^{$λ$  Left} $λ$  Left ← 0 ในขณะที่ p > 1 ส่งคืน k − 1

การเลือกค่า STEP ขึ้นอยู่กับค่าขีดจำกัดของการโอเวอร์โฟลว์ สำหรับรูปแบบเลขทศลอยแบบความแม่นยำสองเท่า ค่าขีดจำกัดจะใกล้เคียงกับ $e 700$ ดังนั้น 500 น่าจะเป็นค่าSTEP $ที่ ปลอดภัย$

วิธีแก้ปัญหาอื่นๆ สำหรับค่า $λ$ ที่มีขนาดใหญ่ ได้แก่การสุ่มตัวอย่างแบบปฏิเสธและการใช้การประมาณค่าแบบเกาส์เซียน

การสุ่มตัวอย่างแบบแปลงผกผันนั้นง่ายและมีประสิทธิภาพสำหรับค่า $λ$ ที่มีขนาดเล็ก และต้องการเพียงตัวเลขสุ่มแบบเอกรูป $u$ เพียงตัวเดียวต่อตัวอย่าง โดยจะตรวจสอบความน่าจะเป็นสะสมทีละตัวจนกว่าจะ มี ค่าใดค่าหนึ่งเกิน $u$

อัลกอริธึมเครื่องกำเนิดปัวซองขึ้นอยู่กับการผกผันโดยการค้นหาตามลำดับ : ^{[ 80 ]}^{: 505} init : ให้ x ← 0, p ← e ^{− lad} , s ← p สร้างเลขสุ่มแบบเอกรูป u ในช่วง [0,1] ในขณะที่ u > s ทำดังนี้: x ← x + 1. p ← p ×  $λ$  / x. s ← s + p. ส่งคืนค่า x

ดูเพิ่มเติม

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[

[

[

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[

24

[ 25 ]

[

[

[

ค่า

[ 30 ]

[

[

[ 33 ]

[

[

36 ] ให้

37

[ 38 ]

[ 39 ]

[

[

[ 42 ]

43

[ 44 ]

[ 45 ]

[ 46 ]

[ 47 ]

[

[ 49 ]

[

[ 51 ]

[ 52 ]

[

[ 54 ]

[

[

[ 57 ]

อ

[ 59 ]

[ 60 ]

[ 61 ]

[ 62 ]

[ 63 ]

[ 64 ]

[ 65 ]

[ 66 ]

[ 67 ]

[ 68 ]

[ 69 ]

[ 70 ]

[ 71 ]

72

[ 73 ]

[ 74 ]

[ 76 ]

[

[

[

[ 80 ]

การแจกแจงปัวซง
ฟังก์ชันมวลความน่าจะเป็น แกนแนวนอนคือดัชนี $k$ ซึ่งเป็นจำนวนครั้งที่เกิดขึ้น $λ$ คืออัตราการเกิดเหตุการณ์ที่คาดหวัง แกนแนวตั้งคือความน่าจะเป็นของการเกิดเหตุการณ์ $k ครั้ง เมื่อกำหนดค่า$ $λ$ แล้ว ฟังก์ชันนี้กำหนดได้เฉพาะที่ค่า $k$ เป็นจำนวนเต็ม เท่านั้น เส้นเชื่อมระหว่างแกนเป็นเพียงเส้นนำสายตาเท่านั้น
ฟังก์ชันการกระจายสะสม แกนแนวนอนคือดัชนี $k$ ซึ่งเป็นจำนวนครั้งที่เกิดขึ้น ฟังก์ชันการกระจายสะสม (CDF) จะไม่ต่อเนื่องที่จำนวนเต็ม $k$ และจะราบเรียบที่จุดอื่นๆ เนื่องจากตัวแปรที่มีการกระจายแบบปัวซงจะมีค่าเป็นจำนวนเต็มเท่านั้น
สัญกรณ์	$\operatorname {Pois} (\lambda )$
พารามิเตอร์	$\lambda \in (0,\infty )$ (ประเมิน)
สนับสนุน	$k\in \mathbb {N} _{0}$ ( จำนวนธรรมชาติเริ่มต้นจาก 0)
พีเอ็มเอฟ	${\frac {\แลมบ์ดา ^{k}e^{-\แลมบ์ดา }}{k!}}$
ซีดีเอฟ	${\frac {\Gamma (\lfloor k+1\rfloor ,\lambda )}{\lfloor k\rfloor !}},$ หรือหรือ $e^{-\lambda }\sum _{j=0}^{\lfloor k\rfloor }{\frac {\lambda ^{j}}{j!}},$ $Q(\lfloor k+1\rfloor ,\lambda )$ (โดยที่คือฟังก์ชันแกมมาไม่สมบูรณ์บนคือฟังก์ชันพื้นและคือฟังก์ชันแกมมาแบบปรับค่า ) $k\geq 0,$ $\Gamma (x,y)$ $\lfloor k\rfloor$ $Q$
หมายถึง	$\lambda$
ค่ามัธยฐาน	$\approx \left\lfloor \lambda +{\frac {1}{3}}-{\frac {1}{50\lambda }}\right\rfloor$
โหมด	$\left\lceil \lambda \right\rceil -1,\left\lfloor \lambda \right\rfloor$
ความแปรปรวน	$\lambda$
ความเบี่ยงเบน	${\frac {1}{\sqrt {\lambda }}}$
ความโค้งส่วนเกิน	${\frac {1}{\แลมบ์ดา }}$
เอนโทรปี	$\lambda {\Bigl [}1-\ln(\lambda ){\Bigr ]}+e^{-\lambda }\sum _{k=0}^{\infty }{\frac {\lambda ^{k}\ln(k!)}{k!}}$ หรือสำหรับขนาดใหญ่ $\lambda$ ${\begin{aligned}\approx {\frac {1}{2}}\ln \left(2\pi e\lambda \right)-{\frac {1}{12\lambda }}-{\frac {1}{24\lambda ^{2}}}\\-{\frac {19}{360\lambda ^{3}}}+{\mathcal {O}}\left({\frac {1}{\lambda ^{4}}}\right)\end{aligned}}$
เอ็มจีเอฟ	$\exp \left[\lambda \left(e^{t}-1\right)\right]$
ซีเอฟ	$\exp \left[\lambda \left(e^{it}-1\right)\right]$
พีจีเอฟ	$\exp \left[\lambda \left(z-1\right)\right]$
ข้อมูลของฟิชเชอร์	${\frac {1}{\แลมบ์ดา }}$