การกระจายความน่าจะเป็น

ในทฤษฎีความน่าจะเป็นและสถิติการแจกแจงความน่าจะเป็นอธิบายถึงวิธีการกำหนดความน่าจะเป็นให้กับผลลัพธ์ที่เป็นไปได้ของปรากฏการณ์สุ่ม—หรือกล่าวให้แม่นยำยิ่งขึ้นคือเหตุการณ์ซึ่งเป็นเซตของผลลัพธ์ที่เป็นไปได้ของการทดลองเชิงความน่า จะเป็น โดยทั่วไป การแจกแจงความน่าจะเป็นบอกเราว่าผลลัพธ์ที่แตกต่างกันมีโอกาสเกิดขึ้นมากน้อยเพียงใด ในทางทฤษฎีแล้ว มันคือการวัดความน่าจะเป็น : ฟังก์ชันที่กำหนดความน่าจะเป็นให้กับเหตุการณ์ในลักษณะที่สอดคล้องกับสัจพจน์ของความน่าจะเป็น

การแจกแจงความน่าจะเป็นมีความเชื่อมโยงอย่างใกล้ชิดกับตัวแปรสุ่มตัวแปรสุ่มคือฟังก์ชันที่กำหนดค่าให้กับผลลัพธ์แต่ละอย่างของการทดลองเชิงความน่าจะเป็น โดยจะสร้างการแจกแจงความน่าจะเป็นบนเซตของค่าที่ตัวแปรสุ่มสามารถรับได้ ตัวอย่างเช่น ผลลัพธ์ของการโยนเหรียญสามารถแทนด้วยตัวแปรสุ่ม $X$ ที่เท่ากับ $1$ สำหรับหัวและ $0$ สำหรับก้อย หากเหรียญนั้นยุติธรรม การแจกแจงนี้จะกำหนดความน่าจะเป็น $1/2$ ให้กับ $X = 1$ และความน่าจะเป็น $1/2$ ให้กับ $X = 0$ เมื่อมองในแง่ของการวัดความน่าจะเป็น การแจกแจงของ $X$ จะกำหนด $ค่า ℙ(X \in A)$ ให้กับแต่ละเซต $A \subseteq {0,1$ }; สำหรับเหรียญที่ยุติธรรม $ℙ(X \in {1}) = ℙ(X \in {0}) = 1/2$ , $ℙ(X \in {0,1}) = 1$ , และ $ℙ(X \in \emptyset) =$ 0

ในทางปฏิบัติ การแจกแจงความน่าจะเป็นมักถูกอธิบายด้วยฟังก์ชันต่างๆ เช่นฟังก์ชันการแจกแจงสะสมฟังก์ชันมวลความน่าจะเป็นหรือฟังก์ชันความหนาแน่นความน่าจะเป็นการเลือกใช้คำอธิบายใดนั้นขึ้นอยู่กับลักษณะของการแจกแจง: ฟังก์ชันมวลความน่าจะเป็นใช้สำหรับการแจกแจงแบบไม่ต่อเนื่องในขณะที่ฟังก์ชันความหนาแน่นความน่าจะเป็นใช้สำหรับการแจกแจงแบบต่อเนื่อง หลายๆ แบบ

การแจกแจงความน่าจะเป็นที่เกิดขึ้นบ่อยครั้งหรือมีความสำคัญทางทฤษฎีเป็นพิเศษ มักจะได้รับชื่อเฉพาะ ตัวอย่างต่างๆ ได้ถูกรวบรวมไว้ในรายการของการแจกแจงความน่าจะเป็น

การแนะนำ

การแจกแจงความน่าจะเป็นคือคำอธิบายทางคณิตศาสตร์ของความน่าจะเป็นของเหตุการณ์ต่างๆ กล่าวคือ เซตย่อยของปริภูมิของตัวอย่าง ปริภูมิของตัวอย่างซึ่งมักแสดงด้วยสัญลักษณ์ Ω คือเซต ของ ผลลัพธ์ที่เป็นไปได้ทั้งหมดของปรากฏการณ์ สุ่ม ที่กำลังสังเกต ปริภูมิของตัวอย่างอาจเป็นเซตของตัวเลขเวกเตอร์ป้ายกำกับ หรือสิ่งอื่นๆ ก็ได้ ตัวอย่างเช่น ปริภูมิของตัวอย่างของการโยนเหรียญอาจเป็น $Ω =$ ${$ $"หัว", "ก้อย"$ $}$ ในขณะที่สำหรับ ทอย ลูกเต๋าอาจเป็น $Ω =$ ${$ 1, 2 , $3, 4, 5, 6$ $}$ $\ \โอเมก้า \ ,$

เพื่อกำหนดการแจกแจงความน่าจะเป็นสำหรับกรณีเฉพาะของตัวแปรสุ่ม (เพื่อให้ปริภูมิของตัวอย่างสามารถแมปไปยังปริภูมิที่วัดได้เช่นจำนวนจริง ) เป็นเรื่องปกติที่จะแยกแยะระหว่าง ตัวแปรสุ่มแบบ ไม่ต่อเนื่องและแบบต่อเนื่องในกรณีแบบไม่ต่อเนื่อง เพียงพอที่จะระบุฟังก์ชันมวลความน่าจะเป็น ที่กำหนดความน่าจะเป็นให้กับผลลัพธ์ที่เป็นไปได้แต่ละอย่าง (เช่น เมื่อทอยลูกเต๋าที่ยุติธรรม ตัวเลขทั้งหกตัว $“1”$ ถึง $“6”$ ซึ่งสอดคล้องกับจำนวนจุดบนลูกเต๋า มีความน่าจะเป็นที่จะอยู่ด้านบนเมื่อลูกเต๋าตกลงมา) ความน่าจะเป็นของเหตุการณ์จะถูกกำหนดให้เป็นผลรวมของความน่าจะเป็นของผลลัพธ์ทั้งหมดที่สอดคล้องกับเหตุการณ์นั้น ตัวอย่างเช่น ความน่าจะเป็นของเหตุการณ์ “ลูกเต๋าออกเลขคู่” คือ ในทางตรงกันข้าม เมื่อตัวแปรสุ่มรับค่าจากค่าต่อเนื่อง เว้นแต่ว่าฟังก์ชันความหนาแน่นความน่าจะเป็นจะมีจุดสูงสุดที่มีความหนาแน่นอนันต์ ผลลัพธ์แต่ละอย่างจะมีความน่าจะเป็นเป็นศูนย์ สำหรับตัวแปรสุ่มแบบต่อเนื่องดังกล่าว เฉพาะเหตุการณ์ที่มีผลลัพธ์อนันต์จำนวน เช่นช่วง เท่านั้น ที่มีความน่าจะเป็นมากกว่า 0 $p$ ${\tfrac {1}{6}}$ $p({\text{“}}2{\text{”}})+p({\text{“}}4{\text{”}})+p({\text{“}}6{\text{”}})={\frac {1}{6}}+{\frac {1}{6}}+{\frac {1}{6}}={\frac {1}{2}}.$

ยกตัวอย่างเช่น ลองพิจารณาการชั่งน้ำหนักแฮมชิ้นหนึ่งในซูเปอร์มาร์เก็ต และสมมติว่าเครื่องชั่งสามารถให้ความแม่นยำได้หลายหลักอย่างไม่จำกัด ในกรณีนี้ ความน่าจะเป็นที่แฮมจะมีน้ำหนัก500 กรัมพอดีจะต้องเป็นศูนย์ เพราะไม่ว่าระดับความแม่นยำที่เลือกจะสูงแค่ไหน ก็ไม่สามารถสันนิษฐานได้ว่าไม่มีตัวเลขที่ไม่ใช่ศูนย์หลังจากตัวเลขที่เครื่องชั่งแสดงผลออกมา อย่างไรก็ตาม สำหรับกรณีการใช้งานเดียวกันนี้ เป็นไปได้ที่จะตอบสนอง ความต้องการ ด้านการควบคุมคุณภาพเช่น แฮมหนึ่งห่อที่มีน้ำหนัก "500 กรัม" จะต้องมีน้ำหนักอยู่ระหว่าง 490 กรัมถึง 510 กรัม ซึ่งเป็นไปได้เพราะการวัดนี้ไม่ต้องการความแม่นยำสูงมากจากอุปกรณ์ที่ใช้ และยังมีความคลาดเคลื่อน ในระดับหนึ่ง สำหรับความแปรปรวนในวัตถุและกระบวนการทางกายภาพ

การแจกแจงความน่าจะเป็นแบบต่อเนื่องสามารถอธิบายได้โดยใช้ฟังก์ชันการแจกแจงสะสมซึ่งอธิบายความน่าจะเป็นที่ตัวแปรสุ่มจะไม่มากกว่าค่าที่กำหนด (เช่น $P (X \leq x)$ สำหรับ $x$ บางค่า ) ฟังก์ชันการแจกแจงสะสมคือพื้นที่ใต้ฟังก์ชันความหนาแน่นความน่าจะเป็นจาก $-\infty$ ถึง $x$ ดังแสดงในรูปที่ 1 ^{[ 1 ]}

การแจกแจงความน่าจะเป็นแบบต่อเนื่องส่วนใหญ่ที่พบในทางปฏิบัติไม่เพียงแต่ต่อเนื่องเท่านั้น แต่ยังต่อเนื่องอย่างสมบูรณ์ อีก ด้วย การแจกแจงดังกล่าวสามารถอธิบายได้ด้วยฟังก์ชันความหนาแน่นความน่าจะเป็น โดยทั่วไป ความหนาแน่นความน่าจะเป็นของตัวแปรสุ่มจะอธิบายค่าสัมพัทธ์ของความ น่าจะเป็นเล็กน้อย ที่รับค่าใดๆ— นั่นคือเมื่อมีค่าเล็กมาก ความน่าจะเป็นที่อยู่ในช่วงที่กำหนดสามารถคำนวณได้อย่างแม่นยำโดยการอินทิเกรตฟังก์ชันความหนาแน่นความน่าจะเป็นในช่วงนั้น^[²^] $f$ $X$ $X$ $x$ $P(x\leq X<x+\Delta x)\approx f(x)\,\Delta x$ $\Delta x>0$ $X$

นิยามความน่าจะเป็นทั่วไป

ให้เป็นปริภูมิความน่าจะเป็นเป็นปริภูมิที่วัดได้และเป็นตัวแปรสุ่มที่มีค่าอยู่ใน แล้วการแจกแจงความน่าจะเป็นของคือการวัดแบบพุชฟอร์เวิร์ดของการวัดความน่าจะ เป็น บนที่เกิดจาก โดยเฉพาะอย่างยิ่ง การวัดแบบพุชฟอร์เวิร์ดบน นี้กำหนดโดย สำหรับ $(\โอเมก้า ,{\คณิตศาสตร์ {F}},P)$ $(E,{\mathcal {E}})$ $X:\Omega \to E$ $(E,{\mathcal {E}})$ $X$ $P$ $(E,{\mathcal {E}})$ $X$ $(E,{\mathcal {E}})$ $X_{*}(P)(B)=P\left(X^{-1}(B)\right)$ $B\in {\mathcal {E}}.$

การแจกแจงความน่าจะเป็นใดๆ ก็ตามเป็นการวัดความน่าจะเป็นบน(โดยทั่วไปจะแตกต่างจากเว้นแต่ว่าจะเป็นแผนที่เอกลักษณ์) ^[³^] $(E,{\mathcal {E}})$ $P$ $X$

การแจกแจงความน่าจะเป็นสามารถอธิบายได้หลายรูปแบบ เช่น โดยฟังก์ชันมวลความน่าจะเป็นหรือฟังก์ชันการแจกแจงสะสม หนึ่งในคำอธิบายที่ครอบคลุมที่สุด ซึ่งใช้ได้กับตัวแปรต่อเนื่องและตัวแปรไม่ต่อเนื่องอย่างสมบูรณ์ คือ โดยใช้ฟังก์ชันความน่าจะเป็นที่มีปริภูมิอินพุต เป็นพีชคณิต σและให้ ความน่าจะเป็น เป็นจำนวนจริงเป็นเอาต์พุต โดยเฉพาะอย่างยิ่ง จำนวนใน $P\colon {\mathcal {A}}\to \mathbb {R}$ ${\mathcal {A}}$ $[0,1]\subseteq \mathbb {R}$

ฟังก์ชันความน่าจะเป็นสามารถรับเซตย่อยของปริภูมิของตัวอย่างเป็นอาร์กิวเมนต์ได้ ดังเช่นในตัวอย่างการโยนเหรียญ ซึ่งฟังก์ชันถูกกำหนดให้ $P$ $(หัว) = 0.5$ และ $P$ $(ก้อย) = 0.5$ อย่างไรก็ตาม เนื่องจากการใช้ตัวแปรสุ่ม อย่างแพร่หลาย ซึ่งแปลงปริภูมิของตัวอย่างให้เป็นเซตของตัวเลข (เช่น, ) จึงเป็นเรื่องปกติมากกว่าที่จะศึกษาการแจกแจงความน่าจะเป็นที่มีอาร์กิวเมนต์เป็นเซตย่อยของเซตประเภทนี้ (เซตตัวเลข) ^[⁴^]และการแจกแจงความน่าจะเป็นทั้งหมดที่กล่าวถึงในบทความนี้เป็นประเภทนี้ เป็นเรื่องปกติที่จะใช้สัญลักษณ์ แทนความน่าจะเป็นที่ค่าใดค่าหนึ่งของตัวแปรเป็นของเหตุการณ์ใดเหตุการณ์หนึ่ง^[⁵^]^[⁶^] $P$ $P$ $\mathbb {R}$ $\mathbb {N}$ $P(X\in E)$ $X$ $E$

ฟังก์ชันความน่าจะเป็นข้างต้นจะอธิบายการแจกแจงความน่าจะเป็นได้ก็ต่อเมื่อเป็นไปตามสัจพจน์ของ Kolmogorov ทั้งหมด กล่าวคือ:

$P(X\in E)\geq 0\;\forall E\in {\mathcal {A}}$ ดังนั้นความน่าจะเป็นจึงไม่ใช่ค่าลบ
$P(X\in E)\leq 1\;\forall E\in {\mathcal {A}}$ ดังนั้นความน่าจะเป็นจึงไม่เกินกว่า $1$
$P(X\in \bigcup _{i}E_{i})=\sum _{i}P(X\in E_{i})$ สำหรับเซตตระกูลหนึ่งที่นับได้และไม่ซ้อนทับกัน $\{E_{i}\}$

แนวคิดของฟังก์ชันความน่าจะเป็นมีความเข้มงวดมากขึ้นโดยกำหนดให้เป็นองค์ประกอบของปริภูมิความน่าจะเป็น โดยที่คือเซตของผลลัพธ์ที่เป็นไปได้คือเซตของเซตย่อยทั้งหมดที่สามารถวัดความน่าจะเป็นได้ และคือฟังก์ชันความน่าจะเป็น หรือการวัดความน่าจะเป็น ที่กำหนดความน่าจะเป็นให้กับเซตย่อยที่วัดได้แต่ละเซต^[⁷^] $(X,{\mathcal {A}},P)$ $X$ ${\mathcal {A}}$ $E\subset X$ $P$ $E\in {\mathcal {A}}$

โดยทั่วไปแล้ว การแจกแจงความน่าจะเป็นจะอยู่ในสองประเภทหลักๆ

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องนั้นใช้ได้กับสถานการณ์ที่ชุดของผลลัพธ์ที่เป็นไปได้นั้นเป็นแบบไม่ต่อเนื่อง (เช่น การโยนเหรียญ การทอยลูกเต๋า) และความน่าจะเป็นถูกเข้ารหัสด้วยรายการความน่าจะเป็นของผลลัพธ์แบบไม่ต่อเนื่อง ในกรณีนี้ ความน่าจะเป็นจะถูกอธิบายด้วยฟังก์ชันมวลความน่าจะเป็นและการแจกแจงความน่าจะเป็นจะกำหนดโดยผลรวมของฟังก์ชันมวลความน่าจะเป็น

การแจกแจงความน่าจะเป็นแบบต่อเนื่องอย่างสมบูรณ์นั้นใช้ได้กับสถานการณ์ที่ชุดของผลลัพธ์ที่เป็นไปได้สามารถมีค่าอยู่ในช่วงต่อเนื่อง (เช่น จำนวนจริง) เช่น อุณหภูมิในวันที่กำหนด ในกรณีที่ต่อเนื่องอย่างสมบูรณ์ ความน่าจะเป็นจะถูกอธิบายโดยฟังก์ชันความหนาแน่นของความน่าจะเป็นและการแจกแจงความน่าจะเป็นนั้นโดยนิยามแล้วคือปริพันธ์ของฟังก์ชันความหนาแน่นของความน่าจะเป็น^{[ 5 ]}^{[ 2 ]}^{[ 6 ]}การแจกแจงแบบปกติเป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องอย่างสมบูรณ์ที่พบได้ทั่วไป การทดลองที่ซับซ้อนกว่า เช่น การทดลองที่เกี่ยวข้องกับกระบวนการสุ่มที่กำหนดในเวลาต่อเนื่องอาจต้องการใช้การวัดความน่าจะ เป็น ทั่วไป มากขึ้น

การแจกแจงความน่าจะเป็นที่มีปริภูมิของตัวอย่างเป็นมิติเดียว (เช่น จำนวนจริง รายการของป้ายกำกับ ป้ายกำกับเรียงลำดับ หรือเลขฐานสอง) เรียกว่าการแจกแจง ความน่าจะเป็นแบบ ตัวแปรเดียว ในขณะที่การแจกแจงความน่าจะเป็นที่มีปริภูมิของตัวอย่างเป็น ปริภูมิเวกเตอร์ที่มีมิติ 2 หรือมากกว่า เรียกว่า การแจกแจงความน่า จะเป็นแบบหลายตัวแปร การแจกแจงความน่าจะเป็นแบบตัวแปรเดียวให้ความน่าจะเป็นของตัวแปรสุ่ม ตัวเดียว ที่รับค่าต่างๆ กัน การแจกแจงความน่าจะเป็นแบบหลายตัวแปร ( การแจกแจงความน่าจะเป็นร่วม ) ให้ความน่าจะเป็นของเวกเตอร์สุ่มซึ่งเป็นรายการของตัวแปรสุ่มสองตัวหรือมากกว่า ที่รับค่าต่างๆ กัน การแจกแจงความน่าจะเป็นแบบตัวแปรเดียวที่สำคัญและพบได้บ่อย ได้แก่การแจกแจงทวินามการแจกแจงไฮเปอร์จีโอเมตริกและการแจกแจงปกติ การแจกแจงความน่าจะ เป็นแบบหลายตัวแปรที่พบได้บ่อยคือ การแจกแจง ปกติแบบหลายตัวแปร

นอกจากฟังก์ชันความน่าจะเป็น ฟังก์ชันการกระจายสะสม ฟังก์ชันมวลความน่าจะเป็น และฟังก์ชันความหนาแน่นความน่าจะเป็นแล้วฟังก์ชันสร้างโมเมนต์และฟังก์ชันลักษณะเฉพาะยังใช้ในการระบุการกระจายความน่าจะเป็น เนื่องจากฟังก์ชันเหล่านี้กำหนดฟังก์ชันการกระจายสะสมพื้นฐานได้อย่างเฉพาะเจาะจง^{[ 8 ]}

ศัพท์เฉพาะ

แนวคิดและคำศัพท์สำคัญบางส่วนที่ใช้กันอย่างแพร่หลายในเอกสารเกี่ยวกับหัวข้อการแจกแจงความน่าจะเป็นมีดังต่อไปนี้^{[ 9 ]}

คำศัพท์พื้นฐาน

ตัวแปรสุ่ม : รับค่าจากปริภูมิของตัวอย่าง; ความน่าจะเป็นจะอธิบายว่าค่าใดและชุดของค่าใดมีโอกาสเกิดขึ้นมากกว่ากัน
เหตุการณ์ : เซตของค่าที่เป็นไปได้ (ผลลัพธ์) ของตัวแปรสุ่มที่เกิดขึ้นด้วยความน่าจะเป็นที่กำหนดไว้
ฟังก์ชันความน่าจะเป็นหรือการวัดความน่าจะเป็น : อธิบายความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้น^[¹⁰^] $P(X\in E)$ $E,$
ฟังก์ชันการแจกแจงสะสม : ฟังก์ชันที่ประเมินความน่าจะของตัวแปรสุ่มจะมีค่าน้อยกว่าหรือเท่ากับค่าที่กำหนด $X$ $x$
ฟังก์ชันควอนไทล์ : ส่วนกลับของฟังก์ชันการกระจายสะสม ให้ค่า ที่ทำให้ ด้วยความน่าจะเป็นจะไม่เกิน. $x$ $q$ $X$ $x$

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง : สำหรับตัวแปรสุ่มจำนวนมากที่มีค่าจำกัดหรืออนันต์นับได้
ฟังก์ชันความน่าจะเป็นมวล ( pmf ): ฟังก์ชันที่แสดงความน่าจะเป็นที่ตัวแปรสุ่มแบบไม่ต่อเนื่องจะมีค่าเท่ากับค่าใดค่าหนึ่ง
การแจกแจงความถี่ : ตารางที่แสดงความถี่ของผลลัพธ์ต่างๆในกลุ่มตัวอย่าง
การแจกแจงความถี่สัมพัทธ์ :การแจกแจงความถี่ที่แต่ละค่าถูกหาร (ทำให้เป็นมาตรฐาน) ด้วยจำนวนผลลัพธ์ในตัวอย่าง (เช่น ขนาดตัวอย่าง)
การแจกแจงเชิงหมวดหมู่ : สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีค่าจำกัด

การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์

การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์ : สำหรับตัวแปรสุ่มจำนวนมากที่มีค่าเป็นจำนวนนับไม่ถ้วน
ฟังก์ชันความหนาแน่นความน่าจะเป็น ( pdf ) หรือความหนาแน่นความน่าจะเป็น : ฟังก์ชันที่มีค่า ณ ตัวอย่างใดๆ (หรือจุดใดๆ) ในปริภูมิของตัวอย่าง (เซตของค่าที่เป็นไปได้ที่ตัวแปรสุ่มรับ) สามารถตีความได้ว่าเป็นการให้ความน่าจะเป็นสัมพัทธ์ที่ค่าของตัวแปรสุ่มจะเท่ากับตัวอย่างนั้น

คำศัพท์ที่เกี่ยวข้อง

ช่วงสนับสนุน : เซตของค่า $x$ ที่ทำให้ตัวแปรสุ่มมีโอกาสตกในทุกย่านเปิดของ $x$ เป็นค่า บวก
หาง : ^{[ 11 ]}บริเวณใกล้ขอบเขตของตัวแปรสุ่ม หาก pmf หรือ pdf ค่อนข้างต่ำในบริเวณนั้น โดยปกติจะมีรูปแบบหรือการรวมกันของทั้งสอง $X>a$ $X<b$
ค่าที่คาดหวังหรือค่าเฉลี่ย :ค่าเฉลี่ยถ่วงน้ำหนักของค่าที่เป็นไปได้ทั้งหมด โดยใช้ความน่าจะเป็นของแต่ละค่าเป็นน้ำหนัก หรือค่าที่เทียบเท่าในรูปแบบต่อเนื่อง
ค่ามัธยฐาน : ค่าที่ทำให้เซตของค่าที่น้อยกว่าค่ามัธยฐาน และเซตของค่าที่มากกว่าค่ามัธยฐาน แต่ละเซตมีโอกาสปรากฏไม่เกินหนึ่งในสอง
โหมด : สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ค่าที่มีความน่าจะเป็นสูงสุด สำหรับตัวแปรสุ่มแบบต่อเนื่องอย่างสมบูรณ์ ตำแหน่งที่ฟังก์ชันความหนาแน่นความน่าจะเป็นมีค่าสูงสุดเฉพาะที่
ควอนไทล์ : ควอนไทล์ q คือค่าที่ทำให้. $x$ $P(X<x)=q$
ความแปรปรวน : โมเมนต์อันดับสองของตัวแปรสุ่มเทียบกับค่าเฉลี่ย เป็นมาตรวัดที่สำคัญของการกระจายตัวของข้อมูล
ส่วนเบี่ยงเบนมาตรฐาน : รากที่สองของความแปรปรวน ดังนั้นจึงเป็นอีกมาตรวัดหนึ่งของการกระจายตัว
สมมาตร : คุณสมบัติอย่างหนึ่งของการแจกแจงข้อมูลบางประเภท ซึ่งส่วนของการแจกแจงข้อมูลทางด้านซ้ายของค่าเฉพาะค่าหนึ่ง (โดยปกติคือค่ามัธยฐาน) จะเป็นภาพสะท้อนของส่วนทางด้านขวาของค่าดังกล่าว
ความเบี่ยงเบน (Skewness) : การวัดระดับที่ฟังก์ชันความน่าจะเป็น (pmf) หรือฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) "เอนเอียง" ไปทางด้านใดด้านหนึ่งของค่าเฉลี่ยโมเมนต์มาตรฐานลำดับ ที่สาม ของการกระจายตัว
ค่า ความโค้ง (Kurtosis ): เป็นตัววัด "ความอ้วน" ของส่วนหางของฟังก์ชันความน่าจะเป็น (pmf) หรือฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) ค่าโมเมนต์มาตรฐานลำดับที่สี่ของการกระจายตัว

ฟังก์ชันการกระจายสะสม

ในกรณีพิเศษของตัวแปรสุ่มที่มีค่าเป็นจำนวนจริง การแจกแจงความน่าจะเป็นสามารถแสดงได้อย่างเทียบเท่าด้วยฟังก์ชันการแจกแจงสะสมแทนที่จะเป็นการวัดความน่าจะเป็น ฟังก์ชันการแจกแจงสะสมของตัวแปรสุ่มที่เกี่ยวข้องกับการแจกแจงความน่าจะเป็นนั้นกำหนดไว้ดังนี้ $X$ $p$ $F(x)=P(X\leq x).$

ฟังก์ชันการกระจายสะสมของตัวแปรสุ่มค่าจริงใดๆ มีคุณสมบัติดังต่อไปนี้:

$F(x)$ เป็นค่าที่ไม่ลดลง ;
$F(x)$ เป็นฟังก์ชันต่อเนื่องทางขวา ;
$0\leq F(x)\leq 1$ ;
$\lim _{x\to -\infty }F(x)=0$ และ; และ $\lim _{x\to \infty }F(x)=1$
$\Pr(a<X\leq b)=F(b)-F(a)$ .

ในทางกลับกัน ฟังก์ชันใดๆที่ตรงตามคุณสมบัติสี่ข้อแรกข้างต้น จะเป็นฟังก์ชันการกระจายสะสมของการกระจายความน่าจะเป็นบางอย่างบนจำนวนจริง^[¹²^] $F:\mathbb {R} \to \mathbb {R}$

การแจกแจงความน่าจะเป็นใดๆ สามารถแยกส่วนได้เป็นส่วนผสมของการ แจกแจง แบบไม่ต่อเนื่อง การแจกแจงแบบต่อเนื่อง โดยสมบูรณ์และการแจกแจงแบบต่อเนื่องเอกพจน์ [ ^{13 ] และ}ด้วยเหตุนี้ ฟังก์ชันการแจกแจงสะสมใดๆ จึงยอมรับการแยกส่วนเป็นผลรวมนูนของฟังก์ชันการแจกแจงสะสมทั้งสามตามลำดับ

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องคือการแจกแจงความน่าจะเป็นของตัวแปรสุ่มที่สามารถรับค่าได้เพียงจำนวนนับเท่านั้น^{[ 14 ]} ( เกือบแน่นอน ) ^{[ 15 ]}ซึ่งหมายความว่าความน่าจะเป็นของเหตุการณ์ใดๆสามารถแสดงเป็นผลรวม (จำกัดหรืออนันต์แบบนับได้ ) ได้ดังนี้: โดยที่เป็นเซตที่นับได้ที่มีดังนั้น ตัวแปรสุ่มแบบไม่ต่อเนื่อง (เช่น ตัวแปรสุ่มที่มีการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง) ก็คือตัวแปรที่มีฟังก์ชันมวลความน่าจะเป็น ในกรณีที่ช่วงของค่าเป็นอนันต์แบบนับได้ ค่าเหล่านี้จะต้องลดลงเป็นศูนย์เร็วพอที่ความน่าจะเป็นจะรวมกันได้เท่ากับ 1 ตัวอย่างเช่น ถ้าสำหรับผลรวมของความน่าจะเป็นจะเป็น $E$ $P(X\in E)=\sum _{\omega \in A\cap E}P(X=\omega ),$ $A$ $P(X\in A)=1$ $p(x)=P(X=x)$ $p(n)={\tfrac {1}{2^{n}}}$ $n=1,2,...$ $1/2+1/4+1/8+\dots =1$

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องที่เป็นที่รู้จักกันดีซึ่งใช้ในการสร้างแบบจำลองทางสถิติ ได้แก่ การแจกแจงปัวซงการแจกแจงเบอร์นูลลีการแจกแจงทวินามการแจกแจงเรขาคณิต การแจกแจงทวินามเชิง ลบและการแจกแจงเชิงหมวดหมู่^[¹⁶^]เมื่อสุ่มตัวอย่าง (ชุดของการสังเกต) จากประชากรขนาดใหญ่ จุดตัวอย่างจะมีการแจกแจงเชิงประจักษ์ที่ไม่ต่อเนื่อง ซึ่งให้ข้อมูลเกี่ยวกับการกระจายของประชากร นอกจากนี้การแจกแจงเอกรูปไม่ต่อเนื่องยังใช้กันทั่วไปในโปรแกรมคอมพิวเตอร์ที่ทำการเลือกแบบสุ่มที่มีความน่าจะเป็นเท่ากันระหว่างตัวเลือกจำนวนหนึ่ง

ฟังก์ชันการกระจายสะสม

ตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีค่าเป็นจำนวนจริง สามารถนิยามได้อย่างเทียบเท่ากับตัวแปรสุ่มที่มีฟังก์ชันการกระจายสะสมเพิ่มขึ้นเฉพาะที่จุดกระโดดที่ไม่ต่อเนื่องเท่านั้น กล่าวคือ ฟังก์ชันการกระจายสะสมจะเพิ่มขึ้นเฉพาะที่จุดที่มีการ "กระโดด" ไปสู่ค่าที่สูงกว่า และจะมีค่าคงที่ในช่วงที่ไม่มีการกระโดด จุดที่มีการกระโดดเกิดขึ้นคือค่าที่ตัวแปรสุ่มอาจมีได้ ดังนั้น ฟังก์ชันการกระจายสะสมจึงมีรูปแบบดังนี้ จุดที่ฟังก์ชันการกระจายสะสมกระโดดจะประกอบกันเป็นเซตที่นับได้ ซึ่งอาจเป็นเซตที่นับได้ใดๆ ก็ได้ และดังนั้นอาจมีความหนาแน่นในจำนวนจริงด้วย $F(x)=P(X\leq x)=\sum _{\omega \leq x}p(\omega ).$

การแสดงผลแบบเดลต้าของ Dirac

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องมักแสดงด้วยมาตรวัดของ Diracหรือที่เรียกว่าการแจกแจงแบบจุดเดียว (ดูด้านล่าง) ซึ่งเป็นการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเชิงกำหนดสำหรับผลลัพธ์ใดๆให้เป็นมาตรวัดของ Dirac ที่กระจุกตัวอยู่ที่เมื่อกำหนดการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง จะมีเซตที่นับได้ที่มีและฟังก์ชันมวลความน่าจะเป็นถ้าเป็นเหตุการณ์ใดๆ แล้ว หรือกล่าวโดยย่อคือ $\omega$ $\delta _{\omega }$ $\omega$ $A$ $P(X\in A)=1$ $p$ $E$ $P(X\in E)=\sum _{\omega \in A}p(\omega )\delta _{\omega }(E),$ $P_{X}=\sum _{\omega \in A}p(\omega )\delta _{\omega }.$

ในทำนองเดียวกัน การแจกแจงแบบไม่ต่อเนื่องสามารถแสดงได้ด้วยฟังก์ชันเดลต้าของ Diracเป็นฟังก์ชันความหนาแน่นความน่าจะ เป็นทั่วไป ซึ่ง หมายความว่า สำหรับเหตุการณ์ใดๆ^[¹⁷^] $f$ $f(x)=\sum _{\omega \in A}p(\omega )\delta (x-\omega ),$ $P(X\in E)=\int _{E}f(x)\,dx=\sum _{\omega \in A}p(\omega )\int _{E}\delta (x-\omega )=\sum _{\omega \in A\cap E}p(\omega )$ $E.$

การแสดงผลฟังก์ชันตัวบ่งชี้

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องให้เป็นค่าที่ตัวแปรสุ่มนั้นสามารถรับได้ด้วยความน่าจะเป็นที่ไม่เป็นศูนย์ กำหนดให้ เป็นเซตที่ไม่ซ้ำกันและสำหรับเซตดังกล่าว จะได้ว่าความน่าจะเป็นที่ รับค่าใดๆ ยกเว้นคือศูนย์ ดังนั้นจึงสามารถเขียนได้เป็น ยกเว้นบนเซตที่มีความน่าจะเป็นเป็นศูนย์ โดยที่คือฟังก์ชันบ่งชี้ของ นี่อาจใช้เป็นนิยามทางเลือกของตัวแปรสุ่มแบบไม่ต่อเนื่องได้ $X$ $u_{0},u_{1},\dots$ $\Omega _{i}=X^{-1}(u_{i})=\{\omega :X(\omega )=u_{i}\},\,i=0,1,2,\dots$ $P\left(\bigcup _{i}\Omega _{i}\right)=\sum _{i}P(\Omega _{i})=\sum _{i}P(X=u_{i})=1.$ $X$ $u_{0},u_{1},\dots$ $X$ $X(\omega )=\sum _{i}u_{i}1_{\Omega _{i}}(\omega )$ $1_{A}$ $A$

การกระจายจุดเดียว

กรณีพิเศษคือการแจกแจงแบบไม่ต่อเนื่องของตัวแปรสุ่มที่สามารถรับค่าคงที่ได้เพียงค่าเดียว กล่าวอีกนัยหนึ่งคือ การวัดแบบ Dirac กล่าวอย่างเป็นทางการ ตัวแปรสุ่มมีการแจกแจงแบบจุดเดียวหากมีผลลัพธ์ที่เป็นไปได้เช่นนั้น^[¹⁸^]ผลลัพธ์ที่เป็นไปได้อื่นๆ ทั้งหมดจะมีโอกาสเป็น 0 ฟังก์ชันการแจกแจงสะสมจะกระโดดจาก 0 ทันทีก่อนเป็น 1 ที่มันมีความเกี่ยวข้องอย่างใกล้ชิดกับการแจกแจงแบบกำหนด ซึ่งไม่สามารถรับค่าอื่นใดได้ ในขณะที่การแจกแจงแบบจุดเดียวสามารถรับค่าอื่นได้ แม้ว่าจะมีโอกาสเป็น 0 เท่านั้น สำหรับวัตถุประสงค์ในทางปฏิบัติส่วนใหญ่ แนวคิดทั้งสองนี้เทียบเท่ากัน $X$ $x$ $P(X{=}x)=1.$ $x$ $x$

การกระจายความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์

การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์คือการแจกแจงความน่าจะเป็นบนจำนวนจริงที่มีค่าที่เป็นไปได้นับไม่ถ้วน เช่น ช่วงทั้งหมดบนเส้นจำนวนจริง และความน่าจะเป็นของเหตุการณ์ใดๆ สามารถแสดงได้ในรูปของปริพันธ์^{[ 19 ]}กล่าวให้แม่นยำยิ่งขึ้น ตัวแปรสุ่มจริงมี การแจกแจงความน่าจะ เป็นแบบต่อเนื่องโดยสมบูรณ์หากมีฟังก์ชันที่สำหรับแต่ละช่วงความน่าจะเป็นของการเป็นสมาชิกของ ช่วง นั้นกำหนดโดยปริพันธ์ของฟังก์ชันในช่วง: ^[²⁰^]^[²¹^] นี่คือนิยามของฟังก์ชันความหนาแน่นความน่าจะเป็นดังนั้นการแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์จึงเป็นการแจกแจงที่มีฟังก์ชันความหนาแน่นความน่าจะเป็น โดยเฉพาะอย่างยิ่ง ความน่าจะเป็นที่ค่าใดค่าหนึ่ง(นั่นคือ) จะเป็นศูนย์ เพราะปริพันธ์ที่มีขอบเขตบนและล่างที่ตรงกันจะเท่ากับศูนย์เสมอ หากช่วงถูกแทนที่ด้วยเซตที่วัดได้ใดๆความเท่าเทียมกันที่เกี่ยวข้องก็ยังคงเป็นจริง: $X$ $f:\mathbb {R} \to [0,\infty ]$ $I=[a,b]\subset \mathbb {R}$ $X$ $I$ $f$ $I$ $P\left(a\leq X\leq b\right)=\int _{a}^{b}f(x)\,dx.$ $X$ $a$ $a\leq X\leq a$ $[a,b]$ $A$ $P(X\in A)=\int _{A}f(x)\,dx.$

ตัวแปรสุ่มต่อเนื่องโดยสมบูรณ์คือ ตัวแปรสุ่มที่มีการกระจายความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์

มีตัวอย่างมากมายของการแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์ เช่น การแจกแจงแบบปกติ การแจกแจง แบบเอก รูป การแจกแจงแบบไคกำลังสองและอื่นๆ

ฟังก์ชันการกระจายสะสม

การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์ตามที่นิยามไว้ข้างต้น คือการแจกแจงที่มี ฟังก์ชันการแจกแจงสะสม แบบต่อเนื่องโดยสมบูรณ์ ในกรณีนี้ ฟังก์ชันการแจกแจงสะสมจะมีรูปแบบ โดยที่คือความหนาแน่นของตัวแปรสุ่มที่เกี่ยวข้องกับการแจกแจง $F$ $F(x)=P(X\leq x)=\int _{-\infty }^{x}f(t)\,dt$ $f$ $X$ $P$

หมายเหตุเกี่ยวกับคำศัพท์:ควรแยกแยะการแจกแจงแบบต่อเนื่องสัมบูรณ์ออกจากการแจกแจงแบบต่อเนื่องซึ่งเป็นการแจกแจงที่มีฟังก์ชันการแจกแจงสะสมแบบต่อเนื่อง การแจกแจงแบบต่อเนื่องสัมบูรณ์ทุกแบบเป็นการแจกแจงแบบต่อเนื่อง แต่ในทางกลับกันนั้นไม่เป็นจริง มีการแจกแจงแบบเอกฐานซึ่งไม่ใช่ทั้งแบบต่อเนื่องสัมบูรณ์หรือแบบไม่ต่อเนื่อง หรือเป็นการผสมผสานของทั้งสองอย่าง และไม่มีความหนาแน่น ตัวอย่างเช่น การแจกแจงแคนเตอร์อย่างไรก็ตาม ผู้เขียนบางคนใช้คำว่า "การแจกแจงแบบต่อเนื่อง" เพื่อหมายถึงการแจกแจงทั้งหมดที่มีฟังก์ชันการแจกแจงสะสมแบบต่อเนื่องสัมบูรณ์กล่าวคือ อ้างถึงการแจกแจงแบบต่อเนื่องสัมบูรณ์ว่าเป็นการแจกแจงแบบต่อเนื่อง^{[ 5 ]}

สำหรับคำจำกัดความทั่วไปของฟังก์ชันความหนาแน่นและมาตรวัดต่อเนื่องสัมบูรณ์ที่เทียบเท่ากัน โปรดดูที่ มาตรวัด ต่อ เนื่องสัมบูรณ์

คำจำกัดความของ Kolmogorov

ในการ กำหนด รูปแบบเชิงวัดของทฤษฎีความน่าจะ เป็น ตัวแปรสุ่มถูกกำหนดให้เป็นฟังก์ชันที่วัดได้ จากปริภูมิความน่าจะ เป็น ไปยังปริภูมิที่วัดได้เนื่องจากความน่าจะเป็นของเหตุการณ์ในรูปแบบเป็นไปตามสัจพจน์ความน่าจะเป็นของ Kolmogorovการแจกแจงความน่าจะเป็นของคือการวัดภาพของซึ่งเป็นการวัดความน่าจะ เป็น บนที่สอดคล้อง กับ ^[²²^]^[²³^]^[²⁴^] $X$ $(\Omega ,{\mathcal {F}},\mathbb {P} )$ $({\mathcal {X}},{\mathcal {A}})$ $\{\omega \in \Omega \mid X(\omega )\in A\}$ $X$ $X_{*}\mathbb {P}$ $X$ $({\mathcal {X}},{\mathcal {A}})$ $X_{*}\mathbb {P} =\mathbb {P} X^{-1}$

การแจกจ่ายประเภทอื่นๆ

การแจกแจงแบบต่อเนื่องและแบบไม่ต่อเนื่องอย่างสมบูรณ์ที่มีส่วนรองรับบนหรือมีประโยชน์อย่างยิ่งในการจำลองปรากฏการณ์มากมาย^[⁵^]^[¹^]เนื่องจากส่วนใหญ่การแจกแจงในทางปฏิบัติจะมีส่วนรองรับบนเซตย่อยที่ค่อนข้างง่าย เช่นไฮเปอร์คิวบ์หรือลูกบอลอย่างไรก็ตาม นี่ไม่ใช่กรณีเสมอไป และมีปรากฏการณ์ที่มีส่วนรองรับที่เป็นเส้นโค้งที่ซับซ้อนภายในพื้นที่บางอย่างหรือคล้ายกัน ในกรณีเหล่านี้ การแจกแจงความน่าจะเป็นจะมีส่วนรองรับบนภาพของเส้นโค้งดังกล่าว และมีแนวโน้มที่จะถูกกำหนดโดยประสบการณ์มากกว่าการหาสูตรปิด^[²⁵^] $\mathbb {R} ^{k}$ $\mathbb {N} ^{k}$ $\gamma :[a,b]\rightarrow \mathbb {R} ^{n}$ $\mathbb {R} ^{n}$

ตัวอย่างหนึ่งแสดงอยู่ในรูปทางด้านขวา ซึ่งแสดงวิวัฒนาการของระบบสมการเชิงอนุพันธ์ (โดยทั่วไปเรียกว่าสมการ Rabinovich–Fabrikant ) ที่สามารถใช้จำลองพฤติกรรมของคลื่น Langmuirในพลาสมาได้^{[ 26 ]}เมื่อศึกษาปรากฏการณ์นี้ สถานะที่สังเกตได้จากเซตย่อยจะแสดงเป็นสีแดง ดังนั้นจึงอาจถามได้ว่าความน่าจะเป็นของการสังเกตสถานะในตำแหน่งใดตำแหน่งหนึ่งของเซตย่อยสีแดงคืออะไร หากมีความน่าจะเป็นดังกล่าวอยู่ จะเรียกว่าการวัดความน่าจะเป็นของระบบ^{[ 27 ]}^{[ 25 ]}

การสนับสนุนที่ซับซ้อนประเภทนี้มักปรากฏในระบบพลวัตบ่อย ครั้ง การพิสูจน์ว่าระบบมีการวัดความน่าจะเป็นนั้นไม่ใช่เรื่องง่าย และปัญหาหลักคือดังต่อไปนี้ ให้เป็นช่วงเวลา และเป็นเซตย่อยของการสนับสนุน ถ้าหากการวัดความน่าจะเป็นมีอยู่สำหรับระบบ เราคาดหวังว่าความถี่ของการสังเกตสถานะภายในเซตจะเท่ากันในช่วงเวลาและซึ่งอาจไม่เกิดขึ้น ตัวอย่างเช่น อาจแกว่งไปมาคล้ายกับฟังก์ชันไซน์ซึ่งลิมิตเมื่อไม่ลู่เข้า ในทางทฤษฎี การวัดจะมีอยู่ก็ต่อเมื่อลิมิตของความถี่สัมพัทธ์ลู่เข้าเมื่อสังเกตระบบในอนาคตอันไม่มีที่สิ้นสุด^[²⁸^]สาขาของระบบพลวัตที่ศึกษาการมีอยู่ของการวัดความน่าจะเป็นคือทฤษฎีเออร์โกดิก $t_{1}\ll t_{2}\ll t_{3}$ $O$ $O$ $[t_{1},t_{2}]$ $[t_{2},t_{3}]$ $\sin(t)$ $t\rightarrow \infty$

โปรดทราบว่าแม้ในกรณีเหล่านี้ การกระจายความน่าจะเป็น หากมีอยู่จริง ก็อาจยังคงถูกเรียกว่า "ต่อเนื่องอย่างสมบูรณ์" หรือ "ไม่ต่อเนื่อง" ขึ้นอยู่กับว่าขอบเขตนั้นนับไม่ได้หรือนับได้ ตามลำดับ

การสลายตัวของเลเบสก์

ทฤษฎีบทการแยกส่วนของเลเบสก์ระบุว่าการกระจายความน่าจะเป็นใดๆ บนเส้นจำนวนจริงสามารถแยกส่วนได้อย่างไม่ซ้ำกันเป็นส่วนผสมของประเภทพื้นฐานสามประเภท โดยที่ผลรวมของสัมประสิทธิ์เท่ากับ 1 ส่วนประกอบทั้งสามคือ: ^[²⁹^] $F=\alpha F_{\text{discrete}}+\beta F_{\text{ac}}+\gamma F_{\text{singular}}$ $\alpha ,\beta ,\gamma \in [0,1]$

แบบไม่ต่อเนื่อง :ความน่าจะเป็นจะกระจุกตัวอยู่บนชุดค่า (จุด) ที่นับได้ ฟังก์ชันการกระจายสะสม (CDF) เป็นฟังก์ชันขั้นบันได
ต่อเนื่องอย่างสมบูรณ์ :การแจกแจงมีฟังก์ชันความหนาแน่นความน่าจะเป็น ที่ โดยที่เซตของค่าที่มีความหนาแน่นความน่าจะเป็นไม่เป็นศูนย์จะมีค่าการวัดของเลเบสมากกว่าศูนย์ $f(x)$ $F(x)=\int _{-\infty }^{x}f(t)\,dt$
ความต่อเนื่องแบบเอกลักษณ์ :ฟังก์ชันการกระจายสะสม (CDF) ต่อเนื่องทุกที่ แต่ค่าอนุพันธ์ของมันเป็นศูนย์เกือบทุกที่ (เมื่อเทียบกับการวัดแบบเลเบส) ความน่าจะเป็นจะกระจุกตัวอยู่บนเซตที่มีการวัดเป็นศูนย์ (เช่นเซตแคนเตอร์ ) ตัวอย่างคลาสสิกคือการกระจายแบบแคนเตอร์

การแจกแจงมาตรฐานส่วนใหญ่ในการประยุกต์ใช้ทางสถิติจะเป็นแบบไม่ต่อเนื่องล้วนๆ ( ) หรือแบบต่อเนื่องสัมบูรณ์ล้วนๆ ( ) การแจกแจงเอกลักษณ์ไม่ค่อยปรากฏในสถิติประยุกต์ แต่มีความสำคัญในทฤษฎีของกระบวนการสุ่มและแฟรกทัล $\alpha =1$ $\beta =1$

การสร้างเลขสุ่ม

อัลกอริทึมส่วนใหญ่ใช้ตัวสร้างเลขสุ่มเทียมที่สร้างตัวเลขที่มีการกระจายอย่างสม่ำเสมอในช่วงครึ่งเปิด $[0, 1) จากนั้น$ ตัวแปรสุ่มเหล่านี้จะถูกแปลงผ่านอัลกอริทึมบางอย่างเพื่อสร้างตัวแปรสุ่มใหม่ที่มีการกระจายความน่าจะเป็นที่ต้องการ ด้วยแหล่งที่มาของความสุ่มเทียมแบบสม่ำเสมอนี้ สามารถสร้างค่าของตัวแปรสุ่มใดๆ ก็ได้^[³⁰^] $X$ $X$

ตัวอย่างเช่น สมมติว่า $U$ มีการแจกแจงแบบเอกรูประหว่าง 0 และ 1 เพื่อสร้างตัวแปรเบอร์นูลีแบบสุ่มสำหรับ $0 < p < 1$ บางค่า ให้กำหนด ดังนั้นเราจึงมี ดังนั้นตัวแปรสุ่ม $X$ จึงมีการแจกแจงแบบเบอร์นูลี ที่มีพารามิเตอร์ $p$ ^[³⁰^] $X={\begin{cases}1&{\text{if }}U<p\\0&{\text{if }}U\geq p.\end{cases}}$ $P(X=1)=P(U<p)=p,\quad P(X=0)=P(U\geq p)=1-p.$

วิธีนี้สามารถปรับใช้เพื่อสร้างตัวแปรสุ่มค่าจริงที่มีการแจกแจงใดๆ ก็ได้: สำหรับ f เป็นฟังก์ชันการแจกแจงสะสมใดๆ $F$ ให้ $F inv$ เป็นฟังก์ชันผกผันซ้ายทั่วไปของ f ซึ่งในบริบทนี้เรียกว่าฟังก์ชันควอนไทล์หรือฟังก์ชันการแจกแจงผกผัน : จากนั้น $F$ $inv$ $($ $p$ $) \leq$ $x$ ก็ต่อเมื่อ $p$ $\leq$ $F$ $($ $x$ $)$ เท่านั้น ดังนั้น ถ้า $U$ มีการแจกแจงแบบเอกรูปบน $[0, 1]$ แล้ว ฟังก์ชันการแจกแจงสะสมของ $X$ $=$ $F$ $inv$ $($ $U$ $)$ คือ $F$ $F,$ $F^{\mathrm {inv} }(p)=\inf\{x\in \mathbb {R} :p\leq F(x)\}.$

ตัวอย่างเช่น สมมติว่าเราต้องการสร้างตัวแปรสุ่มที่มีการแจกแจงแบบเอกซ์โพเนนเชียลที่มีพารามิเตอร์— นั่นคือ มีฟังก์ชันการแจกแจงสะสม ดังนั้นและถ้า $U$ มีการแจกแจงแบบเอกรูปบน $[0, 1)$ แล้ว ก็มีการแจกแจงแบบเอกซ์โพเนนเชียลที่มีพารามิเตอร์^[³⁰^] $\lambda$ $F:x\mapsto 1-e^{-\lambda x}.$ ${\begin{aligned}F(x)=u&\Leftrightarrow 1-e^{-\lambda x}=u\\[2pt]&\Leftrightarrow e^{-\lambda x}=1-u\\[2pt]&\Leftrightarrow -\lambda x=\ln(1-u)\\[2pt]&\Leftrightarrow x={\frac {-1}{\lambda }}\ln(1-u)\end{aligned}}$ $F^{\mathrm {inv} }(u)=-{\tfrac {1}{\lambda }}\ln(1-u)$ $X=-{\tfrac {1}{\lambda }}\ln(1-U)$ $\lambda .$

แม้ว่าในทางทฤษฎีแล้ว วิธีนี้จะใช้ได้ผลเสมอ แต่ในทางปฏิบัติ ฟังก์ชันการแจกแจงผกผันนั้นไม่เป็นที่รู้จักและ/หรือไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ ในกรณีเช่นนี้ จึงต้องใช้วิธีการอื่น (เช่นวิธีมอนเตคาร์โล )

การแจกแจงความน่าจะเป็นทั่วไปและการประยุกต์ใช้

แนวคิดเรื่องการกระจายความน่าจะเป็นและตัวแปรสุ่มที่อธิบายถึงการกระจายนั้นเป็นพื้นฐานของวิชาคณิตศาสตร์ทฤษฎีความน่าจะเป็นและวิทยาศาสตร์สถิติ เกือบทุกค่าที่สามารถวัดได้ในประชากร (เช่น ความสูงของคน ความทนทานของโลหะ การเติบโตของยอดขาย การจราจร ฯลฯ) ล้วนมีการกระจายหรือความแปรปรวน การวัดเกือบทั้งหมดมีข้อผิดพลาดโดยธรรมชาติ ในวิชาฟิสิกส์ กระบวนการหลายอย่างถูกอธิบายด้วยความน่าจะเป็น ตั้งแต่คุณสมบัติทางจลน์ของก๊าซไปจนถึง คำอธิบาย ทางกลศาสตร์ควอนตัมของอนุภาคพื้นฐาน ด้วยเหตุผลเหล่านี้และเหตุผลอื่นๆ อีกมากมาย ตัวเลขธรรมดาจึงมักไม่เพียงพอสำหรับการอธิบายปริมาณ ในขณะที่การกระจายความน่าจะเป็นมักเหมาะสมกว่า

ต่อไปนี้เป็นรายการของการแจกแจงความน่าจะเป็นที่พบบ่อยที่สุดบางส่วน โดยจัดกลุ่มตามประเภทของกระบวนการที่เกี่ยวข้อง สำหรับรายการที่สมบูรณ์ยิ่งขึ้น โปรดดูที่รายการการแจกแจงความน่าจะเป็นซึ่งจัดกลุ่มตามลักษณะของผลลัพธ์ที่พิจารณา (แบบไม่ต่อเนื่อง แบบต่อเนื่องอย่างสมบูรณ์ แบบหลายตัวแปร ฯลฯ)

การแจกแจงแบบตัวแปรเดียวทั้งหมดด้านล่างนี้มีจุดสูงสุดเพียงจุดเดียว กล่าวคือ สมมติว่าค่าต่างๆ กระจุกตัวอยู่รอบจุดเดียว ในทางปฏิบัติ ปริมาณที่สังเกตได้จริงอาจกระจุกตัวอยู่รอบค่าหลายค่า ปริมาณดังกล่าวสามารถจำลองได้โดยใช้การ แจกแจงแบบผสม

การเติบโตเชิงเส้น (เช่น ข้อผิดพลาด ค่าเบี่ยงเบน)

การแจกแจงแบบปกติ (การแจกแจงแบบเกาส์เซียน) สำหรับปริมาณเดียวดังกล่าว เป็นการแจกแจงแบบต่อเนื่องที่ใช้กันมากที่สุด

การเติบโตแบบทวีคูณ (เช่น ราคา รายได้ ประชากร)

การแจกแจงแบบลอการิทมิกปกติสำหรับปริมาณเดียวดังกล่าวซึ่งค่าลอการิทมิกมีการแจกแจงแบบปกติ
การแจกแจงพาเรโตสำหรับปริมาณเดียวที่มีลอการิทึมเป็นการแจกแจงแบบเอก ซ์โปเนนเชียล การแจกแจงแบบกฎกำลัง ที่เป็นต้นแบบ

ปริมาณที่กระจายอย่างสม่ำเสมอ

การแจกแจงแบบเอกรูปไม่ต่อเนื่องสำหรับชุดค่าที่จำกัด (เช่น ผลลัพธ์ของการทอยลูกเต๋าที่ยุติธรรม)
การแจกแจงแบบเอกรูปต่อเนื่องสำหรับค่าที่มีการแจกแจงแบบต่อเนื่องอย่างสมบูรณ์

การทดลองแบบเบอร์นูลลี (เหตุการณ์ใช่/ไม่ใช่ ด้วยความน่าจะเป็นที่กำหนด)

การแจกแจงพื้นฐาน:
- การแจกแจงแบบเบอร์นูลลีสำหรับผลลัพธ์ของการทดลองแบบเบอร์นูลลีครั้งเดียว (เช่น สำเร็จ/ล้มเหลว ใช่/ไม่ใช่)
- การแจกแจงแบบทวินามสำหรับจำนวน "เหตุการณ์เชิงบวก" (เช่น ความสำเร็จ การลงคะแนนเห็นด้วย เป็นต้น) เมื่อกำหนดจำนวนเหตุการณ์อิสระ ทั้งหมดคงที่
- การแจกแจงทวินามเชิงลบสำหรับการสังเกตแบบทวินาม แต่ปริมาณที่สนใจคือจำนวนความล้มเหลวก่อนที่จะเกิดความสำเร็จตามจำนวนที่กำหนด
- การแจกแจงแบบเรขาคณิตสำหรับการสังเกตแบบทวินาม แต่ปริมาณที่สนใจคือจำนวนความล้มเหลวก่อนความสำเร็จครั้งแรก เป็นกรณีพิเศษของการแจกแจงทวินามเชิงลบ
เกี่ยวข้องกับแผนการสุ่มตัวอย่างในประชากรที่มีจำนวนจำกัด:
- การแจกแจงแบบไฮเปอร์จีโอเมตริกสำหรับจำนวน "เหตุการณ์เชิงบวก" (เช่น ความสำเร็จ การลงคะแนนเห็นด้วย ฯลฯ) เมื่อกำหนดจำนวนเหตุการณ์ทั้งหมดคงที่ โดยใช้การสุ่มตัวอย่างแบบไม่ใส่คืน
- การแจกแจงแบบเบตา-ไบโนเมียลสำหรับจำนวน "เหตุการณ์เชิงบวก" (เช่น ความสำเร็จ การลงคะแนนเห็นด้วย ฯลฯ) เมื่อกำหนดจำนวนเหตุการณ์ทั้งหมดคงที่ โดยใช้การสุ่มตัวอย่างแบบโถโพลยา (ในแง่หนึ่ง เป็น "สิ่งที่ตรงกันข้าม" กับการสุ่มตัวอย่างโดยไม่ใส่คืน )

ผลลัพธ์เชิงหมวดหมู่ (เหตุการณ์ที่มี ผลลัพธ์ที่เป็นไปได้ $K$ อย่าง)

การแจกแจงเชิงหมวดหมู่สำหรับผลลัพธ์เชิงหมวดหมู่เดียว (เช่น ใช่/ไม่ใช่/อาจจะ ในแบบสำรวจ) ซึ่งเป็นการขยายความของการแจกแจงแบบเบอร์นูลลี
การแจกแจงพหุนามสำหรับจำนวนของผลลัพธ์เชิงหมวดหมู่แต่ละประเภท เมื่อกำหนดจำนวนผลลัพธ์ทั้งหมดคงที่ เป็นการขยายความของการแจกแจงทวินาม
การแจกแจงไฮเปอร์จีโอเมตริกแบบหลายตัวแปรคล้ายกับการแจกแจงมัลติโนเมียลแต่ใช้การสุ่มตัวอย่างแบบไม่ใส่คืนเป็นการขยายความของการแจกแจงไฮเปอร์จีโอเมตริก

กระบวนการปัวซง (เหตุการณ์ที่เกิดขึ้นอย่างอิสระด้วยอัตราที่กำหนด)

การแจกแจงปัวซงสำหรับจำนวนครั้งของการเกิดเหตุการณ์ประเภทปัวซงในช่วงเวลาที่กำหนด
การแจกแจงแบบเอกซ์โปเนนเชียลสำหรับช่วงเวลาก่อนที่เหตุการณ์แบบปัวซงครั้งถัดไปจะเกิดขึ้น
การแจกแจงแกมมาสำหรับช่วงเวลาก่อนที่เหตุการณ์แบบปัวซง k ครั้งถัดไปจะเกิดขึ้น

ค่าสัมบูรณ์ของเวกเตอร์ที่มีส่วนประกอบกระจายแบบปกติ

การแจกแจงแบบเรย์ลี (Rayleigh distribution ) คือการแจกแจงขนาดของเวกเตอร์ที่มีส่วนประกอบเชิงตั้งฉากแบบการแจกแจงแบบเกาส์เซียน การแจกแจงแบบเรย์ลีพบได้ในสัญญาณ RF ที่มีส่วนประกอบจริงและส่วนประกอบจินตนาการแบบเกาส์เซียน
การแจกแจงแบบไรซ์ (Rice distribution ) เป็นการขยายความของการแจกแจงแบบเรย์ลี (Rayleigh distribution) สำหรับกรณีที่มีส่วนประกอบของสัญญาณพื้นหลังที่คงที่ พบได้ในการลดทอนสัญญาณวิทยุแบบไรซ์เนื่องจากการแพร่กระจายแบบหลายเส้นทาง และในภาพ MRI ที่มีการรบกวนจากสัญญาณรบกวนในสัญญาณ NMR ที่ไม่เป็นศูนย์

ปริมาณที่มีการกระจายแบบปกติจะดำเนินการด้วยผลรวมของกำลังสอง

การแจกแจงไคกำลังสองคือการแจกแจงของผลรวมของกำลังสองของ ตัวแปร ปกติมาตรฐานมีประโยชน์ เช่น สำหรับการอนุมานเกี่ยวกับความแปรปรวนของตัวอย่างที่มีการแจกแจงแบบปกติ (ดูการทดสอบไคกำลังสอง )
การแจกแจงแบบ t ของนักเรียนคือการแจกแจงของอัตราส่วนระหว่าง ตัวแปร ปกติมาตรฐานกับรากที่สองของ ตัวแปร ไคกำลังสอง ที่ปรับขนาดแล้ว มีประโยชน์สำหรับการอนุมานเกี่ยวกับค่าเฉลี่ยของตัวอย่างที่มีการแจกแจงแบบปกติโดยที่ค่าความแปรปรวนไม่ทราบค่า (ดูการทดสอบ t ของนักเรียน )
การแจกแจง Fคือการแจกแจงของอัตราส่วนของ ตัวแปร ไคกำลัง สองที่ปรับขนาดแล้วสองตัว ซึ่งมีประโยชน์ เช่น สำหรับการอนุมานที่เกี่ยวข้องกับการเปรียบเทียบความแปรปรวน หรือเกี่ยวข้องกับค่า R-squared ( สัมประสิทธิ์สหสัมพันธ์ กำลังสอง )

ในฐานะการแจกแจงความน่าจะเป็นก่อนหน้าแบบคู่ในอนุมานแบบเบย์เซียน

การแจกแจงเบตาสำหรับความน่าจะเป็นเดียว (จำนวนจริงระหว่าง 0 ถึง 1) เป็นคู่ควบกับการแจกแจงเบอร์นูลลีและการแจกแจงทวินาม
การแจกแจงแกมมาสำหรับพารามิเตอร์การปรับขนาดที่ไม่เป็นลบ; คู่กับพารามิเตอร์อัตราของการแจกแจงปัวซงหรือการแจกแจงเอกซ์โปเนนเชียลความแม่นยำ (ส่วนกลับของความแปรปรวน ) ของการแจกแจงปกติเป็นต้น
การแจกแจงแบบ Dirichletคือการแจกแจงเวกเตอร์ของความน่าจะเป็นที่ผลรวมต้องเท่ากับ 1 ซึ่งเป็นการแจกแจงคู่ขนานกับการแจกแจงแบบหมวดหมู่และการแจกแจงแบบพหุนามและเป็นการวางนัยทั่วไปของการแจกแจงแบบเบตา
การแจกแจง Wishartสำหรับเมทริกซ์สมมาตรที่ไม่เป็นลบแน่นอน ; สอดคล้องกับเมทริกซ์ผกผันของเมทริกซ์ความแปรปรวน ร่วม ของการแจกแจงปกติหลายตัวแปร ; การวางนัยทั่วไปของการแจกแจงแกมมา^{[ 31 ]}

การประยุกต์ใช้การแจกแจงความน่าจะเป็นในบางสาขาเฉพาะทาง

แบบจำลองภาษาแคชและแบบจำลองภาษาเชิงสถิติ อื่นๆ ที่ใช้ในการประมวลผลภาษาธรรมชาติเพื่อกำหนดความน่าจะเป็นของการเกิดขึ้นของคำและลำดับคำเฉพาะนั้น จะทำโดยอาศัยการแจกแจงความน่าจะเป็น
ในกลศาสตร์ควอนตัม ความหนาแน่นของความน่าจะเป็นที่จะพบอนุภาค ณ จุดที่กำหนดนั้นเป็นสัดส่วนกับกำลังสองของขนาดของฟังก์ชันคลื่น ของอนุภาค ณ จุดนั้น (ดูกฎของบอร์น ) ดังนั้น ฟังก์ชันการกระจายความน่าจะเป็นของตำแหน่งของอนุภาคจึงอธิบายได้ด้วย ความน่าจะเป็นที่ตำแหน่ง $x$ ของอนุภาคจะอยู่ในช่วง $a$ $\leq$ $x$ $\leq$ $b$ ในมิติหนึ่ง และปริพันธ์สามชั้น ที่คล้ายกัน ในมิติสาม นี่เป็นหลักการสำคัญของกลศาสตร์ควอนตัม^[³²^] ${\textstyle P_{a\leq x\leq b}(t)=\int _{a}^{b}dx\,|\Psi (x,t)|^{2}}$
การไหลของโหลดเชิงความน่าจะเป็นในการศึกษาการไหลของพลังงานจะอธิบายความไม่แน่นอนของตัวแปรอินพุตเป็นการกระจายความน่าจะเป็น และให้การคำนวณการไหลของพลังงานในแง่ของการกระจายความน่าจะเป็นเช่นกัน^{[ 33 ]}
การคาดการณ์การเกิดปรากฏการณ์ธรรมชาติโดยอาศัยการกระจายความถี่ ก่อนหน้า เช่นพายุหมุนเขตร้อนลูกเห็บ ระยะเวลาระหว่างเหตุการณ์ ฯลฯ^{[ 34 ]}

การติดตั้ง

การปรับให้เข้ากับแบบจำลองการแจกแจงความน่าจะเป็นหรือเรียกสั้น ๆ ว่า การปรับให้เข้ากับแบบจำลองการแจกแจง คือการปรับแบบจำลองการแจกแจงความน่าจะเป็นให้เข้ากับชุดข้อมูลเกี่ยวกับการวัดซ้ำ ๆ ของปรากฏการณ์ตัวแปร จุดมุ่งหมายของการปรับให้เข้ากับแบบจำลองการแจกแจงคือการ ทำนายความน่าจะเป็นหรือพยากรณ์ความถี่ของการเกิดของขนาดของปรากฏการณ์ในช่วงเวลาที่กำหนด

มีฟังก์ชันความน่าจะเป็นหลายแบบ (ดูรายชื่อฟังก์ชันความน่าจะเป็น ) ซึ่งบางแบบอาจเหมาะสมกับความถี่ที่สังเกตได้ของข้อมูลมากกว่าแบบอื่น ขึ้นอยู่กับลักษณะของปรากฏการณ์และของฟังก์ชันความน่าจะเป็นนั้น ฟังก์ชันความน่าจะเป็นที่เหมาะสมที่สุดมักจะนำไปสู่การทำนายที่ดี ดังนั้น ในการปรับฟังก์ชันความน่าจะเป็นให้เข้ากับข้อมูล จึงจำเป็นต้องเลือกฟังก์ชันความน่าจะเป็นที่เหมาะสมกับข้อมูลมากที่สุด

การบรรจบกัน

แนวคิดพื้นฐานในทฤษฎีความน่าจะเป็นคือการลู่เข้าของลำดับการแจกแจงความน่าจะเป็น ลำดับการแจกแจงความน่าจะเป็นจะลู่เข้าอย่างอ่อน (หรือในเชิงการแจกแจง ) ไปยังการแจกแจงความน่าจะเป็นถ้า สำหรับทุกเซตที่มีขอบเขตซึ่งมีความน่าจะเป็น 0 $(P_{n})$ $P$ $\lim _{n\to \infty }P_{n}(A)=P(A)$ $A$ $P$

ในทำนองเดียวกัน การใช้ฟังก์ชันการกระจายสะสมลำดับจะลู่เข้าสู่ถ้า สำหรับทุก ๆที่ ซึ่งมีความต่อเนื่อง^[³⁵^] $F_{n}$ $F$ $\lim _{n\to \infty }F_{n}(x)=F(x)$ $x$ $F$

แนวคิดนี้มีความสำคัญต่อทฤษฎีบทขีดจำกัดกลางซึ่งระบุว่าการแจกแจงความน่าจะเป็นของผลรวมมาตรฐานของตัวแปรสุ่มอิสระและมีการแจกแจงเหมือนกันจะลู่เข้าสู่การแจกแจงปกติมาตรฐานโดยไม่คำนึงถึงการแจกแจงพื้นฐานของตัวแปรแต่ละตัว^{[ 36 ]}

ดูเพิ่มเติม

รายการ

ลิงก์ภายนอก

"การแจกแจงความน่าจะเป็น" , สารานุกรมคณิตศาสตร์ , EMS Press , 2001 [1994]
คู่มือภาคสนามสำหรับความน่าจะเป็นแบบต่อเนื่องโดย Gavin E. Crooks
ความแตกต่างระหว่างการวัดความน่าจะเป็น ฟังก์ชันความน่าจะเป็น และการแจกแจงความน่าจะเป็น Math Stack Exchange

[ 1 ]

[

[

[

[

[

[

[ 8 ]

[ 9 ]

[

[ 11 ]

[

13 ] และ

[ 14 ]

[ 15 ]

[

[

[

[ 19 ]

[

[

[

[

[

[

[ 26 ]

[ 27 ]

[

[

[

[ 31 ]

[

[ 33 ]

[ 34 ]

[

[ 36 ]

การกระจายความน่าจะเป็น

การแนะนำ

นิยามความน่าจะเป็นทั่วไป

ศัพท์เฉพาะ

คำศัพท์พื้นฐาน

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์

คำศัพท์ที่เกี่ยวข้อง

ฟังก์ชันการกระจายสะสม

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

ฟังก์ชันการกระจายสะสม

การแสดงผลแบบเดลต้าของ Dirac

การแสดงผลฟังก์ชันตัวบ่งชี้

การกระจายจุดเดียว

การกระจายความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์

ฟังก์ชันการกระจายสะสม

คำจำกัดความของ Kolmogorov

การแจกจ่ายประเภทอื่นๆ

การสลายตัวของเลเบสก์

การสร้างเลขสุ่ม

การแจกแจงความน่าจะเป็นทั่วไปและการประยุกต์ใช้

การเติบโตเชิงเส้น (เช่น ข้อผิดพลาด ค่าเบี่ยงเบน)

การเติบโตแบบทวีคูณ (เช่น ราคา รายได้ ประชากร)

ปริมาณที่กระจายอย่างสม่ำเสมอ

การทดลองแบบเบอร์นูลลี (เหตุการณ์ใช่/ไม่ใช่ ด้วยความน่าจะเป็นที่กำหนด)

ผลลัพธ์เชิงหมวดหมู่ (เหตุการณ์ที่มี ผลลัพธ์ที่เป็นไปได้ Kอย่าง)

กระบวนการปัวซง (เหตุการณ์ที่เกิดขึ้นอย่างอิสระด้วยอัตราที่กำหนด)

ค่าสัมบูรณ์ของเวกเตอร์ที่มีส่วนประกอบกระจายแบบปกติ

ปริมาณที่มีการกระจายแบบปกติจะดำเนินการด้วยผลรวมของกำลังสอง

ในฐานะการแจกแจงความน่าจะเป็นก่อนหน้าแบบคู่ในอนุมานแบบเบย์เซียน

การประยุกต์ใช้การแจกแจงความน่าจะเป็นในบางสาขาเฉพาะทาง

การติดตั้ง

การบรรจบกัน

ดูเพิ่มเติม

รายการ

ลิงก์ภายนอก

ข้อมูลสำคัญจากบทความ

ผลลัพธ์เชิงหมวดหมู่ (เหตุการณ์ที่มี ผลลัพธ์ที่เป็นไปได้ $K$ อย่าง)