กลับไปหน้าบทความ

อ่าน 20 นาที

การกระจายความน่าจะเป็น

ในทฤษฎีความน่าจะเป็นและสถิติการแจกแจงความน่าจะเป็นอธิบายถึงวิธีการกำหนดความน่าจะเป็นให้กับผลลัพธ์ที่เป็นไปได้ของปรากฏการณ์สุ่ม—หรือกล่าวให้แม่นยำยิ่งขึ้นคือเหตุการณ์ซึ่งเป็นเซตของผ...

การกระจายความน่าจะเป็น

ในทฤษฎีความน่าจะเป็นและสถิติการแจกแจงความน่าจะเป็นอธิบายถึงวิธีการกำหนดความน่าจะเป็นให้กับผลลัพธ์ที่เป็นไปได้ของปรากฏการณ์สุ่ม—หรือกล่าวให้แม่นยำยิ่งขึ้นคือเหตุการณ์ซึ่งเป็นเซตของผลลัพธ์ที่เป็นไปได้ของการทดลองเชิงความน่า จะเป็น โดยทั่วไป การแจกแจงความน่าจะเป็นบอกเราว่าผลลัพธ์ที่แตกต่างกันมีโอกาสเกิดขึ้นมากน้อยเพียงใด ในทางทฤษฎีแล้ว มันคือการวัดความน่าจะเป็น : ฟังก์ชันที่กำหนดความน่าจะเป็นให้กับเหตุการณ์ในลักษณะที่สอดคล้องกับสัจพจน์ของความน่าจะเป็น

การแจกแจงความน่าจะเป็นมีความเชื่อมโยงอย่างใกล้ชิดกับตัวแปรสุ่มตัวแปรสุ่มคือฟังก์ชันที่กำหนดค่าให้กับผลลัพธ์แต่ละอย่างของการทดลองเชิงความน่าจะเป็น โดยจะสร้างการแจกแจงความน่าจะเป็นบนเซตของค่าที่ตัวแปรสุ่มสามารถรับได้ ตัวอย่างเช่น ผลลัพธ์ของการโยนเหรียญสามารถแทนด้วยตัวแปรสุ่มXที่เท่ากับ1สำหรับหัวและ0สำหรับก้อย หากเหรียญนั้นยุติธรรม การแจกแจงนี้จะกำหนดความน่าจะเป็น1/2ให้กับX = 1และความน่าจะเป็น1/2ให้กับX = 0เมื่อมองในแง่ของการวัดความน่าจะเป็น การแจกแจงของXจะกำหนดค่า ℙ( XA )ให้กับแต่ละเซตA ⊆ {0,1 }; สำหรับเหรียญที่ยุติธรรมℙ( X ∈ {1}) = ℙ( X ∈ {0}) = 1/2 , ℙ( X ∈ {0,1}) = 1 , และℙ( X ∈ ∅) = 0

ในทางปฏิบัติ การแจกแจงความน่าจะเป็นมักถูกอธิบายด้วยฟังก์ชันต่างๆ เช่นฟังก์ชันการแจกแจงสะสมฟังก์ชันมวลความน่าจะเป็นหรือฟังก์ชันความหนาแน่นความน่าจะเป็นการเลือกใช้คำอธิบายใดนั้นขึ้นอยู่กับลักษณะของการแจกแจง: ฟังก์ชันมวลความน่าจะเป็นใช้สำหรับการแจกแจงแบบไม่ต่อเนื่องในขณะที่ฟังก์ชันความหนาแน่นความน่าจะเป็นใช้สำหรับการแจกแจงแบบต่อเนื่อง หลายๆ แบบ

การแจกแจงความน่าจะเป็นที่เกิดขึ้นบ่อยครั้งหรือมีความสำคัญทางทฤษฎีเป็นพิเศษ มักจะได้รับชื่อเฉพาะ ตัวอย่างต่างๆ ได้ถูกรวบรวมไว้ในรายการของการแจกแจงความน่าจะเป็น

การแนะนำ

การแจกแจงความน่าจะเป็นคือคำอธิบายทางคณิตศาสตร์ของความน่าจะเป็นของเหตุการณ์ต่างๆ กล่าวคือ เซตย่อยของปริภูมิของตัวอย่าง ปริภูมิของตัวอย่างซึ่งมักแสดงด้วยสัญลักษณ์ Ω คือเซต ของ ผลลัพธ์ที่เป็นไปได้ทั้งหมดของปรากฏการณ์ สุ่ม ที่กำลังสังเกต ปริภูมิของตัวอย่างอาจเป็นเซตของตัวเลขเวกเตอร์ป้ายกำกับ หรือสิ่งอื่นๆ ก็ได้ ตัวอย่างเช่น ปริภูมิของตัวอย่างของการโยนเหรียญอาจเป็นΩ = { "หัว", "ก้อย" }ในขณะที่สำหรับ ทอย ลูกเต๋าอาจเป็นΩ = { 1, 2 , 3, 4, 5, 6 }

เพื่อกำหนดการแจกแจงความน่าจะเป็นสำหรับกรณีเฉพาะของตัวแปรสุ่ม (เพื่อให้ปริภูมิของตัวอย่างสามารถแมปไปยังปริภูมิที่วัดได้เช่นจำนวนจริง ) เป็นเรื่องปกติที่จะแยกแยะระหว่าง ตัวแปรสุ่มแบบ ไม่ต่อเนื่องและแบบต่อเนื่องในกรณีแบบไม่ต่อเนื่อง เพียงพอที่จะระบุฟังก์ชันมวลความน่าจะเป็น ที่กำหนดความน่าจะเป็นให้กับผลลัพธ์ที่เป็นไปได้แต่ละอย่าง (เช่น เมื่อทอยลูกเต๋าที่ยุติธรรม ตัวเลขทั้งหกตัว“1”ถึง“6”ซึ่งสอดคล้องกับจำนวนจุดบนลูกเต๋า มีความน่าจะเป็นที่จะอยู่ด้านบนเมื่อลูกเต๋าตกลงมา) ความน่าจะเป็นของเหตุการณ์จะถูกกำหนดให้เป็นผลรวมของความน่าจะเป็นของผลลัพธ์ทั้งหมดที่สอดคล้องกับเหตุการณ์นั้น ตัวอย่างเช่น ความน่าจะเป็นของเหตุการณ์ “ลูกเต๋าออกเลขคู่” คือ ในทางตรงกันข้าม เมื่อตัวแปรสุ่มรับค่าจากค่าต่อเนื่อง เว้นแต่ว่าฟังก์ชันความหนาแน่นความน่าจะเป็นจะมีจุดสูงสุดที่มีความหนาแน่นอนันต์ ผลลัพธ์แต่ละอย่างจะมีความน่าจะเป็นเป็นศูนย์ สำหรับตัวแปรสุ่มแบบต่อเนื่องดังกล่าว เฉพาะเหตุการณ์ที่มีผลลัพธ์อนันต์จำนวน เช่นช่วง เท่านั้น ที่มีความน่าจะเป็นมากกว่า 0

ยกตัวอย่างเช่น ลองพิจารณาการชั่งน้ำหนักแฮมชิ้นหนึ่งในซูเปอร์มาร์เก็ต และสมมติว่าเครื่องชั่งสามารถให้ความแม่นยำได้หลายหลักอย่างไม่จำกัด ในกรณีนี้ ความน่าจะเป็นที่แฮมจะมีน้ำหนัก500  กรัมพอดีจะต้องเป็นศูนย์ เพราะไม่ว่าระดับความแม่นยำที่เลือกจะสูงแค่ไหน ก็ไม่สามารถสันนิษฐานได้ว่าไม่มีตัวเลขที่ไม่ใช่ศูนย์หลังจากตัวเลขที่เครื่องชั่งแสดงผลออกมา อย่างไรก็ตาม สำหรับกรณีการใช้งานเดียวกันนี้ เป็นไปได้ที่จะตอบสนอง ความต้องการ ด้านการควบคุมคุณภาพเช่น แฮมหนึ่งห่อที่มีน้ำหนัก "500 กรัม" จะต้องมีน้ำหนักอยู่ระหว่าง 490 กรัมถึง 510 กรัม ซึ่งเป็นไปได้เพราะการวัดนี้ไม่ต้องการความแม่นยำสูงมากจากอุปกรณ์ที่ใช้ และยังมีความคลาดเคลื่อน ในระดับหนึ่ง สำหรับความแปรปรวนในวัตถุและกระบวนการทางกายภาพ

รูปที่ 1: กราฟด้านซ้ายแสดงฟังก์ชันความหนาแน่นความน่าจะเป็น กราฟด้านขวาแสดงฟังก์ชันการกระจายสะสม ค่าที่จุดaในการกระจายสะสมเท่ากับพื้นที่ใต้เส้นโค้งความหนาแน่นความน่าจะเป็นจนถึงจุดa '

การแจกแจงความน่าจะเป็นแบบต่อเนื่องสามารถอธิบายได้โดยใช้ฟังก์ชันการแจกแจงสะสมซึ่งอธิบายความน่าจะเป็นที่ตัวแปรสุ่มจะไม่มากกว่าค่าที่กำหนด (เช่นP ( Xx )สำหรับx บางค่า ) ฟังก์ชันการแจกแจงสะสมคือพื้นที่ใต้ฟังก์ชันความหนาแน่นความน่าจะเป็นจาก-∞ถึงxดังแสดงในรูปที่ 1 [ 1 ]

การแจกแจงความน่าจะเป็นแบบต่อเนื่องส่วนใหญ่ที่พบในทางปฏิบัติไม่เพียงแต่ต่อเนื่องเท่านั้น แต่ยังต่อเนื่องอย่างสมบูรณ์ อีก ด้วย การแจกแจงดังกล่าวสามารถอธิบายได้ด้วยฟังก์ชันความหนาแน่นความน่าจะเป็น โดยทั่วไป ความหนาแน่นความน่าจะเป็นของตัวแปรสุ่มจะอธิบายค่าสัมพัทธ์ของความ น่าจะเป็นเล็กน้อย ที่รับค่าใดๆ— นั่นคือเมื่อมีค่าเล็กมาก ความน่าจะเป็นที่อยู่ในช่วงที่กำหนดสามารถคำนวณได้อย่างแม่นยำโดยการอินทิเกรตฟังก์ชันความหนาแน่นความน่าจะเป็นในช่วงนั้น[ 2 ]

นิยามความน่าจะเป็นทั่วไป

ให้เป็นปริภูมิความน่าจะเป็นเป็นปริภูมิที่วัดได้และเป็นตัวแปรสุ่มที่มีค่าอยู่ใน แล้วการแจกแจงความน่าจะเป็นของคือการวัดแบบพุชฟอร์เวิร์ดของการวัดความน่าจะ เป็น บนที่เกิดจาก โดยเฉพาะอย่างยิ่ง การวัดแบบพุชฟอร์เวิร์ดบน นี้กำหนดโดย สำหรับ

การแจกแจงความน่าจะเป็นใดๆ ก็ตามเป็นการวัดความน่าจะเป็นบน(โดยทั่วไปจะแตกต่างจากเว้นแต่ว่าจะเป็นแผนที่เอกลักษณ์) [ 3 ]

การแจกแจงความน่าจะเป็นสามารถอธิบายได้หลายรูปแบบ เช่น โดยฟังก์ชันมวลความน่าจะเป็นหรือฟังก์ชันการแจกแจงสะสม หนึ่งในคำอธิบายที่ครอบคลุมที่สุด ซึ่งใช้ได้กับตัวแปรต่อเนื่องและตัวแปรไม่ต่อเนื่องอย่างสมบูรณ์ คือ โดยใช้ฟังก์ชันความน่าจะเป็นที่มีปริภูมิอินพุต เป็นพีชคณิต σและให้ ความน่าจะเป็น เป็นจำนวนจริงเป็นเอาต์พุต โดยเฉพาะอย่างยิ่ง จำนวนใน

ฟังก์ชันความน่าจะเป็นสามารถรับเซตย่อยของปริภูมิของตัวอย่างเป็นอาร์กิวเมนต์ได้ ดังเช่นในตัวอย่างการโยนเหรียญ ซึ่งฟังก์ชันถูกกำหนดให้P (หัว) = 0.5และP (ก้อย) = 0.5อย่างไรก็ตาม เนื่องจากการใช้ตัวแปรสุ่ม อย่างแพร่หลาย ซึ่งแปลงปริภูมิของตัวอย่างให้เป็นเซตของตัวเลข (เช่น, ) จึงเป็นเรื่องปกติมากกว่าที่จะศึกษาการแจกแจงความน่าจะเป็นที่มีอาร์กิวเมนต์เป็นเซตย่อยของเซตประเภทนี้ (เซตตัวเลข) [ 4 ]และการแจกแจงความน่าจะเป็นทั้งหมดที่กล่าวถึงในบทความนี้เป็นประเภทนี้ เป็นเรื่องปกติที่จะใช้สัญลักษณ์ แทนความน่าจะเป็นที่ค่าใดค่าหนึ่งของตัวแปรเป็นของเหตุการณ์ใดเหตุการณ์หนึ่ง[ 5 ] [ 6 ]

ฟังก์ชันความน่าจะเป็นข้างต้นจะอธิบายการแจกแจงความน่าจะเป็นได้ก็ต่อเมื่อเป็นไปตามสัจพจน์ของ Kolmogorov ทั้งหมด กล่าวคือ:

  1. ดังนั้นความน่าจะเป็นจึงไม่ใช่ค่าลบ
  2. ดังนั้นความน่าจะเป็นจึงไม่เกินกว่า
  3. สำหรับเซตตระกูลหนึ่งที่นับได้และไม่ซ้อนทับกัน

แนวคิดของฟังก์ชันความน่าจะเป็นมีความเข้มงวดมากขึ้นโดยกำหนดให้เป็นองค์ประกอบของปริภูมิความน่าจะเป็น โดยที่คือเซตของผลลัพธ์ที่เป็นไปได้คือเซตของเซตย่อยทั้งหมดที่สามารถวัดความน่าจะเป็นได้ และคือฟังก์ชันความน่าจะเป็น หรือการวัดความน่าจะเป็น ที่กำหนดความน่าจะเป็นให้กับเซตย่อยที่วัดได้แต่ละเซต[ 7 ]

โดยทั่วไปแล้ว การแจกแจงความน่าจะเป็นจะอยู่ในสองประเภทหลักๆ

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องนั้นใช้ได้กับสถานการณ์ที่ชุดของผลลัพธ์ที่เป็นไปได้นั้นเป็นแบบไม่ต่อเนื่อง (เช่น การโยนเหรียญ การทอยลูกเต๋า) และความน่าจะเป็นถูกเข้ารหัสด้วยรายการความน่าจะเป็นของผลลัพธ์แบบไม่ต่อเนื่อง ในกรณีนี้ ความน่าจะเป็นจะถูกอธิบายด้วยฟังก์ชันมวลความน่าจะเป็นและการแจกแจงความน่าจะเป็นจะกำหนดโดยผลรวมของฟังก์ชันมวลความน่าจะเป็น

การแจกแจงความน่าจะเป็นแบบต่อเนื่องอย่างสมบูรณ์นั้นใช้ได้กับสถานการณ์ที่ชุดของผลลัพธ์ที่เป็นไปได้สามารถมีค่าอยู่ในช่วงต่อเนื่อง (เช่น จำนวนจริง) เช่น อุณหภูมิในวันที่กำหนด ในกรณีที่ต่อเนื่องอย่างสมบูรณ์ ความน่าจะเป็นจะถูกอธิบายโดยฟังก์ชันความหนาแน่นของความน่าจะเป็นและการแจกแจงความน่าจะเป็นนั้นโดยนิยามแล้วคือปริพันธ์ของฟังก์ชันความหนาแน่นของความน่าจะเป็น[ 5 ] [ 2 ] [ 6 ]การแจกแจงแบบปกติเป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องอย่างสมบูรณ์ที่พบได้ทั่วไป การทดลองที่ซับซ้อนกว่า เช่น การทดลองที่เกี่ยวข้องกับกระบวนการสุ่มที่กำหนดในเวลาต่อเนื่องอาจต้องการใช้การวัดความน่าจะ เป็น ทั่วไป มากขึ้น

การแจกแจงความน่าจะเป็นที่มีปริภูมิของตัวอย่างเป็นมิติเดียว (เช่น จำนวนจริง รายการของป้ายกำกับ ป้ายกำกับเรียงลำดับ หรือเลขฐานสอง) เรียกว่าการแจกแจง ความน่าจะเป็นแบบ ตัวแปรเดียว ในขณะที่การแจกแจงความน่าจะเป็นที่มีปริภูมิของตัวอย่างเป็น ปริภูมิเวกเตอร์ที่มีมิติ 2 หรือมากกว่า เรียกว่า การแจกแจงความน่า จะเป็นแบบหลายตัวแปร การแจกแจงความน่าจะเป็นแบบตัวแปรเดียวให้ความน่าจะเป็นของตัวแปรสุ่ม ตัวเดียว ที่รับค่าต่างๆ กัน การแจกแจงความน่าจะเป็นแบบหลายตัวแปร ( การแจกแจงความน่าจะเป็นร่วม ) ให้ความน่าจะเป็นของเวกเตอร์สุ่มซึ่งเป็นรายการของตัวแปรสุ่มสองตัวหรือมากกว่า ที่รับค่าต่างๆ กัน การแจกแจงความน่าจะเป็นแบบตัวแปรเดียวที่สำคัญและพบได้บ่อย ได้แก่การแจกแจงทวินามการแจกแจงไฮเปอร์จีโอเมตริกและการแจกแจงปกติ การแจกแจงความน่าจะ เป็นแบบหลายตัวแปรที่พบได้บ่อยคือ การแจกแจง ปกติแบบหลายตัวแปร

นอกจากฟังก์ชันความน่าจะเป็น ฟังก์ชันการกระจายสะสม ฟังก์ชันมวลความน่าจะเป็น และฟังก์ชันความหนาแน่นความน่าจะเป็นแล้วฟังก์ชันสร้างโมเมนต์และฟังก์ชันลักษณะเฉพาะยังใช้ในการระบุการกระจายความน่าจะเป็น เนื่องจากฟังก์ชันเหล่านี้กำหนดฟังก์ชันการกระจายสะสมพื้นฐานได้อย่างเฉพาะเจาะจง[ 8 ]

รูปที่ 2: ฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) ของการแจกแจงปกติหรือที่เรียกว่าการแจกแจงเกาส์เซียนหรือ "เส้นโค้งระฆัง" ซึ่งเป็นการแจกแจงสุ่มต่อเนื่องที่สำคัญที่สุด ดังที่แสดงในรูป ความน่าจะเป็นของช่วงค่าต่างๆ จะสอดคล้องกับพื้นที่ใต้เส้นโค้ง

ศัพท์เฉพาะ

แนวคิดและคำศัพท์สำคัญบางส่วนที่ใช้กันอย่างแพร่หลายในเอกสารเกี่ยวกับหัวข้อการแจกแจงความน่าจะเป็นมีดังต่อไปนี้[ 9 ]

คำศัพท์พื้นฐาน

  • ตัวแปรสุ่ม : รับค่าจากปริภูมิของตัวอย่าง; ความน่าจะเป็นจะอธิบายว่าค่าใดและชุดของค่าใดมีโอกาสเกิดขึ้นมากกว่ากัน
  • เหตุการณ์ : เซตของค่าที่เป็นไปได้ (ผลลัพธ์) ของตัวแปรสุ่มที่เกิดขึ้นด้วยความน่าจะเป็นที่กำหนดไว้
  • ฟังก์ชันความน่าจะเป็นหรือการวัดความน่าจะเป็น : อธิบายความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้น [ 10 ]
  • ฟังก์ชันการแจกแจงสะสม : ฟังก์ชันที่ประเมินความน่าจะของตัวแปรสุ่มจะมีค่าน้อยกว่าหรือเท่ากับค่าที่กำหนด
  • ฟังก์ชันควอนไทล์ : ส่วนกลับของฟังก์ชันการกระจายสะสม ให้ค่า ที่ทำให้ ด้วยความน่าจะเป็นจะไม่เกิน.

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์

  • การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์ : สำหรับตัวแปรสุ่มจำนวนมากที่มีค่าเป็นจำนวนนับไม่ถ้วน
  • ฟังก์ชันความหนาแน่นความน่าจะเป็น ( pdf ) หรือความหนาแน่นความน่าจะเป็น : ฟังก์ชันที่มีค่า ณ ตัวอย่างใดๆ (หรือจุดใดๆ) ในปริภูมิของตัวอย่าง (เซตของค่าที่เป็นไปได้ที่ตัวแปรสุ่มรับ) สามารถตีความได้ว่าเป็นการให้ความน่าจะเป็นสัมพัทธ์ที่ค่าของตัวแปรสุ่มจะเท่ากับตัวอย่างนั้น
  • ช่วงสนับสนุน : เซตของค่า xที่ทำให้ตัวแปรสุ่มมีโอกาสตกในทุกย่านเปิดของ x เป็นค่า บวก
  • หาง : [ 11 ]บริเวณใกล้ขอบเขตของตัวแปรสุ่ม หาก pmf หรือ pdf ค่อนข้างต่ำในบริเวณนั้น โดยปกติจะมีรูปแบบหรือการรวมกันของทั้งสอง
  • ค่าที่คาดหวังหรือค่าเฉลี่ย :ค่าเฉลี่ยถ่วงน้ำหนักของค่าที่เป็นไปได้ทั้งหมด โดยใช้ความน่าจะเป็นของแต่ละค่าเป็นน้ำหนัก หรือค่าที่เทียบเท่าในรูปแบบต่อเนื่อง
  • ค่ามัธยฐาน : ค่าที่ทำให้เซตของค่าที่น้อยกว่าค่ามัธยฐาน และเซตของค่าที่มากกว่าค่ามัธยฐาน แต่ละเซตมีโอกาสปรากฏไม่เกินหนึ่งในสอง
  • โหมด : สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ค่าที่มีความน่าจะเป็นสูงสุด สำหรับตัวแปรสุ่มแบบต่อเนื่องอย่างสมบูรณ์ ตำแหน่งที่ฟังก์ชันความหนาแน่นความน่าจะเป็นมีค่าสูงสุดเฉพาะที่
  • ควอนไทล์ : ควอนไทล์ q คือค่าที่ทำให้.
  • ความแปรปรวน : โมเมนต์อันดับสองของตัวแปรสุ่มเทียบกับค่าเฉลี่ย เป็นมาตรวัดที่สำคัญของการกระจายตัวของข้อมูล
  • ส่วนเบี่ยงเบนมาตรฐาน : รากที่สองของความแปรปรวน ดังนั้นจึงเป็นอีกมาตรวัดหนึ่งของการกระจายตัว
  • สมมาตร : คุณสมบัติอย่างหนึ่งของการแจกแจงข้อมูลบางประเภท ซึ่งส่วนของการแจกแจงข้อมูลทางด้านซ้ายของค่าเฉพาะค่าหนึ่ง (โดยปกติคือค่ามัธยฐาน) จะเป็นภาพสะท้อนของส่วนทางด้านขวาของค่าดังกล่าว
  • ความเบี่ยงเบน (Skewness) : การวัดระดับที่ฟังก์ชันความน่าจะเป็น (pmf) หรือฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) "เอนเอียง" ไปทางด้านใดด้านหนึ่งของค่าเฉลี่ยโมเมนต์มาตรฐานลำดับ ที่สาม ของการกระจายตัว
  • ค่า ความโค้ง (Kurtosis ): เป็นตัววัด "ความอ้วน" ของส่วนหางของฟังก์ชันความน่าจะเป็น (pmf) หรือฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) ค่าโมเมนต์มาตรฐานลำดับที่สี่ของการกระจายตัว

ฟังก์ชันการกระจายสะสม

ในกรณีพิเศษของตัวแปรสุ่มที่มีค่าเป็นจำนวนจริง การแจกแจงความน่าจะเป็นสามารถแสดงได้อย่างเทียบเท่าด้วยฟังก์ชันการแจกแจงสะสมแทนที่จะเป็นการวัดความน่าจะเป็น ฟังก์ชันการแจกแจงสะสมของตัวแปรสุ่มที่เกี่ยวข้องกับการแจกแจงความน่าจะเป็นนั้นกำหนดไว้ดังนี้

ฟังก์ชันการกระจายสะสมของตัวแปรสุ่มค่าจริงใดๆ มีคุณสมบัติดังต่อไปนี้:

ในทางกลับกัน ฟังก์ชันใดๆที่ตรงตามคุณสมบัติสี่ข้อแรกข้างต้น จะเป็นฟังก์ชันการกระจายสะสมของการกระจายความน่าจะเป็นบางอย่างบนจำนวนจริง[ 12 ]

การแจกแจงความน่าจะเป็นใดๆ สามารถแยกส่วนได้เป็นส่วนผสมของการ แจกแจง แบบไม่ต่อเนื่อง การแจกแจงแบบต่อเนื่อง โดยสมบูรณ์และการแจกแจงแบบต่อเนื่องเอกพจน์ [ 13 ] และด้วยเหตุนี้ ฟังก์ชันการแจกแจงสะสมใดๆ จึงยอมรับการแยกส่วนเป็นผลรวมนูนของฟังก์ชันการแจกแจงสะสมทั้งสามตามลำดับ

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

รูปที่ 3: ฟังก์ชันความน่าจะเป็นมวล (pmf) ระบุการกระจายความน่าจะเป็นสำหรับผลรวม ของจำนวนครั้งที่ทอย ลูกเต๋า 2 ลูก ตัวอย่างเช่น รูปแสดงให้เห็นว่าpmf ช่วยให้สามารถคำนวณความน่าจะเป็นของเหตุการณ์ต่างๆ เช่นและความน่าจะเป็นอื่นๆ ทั้งหมดในการกระจายได้
รูปที่ 4: ฟังก์ชันความน่าจะเป็นมวลของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ความน่าจะเป็นของเซตเดี่ยว {1}, {3} และ {7} คือ 0.2, 0.5 และ 0.3 ตามลำดับ เซตที่ไม่มีจุดใดจุดหนึ่งเหล่านี้มีความน่าจะเป็นเป็นศูนย์
รูปที่ 5: ฟังก์ชันการกระจาย สะสม (cdf)ของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ...
รูปที่ 6: ... ของการกระจายความน่าจะเป็นแบบต่อเนื่อง ...
รูปที่ 7: ... ของการกระจายที่มีทั้งส่วนต่อเนื่องและส่วนไม่ต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องคือการแจกแจงความน่าจะเป็นของตัวแปรสุ่มที่สามารถรับค่าได้เพียงจำนวนนับเท่านั้น[ 14 ] ( เกือบแน่นอน ) [ 15 ]ซึ่งหมายความว่าความน่าจะเป็นของเหตุการณ์ใดๆสามารถแสดงเป็นผลรวม (จำกัดหรืออนันต์แบบนับได้ ) ได้ดังนี้: โดยที่เป็นเซตที่นับได้ที่มีดังนั้น ตัวแปรสุ่มแบบไม่ต่อเนื่อง (เช่น ตัวแปรสุ่มที่มีการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง) ก็คือตัวแปรที่มีฟังก์ชันมวลความน่าจะเป็น ในกรณีที่ช่วงของค่าเป็นอนันต์แบบนับได้ ค่าเหล่านี้จะต้องลดลงเป็นศูนย์เร็วพอที่ความน่าจะเป็นจะรวมกันได้เท่ากับ 1 ตัวอย่างเช่น ถ้าสำหรับผลรวมของความน่าจะเป็นจะเป็น

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องที่เป็นที่รู้จักกันดีซึ่งใช้ในการสร้างแบบจำลองทางสถิติ ได้แก่ การแจกแจงปัวซงการแจกแจงเบอร์นูลลีการแจกแจงทวินามการแจกแจงเรขาคณิต การแจกแจงทวินามเชิง ลบและการแจกแจงเชิงหมวดหมู่[ 16 ]เมื่อสุ่มตัวอย่าง (ชุดของการสังเกต) จากประชากรขนาดใหญ่ จุดตัวอย่างจะมีการแจกแจงเชิงประจักษ์ที่ไม่ต่อเนื่อง ซึ่งให้ข้อมูลเกี่ยวกับการกระจายของประชากร นอกจากนี้การแจกแจงเอกรูปไม่ต่อเนื่องยังใช้กันทั่วไปในโปรแกรมคอมพิวเตอร์ที่ทำการเลือกแบบสุ่มที่มีความน่าจะเป็นเท่ากันระหว่างตัวเลือกจำนวนหนึ่ง

ฟังก์ชันการกระจายสะสม

ตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีค่าเป็นจำนวนจริง สามารถนิยามได้อย่างเทียบเท่ากับตัวแปรสุ่มที่มีฟังก์ชันการกระจายสะสมเพิ่มขึ้นเฉพาะที่จุดกระโดดที่ไม่ต่อเนื่องเท่านั้น กล่าวคือ ฟังก์ชันการกระจายสะสมจะเพิ่มขึ้นเฉพาะที่จุดที่มีการ "กระโดด" ไปสู่ค่าที่สูงกว่า และจะมีค่าคงที่ในช่วงที่ไม่มีการกระโดด จุดที่มีการกระโดดเกิดขึ้นคือค่าที่ตัวแปรสุ่มอาจมีได้ ดังนั้น ฟังก์ชันการกระจายสะสมจึงมีรูปแบบดังนี้ จุดที่ฟังก์ชันการกระจายสะสมกระโดดจะประกอบกันเป็นเซตที่นับได้ ซึ่งอาจเป็นเซตที่นับได้ใดๆ ก็ได้ และดังนั้นอาจมีความหนาแน่นในจำนวนจริงด้วย

การแสดงผลแบบเดลต้าของ Dirac

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องมักแสดงด้วยมาตรวัดของ Diracหรือที่เรียกว่าการแจกแจงแบบจุดเดียว (ดูด้านล่าง) ซึ่งเป็นการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเชิงกำหนดสำหรับผลลัพธ์ใดๆให้เป็นมาตรวัดของ Dirac ที่กระจุกตัวอยู่ที่เมื่อกำหนดการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง จะมีเซตที่นับได้ที่มีและฟังก์ชันมวลความน่าจะเป็นถ้าเป็นเหตุการณ์ใดๆ แล้ว หรือกล่าวโดยย่อคือ

ในทำนองเดียวกัน การแจกแจงแบบไม่ต่อเนื่องสามารถแสดงได้ด้วยฟังก์ชันเดลต้าของ Diracเป็นฟังก์ชันความหนาแน่นความน่าจะเป็นทั่วไป ซึ่ง หมายความว่า สำหรับเหตุการณ์ใดๆ[ 17 ]

การแสดงผลฟังก์ชันตัวบ่งชี้

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องให้เป็นค่าที่ตัวแปรสุ่มนั้นสามารถรับได้ด้วยความน่าจะเป็นที่ไม่เป็นศูนย์ กำหนดให้ เป็นเซตที่ไม่ซ้ำกันและสำหรับเซตดังกล่าว จะได้ว่าความน่าจะเป็นที่ รับค่าใดๆ ยกเว้นคือศูนย์ ดังนั้นจึงสามารถเขียนได้เป็น ยกเว้นบนเซตที่มีความน่าจะเป็นเป็นศูนย์ โดยที่คือฟังก์ชันบ่งชี้ของ นี่อาจใช้เป็นนิยามทางเลือกของตัวแปรสุ่มแบบไม่ต่อเนื่องได้

การกระจายจุดเดียว

กรณีพิเศษคือการแจกแจงแบบไม่ต่อเนื่องของตัวแปรสุ่มที่สามารถรับค่าคงที่ได้เพียงค่าเดียว กล่าวอีกนัยหนึ่งคือ การวัดแบบ Dirac กล่าวอย่างเป็นทางการ ตัวแปรสุ่มมีการแจกแจงแบบจุดเดียวหากมีผลลัพธ์ที่เป็นไปได้เช่นนั้น[ 18 ]ผลลัพธ์ที่เป็นไปได้อื่นๆ ทั้งหมดจะมีโอกาสเป็น 0 ฟังก์ชันการแจกแจงสะสมจะกระโดดจาก 0 ทันทีก่อนเป็น 1 ที่มันมีความเกี่ยวข้องอย่างใกล้ชิดกับการแจกแจงแบบกำหนด ซึ่งไม่สามารถรับค่าอื่นใดได้ ในขณะที่การแจกแจงแบบจุดเดียวสามารถรับค่าอื่นได้ แม้ว่าจะมีโอกาสเป็น 0 เท่านั้น สำหรับวัตถุประสงค์ในทางปฏิบัติส่วนใหญ่ แนวคิดทั้งสองนี้เทียบเท่ากัน

การกระจายความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์

การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์คือการแจกแจงความน่าจะเป็นบนจำนวนจริงที่มีค่าที่เป็นไปได้นับไม่ถ้วน เช่น ช่วงทั้งหมดบนเส้นจำนวนจริง และความน่าจะเป็นของเหตุการณ์ใดๆ สามารถแสดงได้ในรูปของปริพันธ์[ 19 ]กล่าวให้แม่นยำยิ่งขึ้น ตัวแปรสุ่มจริงมี การแจกแจงความน่าจะ เป็นแบบต่อเนื่องโดยสมบูรณ์หากมีฟังก์ชันที่สำหรับแต่ละช่วงความน่าจะเป็นของการเป็นสมาชิกของ ช่วง นั้นกำหนดโดยปริพันธ์ของฟังก์ชันในช่วง: [ 20 ] [ 21 ] นี่คือนิยามของฟังก์ชันความหนาแน่นความน่าจะเป็นดังนั้นการแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์จึงเป็นการแจกแจงที่มีฟังก์ชันความหนาแน่นความน่าจะเป็น โดยเฉพาะอย่างยิ่ง ความน่าจะเป็นที่ค่าใดค่าหนึ่ง(นั่นคือ) จะเป็นศูนย์ เพราะปริพันธ์ที่มีขอบเขตบนและล่างที่ตรงกันจะเท่ากับศูนย์เสมอ หากช่วงถูกแทนที่ด้วยเซตที่วัดได้ใดๆความเท่าเทียมกันที่เกี่ยวข้องก็ยังคงเป็นจริง:

ตัวแปรสุ่มต่อเนื่องโดยสมบูรณ์คือ ตัวแปรสุ่มที่มีการกระจายความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์

มีตัวอย่างมากมายของการแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์ เช่น การแจกแจงแบบปกติ การแจกแจง แบบเอกรูป การแจกแจงแบบไคกำลังสองและอื่น

ฟังก์ชันการกระจายสะสม

การแจกแจงความน่าจะเป็นแบบต่อเนื่องโดยสมบูรณ์ตามที่นิยามไว้ข้างต้น คือการแจกแจงที่มี ฟังก์ชันการแจกแจงสะสม แบบต่อเนื่องโดยสมบูรณ์ ในกรณีนี้ ฟังก์ชันการแจกแจงสะสมจะมีรูปแบบ โดยที่คือความหนาแน่นของตัวแปรสุ่มที่เกี่ยวข้องกับการแจกแจง

หมายเหตุเกี่ยวกับคำศัพท์:ควรแยกแยะการแจกแจงแบบต่อเนื่องสัมบูรณ์ออกจากการแจกแจงแบบต่อเนื่องซึ่งเป็นการแจกแจงที่มีฟังก์ชันการแจกแจงสะสมแบบต่อเนื่อง การแจกแจงแบบต่อเนื่องสัมบูรณ์ทุกแบบเป็นการแจกแจงแบบต่อเนื่อง แต่ในทางกลับกันนั้นไม่เป็นจริง มีการแจกแจงแบบเอกฐานซึ่งไม่ใช่ทั้งแบบต่อเนื่องสัมบูรณ์หรือแบบไม่ต่อเนื่อง หรือเป็นการผสมผสานของทั้งสองอย่าง และไม่มีความหนาแน่น ตัวอย่างเช่น การแจกแจงแคนเตอร์อย่างไรก็ตาม ผู้เขียนบางคนใช้คำว่า "การแจกแจงแบบต่อเนื่อง" เพื่อหมายถึงการแจกแจงทั้งหมดที่มีฟังก์ชันการแจกแจงสะสมแบบต่อเนื่องสัมบูรณ์กล่าวคือ อ้างถึงการแจกแจงแบบต่อเนื่องสัมบูรณ์ว่าเป็นการแจกแจงแบบต่อเนื่อง[ 5 ]

สำหรับคำจำกัดความทั่วไปของฟังก์ชันความหนาแน่นและมาตรวัดต่อเนื่องสัมบูรณ์ที่เทียบเท่ากัน โปรดดูที่ มาตรวัด ต่อ เนื่องสัมบูรณ์

คำจำกัดความของ Kolmogorov

ในการ กำหนด รูปแบบเชิงวัดของทฤษฎีความน่าจะ เป็น ตัวแปรสุ่มถูกกำหนดให้เป็นฟังก์ชันที่วัดได้ จากปริภูมิความน่าจะ เป็น ไปยังปริภูมิที่วัดได้เนื่องจากความน่าจะเป็นของเหตุการณ์ในรูปแบบเป็นไปตามสัจพจน์ความน่าจะเป็นของ Kolmogorovการแจกแจงความน่าจะเป็นของคือการวัดภาพของซึ่งเป็นการวัดความน่าจะ เป็น บนที่สอดคล้อง กับ [ 22 ] [ 23 ] [ 24 ]

การแจกจ่ายประเภทอื่นๆ

รูปที่ 8: หนึ่งในวิธีแก้สมการ Rabinovich–Fabrikantความน่าจะเป็นของการสังเกตสถานะ ณ ตำแหน่งใดตำแหน่งหนึ่งของส่วนรองรับ (เช่น ส่วนย่อยสีแดง) คือเท่าใด

การแจกแจงแบบต่อเนื่องและแบบไม่ต่อเนื่องอย่างสมบูรณ์ที่มีส่วนรองรับบนหรือมีประโยชน์อย่างยิ่งในการจำลองปรากฏการณ์มากมาย[ 5 ] [ 1 ]เนื่องจากส่วนใหญ่การแจกแจงในทางปฏิบัติจะมีส่วนรองรับบนเซตย่อยที่ค่อนข้างง่าย เช่นไฮเปอร์คิวบ์หรือลูกบอลอย่างไรก็ตาม นี่ไม่ใช่กรณีเสมอไป และมีปรากฏการณ์ที่มีส่วนรองรับที่เป็นเส้นโค้งที่ซับซ้อนภายในพื้นที่บางอย่างหรือคล้ายกัน ในกรณีเหล่านี้ การแจกแจงความน่าจะเป็นจะมีส่วนรองรับบนภาพของเส้นโค้งดังกล่าว และมีแนวโน้มที่จะถูกกำหนดโดยประสบการณ์มากกว่าการหาสูตรปิด[ 25 ]

ตัวอย่างหนึ่งแสดงอยู่ในรูปทางด้านขวา ซึ่งแสดงวิวัฒนาการของระบบสมการเชิงอนุพันธ์ (โดยทั่วไปเรียกว่าสมการ Rabinovich–Fabrikant ) ที่สามารถใช้จำลองพฤติกรรมของคลื่น Langmuirในพลาสมาได้[ 26 ]เมื่อศึกษาปรากฏการณ์นี้ สถานะที่สังเกตได้จากเซตย่อยจะแสดงเป็นสีแดง ดังนั้นจึงอาจถามได้ว่าความน่าจะเป็นของการสังเกตสถานะในตำแหน่งใดตำแหน่งหนึ่งของเซตย่อยสีแดงคืออะไร หากมีความน่าจะเป็นดังกล่าวอยู่ จะเรียกว่าการวัดความน่าจะเป็นของระบบ[ 27 ] [ 25 ]

การสนับสนุนที่ซับซ้อนประเภทนี้มักปรากฏในระบบพลวัตบ่อย ครั้ง การพิสูจน์ว่าระบบมีการวัดความน่าจะเป็นนั้นไม่ใช่เรื่องง่าย และปัญหาหลักคือดังต่อไปนี้ ให้เป็นช่วงเวลา และเป็นเซตย่อยของการสนับสนุน ถ้าหากการวัดความน่าจะเป็นมีอยู่สำหรับระบบ เราคาดหวังว่าความถี่ของการสังเกตสถานะภายในเซตจะเท่ากันในช่วงเวลาและซึ่งอาจไม่เกิดขึ้น ตัวอย่างเช่น อาจแกว่งไปมาคล้ายกับฟังก์ชันไซน์ซึ่งลิมิตเมื่อไม่ลู่เข้า ในทางทฤษฎี การวัดจะมีอยู่ก็ต่อเมื่อลิมิตของความถี่สัมพัทธ์ลู่เข้าเมื่อสังเกตระบบในอนาคตอันไม่มีที่สิ้นสุด[ 28 ]สาขาของระบบพลวัตที่ศึกษาการมีอยู่ของการวัดความน่าจะเป็นคือทฤษฎีเออร์โกดิก

โปรดทราบว่าแม้ในกรณีเหล่านี้ การกระจายความน่าจะเป็น หากมีอยู่จริง ก็อาจยังคงถูกเรียกว่า "ต่อเนื่องอย่างสมบูรณ์" หรือ "ไม่ต่อเนื่อง" ขึ้นอยู่กับว่าขอบเขตนั้นนับไม่ได้หรือนับได้ ตามลำดับ

การสลายตัวของเลเบสก์

ทฤษฎีบทการแยกส่วนของเลเบสก์ระบุว่าการกระจายความน่าจะเป็นใดๆ บนเส้นจำนวนจริงสามารถแยกส่วนได้อย่างไม่ซ้ำกันเป็นส่วนผสมของประเภทพื้นฐานสามประเภท โดยที่ผลรวมของสัมประสิทธิ์เท่ากับ 1 ส่วนประกอบทั้งสามคือ: [ 29 ]

การแจกแจงมาตรฐานส่วนใหญ่ในการประยุกต์ใช้ทางสถิติจะเป็นแบบไม่ต่อเนื่องล้วนๆ ( ) หรือแบบต่อเนื่องสัมบูรณ์ล้วนๆ ( ) การแจกแจงเอกลักษณ์ไม่ค่อยปรากฏในสถิติประยุกต์ แต่มีความสำคัญในทฤษฎีของกระบวนการสุ่มและแฟรกทั

การสร้างเลขสุ่ม

อัลกอริทึมส่วนใหญ่ใช้ตัวสร้างเลขสุ่มเทียมที่สร้างตัวเลขที่มีการกระจายอย่างสม่ำเสมอในช่วงครึ่งเปิด[0, 1) จากนั้น ตัวแปรสุ่มเหล่านี้จะถูกแปลงผ่านอัลกอริทึมบางอย่างเพื่อสร้างตัวแปรสุ่มใหม่ที่มีการกระจายความน่าจะเป็นที่ต้องการ ด้วยแหล่งที่มาของความสุ่มเทียมแบบสม่ำเสมอนี้ สามารถสร้างค่าของตัวแปรสุ่มใดๆ ก็ได้[ 30 ]

ตัวอย่างเช่น สมมติว่าUมีการแจกแจงแบบเอกรูประหว่าง 0 และ 1 เพื่อสร้างตัวแปรเบอร์นูลีแบบสุ่มสำหรับ0 < p < 1 บางค่า ให้กำหนด ดังนั้นเราจึงมี ดังนั้นตัวแปรสุ่มX จึงมีการแจกแจงแบบเบอร์นูลี ที่มีพารามิเตอร์p [ 30 ]

วิธีนี้สามารถปรับใช้เพื่อสร้างตัวแปรสุ่มค่าจริงที่มีการแจกแจงใดๆ ก็ได้: สำหรับ f เป็นฟังก์ชันการแจกแจงสะสมใดๆFให้F invเป็นฟังก์ชันผกผันซ้ายทั่วไปของ f ซึ่งในบริบทนี้เรียกว่าฟังก์ชันควอนไทล์หรือฟังก์ชันการแจกแจงผกผัน : จากนั้นF inv ( p ) ≤ xก็ต่อเมื่อpF ( x ) เท่านั้น ดังนั้น ถ้าUมีการแจกแจงแบบเอกรูปบน[0, 1]แล้ว ฟังก์ชันการแจกแจงสะสมของ X = F inv ( U )คือF

ตัวอย่างเช่น สมมติว่าเราต้องการสร้างตัวแปรสุ่มที่มีการแจกแจงแบบเอกซ์โพเนนเชียลที่มีพารามิเตอร์— นั่นคือ มีฟังก์ชันการแจกแจงสะสม ดังนั้นและถ้าUมีการแจกแจงแบบเอกรูปบน[0, 1)แล้ว ก็มีการแจกแจงแบบเอกซ์โพเนนเชียลที่มีพารามิเตอร์[ 30 ]

แม้ว่าในทางทฤษฎีแล้ว วิธีนี้จะใช้ได้ผลเสมอ แต่ในทางปฏิบัติ ฟังก์ชันการแจกแจงผกผันนั้นไม่เป็นที่รู้จักและ/หรือไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ ในกรณีเช่นนี้ จึงต้องใช้วิธีการอื่น (เช่นวิธีมอนเตคาร์โล )

การแจกแจงความน่าจะเป็นทั่วไปและการประยุกต์ใช้

แนวคิดเรื่องการกระจายความน่าจะเป็นและตัวแปรสุ่มที่อธิบายถึงการกระจายนั้นเป็นพื้นฐานของวิชาคณิตศาสตร์ทฤษฎีความน่าจะเป็นและวิทยาศาสตร์สถิติ เกือบทุกค่าที่สามารถวัดได้ในประชากร (เช่น ความสูงของคน ความทนทานของโลหะ การเติบโตของยอดขาย การจราจร ฯลฯ) ล้วนมีการกระจายหรือความแปรปรวน การวัดเกือบทั้งหมดมีข้อผิดพลาดโดยธรรมชาติ ในวิชาฟิสิกส์ กระบวนการหลายอย่างถูกอธิบายด้วยความน่าจะเป็น ตั้งแต่คุณสมบัติทางจลน์ของก๊าซไปจนถึง คำอธิบาย ทางกลศาสตร์ควอนตัมของอนุภาคพื้นฐาน ด้วยเหตุผลเหล่านี้และเหตุผลอื่นๆ อีกมากมาย ตัวเลขธรรมดาจึงมักไม่เพียงพอสำหรับการอธิบายปริมาณ ในขณะที่การกระจายความน่าจะเป็นมักเหมาะสมกว่า

ต่อไปนี้เป็นรายการของการแจกแจงความน่าจะเป็นที่พบบ่อยที่สุดบางส่วน โดยจัดกลุ่มตามประเภทของกระบวนการที่เกี่ยวข้อง สำหรับรายการที่สมบูรณ์ยิ่งขึ้น โปรดดูที่รายการการแจกแจงความน่าจะเป็นซึ่งจัดกลุ่มตามลักษณะของผลลัพธ์ที่พิจารณา (แบบไม่ต่อเนื่อง แบบต่อเนื่องอย่างสมบูรณ์ แบบหลายตัวแปร ฯลฯ)

การแจกแจงแบบตัวแปรเดียวทั้งหมดด้านล่างนี้มีจุดสูงสุดเพียงจุดเดียว กล่าวคือ สมมติว่าค่าต่างๆ กระจุกตัวอยู่รอบจุดเดียว ในทางปฏิบัติ ปริมาณที่สังเกตได้จริงอาจกระจุกตัวอยู่รอบค่าหลายค่า ปริมาณดังกล่าวสามารถจำลองได้โดยใช้การ แจกแจงแบบผสม

การเติบโตเชิงเส้น (เช่น ข้อผิดพลาด ค่าเบี่ยงเบน)

  • การแจกแจงแบบปกติ (การแจกแจงแบบเกาส์เซียน) สำหรับปริมาณเดียวดังกล่าว เป็นการแจกแจงแบบต่อเนื่องที่ใช้กันมากที่สุด

การเติบโตแบบทวีคูณ (เช่น ราคา รายได้ ประชากร)

ปริมาณที่กระจายอย่างสม่ำเสมอ

การทดลองแบบเบอร์นูลลี (เหตุการณ์ใช่/ไม่ใช่ ด้วยความน่าจะเป็นที่กำหนด)

ผลลัพธ์เชิงหมวดหมู่ (เหตุการณ์ที่มี ผลลัพธ์ที่เป็นไปได้ Kอย่าง)

กระบวนการปัวซง (เหตุการณ์ที่เกิดขึ้นอย่างอิสระด้วยอัตราที่กำหนด)

ค่าสัมบูรณ์ของเวกเตอร์ที่มีส่วนประกอบกระจายแบบปกติ

  • การแจกแจงแบบเรย์ลี (Rayleigh distribution ) คือการแจกแจงขนาดของเวกเตอร์ที่มีส่วนประกอบเชิงตั้งฉากแบบการแจกแจงแบบเกาส์เซียน การแจกแจงแบบเรย์ลีพบได้ในสัญญาณ RF ที่มีส่วนประกอบจริงและส่วนประกอบจินตนาการแบบเกาส์เซียน
  • การแจกแจงแบบไรซ์ (Rice distribution ) เป็นการขยายความของการแจกแจงแบบเรย์ลี (Rayleigh distribution) สำหรับกรณีที่มีส่วนประกอบของสัญญาณพื้นหลังที่คงที่ พบได้ในการลดทอนสัญญาณวิทยุแบบไรซ์เนื่องจากการแพร่กระจายแบบหลายเส้นทาง และในภาพ MRI ที่มีการรบกวนจากสัญญาณรบกวนในสัญญาณ NMR ที่ไม่เป็นศูนย์

ปริมาณที่มีการกระจายแบบปกติจะดำเนินการด้วยผลรวมของกำลังสอง

ในฐานะการแจกแจงความน่าจะเป็นก่อนหน้าแบบคู่ในอนุมานแบบเบย์เซียน

การประยุกต์ใช้การแจกแจงความน่าจะเป็นในบางสาขาเฉพาะทาง

  • แบบจำลองภาษาแคชและแบบจำลองภาษาเชิงสถิติ อื่นๆ ที่ใช้ในการประมวลผลภาษาธรรมชาติเพื่อกำหนดความน่าจะเป็นของการเกิดขึ้นของคำและลำดับคำเฉพาะนั้น จะทำโดยอาศัยการแจกแจงความน่าจะเป็น
  • ในกลศาสตร์ควอนตัม ความหนาแน่นของความน่าจะเป็นที่จะพบอนุภาค ณ จุดที่กำหนดนั้นเป็นสัดส่วนกับกำลังสองของขนาดของฟังก์ชันคลื่น ของอนุภาค ณ จุดนั้น (ดูกฎของบอร์น ) ดังนั้น ฟังก์ชันการกระจายความน่าจะเป็นของตำแหน่งของอนุภาคจึงอธิบายได้ด้วย ความน่าจะเป็นที่ตำแหน่ง xของอนุภาคจะอยู่ในช่วงaxbในมิติหนึ่ง และปริพันธ์สามชั้น ที่คล้ายกัน ในมิติสาม นี่เป็นหลักการสำคัญของกลศาสตร์ควอนตัม[ 32 ]
  • การไหลของโหลดเชิงความน่าจะเป็นในการศึกษาการไหลของพลังงานจะอธิบายความไม่แน่นอนของตัวแปรอินพุตเป็นการกระจายความน่าจะเป็น และให้การคำนวณการไหลของพลังงานในแง่ของการกระจายความน่าจะเป็นเช่นกัน[ 33 ]
  • การคาดการณ์การเกิดปรากฏการณ์ธรรมชาติโดยอาศัยการกระจายความถี่ ก่อนหน้า เช่นพายุหมุนเขตร้อนลูกเห็บ ระยะเวลาระหว่างเหตุการณ์ ฯลฯ[ 34 ]

การติดตั้ง

การปรับให้เข้ากับแบบจำลองการแจกแจงความน่าจะเป็นหรือเรียกสั้น ๆ ว่า การปรับให้เข้ากับแบบจำลองการแจกแจง คือการปรับแบบจำลองการแจกแจงความน่าจะเป็นให้เข้ากับชุดข้อมูลเกี่ยวกับการวัดซ้ำ ๆ ของปรากฏการณ์ตัวแปร จุดมุ่งหมายของการปรับให้เข้ากับแบบจำลองการแจกแจงคือการทำนายความน่าจะเป็นหรือพยากรณ์ความถี่ของการเกิดของขนาดของปรากฏการณ์ในช่วงเวลาที่กำหนด

มีฟังก์ชันความน่าจะเป็นหลายแบบ (ดูรายชื่อฟังก์ชันความน่าจะเป็น ) ซึ่งบางแบบอาจเหมาะสมกับความถี่ที่สังเกตได้ของข้อมูลมากกว่าแบบอื่น ขึ้นอยู่กับลักษณะของปรากฏการณ์และของฟังก์ชันความน่าจะเป็นนั้น ฟังก์ชันความน่าจะเป็นที่เหมาะสมที่สุดมักจะนำไปสู่การทำนายที่ดี ดังนั้น ในการปรับฟังก์ชันความน่าจะเป็นให้เข้ากับข้อมูล จึงจำเป็นต้องเลือกฟังก์ชันความน่าจะเป็นที่เหมาะสมกับข้อมูลมากที่สุด

การบรรจบกัน

แนวคิดพื้นฐานในทฤษฎีความน่าจะเป็นคือการลู่เข้าของลำดับการแจกแจงความน่าจะเป็น ลำดับการแจกแจงความน่าจะเป็นจะลู่เข้าอย่างอ่อน (หรือในเชิงการแจกแจง ) ไปยังการแจกแจงความน่าจะเป็นถ้า สำหรับทุกเซตที่มีขอบเขตซึ่งมีความน่าจะเป็น 0

ในทำนองเดียวกัน การใช้ฟังก์ชันการกระจายสะสมลำดับจะลู่เข้าสู่ถ้า สำหรับทุก ๆที่ ซึ่งมีความต่อเนื่อง[ 35 ]

แนวคิดนี้มีความสำคัญต่อทฤษฎีบทขีดจำกัดกลางซึ่งระบุว่าการแจกแจงความน่าจะเป็นของผลรวมมาตรฐานของตัวแปรสุ่มอิสระและมีการแจกแจงเหมือนกันจะลู่เข้าสู่การแจกแจงปกติมาตรฐานโดยไม่คำนึงถึงการแจกแจงพื้นฐานของตัวแปรแต่ละตัว[ 36 ]

ดูเพิ่มเติม

รายการ

  • "การแจกแจงความน่าจะเป็น" , สารานุกรมคณิตศาสตร์ , EMS Press , 2001 [1994]
  • คู่มือภาคสนามสำหรับความน่าจะเป็นแบบต่อเนื่องโดย Gavin E. Crooks
  • ความแตกต่างระหว่างการวัดความน่าจะเป็น ฟังก์ชันความน่าจะเป็น และการแจกแจงความน่าจะเป็น Math Stack Exchange
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Probability_distribution&oldid=1360730124#Discrete_probability_distribution "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การกระจายความน่าจะเป็น

ในทฤษฎีความน่าจะเป็นและสถิติการแจกแจงความน่าจะเป็นอธิบายถึงวิธีการกำหนดความน่าจะเป็นให้กับผลลัพธ์ที่เป็นไปได้ของปรากฏการณ์สุ่ม—หรือกล่าวให้แม่นยำยิ่งขึ้นคือเหตุการณ์ซึ่งเป็นเซตของผ...

การแนะนำ

การแจกแจงความน่าจะเป็นคือคำอธิบายทางคณิตศาสตร์ของ ความน่าจะเป็น ของเหตุการณ์ต่างๆ กล่าวคือ เซตย่อยของปริภูมิของ ตัวอย่าง ปริภูมิของตัวอย่าง ซึ่งมักแสดงด้วยสัญลักษณ์ Ω คือ เซต ของ ผลลัพธ์ ที่เป็นไปได้ทั้งหมดของ ปรากฏการณ์ สุ่ม ที่กำลังสังเกต...

นิยามความน่าจะเป็นทั่วไป

ให้เป็น ปริภูมิความน่าจะ เป็นเป็น ปริภูมิที่วัดได้ และเป็นตัวแปรสุ่มที่มีค่าอยู่ใน แล้วการแจกแจงความน่าจะเป็นของคือ การวัดแบบพุชฟอร์เวิร์ด ของการวัดความน่าจะ เป็น บนที่เกิดจาก โดยเฉพาะอย่างยิ่ง การวัดแบบพุชฟอร์เวิร์ดบน นี้กำหนดโดย สำหรับ ( Ω , เอฟ , พี )...

ศัพท์เฉพาะ

แนวคิดและคำศัพท์สำคัญบางส่วนที่ใช้กันอย่างแพร่หลายในเอกสารเกี่ยวกับหัวข้อการแจกแจงความน่าจะเป็นมีดังต่อไปนี้ [ 9 ]