กลับไปหน้าบทความ

อ่าน 15 นาที

ฟังก์ชันการกระจายสะสม

ในทฤษฎีความน่าจะเป็นและสถิติฟังก์ชันการกระจายสะสม ( CDF ) ของ ตัวแปรสุ่ม ค่าจริงหรือเรียกง่ายๆ ว่าฟังก์ชันการกระจายของที่ประเมินค่า ณ จุดคือความน่า จะเป็น ที่ จะมีค่าน้อย...

ฟังก์ชันการกระจายสะสม

ฟังก์ชันการกระจายสะสมสำหรับการกระจายแบบเอกซ์โปเนนเชียล
ฟังก์ชันการกระจายสะสมสำหรับการกระจายแบบปกติ

ในทฤษฎีความน่าจะเป็นและสถิติฟังก์ชันการกระจายสะสม ( CDF ) ของ ตัวแปรสุ่ม ค่าจริงหรือเรียกง่ายๆ ว่าฟังก์ชันการกระจายของที่ประเมินค่า ณ จุดคือความน่า จะเป็น ที่ จะมีค่าน้อย กว่าหรือเท่ากับ[ 1 ]

การแจกแจงความน่าจะเป็น ทุก รูปแบบ ที่รองรับด้วยจำนวนจริง ไม่ว่าจะเป็นแบบไม่ต่อเนื่องหรือแบบ "ผสม" รวมถึงแบบต่อเนื่องจะถูกระบุอย่างเฉพาะเจาะจงด้วยฟังก์ชันเพิ่มขึ้นแบบโมโนโทนต่อเนื่องทางขวา ( ฟังก์ชัน càdlàg ) ที่สอดคล้องกับ และ

ในกรณีของการแจกแจงแบบต่อเนื่อง เชิงสเกลาร์ ฟังก์ชัน การแจกแจงสะสมจะให้พื้นที่ใต้ฟังก์ชันความหนาแน่นความน่าจะเป็นตั้งแต่ลบอนันต์ถึง นอกจากนี้ฟังก์ชันการแจกแจงสะสมยังใช้เพื่อระบุการแจกแจงของตัวแปรสุ่มหลายตัวแปรอีก ด้วย

คำนิยาม

ฟังก์ชันการกระจายสะสมของตัวแปรสุ่ม ค่าจริง คือฟังก์ชันที่กำหนดโดย[ 2 ] : 77

   ( สมการที่ 1 )

โดยที่ด้านขวามือแสดงถึงความน่าจะเป็นที่ตัวแปรสุ่มจะ มีค่าต่ำกว่าหรือเท่ากับ

ความน่าจะเป็น ที่อยู่ใน ช่วงกึ่งปิดโดยที่จึงเป็นดังนี้[ 2 ] : 84

   ( สมการที่ 2 )

ในคำจำกัดความข้างต้น เครื่องหมาย "น้อยกว่าหรือเท่ากับ" "≤" เป็นเพียงข้อตกลง ไม่ได้ใช้กันอย่างแพร่หลาย (เช่น ในวรรณกรรมฮังการีใช้ "<") แต่ความแตกต่างนี้มีความสำคัญสำหรับการแจกแจงแบบไม่ต่อเนื่อง การใช้ตาราง การแจกแจง แบบทวินามและปัวซง อย่างถูกต้องนั้น ขึ้นอยู่กับข้อตกลงนี้ นอกจากนี้ สูตรสำคัญๆ เช่นสูตรผกผันของPaul Lévy สำหรับ ฟังก์ชันลักษณะเฉพาะก็อาศัยการกำหนด "น้อยกว่าหรือเท่ากับ" เช่นกัน

หากพิจารณาตัวแปรสุ่มหลายตัวจะใช้ตัวอักษรที่เกี่ยวข้องเป็นตัวห้อย ในขณะที่หากพิจารณาเพียงตัวเดียว มักจะละเว้นตัวห้อย ตามธรรมเนียมแล้วจะใช้ตัวพิมพ์ใหญ่สำหรับฟังก์ชันการแจกแจงสะสม ซึ่งแตกต่างจากตัวพิมพ์เล็กที่ใช้สำหรับฟังก์ชันความหนาแน่นความน่าจะเป็นและฟังก์ชันมวลความน่าจะเป็น หลักการ นี้ใช้ได้กับการอธิบายการแจกแจงทั่วไป: การแจกแจงเฉพาะบางอย่างมีสัญลักษณ์เฉพาะของตนเอง ตัวอย่างเช่นการแจกแจงปกติใช้และแทนและตามลำดับ

ฟังก์ชันความหนาแน่นความน่าจะเป็นของตัวแปรสุ่มต่อเนื่องสามารถกำหนดได้จากฟังก์ชันการกระจายสะสมโดยการหาอนุพันธ์[ 3 ]โดยใช้ทฤษฎีบทพื้นฐานของแคลคูลัสกล่าวคือ กำหนดให้ตราบ ใดที่อนุพันธ์มีอยู่

CDF ของตัวแปรสุ่มต่อเนื่องอย่างสมบูรณ์ สามารถแสดงเป็นอินทิกรัลของฟังก์ชันความหนาแน่นความน่าจะเป็นได้ดังนี้: [ 2 ] : 86

ในกรณีของตัวแปรสุ่มที่มีการกระจายตัวซึ่งมีส่วนประกอบแบบไม่ต่อเนื่องที่ค่าหนึ่ง

ถ้าฟังก์ชันมีความต่อเนื่องที่จุดค่านี้จะเท่ากับศูนย์ และจะไม่มีส่วนประกอบที่ไม่ต่อเนื่องที่จุดนั้น

คุณสมบัติ

จากบนลงล่าง ฟังก์ชันการกระจายสะสมของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง การแจกแจงความน่าจะเป็นแบบต่อเนื่อง และการแจกแจงที่มีทั้งส่วนต่อเนื่องและส่วนไม่ต่อเนื่อง
ตัวอย่างของฟังก์ชันการกระจายสะสมที่มีชุดจุดไม่ต่อเนื่องที่นับได้เป็นอนันต์

ฟังก์ชันการกระจายสะสมทุกฟังก์ชันจะไม่ลดลง[ 2 ] : 78 และต่อเนื่องทางขวา [ 2 ] : 79 ซึ่งทำให้เป็นฟังก์ชัน càdlàg ยิ่งไปกว่านั้น

ทุกฟังก์ชันที่มีคุณสมบัติทั้งสามประการนี้เป็นฟังก์ชันการกระจายสะสม (CDF) กล่าวคือ สำหรับทุกฟังก์ชันดังกล่าวสามารถกำหนด ตัวแปรสุ่ม ได้โดยที่ฟังก์ชันนั้นเป็นฟังก์ชันการกระจายสะสมของตัวแปรสุ่มนั้น

ถ้าเป็นตัวแปรสุ่มแบบไม่ต่อเนื่อง โดยสมบูรณ์ มันจะมีค่าเป็นด้วยความน่าจะเป็นและฟังก์ชันการกระจายสะสม (CDF) ของจะไม่ต่อเนื่องที่จุด:

ถ้าฟังก์ชันการกระจายสะสม (CDF) ของตัวแปรสุ่มค่าจริงเป็นแบบต่อเนื่องแสดงว่าเป็นตัวแปรสุ่มแบบต่อเนื่องเช่นกัน และถ้าเป็นแบบต่อเนื่องสัมบูรณ์ ด้วย แล้ว จะมีฟังก์ชันที่สามารถหาปริพันธ์แบบเลเบสได้ซึ่ง สำหรับจำนวนจริงและ ทุก ตัว ฟังก์ชันจะเท่ากับอนุพันธ์ของเกือบทุกที่และเรียกว่าฟังก์ชันความหนาแน่นความน่าจะเป็นของการกระจายของ

ถ้ามีค่าL1-norm จำกัด นั่นคือ ค่าคาดหวังของมีค่าจำกัด ค่าคาดหวังจะกำหนดโดยปริพันธ์ Riemann–Stieltjes

กราฟ CDF ที่มีสี่เหลี่ยมสีแดงสองรูป แสดงถึงอสมการสองข้อ

และสำหรับค่าใดๆก็ตาม รวมถึง ดังที่แสดงในแผนภาพ (พิจารณาพื้นที่ของสี่เหลี่ยมผืนผ้าสีแดงสองรูปและส่วนขยายไปทางขวาหรือซ้ายจนถึงกราฟของ) โดยเฉพาะอย่างยิ่ง เรามี นอกจากนี้ ค่าคาดหวัง (จำกัด) ของตัวแปรสุ่มค่าจริงสามารถกำหนดได้บนกราฟของฟังก์ชันการกระจายสะสม ดังที่แสดงโดยภาพวาดในคำจำกัดความของค่าคาดหวังสำหรับตัวแปรสุ่มค่าจริงใด

ตัวอย่าง

ยกตัวอย่างเช่น สมมติว่ามีการแจกแจงแบบเอกรูปในช่วงหน่วยแล้วฟังก์ชันการแจกแจงสะสม (CDF) ของจะกำหนดโดย

สมมติว่ารับค่าเฉพาะ 0 และ 1 เท่านั้น โดยมีความน่าจะเป็นเท่ากัน ดังนั้นฟังก์ชันการกระจายสะสม (CDF) ของจะกำหนดโดย

สมมติว่ามีการแจกแจงแบบเอกซ์โปเนนเชียลแล้วฟังก์ชันการแจกแจงสะสม (CDF) ของจะกำหนดโดย โดย ที่λ > 0 คือพารามิเตอร์ของการแจกแจง ซึ่งมักเรียกว่าพารามิเตอร์อัตรา

สมมติว่ามีการแจกแจงแบบปกติแล้วฟังก์ชันการแจกแจงสะสม (CDF) ของจะกำหนดโดย โดย ที่พารามิเตอร์คือค่าเฉลี่ยหรือค่าคาดหวังของการแจกแจง และคือค่าเบี่ยงเบนมาตรฐาน

ตารางฟังก์ชันการกระจายสะสม (CDF) ของการแจกแจงปกติมาตรฐาน ( และ) มักถูกนำไปใช้ในงานทางสถิติ โดยเรียกชื่อว่าตารางปกติมาตรฐานตารางปกติหน่วยหรือตาราง Z

สมมติว่ามีการแจกแจงแบบทวินามจากนั้น CDF ของจะกำหนดโดย โดยที่คือความน่าจะเป็นของความสำเร็จ และฟังก์ชัน แสดงถึงการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องของจำนวนความสำเร็จในลำดับของการทดลองอิสระ และคือ"ค่าต่ำสุด"ภายใต้ กล่าว คือ จำนวนเต็มที่มากที่สุดที่น้อย กว่าหรือเท่ากับ[ 4 ]

ฟังก์ชันการกระจายสะสมและค่าคาดหวังของ 𝑋
ฟังก์ชันการกระจายสะสมและค่าคาดหวังของ 𝑋

สมมติให้เป็นจำนวนจุดสำหรับการทอยลูกเต๋าในอุดมคติแล้วฟังก์ชันการกระจายสะสมของมันจะกำหนดโดยการทอยลูกเต๋าครั้งถัดไป

ตามที่กล่าวไว้ข้างต้น (ในตอนท้ายของส่วนคุณสมบัติ) สามารถใช้เพื่อกำหนดค่าที่คาดหวังซึ่งนำไปสู่ ​​(พื้นที่ของพื้นผิวที่ไฮไลต์ด้วยสีเหลือง ผลรวมนี้ยังสอดคล้องกับสูตรเฉพาะสำหรับตัวแปรสุ่มที่มีผลลัพธ์จำนวนจำกัด ) [ 5 ]

ฟังก์ชันอนุพันธ์

ฟังก์ชันการกระจายสะสมเสริม (การกระจายส่วนหาง)

บางครั้ง การศึกษาคำถามตรงกันข้ามและถามว่าตัวแปรสุ่มอยู่ เหนือ ระดับที่กำหนด บ่อยแค่ไหน ก็มีประโยชน์นี่เรียกว่า...ฟังก์ชันการกระจายสะสมเสริม (ccdf ) หรือเรียกง่ายๆ ว่าการกระจายหางหรือการเกินค่าและถูกกำหนดให้เป็น

สิ่งนี้มีประโยชน์ในการทดสอบสมมติฐานทางสถิติ ตัวอย่างเช่น เนื่องจาก ค่า p-valueแบบด้านเดียวคือความน่าจะเป็นของการสังเกตค่าสถิติการทดสอบที่ มีค่า อย่างน้อยที่สุดเท่ากับค่าที่สังเกตได้ ดังนั้น หากค่าสถิติการทดสอบ T มี การแจกแจงแบบต่อเนื่อง ค่า p-valueแบบด้านเดียวจะคำนวณได้ง่ายๆ จากฟังก์ชันการแจกแจงแบบรวม (ccdf): สำหรับค่าที่สังเกตได้ของค่าสถิติการทดสอบ

ในการวิเคราะห์การอยู่รอดจะเรียกว่าฟังก์ชันการอยู่รอดและใช้สัญลักษณ์ในขณะที่คำว่าฟังก์ชันความน่าเชื่อถือมักใช้กันในทาง วิศวกรรม

คุณสมบัติ
  • สำหรับตัวแปรสุ่มต่อเนื่องที่ไม่เป็นลบซึ่งมีค่าคาดหวังอสมการของ Markovระบุว่า[ 6 ]
  • เนื่องจากและในความเป็นจริงแล้วหากมีค่าจำกัดพิสูจน์: สมมติว่ามีฟังก์ชันความหนาแน่นสำหรับใดๆจากนั้น เมื่อพิจารณาและจัดเรียงพจน์ใหม่ จะได้ตามที่กล่าวอ้าง
  • สำหรับตัวแปรสุ่มที่มีค่าเฉลี่ยและสำหรับตัวแปรสุ่มที่ไม่เป็นลบ พจน์ที่สองจะเป็น 0 ถ้าตัวแปรสุ่มสามารถรับค่าได้เฉพาะจำนวนเต็มที่ไม่เป็นลบเท่านั้น นี่จะเทียบเท่ากับ

การแจกแจงสะสมแบบพับ

ตัวอย่างการแจกแจงสะสมแบบพับสำหรับฟังก์ชันการแจกแจงปกติ ที่มี ค่าเฉลี่ยเท่ากับ 0 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 1

ในขณะที่กราฟการกระจายสะสมมักจะมีรูปร่างคล้ายตัว S ภาพประกอบทางเลือกคือการกระจายสะสมแบบพับหรือกราฟภูเขาซึ่งพับครึ่งบนของกราฟลงมา[ 7 ] [ 8 ]นั่นคือ

โดยที่หมายถึงฟังก์ชันตัวบ่งชี้และพจน์ที่สองคือฟังก์ชันการอยู่รอดดังนั้นจึงใช้มาตราส่วนสองมาตรา มาตราหนึ่งสำหรับความชันขาขึ้น และอีกมาตราหนึ่งสำหรับความชันขาลง รูปแบบการแสดงภาพประกอบนี้เน้นที่ค่ามัธยฐานการกระจาย(โดยเฉพาะค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยจากค่ามัธยฐาน[ 9 ] ) และความเบ้ของการกระจายหรือผลลัพธ์เชิงประจักษ์

ฟังก์ชันการกระจายผกผัน (ฟังก์ชันควอนไทล์)

ถ้าฟังก์ชันการกระจายสะสม (CDF) Fเพิ่มขึ้นอย่างเคร่งครัดและต่อเนื่อง จะเป็นจำนวนจริงที่ไม่ซ้ำกันเพียงจำนวนเดียวที่ทำให้ซึ่งเป็นการกำหนดฟังก์ชันการกระจายผกผันหรือฟังก์ชันควอนไทล์

การแจกแจงบางแบบไม่มีฟังก์ชันผกผันที่ไม่ซ้ำกัน (ตัวอย่างเช่น ถ้าสำหรับทุกค่าซึ่งทำให้ค่า เป็นค่าคงที่) ในกรณีนี้ อาจใช้ฟังก์ชันการแจกแจงผกผันทั่วไปซึ่งกำหนดโดย

  • ตัวอย่างที่ 1: ค่ามัธยฐานคือ.
  • ตัวอย่างที่ 2: แทนค่า. จากนั้นเราเรียกค่านี้ว่าเปอร์เซ็นไทล์ที่ 95

คุณสมบัติที่มีประโยชน์บางประการของฟังก์ชันการกระจายสะสมผกผัน (ซึ่งยังคงมีอยู่ในการนิยามของ ฟังก์ชัน การกระจายผกผัน ทั่วไป ) ได้แก่:

  1. ไม่ลดลง[ 10 ]
  2. ก็ต่อเมื่อ
  3. ถ้ามีการแจกแจงแบบ แล้ว ก็จะมีการแจกแจงแบบ เช่นกันซึ่งใช้ในการสร้างเลขสุ่มโดยใช้ วิธี การสุ่มแบบแปลงผกผัน (inverse transform sampling )
  4. ถ้าเป็นชุดของตัวแปรสุ่มอิสระ ที่มีการแจกแจงแบบ ซึ่งกำหนดไว้ใน ปริภูมิตัวอย่างเดียวกันแล้วจะมีตัวแปรสุ่มอยู่จริงซึ่งทำให้ มีการแจกแจงแบบและด้วยความน่าจะเป็น 1 สำหรับทุก

ฟังก์ชันผกผันของฟังก์ชันการกระจายสะสม (cdf) สามารถนำมาใช้แปลงผลลัพธ์ที่ได้จากการแจกแจงแบบเอกรูปไปเป็นการแจกแจงแบบอื่นได้

ฟังก์ชันการกระจายเชิงประจักษ์

ฟังก์ชันการกระจายเชิงประจักษ์เป็นการประมาณค่าของฟังก์ชันการกระจายสะสมที่สร้างจุดในตัวอย่าง โดยจะลู่เข้าสู่การกระจายพื้นฐานด้วยความน่าจะเป็น 1 มีผลลัพธ์หลายอย่างที่ใช้ในการหาปริมาณอัตราการลู่เข้าของฟังก์ชันการกระจายเชิงประจักษ์ไปยังฟังก์ชันการกระจายสะสมพื้นฐาน[ 11 ]

กรณีหลายตัวแปร

นิยามของตัวแปรสุ่มสองตัว

เมื่อจัดการกับตัวแปรสุ่มมากกว่าหนึ่งตัวพร้อมกันฟังก์ชันการกระจายสะสมร่วมก็สามารถกำหนดได้เช่นกัน ตัวอย่างเช่น สำหรับตัวแปรสุ่มสองตัวฟังก์ชันการกระจายสะสมร่วมจะกำหนดโดย[ 2 ] : 89

   ( สมการที่ 3 )

โดยที่ด้านขวามือแสดงถึงความน่าจะเป็นที่ตัวแปรสุ่มจะมีค่าต่ำกว่าหรือเท่ากับและตัวแปร สุ่มจะมีค่าต่ำกว่าหรือเท่ากับ

ตัวอย่างของฟังก์ชันการกระจายสะสมร่วม:

สำหรับตัวแปรต่อเนื่องสองตัวคือXและY :

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องสองตัว การสร้างตารางความน่าจะเป็นและการพิจารณาความน่าจะเป็นสะสมสำหรับแต่ละช่วงที่เป็นไปได้ของXและY จะเป็นประโยชน์ และนี่คือตัวอย่าง: [ 12 ]

เมื่อกำหนดฟังก์ชันความน่าจะเป็นร่วมในรูปแบบตารางแล้ว จงหาฟังก์ชันการกระจายสะสมร่วม

วาย = 2 วาย = 4 วาย = 6 วาย = 8
X = 1 0 0.1 0 0.1
X = 3 0 0 0.2 0
X = 5 0.3 0 0 0.15
X = 7 0 0 0.15 0

วิธีแก้ปัญหา: โดยใช้ตารางความน่าจะเป็นที่กำหนดให้สำหรับแต่ละช่วงที่เป็นไปได้ของXและYฟังก์ชันการกระจายสะสมร่วมสามารถสร้างได้ในรูปแบบตาราง:

วาย < 2 Y ≤ 2 Y ≤ 4 Y ≤ 6 Y ≤ 8
X < 1 0 0 0 0 0
X ≤ 1 0 0 0.1 0.1 0.2
X ≤ 3 0 0 0.1 0.3 0.4
X ≤ 5 0 0.3 0.4 0.6 0.85
X ≤ 7 0 0.3 0.4 0.75 1

นิยามสำหรับตัวแปรสุ่มมากกว่าสองตัว

สำหรับตัวแปรสุ่ม ฟังก์ชันการกระจายสะสมร่วม (Joint CDF) จะกำหนดโดย

   ( สมการที่ 4 )

การตีความตัวแปรสุ่มเป็นเวกเตอร์สุ่มทำให้ได้สัญลักษณ์ที่สั้นกว่า:

คุณสมบัติ

ฟังก์ชันการกระจายสะสมแบบหลายตัวแปรทุกตัวมีคุณสมบัติดังนี้:

  1. มีค่าไม่ลดลงอย่างต่อเนื่องสำหรับตัวแปรแต่ละตัว
  2. ต่อเนื่องทางขวาในตัวแปรแต่ละตัว
  3. และสำหรับทุกสิ่งทุกอย่าง

ไม่ใช่ทุกฟังก์ชันที่ตรงตามคุณสมบัติทั้งสี่ข้างต้นจะเป็นฟังก์ชันการกระจายสะสมแบบหลายตัวแปรเสมอไป ต่างจากกรณีมิติเดียว ตัวอย่างเช่น ให้สำหรับหรือหรือและให้ในกรณีอื่น ๆ จะเห็นได้ง่ายว่าเงื่อนไขข้างต้นเป็นไปตามที่กำหนด แต่ฟังก์ชันนี้ก็ยังไม่ใช่ฟังก์ชันการกระจายสะสม เนื่องจากถ้าเป็นฟังก์ชันการกระจายสะสมแล้ว จะเป็นไปตามที่อธิบายไว้ด้านล่าง

ความน่าจะเป็นที่จุดหนึ่งจะอยู่ในไฮเปอร์เรคแทงเกิลนั้นคล้ายคลึงกับกรณี 1 มิติ: [ 13 ]

คดีที่ซับซ้อน

ตัวแปรสุ่มเชิงซ้อน

การขยายฟังก์ชันการกระจายสะสมจากตัวแปรสุ่มจำนวนจริงไปสู่ตัวแปรสุ่มจำนวนเชิงซ้อนนั้นไม่ใช่เรื่องง่าย เนื่องจากนิพจน์ในรูปแบบนั้นไม่มีความหมาย อย่างไรก็ตาม นิพจน์ในรูปแบบนั้นมีความหมาย ดังนั้น เราจึงกำหนดการกระจายสะสมของตัวแปรสุ่มจำนวนเชิงซ้อนผ่านการกระจายร่วมของส่วนจริงและส่วนจินตนาการของตัวแปรเหล่านั้น:

เวกเตอร์สุ่มเชิงซ้อน

การสรุปทั่วไปของสมการที่ 4ทำให้ได้ นิยามสำหรับ CDS ของเวกเตอร์สุ่มเชิงซ้อน

ใช้ในการวิเคราะห์ทางสถิติ

แนวคิดของฟังก์ชันการแจกแจงสะสมปรากฏให้เห็นอย่างชัดเจนในการวิเคราะห์ทางสถิติในสองวิธี (ที่คล้ายคลึงกัน) การวิเคราะห์ความถี่สะสมคือการวิเคราะห์ความถี่ของการเกิดค่าของปรากฏการณ์ที่น้อยกว่าค่าอ้างอิงฟังก์ชันการแจกแจงเชิงประจักษ์เป็นการประมาณค่าโดยตรงอย่างเป็นทางการของฟังก์ชันการแจกแจงสะสม ซึ่งสามารถหาคุณสมบัติทางสถิติอย่างง่ายได้ และสามารถใช้เป็นพื้นฐานของการทดสอบสมมติฐานทางสถิติ ต่างๆ การทดสอบดังกล่าวสามารถประเมินได้ว่ามีหลักฐานที่ขัดแย้งกับสมมติฐานที่ว่าตัวอย่างข้อมูลมาจากกลุ่มการแจกแจงที่กำหนด หรือมีหลักฐานที่ขัดแย้งกับสมมติฐานที่ว่าตัวอย่างข้อมูลสองตัวอย่างมาจากกลุ่มการแจกแจงประชากรเดียวกัน (ที่ไม่ทราบ)

การทดสอบของ Kolmogorov–Smirnov และ Kuiper

การทดสอบ Kolmogorov–Smirnovนั้นอิงตามฟังก์ชันการกระจายสะสม และสามารถใช้ทดสอบได้ว่าการกระจายเชิงประจักษ์สองแบบแตกต่างกันหรือไม่ หรือการกระจายเชิงประจักษ์แตกต่างจากการกระจายในอุดมคติหรือไม่การทดสอบ Kuiper ซึ่งมีความเกี่ยวข้องอย่างใกล้ชิดนั้น มีประโยชน์หากโดเมนของการกระจายมีลักษณะเป็นวัฏจักร เช่น วันในสัปดาห์ ตัวอย่างเช่น การทดสอบ Kuiper อาจใช้เพื่อตรวจสอบว่าจำนวนพายุทอร์นาโดเปลี่ยนแปลงไปในระหว่างปีหรือไม่ หรือยอดขายของผลิตภัณฑ์เปลี่ยนแปลงไปตามวันในสัปดาห์หรือวันในเดือนหรือไม่

ดูเพิ่มเติม

เอกสารอ้างอิงและหมายเหตุ

  1. ^ Deisenroth, Marc Peter; Faisal, A. Aldo; Ong, Cheng Soon (2020). คณิตศาสตร์สำหรับการเรียนรู้ของเครื่องจักร . สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์. หน้า 181. ISBN 9781108455145.
  2. ^ a b c d e f Park, Kun Il (2018). พื้นฐานของความน่าจะเป็นและกระบวนการสุ่มพร้อมการประยุกต์ใช้กับการสื่อสาร Springer. ISBN 978-3-319-68074-3.
  3. ^มอนต์โกเมอรี, ดักลาส ซี.; รันเกอร์, จอร์จ ซี. (2003). สถิติประยุกต์และความน่าจะเป็นสำหรับวิศวกร (PDF) . จอห์น ไวลีย์ แอนด์ ซันส์ อิงค์. หน้า 104. ISBN 0-471-20454-4จัดเก็บในรูปแบบไฟล์ PDFจากต้นฉบับเมื่อวันที่ 30 กรกฎาคม 2555
  4. ^ในการหาผลรวม ขอบเขตบนสามารถแทนที่ด้วย โดยมีเงื่อนไขว่าหรือ(มิฉะนั้นจะเกิดกำลังของ ที่มีเลขชี้กำลังติดลบ)
  5. อูห์ล, โรแลนด์ (2023) Charakterisierung des Erwartungswertes am Graphen der Verteilungsfunktion [ การแสดงคุณลักษณะของค่าที่คาดหวังบนกราฟของฟังก์ชันการแจกแจงสะสม ] (PDF ) เทคนิคเชอ โฮชชูล บรันเดินบวร์ก พี 8. ดอย : 10.25933/opus4-2986 . เก็บถาวรจากต้นฉบับเมื่อ 2023-12-24
  6. ^ Zwillinger, Daniel; Kokoska, Stephen (2010). ตารางและสูตรความน่าจะเป็นและสถิติมาตรฐานของ CRC . สำนักพิมพ์ CRC. หน้า 49. ISBN 978-1-58488-059-2.
  7. ^ Gentle, JE (2009). สถิติเชิงคำนวณ . Springer . ISBN 978-0-387-98145-1สืบค้นเมื่อ2010-08-06
  8. ^ Monti, KL (1995). "เส้นโค้งฟังก์ชันการกระจายเชิงประจักษ์แบบพับ (แผนภูมิภูเขา)" The American Statistician . 49 (4): 342– 345. doi : 10.2307/2684570 . JSTOR 2684570 . 
  9. ^ Xue, JH; Titterington, DM (2011). "ฟังก์ชันการกระจายสะสมแบบ p-folded และค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยจากควอนไทล์ p" (PDF) . จดหมายสถิติและความน่าจะเป็น . 81 (8): 1179– 1182. doi : 10.1016/j.spl.2011.03.014 .
  10. ^ Chan, Stanley H. (2021). บทนำสู่ความน่าจะเป็นสำหรับวิทยาศาสตร์ข้อมูล . สำนักพิมพ์มิชิแกน. หน้า 18. ISBN 978-1-60785-746-4.
  11. ^ Hesse, C. (1990). "อัตราการลู่เข้าของฟังก์ชันการกระจายเชิงประจักษ์และฟังก์ชันลักษณะเฉพาะเชิงประจักษ์ของกระบวนการเชิงเส้นประเภทกว้าง" วารสารการวิเคราะห์หลายตัวแปร 35 ( 2): 186– 202. doi : 10.1016/0047-259X(90)90024-C .
  12. ^ "ฟังก์ชันการ กระจายสะสมร่วม (CDF)" math.info สืบค้นเมื่อ2019-12-11
  13. ^ "สำเนาที่เก็บถาวร" (PDF) . www.math.wustl.edu . เก็บถาวรจากต้นฉบับ(PDF)เมื่อวันที่ 22 กุมภาพันธ์ 2016 . เรียกดูเมื่อวันที่ 13 มกราคม 2022 .{{cite web}}: CS1 maint: archived copy as title (link)
  • โลโก้ Wikimedia Commonsสื่อที่เกี่ยวข้องกับฟังก์ชันการกระจายแบบสะสมในวิกิมีเดียคอมมอนส์
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Cumulative_distribution_function&oldid=1359282307 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ฟังก์ชันการกระจายสะสม

ในทฤษฎีความน่าจะเป็นและสถิติฟังก์ชันการกระจายสะสม ( CDF ) ของ ตัวแปรสุ่ม ค่าจริงหรือเรียกง่ายๆ ว่าฟังก์ชันการกระจายของที่ประเมินค่า ณ จุดคือความน่า จะเป็น ที่ จะมีค่าน้อย...

คำนิยาม

ฟังก์ชันการกระจายสะสมของ ตัวแปรสุ่ม ค่าจริง คือฟังก์ชันที่กำหนดโดย [ 2 ] : 77 X {\displaystyle X}

คุณสมบัติ

ฟังก์ชันการกระจายสะสมทุกฟังก์ชันจะ ไม่ลดลง [ 2 ] : 78 และ ต่อเนื่องทางขวา [ 2 ] : 79 ซึ่งทำให้เป็นฟังก์ชัน càdlàg ยิ่งไปกว่านั้น F X {\displaystyle F_{X}} lim x → − ∞ F X ( x ) = 0 , lim x → + ∞ F X ( x ) = 1.

ตัวอย่าง

ยกตัวอย่างเช่น สมมติว่ามี การแจกแจงแบบเอกรูป ในช่วงหน่วยแล้วฟังก์ชันการแจกแจงสะสม (CDF) ของจะกำหนดโดย X {\displaystyle X} [ 0 , 1 ] {\displaystyle [0,1]} X {\displaystyle X} 1\end{cases}}}"> F X ( x ) = { 0 : x 1 {\displaystyle F_{X}(x)={\begin{cases}0&:\ x...