อ่าน 17 นาที
สถิติลำดับ
ใน ทางสถิติ สถิติลำดับ ที่k ของ ตัวอย่าง ทางสถิติ จะเท่ากับค่าที่เล็กที่สุดลำดับที่ k ของมัน [ 1 ] เมื่อกำหนดตัวอย่างที่มีขนาดสถิติลำดับที่ k จะถูกแทนด้วย โดย ที่ สถิติลำดับ...
สถิติลำดับ

ในทางสถิติสถิติลำดับที่k ของตัวอย่างทางสถิติจะเท่ากับค่าที่เล็กที่สุดลำดับที่k ของมัน [ 1 ] เมื่อกำหนดตัวอย่างที่มีขนาดสถิติลำดับที่ k จะถูกแทนด้วยโดยที่สถิติลำดับร่วมกับ สถิติ อันดับ ถือเป็นเครื่องมือพื้นฐานที่สุดอย่างหนึ่งใน สถิติ และการอนุมานแบบไม่ใช้พารามิเตอร์
กรณีพิเศษที่สำคัญของสถิติเรียงลำดับ ได้แก่ ค่าต่ำสุดและ ค่า สูงสุดของตัวอย่าง และ (โดยมีข้อจำกัดบางประการที่กล่าวถึงด้านล่าง) ค่ามัธยฐาน ของตัวอย่างและควอนไทล์อื่นๆของ ตัวอย่าง
เมื่อใช้ทฤษฎีความน่าจะเป็นในการวิเคราะห์สถิติเรียงลำดับของตัวอย่างสุ่มจากตัวแปรต่อเนื่องฟังก์ชันการกระจายสะสมจะถูกนำมาใช้เพื่อลดการวิเคราะห์ให้เหลือเพียงกรณีของสถิติเรียงลำดับของตัวแปรสุ่มแบบเอกรูป
สัญลักษณ์และตัวอย่าง
ตัวอย่างเช่น สมมติว่ามีการสังเกตหรือบันทึกตัวเลขสี่ตัว ทำให้ได้ตัวอย่างขนาด 4 ถ้าค่าของตัวอย่างคือ
- 6, 9, 3, 7
สถิติการสั่งซื้อจะเป็นดังนี้
สถิติอันดับแรก (หรือสถิติอันดับที่เล็กที่สุด ) จะมีค่าต่ำสุดของตัวอย่างเสมอ นั่นคือ
โดยตามธรรมเนียมปฏิบัติทั่วไป เราจะใช้ตัวอักษรพิมพ์ใหญ่เพื่ออ้างถึงตัวแปรสุ่ม และตัวอักษรพิมพ์เล็ก (ดังตัวอย่างข้างต้น) เพื่ออ้างถึงค่าที่สังเกตได้จริง
ในทำนองเดียวกัน สำหรับตัวอย่างขนาดn ค่าสถิติอันดับ ที่n (หรือค่าสถิติอันดับที่ใหญ่ที่สุด ) คือค่าสูงสุดนั่นคือ
ช่วงค่าตัวอย่างคือผลต่างระหว่างค่าสูงสุดและค่าต่ำสุด ซึ่งเป็นฟังก์ชันของสถิติเรียงลำดับ:
สถิติสำคัญอีกอย่างหนึ่งในการวิเคราะห์ข้อมูลเชิงสำรวจซึ่งมีความเกี่ยวข้องกับสถิติเรียงลำดับโดยตรง คือช่วงควาร์ไทล์ของ ตัวอย่าง
ค่ามัธยฐานของตัวอย่างอาจเป็นหรือไม่เป็นสถิติเรียงลำดับก็ได้ เนื่องจากจะมีค่ากลางเพียงค่าเดียวก็ต่อเมื่อจำนวน การสังเกต nเป็นเลขคี่เท่านั้น กล่าวคือ ถ้าn = 2m + 1สำหรับจำนวนเต็มm บางตัว ค่ามัธยฐานของตัวอย่างจะเป็นและดังนั้นจึงเป็นสถิติเรียงลำดับ ในทางกลับกัน เมื่อnเป็นเลขคู่n = 2m และมีค่ากลางสองค่า คือและและค่ามัธยฐานของตัวอย่างจะเป็นฟังก์ชันของค่าทั้งสอง (โดยปกติคือค่าเฉลี่ย) ดังนั้นจึงไม่ใช่สถิติเรียงลำดับ ข้อสังเกตที่คล้ายกันนี้ใช้ได้กับควอนไทล์ของตัวอย่างทั้งหมดด้วย
การวิเคราะห์เชิงความน่าจะเป็น
เมื่อกำหนดตัวแปรสุ่มใดๆตัวแปรสุ่มเหล่านั้นจะถูกกำหนดโดยการเรียงลำดับจากน้อยไปมาก
กรณีที่ตัวแปรสุ่มเป็นอิสระต่อกันและมีการแจกแจงเหมือนกันจะกล่าวถึงต่อไปนี้ โดยทั่วไปแล้ว ตัวแปรสุ่มสามารถเกิดขึ้นได้จากการสุ่มตัวอย่างจากประชากรมากกว่าหนึ่งกลุ่ม จากนั้นเราจะพิจารณากรณีที่ตัวแปรสุ่มเป็นอิสระต่อกันแต่ไม่จำเป็นต้องมีการแจกแจงเหมือนกัน และการแจกแจงความน่าจะเป็นร่วม ของตัวแปรสุ่มนั้น กำหนดโดย ทฤษฎีบท ของ Bapat–Beg
ต่อจากนี้ไป เราจะถือว่าตัวแปรสุ่มที่พิจารณานั้นเป็นตัวแปรต่อเนื่องและในกรณีที่สะดวก เราจะถือว่าตัวแปรเหล่านั้นมีฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ด้วย กล่าวคือ เป็นตัวแปรต่อเนื่องโดยสมบูรณ์ส่วนลักษณะเฉพาะของการวิเคราะห์การแจกแจงที่กำหนดมวลให้กับจุดต่างๆ (โดยเฉพาะอย่างยิ่งการแจกแจงแบบไม่ต่อเนื่อง ) จะกล่าวถึงในตอนท้าย
ฟังก์ชันการกระจายสะสมของสถิติลำดับ
สำหรับตัวอย่างสุ่มดังข้างต้นที่มีการแจกแจงสะสมสถิติลำดับสำหรับตัวอย่างนั้นมีการแจกแจงสะสมดังต่อไปนี้[ 2 ] (โดยที่rระบุสถิติลำดับใด): การพิสูจน์สูตรนี้เป็นเรื่องของการจัดกลุ่ม ล้วนๆ : สำหรับสถิติลำดับที่ th ที่จะเป็นจำนวนตัวอย่างที่เป็นจะต้องอยู่ระหว่างและในกรณีที่เป็นสถิติลำดับที่ใหญ่ที่สุดจะต้องมีตัวอย่าง(แต่ละตัวมีโอกาสเกิดขึ้นอย่างอิสระ) และตัวอย่าง(แต่ละตัวมีโอกาสเกิดขึ้นอย่างอิสระ) สุดท้าย มีหลายวิธีในการเลือกตัวอย่างใดที่เป็นชนิด
ฟังก์ชันความหนาแน่นความน่าจะเป็นที่สอดคล้องกันสามารถหาได้จากผลลัพธ์นี้ และพบว่าเป็นดังนี้
นอกจากนี้ ยังมีกรณีพิเศษอีกสองกรณี ซึ่งมีฟังก์ชันการกระจายสะสม (CDF) ที่คำนวณได้ง่าย
ซึ่งสามารถหาได้จากการพิจารณาความน่าจะเป็นอย่างรอบคอบ
การแจกแจงความน่าจะเป็นของสถิติลำดับ
สถิติลำดับที่สุ่มมาจากการแจกแจงแบบเอกรูป
ในส่วนนี้ เราจะแสดงให้เห็นว่าค่าสถิติเรียงลำดับของการแจกแจงเอกรูปบนช่วงหนึ่งหน่วยมีการแจกแจงแบบมาร์จินัลที่อยู่ใน ตระกูล การแจกแจงเบตานอกจากนี้ เรายังนำเสนอวิธีการง่ายๆ ในการหาการแจกแจงร่วมของค่าสถิติเรียงลำดับจำนวนใดๆ และสุดท้าย แปลผลลัพธ์เหล่านี้ไปสู่การแจกแจงต่อเนื่องใดๆ โดยใช้ฟังก์ชันการกระจายสะสม(cdf )
ตลอดทั้งส่วนนี้ เราจะถือว่าเป็นตัวอย่างสุ่ม ที่ได้ มาจากการแจกแจงแบบต่อเนื่องที่มีฟังก์ชันการกระจายสะสม (cdf ) โดยกำหนดให้เราจะได้ตัวอย่างสุ่มที่สอดคล้องกันจากการแจกแจงเอกรูป มาตรฐาน โปรดทราบว่าสถิติเรียงลำดับยังเป็นไปตามเงื่อนไขด้วย
ฟังก์ชันความหนาแน่นความน่าจะเป็นของสถิติลำดับเท่ากับ[ 3 ]
นั่นคือ สถิติลำดับที่ kของการแจกแจงแบบเอกรูปเป็นตัวแปรสุ่มที่มีการแจกแจงแบบเบต้า[ 3 ] [ 4 ]
การพิสูจน์ข้อความเหล่านี้มีดังนี้ เพื่อให้ค่าอยู่ระหว่างuและu + duจำเป็นต้องมี องค์ประกอบในตัวอย่าง อย่างน้อย k − 1 ตัวที่เล็กกว่า uและอย่างน้อยหนึ่งตัวอยู่ระหว่างuและu + du ความน่าจะเป็นที่มากกว่าหนึ่งตัวอยู่ในช่วงหลังนี้คือดังนั้นเราต้องคำนวณความน่าจะเป็นที่ค่าสังเกตอย่างน้อยk − 1, 1 และn − kค่าจะตกอยู่ในช่วง, และตามลำดับ ซึ่งเท่ากับ (ดู รายละเอียดเพิ่มเติมในเรื่อง การแจกแจงแบบพหุนาม )
และผลลัพธ์ก็เป็นเช่นนี้
ค่าเฉลี่ยของการแจกแจงนี้คือk / ( n + 1)
การแจกแจงร่วมของสถิติลำดับของการแจกแจงแบบเอกรูป
ในทำนองเดียวกัน สำหรับi < jฟังก์ชันความหนาแน่นความน่าจะเป็นร่วมของสถิติลำดับสองค่าU ( i ) < U ( j )สามารถแสดงได้ดังนี้
ซึ่งก็คือ (โดยพิจารณาถึงเงื่อนไขที่มีลำดับสูงกว่า) ความน่าจะเป็นที่ องค์ประกอบตัวอย่าง i − 1, 1, j − 1 − i , 1 และn − jจะตกอยู่ในช่วง, , , , ตามลำดับ
เราใช้เหตุผลในลักษณะที่คล้ายคลึงกันอย่างสิ้นเชิงเพื่อหาการแจกแจงร่วมลำดับสูงกว่า อาจเป็นเรื่องน่าประหลาดใจที่ความหนาแน่นร่วมของสถิติลำดับที่nกลับมีค่าคงที่ :
วิธีหนึ่งที่จะเข้าใจเรื่องนี้คือ ตัวอย่างที่ไม่ได้เรียงลำดับนั้นมีความหนาแน่นคงที่เท่ากับ 1 และมี ลำดับการเรียงสับเปลี่ยนที่แตกต่างกัน n ! แบบของตัวอย่างที่สอดคล้องกับลำดับสถิติการเรียงลำดับเดียวกัน สิ่งนี้เกี่ยวข้องกับข้อเท็จจริงที่ว่า 1/ n ! คือปริมาตรของบริเวณนอกจากนี้ยังเกี่ยวข้องกับลักษณะเฉพาะอีกประการหนึ่งของสถิติการเรียงลำดับของตัวแปรสุ่มเอกรูป: จากความไม่เท่าเทียมกันของ BRSจะได้ว่าจำนวนสูงสุดที่คาดหวังของตัวแปรสุ่มเอกรูป U(0,1] ที่สามารถเลือกได้จากตัวอย่างขนาด n ที่มีผลรวมไม่เกิน นั้นมีขอบเขตบนโดยซึ่งจึงไม่เปลี่ยนแปลงบนเซตของทั้งหมดที่มีผลคูณคงที่
โดยใช้สูตรข้างต้น เราสามารถหาการแจกแจงของช่วงของสถิติเรียงลำดับได้ นั่นคือ การแจกแจงของค่าสูงสุดลบด้วยค่าต่ำสุด โดยทั่วไปแล้ว สำหรับก็มีการแจกแจงแบบเบต้าเช่นกัน: จากสูตรเหล่านี้ เราสามารถหาค่าความแปรปรวนร่วมระหว่างสถิติเรียงลำดับสองตัวได้: สูตรนี้ได้มาจากการสังเกตว่าและเปรียบเทียบว่า กับโดยที่คือการแจกแจงที่แท้จริงของผลต่าง
สถิติลำดับที่สุ่มมาจากการแจกแจงแบบเอกซ์โปเนนเชียล
สำหรับตัวอย่างสุ่มขนาดnจากการแจกแจงเอกซ์โพเนนเชียลที่มีพารามิเตอร์λสถิติเรียงลำดับX ( i )สำหรับi = 1, 2, 3, ..., nแต่ละตัวมีการแจกแจงดังนี้
โดยที่Z jเป็นตัวแปรสุ่มเอกซ์โพเนนเชียลมาตรฐานแบบ iid (กล่าวคือมีพารามิเตอร์อัตรา 1) ผลลัพธ์นี้ได้รับการตีพิมพ์ครั้งแรกโดยAlfréd Rényi [ 5 ] [ 6 ]
สถิติลำดับที่สุ่มมาจากการแจกแจงแบบเออร์ลัง
การแปลงลาปลาสของสถิติลำดับอาจสุ่มตัวอย่างจากการกระจาย Erlangผ่านวิธีการนับเส้นทาง[ 7 ]
การแจกแจงร่วมของสถิติลำดับของการแจกแจงแบบต่อเนื่องโดยสมบูรณ์
ถ้าF Xเป็นฟังก์ชันต่อเนื่องสัมบูรณ์จะมีความหนาแน่นที่และเราสามารถใช้การแทนที่ได้
และ
เพื่อหาฟังก์ชันความหนาแน่นความน่าจะเป็นต่อไปนี้สำหรับสถิติเรียงลำดับของตัวอย่างขนาดnที่สุ่มมาจากการแจกแจงของX :
ที่ไหน
ที่ไหน
การประยุกต์ใช้: ช่วงความเชื่อมั่นสำหรับควอนไทล์
คำถามที่น่าสนใจคือ สถิติเรียงลำดับนั้นมีประสิทธิภาพเพียงใดในการประมาณค่าควอนไทล์ของการกระจายตัวพื้นฐาน
ตัวอย่างที่มีขนาดตัวอย่างเล็ก
กรณีที่ง่ายที่สุดที่จะพิจารณาคือ มัธยฐานของกลุ่มตัวอย่างสามารถประมาณค่ามัธยฐานของประชากรได้ดีเพียงใด
ยกตัวอย่างเช่น พิจารณาตัวอย่างสุ่มขนาด 6 ในกรณีนี้ ค่ามัธยฐานของตัวอย่างมักถูกกำหนดให้เป็นจุดกึ่งกลางของช่วงที่กำหนดโดยสถิติอันดับที่ 3 และ 4 อย่างไรก็ตาม เรารู้จากการอธิบายก่อนหน้านี้ว่า ความน่าจะเป็นที่ช่วงดังกล่าวจะครอบคลุมค่ามัธยฐานของประชากรนั้นคือ
แม้ว่าค่ามัธยฐานของตัวอย่างอาจเป็นค่าประมาณจุด ที่ไม่ขึ้นกับการกระจายตัวที่ดีที่สุด ค่าหนึ่งของค่ามัธยฐานของประชากร แต่ตัวอย่างนี้แสดงให้เห็นว่ามันไม่ใช่ค่าประมาณที่ดีนักในเชิงสัมบูรณ์ ในกรณีนี้ ช่วงความเชื่อมั่นที่ดีกว่าสำหรับค่ามัธยฐานคือช่วงที่กำหนดโดยสถิติอันดับที่ 2 และ 5 ซึ่งมีค่ามัธยฐานของประชากรอยู่ภายในด้วยความน่าจะเป็น
ด้วยขนาดตัวอย่างที่เล็กเช่นนี้ หากต้องการความมั่นใจอย่างน้อย 95% จะต้องกล่าวว่าค่ามัธยฐานอยู่ระหว่างค่าต่ำสุดและค่าสูงสุดของข้อมูลทั้ง 6 ค่า ด้วยความน่าจะเป็น 31/32 หรือประมาณ 97% ที่จริงแล้ว ขนาดตัวอย่าง 6 คือขนาดตัวอย่างที่เล็กที่สุดที่ทำให้ช่วงความเชื่อมั่นที่กำหนดโดยค่าต่ำสุดและค่าสูงสุดมีความมั่นใจอย่างน้อย 95% สำหรับค่ามัธยฐานของประชากร
ขนาดตัวอย่างขนาดใหญ่
สำหรับการแจกแจงแบบเอกรูป เมื่อnมีค่าเข้าสู่∞ ค่าควอนไทล์ตัวอย่างที่ p จะมีการแจกแจงแบบปกติเชิงอะซิมโทติกเนื่องจากสามารถประมาณได้ด้วย
สำหรับการกระจายทั่วไปFที่มีความหนาแน่นต่อเนื่องที่ไม่เป็นศูนย์ที่F −1 ( p ) ความเป็นปกติเชิงอะซิมโทติกที่คล้ายกันก็ใช้ได้เช่นกัน:
โดยที่fคือฟังก์ชันความหนาแน่นและF −1คือฟังก์ชันควอนไทล์ที่เกี่ยวข้องกับFหนึ่งในบุคคลแรกที่กล่าวถึงและพิสูจน์ผลลัพธ์นี้คือFrederick Mostellerในบทความสำคัญของเขาในปี 1946 [ 8 ]การวิจัยเพิ่มเติมนำไปสู่ การแสดงแทนของ Bahadur ในช่วงทศวรรษ 1960 ซึ่งให้ข้อมูลเกี่ยวกับขอบเขตข้อผิดพลาด การลู่เข้าสู่การกระจายแบบปกติยังคงใช้ได้ในความหมายที่แข็งแกร่งกว่า เช่น การลู่เข้าในเอนโทรปีสัมพัทธ์หรือความแตกต่าง KL [ 9 ]
ข้อสังเกตที่น่าสนใจอย่างหนึ่งคือ ในกรณีที่การกระจายตัวสมมาตร และค่ามัธยฐานของประชากรเท่ากับค่าเฉลี่ยของประชากร ในกรณีนี้ค่าเฉลี่ยของตัวอย่างตามทฤษฎีบทลิมิตกลางจะมีการกระจายแบบปกติเชิงอะซิปโทติกเช่นกัน แต่มีค่าความแปรปรวน เท่ากับ σ² /nแทน การวิเคราะห์เชิงอะซิปโทติกนี้ชี้ให้เห็นว่า ค่าเฉลี่ยให้ผลลัพธ์ที่ดีกว่าค่ามัธยฐานในกรณีที่ค่าความโค้ง ต่ำ และในทางกลับกัน ตัวอย่างเช่น ค่ามัธยฐานให้ช่วงความเชื่อมั่นที่ดีกว่าสำหรับการกระจายแบบลาปลาซในขณะที่ค่าเฉลี่ยให้ผลลัพธ์ที่ดีกว่าสำหรับXที่มีการกระจายแบบปกติ
การพิสูจน์
สามารถแสดงให้เห็นได้ว่า
ที่ไหน
โดยที่Z iเป็น ตัวแปรสุ่มเอกซ์ โพเนนเชียลอิสระ ที่มีการแจกแจงเหมือนกันทุกประการ ด้วยอัตรา 1 เนื่องจากX / nและY / nมีการแจกแจงแบบปกติเชิงอะซิมโทติกตามทฤษฎีบทขีดจำกัดส่วนกลาง ผลลัพธ์ของเราจึงได้มาจากการใช้วิธีเดลต้า
ข้อมูลร่วมกันของสถิติการสั่งซื้อ
ข้อมูลร่วมกันและความแตกต่าง fระหว่างสถิติลำดับก็ได้รับการพิจารณาเช่นกัน[ 10 ]ตัวอย่างเช่น หากการแจกแจงหลักเป็นแบบต่อเนื่อง สำหรับทุก ๆ กล่าวอีกนัยหนึ่ง ข้อมูลร่วมกันเป็นอิสระจากการแจกแจงหลัก สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ความเท่าเทียมกันไม่จำเป็นต้องเป็นจริง และเรามีเพียงแค่
ข้อมูลร่วมกันระหว่างสถิติเรียงลำดับสม่ำเสมอจะกำหนดโดย โดย ที่ คือเลขฮาร์มอนิก ที่
การประยุกต์ใช้: การประมาณความหนาแน่นแบบไม่ใช้พารามิเตอร์
โมเมนต์ของการกระจายสำหรับสถิติอันดับแรกสามารถใช้ในการพัฒนาตัวประมาณความหนาแน่นแบบไม่ใช้พารามิเตอร์ได้[ 11 ]สมมติว่าเราต้องการประมาณความหนาแน่นที่จุดพิจารณาตัวแปรสุ่มซึ่งเป็น iid ที่มีฟังก์ชันการกระจายโดยเฉพาะอย่างยิ่ง
ค่าที่คาดหวังของสถิติอันดับแรกเมื่อกำหนดตัวอย่างที่มีจำนวนการสังเกตทั้งหมด จะได้ดังนี้
โดยที่คือฟังก์ชันควอนไทล์ที่เกี่ยวข้องกับการแจกแจงและสมการนี้เมื่อรวมกับ เทคนิค แจ็กไนฟ์จะกลายเป็นพื้นฐานสำหรับอัลกอริธึมการประมาณความหนาแน่นต่อไปนี้
อินพุต: ตัวอย่างข้อมูลการสังเกตจุดประเมินความหนาแน่น พารามิเตอร์ปรับแต่ง(โดยปกติคือ 1/3) ผลลัพธ์: ความหนาแน่นโดยประมาณ ณ จุดประเมิน
1: ชุดที่ 2: ชุดที่ 3: สร้างเมทริก ซ์ ที่เก็บเซตย่อยที่มีข้อมูลสังเกตการณ์ในแต่ละเซต 4. สร้างเวกเตอร์เพื่อเก็บค่าการประเมินความหนาแน่น 5: สำหรับdo 6: สำหรับdo 7: ค้นหาระยะทางที่ใกล้ที่สุดไปยังจุดปัจจุบันภายในเซตย่อยที่ th 8: สิ้นสุดสำหรับ 9: คำนวณค่าเฉลี่ยของระยะทางย่อยไปยัง 10: คำนวณค่าประมาณความหนาแน่นที่ 11: สิ้นสุดสำหรับ 12: ส่งคืน
ตรงกันข้ามกับพารามิเตอร์การปรับแต่งตามแบนด์วิดท์/ความยาวสำหรับวิธี การแบบ ฮิสโตแกรมและเคอร์เนล พารามิเตอร์การปรับแต่งสำหรับตัวประมาณความหนาแน่นตามสถิติลำดับคือขนาดของชุดย่อยตัวอย่าง ตัวประมาณดังกล่าวมีความแข็งแกร่งกว่าวิธีการแบบฮิสโตแกรมและเคอร์เนล ตัวอย่างเช่น ความหนาแน่นเช่นการแจกแจงโคชี (ซึ่งไม่มีโมเมนต์จำกัด) สามารถอนุมานได้โดยไม่ต้องมีการปรับเปลี่ยนเฉพาะ เช่นแบนด์วิดท์ตาม IQRทั้งนี้เนื่องจากโมเมนต์แรกของสถิติลำดับจะมีอยู่เสมอหากค่าที่คาดหวังของการแจกแจงพื้นฐานมีอยู่ แต่ในทางกลับกันนั้นไม่จำเป็นต้องเป็นจริงเสมอไป[ 12 ]
การจัดการกับตัวแปรแบบไม่ต่อเนื่อง
สมมติว่าเป็นตัวแปรสุ่มอิสระและมีแจกแจงเหมือนกัน (iid) จากการแจกแจงแบบไม่ต่อเนื่อง (discrete distribution) ที่มีฟังก์ชันการแจกแจงสะสม (cumulative distribution function) และฟังก์ชันความน่าจะเป็นมวล (probability mass function ) ในการหาความน่าจะเป็นของสถิติเรียงลำดับ (order statistics) จำเป็นต้องมีค่าสามค่าก่อน ได้แก่
ฟังก์ชันการกระจายสะสมของสถิติลำดับสามารถคำนวณได้โดยสังเกตว่า
ในทำนองเดียวกันจะได้รับจาก
โปรดทราบว่าฟังก์ชันความน่าจะเป็นมวลของคือผลต่างของค่าเหล่านี้ กล่าวคือ
การคำนวณสถิติลำดับ
ปัญหาการคำนวณหา องค์ประกอบที่เล็กที่สุด (หรือใหญ่ที่สุด) อันดับที่ kของรายการเรียกว่าปัญหาการเลือก และสามารถแก้ไขได้ด้วยอัลกอริธึมการเลือก แม้ว่าปัญหานี้จะยากสำหรับรายการขนาดใหญ่มาก แต่ก็มีการสร้างอัลกอริธึมการเลือกที่ซับซ้อนขึ้นมาซึ่งสามารถแก้ปัญหานี้ได้ในเวลาที่แปรผันตามจำนวนองค์ประกอบในรายการ แม้ว่ารายการนั้นจะไม่มีลำดับเลยก็ตาม หากข้อมูลถูกจัดเก็บไว้ในโครงสร้างข้อมูลเฉพาะบางอย่าง เวลาที่ใช้สามารถลดลงเหลือ O(log n ) ได้ ในหลายแอปพลิเคชัน จำเป็นต้องใช้สถิติการเรียงลำดับทั้งหมด ในกรณีนี้ สามารถใช้ อัลกอริธึมการเรียงลำดับได้และเวลาที่ใช้จะเป็น O( n log n )
แอปพลิเคชัน
สถิติเชิงลำดับมีการประยุกต์ใช้ในด้านต่างๆ เช่น ทฤษฎีความน่าเชื่อถือ คณิตศาสตร์การเงิน การวิเคราะห์การอยู่รอด ระบาดวิทยา กีฬา การควบคุมคุณภาพ และความเสี่ยงทางคณิตศาสตร์ประกันภัย มีงานวิจัยจำนวนมากที่ศึกษาเกี่ยวกับการประยุกต์ใช้สถิติเชิงลำดับในสาขาเหล่านี้
ตัวอย่างเช่น การประยุกต์ใช้ล่าสุดในความเสี่ยงทางคณิตศาสตร์ประกันภัยสามารถพบได้ใน[ 13 ]ซึ่งมีหลักการเบี้ยประกันภัยแบบถ่วงน้ำหนักบางประการในแง่ของการเรียกร้องค่าสินไหมทดแทนที่บันทึกไว้และการเรียกร้องค่าสินไหมทดแทนที่บันทึกไว้ครั้งที่ k
ดูเพิ่มเติม
- แรนกิต
- แผนภาพกล่อง
- ความไม่เท่าเทียมกันของ BRS
- สถิติร่วม (สถิติ)
- การแจกแจงแบบฟิชเชอร์-ทิปเพ็ตต์
- ทฤษฎีบท Bapat–Begสำหรับสถิติเรียงลำดับของตัวแปรสุ่มอิสระแต่ไม่จำเป็นต้องมีการแจกแจงเหมือนกัน
- พหุนามเบิร์นสไตน์
- ตัวประมาณค่า L – การรวมเชิงเส้นของสถิติลำดับ
- การกระจายขนาดอันดับ
- อัลกอริทึมการเลือก
ตัวอย่างของสถิติเชิงลำดับ
- ตัวอย่างค่าสูงสุดและค่าต่ำสุด
- ควอนไทล์
- เปอร์เซ็นไทล์
- เดซิล์
- ควาร์ไทล์
- ค่ามัธยฐาน
- หมายถึง
- ค่าเฉลี่ยและค่าความแปรปรวนร่วมของตัวอย่าง
ลิงก์ภายนอก
- สถิติการสั่งซื้อที่PlanetMathสืบค้นเมื่อ 2 กุมภาพันธ์ 2548
- ไวส์สไตน์, เอริค ดับเบิลยู. "สถิติลำดับ" . แมธเวิลด์ .สืบค้นข้อมูลเมื่อวันที่ 2 กุมภาพันธ์ 2548
- โค้ด C++ สถิติการสั่งซื้อแบบไดนามิก
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ สถิติลำดับ
ใน ทางสถิติ สถิติลำดับ ที่k ของ ตัวอย่าง ทางสถิติ จะเท่ากับค่าที่เล็กที่สุดลำดับที่ k ของมัน [ 1 ] เมื่อกำหนดตัวอย่างที่มีขนาดสถิติลำดับที่ k จะถูกแทนด้วย โดย ที่ สถิติลำดับ...
สัญลักษณ์และตัวอย่าง
ตัวอย่างเช่น สมมติว่ามีการสังเกตหรือบันทึกตัวเลขสี่ตัว ทำให้ได้ตัวอย่างขนาด 4 ถ้าค่าของตัวอย่างคือ
การวิเคราะห์เชิงความน่าจะเป็น
เมื่อกำหนดตัวแปรสุ่มใดๆตัวแปรสุ่มเหล่านั้นจะถูกกำหนดโดยการเรียงลำดับจากน้อยไปมาก X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\ldots ,X_{n}} X ( 1 ) , X ( 2 ) , … , X ( n ) {\displaystyle X_{(1)},X_{(2)},\ldots ,X_{(n)}} X 1 , X 2 , … , X n {\displaystyle...
ฟังก์ชันการกระจายสะสมของสถิติลำดับ
สำหรับตัวอย่างสุ่มดังข้างต้นที่มีการแจกแจงสะสมสถิติลำดับสำหรับตัวอย่างนั้นมีการแจกแจงสะสมดังต่อไปนี้ [ 2 ] (โดยที่ r ระบุสถิติลำดับใด): การพิสูจน์สูตรนี้เป็นเรื่องของ การจัดกลุ่ม ล้วนๆ : สำหรับสถิติลำดับที่ th...