กลับไปหน้าบทความ

อ่าน 17 นาที

สถิติลำดับ

ใน ทางสถิติ สถิติลำดับ ที่k ของ ตัวอย่าง ทางสถิติ จะเท่ากับค่าที่เล็กที่สุดลำดับที่ k ของมัน [ 1 ] เมื่อกำหนดตัวอย่างที่มีขนาดสถิติลำดับที่ k จะถูกแทนด้วย โดย ที่ สถิติลำดับ...

สถิติลำดับ

ฟังก์ชันความหนาแน่นความน่าจะเป็นของสถิติเรียงลำดับสำหรับตัวอย่างขนาดn  = 5 จากการแจกแจงเอกซ์โพเนนเชียลที่มีพารามิเตอร์มาตราส่วนเท่ากับ 1

ในทางสถิติสถิติลำดับที่k ของตัวอย่างทางสถิติจะเท่ากับค่าที่เล็กที่สุดลำดับที่k ของมัน [ 1 ] เมื่อกำหนดตัวอย่างที่มีขนาดสถิติลำดับที่ k จะถูกแทนด้วยโดยที่สถิติลำดับร่วมกับ สถิติ อันดับ ถือเป็นเครื่องมือพื้นฐานที่สุดอย่างหนึ่งใน สถิติ และการอนุมานแบบไม่ใช้พารามิเตอร์

กรณีพิเศษที่สำคัญของสถิติเรียงลำดับ ได้แก่ ค่าต่ำสุดและ ค่า สูงสุดของตัวอย่าง และ (โดยมีข้อจำกัดบางประการที่กล่าวถึงด้านล่าง) ค่ามัธยฐาน ของตัวอย่างและควอนไทล์อื่นๆของ ตัวอย่าง

เมื่อใช้ทฤษฎีความน่าจะเป็นในการวิเคราะห์สถิติเรียงลำดับของตัวอย่างสุ่มจากตัวแปรต่อเนื่องฟังก์ชันการกระจายสะสมจะถูกนำมาใช้เพื่อลดการวิเคราะห์ให้เหลือเพียงกรณีของสถิติเรียงลำดับของตัวแปรสุ่มแบบเอกรูป

สัญลักษณ์และตัวอย่าง

ตัวอย่างเช่น สมมติว่ามีการสังเกตหรือบันทึกตัวเลขสี่ตัว ทำให้ได้ตัวอย่างขนาด 4 ถ้าค่าของตัวอย่างคือ

6, 9, 3, 7

สถิติการสั่งซื้อจะเป็นดังนี้

สถิติอันดับแรก (หรือสถิติอันดับที่เล็กที่สุด ) จะมีค่าต่ำสุดของตัวอย่างเสมอ นั่นคือ

โดยตามธรรมเนียมปฏิบัติทั่วไป เราจะใช้ตัวอักษรพิมพ์ใหญ่เพื่ออ้างถึงตัวแปรสุ่ม และตัวอักษรพิมพ์เล็ก (ดังตัวอย่างข้างต้น) เพื่ออ้างถึงค่าที่สังเกตได้จริง

ในทำนองเดียวกัน สำหรับตัวอย่างขนาดn ค่าสถิติอันดับ ที่n (หรือค่าสถิติอันดับที่ใหญ่ที่สุด ) คือค่าสูงสุดนั่นคือ

ช่วงค่าตัวอย่างคือผลต่างระหว่างค่าสูงสุดและค่าต่ำสุด ซึ่งเป็นฟังก์ชันของสถิติเรียงลำดับ:

สถิติสำคัญอีกอย่างหนึ่งในการวิเคราะห์ข้อมูลเชิงสำรวจซึ่งมีความเกี่ยวข้องกับสถิติเรียงลำดับโดยตรง คือช่วงควาร์ไทล์ของ ตัวอย่าง

ค่ามัธยฐานของตัวอย่างอาจเป็นหรือไม่เป็นสถิติเรียงลำดับก็ได้ เนื่องจากจะมีค่ากลางเพียงค่าเดียวก็ต่อเมื่อจำนวน การสังเกต nเป็นเลขคี่เท่านั้น กล่าวคือ ถ้าn = 2m + 1สำหรับจำนวนเต็มm บางตัว ค่ามัธยฐานของตัวอย่างจะเป็นและดังนั้นจึงเป็นสถิติเรียงลำดับ ในทางกลับกัน เมื่อnเป็นเลขคู่n = 2m และมีค่ากลางสองค่า คือและและค่ามัธยฐานของตัวอย่างจะเป็นฟังก์ชันของค่าทั้งสอง (โดยปกติคือค่าเฉลี่ย) ดังนั้นจึงไม่ใช่สถิติเรียงลำดับ ข้อสังเกตที่คล้ายกันนี้ใช้ได้กับควอนไทล์ของตัวอย่างทั้งหมดด้วย

การวิเคราะห์เชิงความน่าจะเป็น

เมื่อกำหนดตัวแปรสุ่มใดๆตัวแปรสุ่มเหล่านั้นจะถูกกำหนดโดยการเรียงลำดับจากน้อยไปมาก

กรณีที่ตัวแปรสุ่มเป็นอิสระต่อกันและมีการแจกแจงเหมือนกันจะกล่าวถึงต่อไปนี้ โดยทั่วไปแล้ว ตัวแปรสุ่มสามารถเกิดขึ้นได้จากการสุ่มตัวอย่างจากประชากรมากกว่าหนึ่งกลุ่ม จากนั้นเราจะพิจารณากรณีที่ตัวแปรสุ่มเป็นอิสระต่อกันแต่ไม่จำเป็นต้องมีการแจกแจงเหมือนกัน และการแจกแจงความน่าจะเป็นร่วม ของตัวแปรสุ่มนั้น กำหนดโดย ทฤษฎีบท ของ Bapat–Beg

ต่อจากนี้ไป เราจะถือว่าตัวแปรสุ่มที่พิจารณานั้นเป็นตัวแปรต่อเนื่องและในกรณีที่สะดวก เราจะถือว่าตัวแปรเหล่านั้นมีฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ด้วย กล่าวคือ เป็นตัวแปรต่อเนื่องโดยสมบูรณ์ส่วนลักษณะเฉพาะของการวิเคราะห์การแจกแจงที่กำหนดมวลให้กับจุดต่างๆ (โดยเฉพาะอย่างยิ่งการแจกแจงแบบไม่ต่อเนื่อง ) จะกล่าวถึงในตอนท้าย

ฟังก์ชันการกระจายสะสมของสถิติลำดับ

สำหรับตัวอย่างสุ่มดังข้างต้นที่มีการแจกแจงสะสมสถิติลำดับสำหรับตัวอย่างนั้นมีการแจกแจงสะสมดังต่อไปนี้[ 2 ] (โดยที่rระบุสถิติลำดับใด): การพิสูจน์สูตรนี้เป็นเรื่องของการจัดกลุ่ม ล้วนๆ : สำหรับสถิติลำดับที่ th ที่จะเป็นจำนวนตัวอย่างที่เป็นจะต้องอยู่ระหว่างและในกรณีที่เป็นสถิติลำดับที่ใหญ่ที่สุดจะต้องมีตัวอย่าง(แต่ละตัวมีโอกาสเกิดขึ้นอย่างอิสระ) และตัวอย่าง(แต่ละตัวมีโอกาสเกิดขึ้นอย่างอิสระ) สุดท้าย มีหลายวิธีในการเลือกตัวอย่างใดที่เป็นชนิด

ฟังก์ชันความหนาแน่นความน่าจะเป็นที่สอดคล้องกันสามารถหาได้จากผลลัพธ์นี้ และพบว่าเป็นดังนี้

นอกจากนี้ ยังมีกรณีพิเศษอีกสองกรณี ซึ่งมีฟังก์ชันการกระจายสะสม (CDF) ที่คำนวณได้ง่าย

ซึ่งสามารถหาได้จากการพิจารณาความน่าจะเป็นอย่างรอบคอบ

การแจกแจงความน่าจะเป็นของสถิติลำดับ

สถิติลำดับที่สุ่มมาจากการแจกแจงแบบเอกรูป

ในส่วนนี้ เราจะแสดงให้เห็นว่าค่าสถิติเรียงลำดับของการแจกแจงเอกรูปบนช่วงหนึ่งหน่วยมีการแจกแจงแบบมาร์จินัลที่อยู่ใน ตระกูล การแจกแจงเบตานอกจากนี้ เรายังนำเสนอวิธีการง่ายๆ ในการหาการแจกแจงร่วมของค่าสถิติเรียงลำดับจำนวนใดๆ และสุดท้าย แปลผลลัพธ์เหล่านี้ไปสู่การแจกแจงต่อเนื่องใดๆ โดยใช้ฟังก์ชันการกระจายสะสม(cdf )

ตลอดทั้งส่วนนี้ เราจะถือว่าเป็นตัวอย่างสุ่ม ที่ได้ มาจากการแจกแจงแบบต่อเนื่องที่มีฟังก์ชันการกระจายสะสม (cdf ) โดยกำหนดให้เราจะได้ตัวอย่างสุ่มที่สอดคล้องกันจากการแจกแจงเอกรูป มาตรฐาน โปรดทราบว่าสถิติเรียงลำดับยังเป็นไปตามเงื่อนไขด้วย

ฟังก์ชันความหนาแน่นความน่าจะเป็นของสถิติลำดับเท่ากับ[ 3 ]

นั่นคือ สถิติลำดับที่ kของการแจกแจงแบบเอกรูปเป็นตัวแปรสุ่มที่มีการแจกแจงแบบเบต้า[ 3 ] [ 4 ]

การพิสูจน์ข้อความเหล่านี้มีดังนี้ เพื่อให้ค่าอยู่ระหว่างuและu  +  duจำเป็นต้องมี องค์ประกอบในตัวอย่าง อย่างน้อย k − 1 ตัวที่เล็กกว่า uและอย่างน้อยหนึ่งตัวอยู่ระหว่างuและu  + du ความน่าจะเป็นที่มากกว่าหนึ่งตัวอยู่ในช่วงหลังนี้คือดังนั้นเราต้องคำนวณความน่าจะเป็นที่ค่าสังเกตอย่างน้อยk  − 1, 1 และn  −  kค่าจะตกอยู่ในช่วง, และตามลำดับ ซึ่งเท่ากับ (ดู รายละเอียดเพิ่มเติมในเรื่อง การแจกแจงแบบพหุนาม )

และผลลัพธ์ก็เป็นเช่นนี้

ค่าเฉลี่ยของการแจกแจงนี้คือk / ( n + 1)

การแจกแจงร่วมของสถิติลำดับของการแจกแจงแบบเอกรูป

ในทำนองเดียวกัน สำหรับi  <  jฟังก์ชันความหนาแน่นความน่าจะเป็นร่วมของสถิติลำดับสองค่าU ( i )  <  U ( j )สามารถแสดงได้ดังนี้

ซึ่งก็คือ (โดยพิจารณาถึงเงื่อนไขที่มีลำดับสูงกว่า) ความน่าจะเป็นที่ องค์ประกอบตัวอย่าง i  − 1, 1, j  − 1 −  i , 1 และn  −  jจะตกอยู่ในช่วง, , , , ตามลำดับ

เราใช้เหตุผลในลักษณะที่คล้ายคลึงกันอย่างสิ้นเชิงเพื่อหาการแจกแจงร่วมลำดับสูงกว่า อาจเป็นเรื่องน่าประหลาดใจที่ความหนาแน่นร่วมของสถิติลำดับที่nกลับมีค่าคงที่ :

วิธีหนึ่งที่จะเข้าใจเรื่องนี้คือ ตัวอย่างที่ไม่ได้เรียงลำดับนั้นมีความหนาแน่นคงที่เท่ากับ 1 และมี ลำดับการเรียงสับเปลี่ยนที่แตกต่างกัน n ! แบบของตัวอย่างที่สอดคล้องกับลำดับสถิติการเรียงลำดับเดียวกัน สิ่งนี้เกี่ยวข้องกับข้อเท็จจริงที่ว่า 1/ n ! คือปริมาตรของบริเวณนอกจากนี้ยังเกี่ยวข้องกับลักษณะเฉพาะอีกประการหนึ่งของสถิติการเรียงลำดับของตัวแปรสุ่มเอกรูป: จากความไม่เท่าเทียมกันของ BRSจะได้ว่าจำนวนสูงสุดที่คาดหวังของตัวแปรสุ่มเอกรูป U(0,1] ที่สามารถเลือกได้จากตัวอย่างขนาด n ที่มีผลรวมไม่เกิน นั้นมีขอบเขตบนโดยซึ่งจึงไม่เปลี่ยนแปลงบนเซตของทั้งหมดที่มีผลคูณคงที่

โดยใช้สูตรข้างต้น เราสามารถหาการแจกแจงของช่วงของสถิติเรียงลำดับได้ นั่นคือ การแจกแจงของค่าสูงสุดลบด้วยค่าต่ำสุด โดยทั่วไปแล้ว สำหรับก็มีการแจกแจงแบบเบต้าเช่นกัน: จากสูตรเหล่านี้ เราสามารถหาค่าความแปรปรวนร่วมระหว่างสถิติเรียงลำดับสองตัวได้: สูตรนี้ได้มาจากการสังเกตว่าและเปรียบเทียบว่า กับโดยที่คือการแจกแจงที่แท้จริงของผลต่าง

สถิติลำดับที่สุ่มมาจากการแจกแจงแบบเอกซ์โปเนนเชียล

สำหรับตัวอย่างสุ่มขนาดnจากการแจกแจงเอกซ์โพเนนเชียลที่มีพารามิเตอร์λสถิติเรียงลำดับX ( i )สำหรับi = 1, 2, 3, ..., nแต่ละตัวมีการแจกแจงดังนี้

โดยที่Z jเป็นตัวแปรสุ่มเอกซ์โพเนนเชียลมาตรฐานแบบ iid (กล่าวคือมีพารามิเตอร์อัตรา 1) ผลลัพธ์นี้ได้รับการตีพิมพ์ครั้งแรกโดยAlfréd Rényi [ 5 ] [ 6 ]

สถิติลำดับที่สุ่มมาจากการแจกแจงแบบเออร์ลัง

การแปลงลาปลาสของสถิติลำดับอาจสุ่มตัวอย่างจากการกระจาย Erlangผ่านวิธีการนับเส้นทาง[ 7 ]

การแจกแจงร่วมของสถิติลำดับของการแจกแจงแบบต่อเนื่องโดยสมบูรณ์

ถ้าF Xเป็นฟังก์ชันต่อเนื่องสัมบูรณ์จะมีความหนาแน่นที่และเราสามารถใช้การแทนที่ได้

และ

เพื่อหาฟังก์ชันความหนาแน่นความน่าจะเป็นต่อไปนี้สำหรับสถิติเรียงลำดับของตัวอย่างขนาดnที่สุ่มมาจากการแจกแจงของX :

ที่ไหน

ที่ไหน

การประยุกต์ใช้: ช่วงความเชื่อมั่นสำหรับควอนไทล์

คำถามที่น่าสนใจคือ สถิติเรียงลำดับนั้นมีประสิทธิภาพเพียงใดในการประมาณค่าควอนไทล์ของการกระจายตัวพื้นฐาน

ตัวอย่างที่มีขนาดตัวอย่างเล็ก

กรณีที่ง่ายที่สุดที่จะพิจารณาคือ มัธยฐานของกลุ่มตัวอย่างสามารถประมาณค่ามัธยฐานของประชากรได้ดีเพียงใด

ยกตัวอย่างเช่น พิจารณาตัวอย่างสุ่มขนาด 6 ในกรณีนี้ ค่ามัธยฐานของตัวอย่างมักถูกกำหนดให้เป็นจุดกึ่งกลางของช่วงที่กำหนดโดยสถิติอันดับที่ 3 และ 4 อย่างไรก็ตาม เรารู้จากการอธิบายก่อนหน้านี้ว่า ความน่าจะเป็นที่ช่วงดังกล่าวจะครอบคลุมค่ามัธยฐานของประชากรนั้นคือ

แม้ว่าค่ามัธยฐานของตัวอย่างอาจเป็นค่าประมาณจุด ที่ไม่ขึ้นกับการกระจายตัวที่ดีที่สุด ค่าหนึ่งของค่ามัธยฐานของประชากร แต่ตัวอย่างนี้แสดงให้เห็นว่ามันไม่ใช่ค่าประมาณที่ดีนักในเชิงสัมบูรณ์ ในกรณีนี้ ช่วงความเชื่อมั่นที่ดีกว่าสำหรับค่ามัธยฐานคือช่วงที่กำหนดโดยสถิติอันดับที่ 2 และ 5 ซึ่งมีค่ามัธยฐานของประชากรอยู่ภายในด้วยความน่าจะเป็น

ด้วยขนาดตัวอย่างที่เล็กเช่นนี้ หากต้องการความมั่นใจอย่างน้อย 95% จะต้องกล่าวว่าค่ามัธยฐานอยู่ระหว่างค่าต่ำสุดและค่าสูงสุดของข้อมูลทั้ง 6 ค่า ด้วยความน่าจะเป็น 31/32 หรือประมาณ 97% ที่จริงแล้ว ขนาดตัวอย่าง 6 คือขนาดตัวอย่างที่เล็กที่สุดที่ทำให้ช่วงความเชื่อมั่นที่กำหนดโดยค่าต่ำสุดและค่าสูงสุดมีความมั่นใจอย่างน้อย 95% สำหรับค่ามัธยฐานของประชากร

ขนาดตัวอย่างขนาดใหญ่

สำหรับการแจกแจงแบบเอกรูป เมื่อnมีค่าเข้าสู่∞ ค่าควอนไทล์ตัวอย่างที่ p จะมีการแจกแจงแบบปกติเชิงอะซิมโทติกเนื่องจากสามารถประมาณได้ด้วย

สำหรับการกระจายทั่วไปFที่มีความหนาแน่นต่อเนื่องที่ไม่เป็นศูนย์ที่F  −1 ( p ) ความเป็นปกติเชิงอะซิมโทติกที่คล้ายกันก็ใช้ได้เช่นกัน:

โดยที่fคือฟังก์ชันความหนาแน่นและF  −1คือฟังก์ชันควอนไทล์ที่เกี่ยวข้องกับFหนึ่งในบุคคลแรกที่กล่าวถึงและพิสูจน์ผลลัพธ์นี้คือFrederick Mostellerในบทความสำคัญของเขาในปี 1946 [ 8 ]การวิจัยเพิ่มเติมนำไปสู่ การแสดงแทนของ Bahadur ในช่วงทศวรรษ 1960 ซึ่งให้ข้อมูลเกี่ยวกับขอบเขตข้อผิดพลาด การลู่เข้าสู่การกระจายแบบปกติยังคงใช้ได้ในความหมายที่แข็งแกร่งกว่า เช่น การลู่เข้าในเอนโทรปีสัมพัทธ์หรือความแตกต่าง KL [ 9 ]

ข้อสังเกตที่น่าสนใจอย่างหนึ่งคือ ในกรณีที่การกระจายตัวสมมาตร และค่ามัธยฐานของประชากรเท่ากับค่าเฉลี่ยของประชากร ในกรณีนี้ค่าเฉลี่ยของตัวอย่างตามทฤษฎีบทลิมิตกลางจะมีการกระจายแบบปกติเชิงอะซิปโทติกเช่นกัน แต่มีค่าความแปรปรวน เท่ากับ σ² /nแทน การวิเคราะห์เชิงอะซิปโทติกนี้ชี้ให้เห็นว่า ค่าเฉลี่ยให้ผลลัพธ์ที่ดีกว่าค่ามัธยฐานในกรณีที่ค่าความโค้ง ต่ำ และในทางกลับกัน ตัวอย่างเช่น ค่ามัธยฐานให้ช่วงความเชื่อมั่นที่ดีกว่าสำหรับการกระจายแบบลาปลาซในขณะที่ค่าเฉลี่ยให้ผลลัพธ์ที่ดีกว่าสำหรับXที่มีการกระจายแบบปกติ

การพิสูจน์

สามารถแสดงให้เห็นได้ว่า

ที่ไหน

โดยที่Z iเป็น ตัวแปรสุ่มเอกซ์ โพเนนเชียลอิสระ ที่มีการแจกแจงเหมือนกันทุกประการ ด้วยอัตรา 1 เนื่องจากX / nและY / nมีการแจกแจงแบบปกติเชิงอะซิมโทติกตามทฤษฎีบทขีดจำกัดส่วนกลาง ผลลัพธ์ของเราจึงได้มาจากการใช้วิธีเดลต้า

ข้อมูลร่วมกันของสถิติการสั่งซื้อ

ข้อมูลร่วมกันและความแตกต่าง fระหว่างสถิติลำดับก็ได้รับการพิจารณาเช่นกัน[ 10 ]ตัวอย่างเช่น หากการแจกแจงหลักเป็นแบบต่อเนื่อง สำหรับทุก ๆ กล่าวอีกนัยหนึ่ง ข้อมูลร่วมกันเป็นอิสระจากการแจกแจงหลัก สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง ความเท่าเทียมกันไม่จำเป็นต้องเป็นจริง และเรามีเพียงแค่

ข้อมูลร่วมกันระหว่างสถิติเรียงลำดับสม่ำเสมอจะกำหนดโดย โดย ที่ คือเลขฮาร์มอนิก ที่

การประยุกต์ใช้: การประมาณความหนาแน่นแบบไม่ใช้พารามิเตอร์

โมเมนต์ของการกระจายสำหรับสถิติอันดับแรกสามารถใช้ในการพัฒนาตัวประมาณความหนาแน่นแบบไม่ใช้พารามิเตอร์ได้[ 11 ]สมมติว่าเราต้องการประมาณความหนาแน่นที่จุดพิจารณาตัวแปรสุ่มซึ่งเป็น iid ที่มีฟังก์ชันการกระจายโดยเฉพาะอย่างยิ่ง

ค่าที่คาดหวังของสถิติอันดับแรกเมื่อกำหนดตัวอย่างที่มีจำนวนการสังเกตทั้งหมด จะได้ดังนี้

โดยที่คือฟังก์ชันควอนไทล์ที่เกี่ยวข้องกับการแจกแจงและสมการนี้เมื่อรวมกับ เทคนิค แจ็กไนฟ์จะกลายเป็นพื้นฐานสำหรับอัลกอริธึมการประมาณความหนาแน่นต่อไปนี้

 อินพุต: ตัวอย่างข้อมูลการสังเกตจุดประเมินความหนาแน่น พารามิเตอร์ปรับแต่ง(โดยปกติคือ 1/3) ผลลัพธ์: ความหนาแน่นโดยประมาณ ณ จุดประเมิน 
 1: ชุดที่ 2: ชุดที่ 3: สร้างเมทริก ซ์ ที่เก็บเซตย่อยที่มีข้อมูลสังเกตการณ์ในแต่ละเซต 4. สร้างเวกเตอร์เพื่อเก็บค่าการประเมินความหนาแน่น 5: สำหรับdo 6: สำหรับdo 7: ค้นหาระยะทางที่ใกล้ที่สุดไปยังจุดปัจจุบันภายในเซตย่อยที่ th 8: สิ้นสุดสำหรับ 9: คำนวณค่าเฉลี่ยของระยะทางย่อยไปยัง 10: คำนวณค่าประมาณความหนาแน่นที่ 11: สิ้นสุดสำหรับ 12: ส่งคืน

ตรงกันข้ามกับพารามิเตอร์การปรับแต่งตามแบนด์วิดท์/ความยาวสำหรับวิธี การแบบ ฮิสโตแกรมและเคอร์เนล พารามิเตอร์การปรับแต่งสำหรับตัวประมาณความหนาแน่นตามสถิติลำดับคือขนาดของชุดย่อยตัวอย่าง ตัวประมาณดังกล่าวมีความแข็งแกร่งกว่าวิธีการแบบฮิสโตแกรมและเคอร์เนล ตัวอย่างเช่น ความหนาแน่นเช่นการแจกแจงโคชี (ซึ่งไม่มีโมเมนต์จำกัด) สามารถอนุมานได้โดยไม่ต้องมีการปรับเปลี่ยนเฉพาะ เช่นแบนด์วิดท์ตาม IQRทั้งนี้เนื่องจากโมเมนต์แรกของสถิติลำดับจะมีอยู่เสมอหากค่าที่คาดหวังของการแจกแจงพื้นฐานมีอยู่ แต่ในทางกลับกันนั้นไม่จำเป็นต้องเป็นจริงเสมอไป[ 12 ]

การจัดการกับตัวแปรแบบไม่ต่อเนื่อง

สมมติว่าเป็นตัวแปรสุ่มอิสระและมีแจกแจงเหมือนกัน (iid) จากการแจกแจงแบบไม่ต่อเนื่อง (discrete distribution) ที่มีฟังก์ชันการแจกแจงสะสม (cumulative distribution function) และฟังก์ชันความน่าจะเป็นมวล (probability mass function ) ในการหาความน่าจะเป็นของสถิติเรียงลำดับ (order statistics) จำเป็นต้องมีค่าสามค่าก่อน ได้แก่

ฟังก์ชันการกระจายสะสมของสถิติลำดับสามารถคำนวณได้โดยสังเกตว่า

ในทำนองเดียวกันจะได้รับจาก

โปรดทราบว่าฟังก์ชันความน่าจะเป็นมวลของคือผลต่างของค่าเหล่านี้ กล่าวคือ

การคำนวณสถิติลำดับ

ปัญหาการคำนวณหา องค์ประกอบที่เล็กที่สุด (หรือใหญ่ที่สุด) อันดับที่ kของรายการเรียกว่าปัญหาการเลือก และสามารถแก้ไขได้ด้วยอัลกอริธึมการเลือก แม้ว่าปัญหานี้จะยากสำหรับรายการขนาดใหญ่มาก แต่ก็มีการสร้างอัลกอริธึมการเลือกที่ซับซ้อนขึ้นมาซึ่งสามารถแก้ปัญหานี้ได้ในเวลาที่แปรผันตามจำนวนองค์ประกอบในรายการ แม้ว่ารายการนั้นจะไม่มีลำดับเลยก็ตาม หากข้อมูลถูกจัดเก็บไว้ในโครงสร้างข้อมูลเฉพาะบางอย่าง เวลาที่ใช้สามารถลดลงเหลือ O(log n ) ได้ ในหลายแอปพลิเคชัน จำเป็นต้องใช้สถิติการเรียงลำดับทั้งหมด ในกรณีนี้ สามารถใช้ อัลกอริธึมการเรียงลำดับได้และเวลาที่ใช้จะเป็น O( n log n )

แอปพลิเคชัน

สถิติเชิงลำดับมีการประยุกต์ใช้ในด้านต่างๆ เช่น ทฤษฎีความน่าเชื่อถือ คณิตศาสตร์การเงิน การวิเคราะห์การอยู่รอด ระบาดวิทยา กีฬา การควบคุมคุณภาพ และความเสี่ยงทางคณิตศาสตร์ประกันภัย มีงานวิจัยจำนวนมากที่ศึกษาเกี่ยวกับการประยุกต์ใช้สถิติเชิงลำดับในสาขาเหล่านี้

ตัวอย่างเช่น การประยุกต์ใช้ล่าสุดในความเสี่ยงทางคณิตศาสตร์ประกันภัยสามารถพบได้ใน[ 13 ]ซึ่งมีหลักการเบี้ยประกันภัยแบบถ่วงน้ำหนักบางประการในแง่ของการเรียกร้องค่าสินไหมทดแทนที่บันทึกไว้และการเรียกร้องค่าสินไหมทดแทนที่บันทึกไว้ครั้งที่ k

ดูเพิ่มเติม

ตัวอย่างของสถิติเชิงลำดับ

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Order_statistic&oldid=1349086230 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ สถิติลำดับ

ใน ทางสถิติ สถิติลำดับ ที่k ของ ตัวอย่าง ทางสถิติ จะเท่ากับค่าที่เล็กที่สุดลำดับที่ k ของมัน [ 1 ] เมื่อกำหนดตัวอย่างที่มีขนาดสถิติลำดับที่ k จะถูกแทนด้วย โดย ที่ สถิติลำดับ...

สัญลักษณ์และตัวอย่าง

ตัวอย่างเช่น สมมติว่ามีการสังเกตหรือบันทึกตัวเลขสี่ตัว ทำให้ได้ตัวอย่างขนาด 4 ถ้าค่าของตัวอย่างคือ

การวิเคราะห์เชิงความน่าจะเป็น

เมื่อกำหนดตัวแปรสุ่มใดๆตัวแปรสุ่มเหล่านั้นจะถูกกำหนดโดยการเรียงลำดับจากน้อยไปมาก X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\ldots ,X_{n}} X ( 1 ) , X ( 2 ) , … , X ( n ) {\displaystyle X_{(1)},X_{(2)},\ldots ,X_{(n)}} X 1 , X 2 , … , X n {\displaystyle...

ฟังก์ชันการกระจายสะสมของสถิติลำดับ

สำหรับตัวอย่างสุ่มดังข้างต้นที่มีการแจกแจงสะสมสถิติลำดับสำหรับตัวอย่างนั้นมีการแจกแจงสะสมดังต่อไปนี้ [ 2 ] (โดยที่ r ระบุสถิติลำดับใด): การพิสูจน์สูตรนี้เป็นเรื่องของ การจัดกลุ่ม ล้วนๆ : สำหรับสถิติลำดับที่ th...