อ่าน 2 นาที
อันดับ (สถิติ)
ในทาง สถิติ การจัดอันดับ คือ การแปลงข้อมูล โดยแทนที่ ค่า ตัวเลข หรือ ค่า ลำดับ ด้วยอันดับเมื่อข้อมูลถูกจัดเรียง
อันดับ (สถิติ)
ในทางสถิติการจัดอันดับคือการแปลงข้อมูลโดยแทนที่ ค่า ตัวเลขหรือ ค่า ลำดับด้วยอันดับเมื่อข้อมูลถูกจัดเรียง
ตัวอย่างเช่น ลำดับของข้อมูลตัวเลข 3.4, 5.1, 2.6, 7.3 คือ 2, 3, 1, 4
ตัวอย่างเช่น ข้อมูลเชิงลำดับ ร้อน เย็น อุ่น จะถูกแทนที่ด้วย 3, 1, 2 ในตัวอย่างเหล่านี้ ลำดับจะถูกกำหนดให้กับค่าต่างๆ ตามลำดับจากน้อยไปมาก แม้ว่าจะสามารถใช้ลำดับจากมากไปน้อยได้เช่นกัน
อันดับต่างๆ เกี่ยวข้องกับรายการดัชนีของสถิติ เรียงลำดับ ซึ่งประกอบด้วยชุดข้อมูลดั้งเดิมที่จัดเรียงใหม่ตามลำดับจากน้อยไปมาก
ใช้สำหรับการทดสอบ
การทดสอบทางสถิติบางประเภทใช้การคำนวณโดยอิงตามลำดับ ตัวอย่างเช่น:
- การทดสอบฟรีดแมน
- การทดสอบครัสกัล-วอลลิส
- ผลิตภัณฑ์จัดอันดับ
- สัมประสิทธิ์สหสัมพันธ์ลำดับของสเปียร์แมน
- การทดสอบ Mann–Whitney U
- การทดสอบ Wilcoxon signed-rank
- การทดสอบของแวน เดอร์ แวร์เดน
การกระจายตัวของค่าต่างๆ ตามลำดับจากมากไปน้อยมักเป็นที่น่าสนใจเมื่อค่าต่างๆ มีช่วงขนาดที่แตกต่างกันมาก ตัวอย่างเช่นการกระจายตัวตามลำดับขนาด (หรือการกระจายตัวตามลำดับความถี่) สำหรับขนาดของเมืองหรือความถี่ของคำ ซึ่งมักเป็นไปตามกฎ กำลัง
บางอันดับอาจมีค่าที่ไม่ใช่จำนวนเต็มสำหรับค่าข้อมูลที่ซ้ำกัน ตัวอย่างเช่น เมื่อมีค่าข้อมูลเดียวกันเป็นจำนวนคู่อันดับทางสถิติที่เป็นเศษส่วนของข้อมูลที่ซ้ำกันจะลงท้ายด้วย ½ อันดับเปอร์เซ็นไทล์เป็นอีกประเภทหนึ่งของการจัดอันดับทางสถิติ
การคำนวณ
Microsoft Excelมีฟังก์ชันการจัดอันดับสองฟังก์ชัน ได้แก่ ฟังก์ชัน Rank.EQซึ่งกำหนดอันดับการแข่งขันในกรณีที่มีค่าเท่ากัน และ ฟังก์ชัน Rank.AVGซึ่งกำหนดอันดับแบบเศษส่วนในกรณีที่มีค่าเท่ากัน ตัวอย่างเช่น หากข้อมูลที่กำลังจัดอันดับคือ ("5, 7, 7, 10") ฟังก์ชันRank.EQจะส่งคืนค่า ("1, 2, 2, 4") ในขณะที่ฟังก์ชัน Rank.AVGจะส่งคืนค่า ("1, 2.5, 2.5, 4") โปรดทราบว่าRank.AVGจะรักษาผลรวมของอันดับในกรณีที่มีค่าเท่ากัน ในขณะที่Rank.EQจะไม่ทำเช่นนั้น ทำให้ฟังก์ชันหลังไม่เหมาะสมสำหรับการใช้งานทางสถิติหลายอย่าง ฟังก์ชันเหล่านี้มีอาร์กิวเมนต์ลำดับ[ 1 ]ซึ่งโดยค่าเริ่มต้นจะตั้งค่าเป็นจากมากไปน้อยกล่าวคือ ตัวเลขที่มากที่สุดจะมีอันดับ 1 ซึ่งโดยทั่วไปแล้วจะไม่นิยมใช้ในสถิติที่การจัดอันดับมักจะอยู่ในลำดับจากน้อยไปมาก ซึ่งตัวเลขที่น้อยที่สุดจะมีอันดับ 1
การเปรียบเทียบอันดับ
การหาค่าสัมประสิทธิ์ สหสัมพันธ์ลำดับสามารถใช้เปรียบเทียบการจัดอันดับสองรายการสำหรับชุดวัตถุเดียวกันได้ ตัวอย่างเช่นค่าสัมประสิทธิ์สหสัมพันธ์ลำดับของสเปียร์แมนมีประโยชน์ในการวัดความสัมพันธ์ทางสถิติระหว่างการจัดอันดับของนักกีฬาในการแข่งขันสองรายการ และค่าสัมประสิทธิ์สหสัมพันธ์ลำดับของเคนดัลเป็นอีกแนวทางหนึ่ง หรืออีกทางหนึ่ง แนวทางที่อิงตามการตัดกัน/การทับซ้อนจะให้ความยืดหยุ่นเพิ่มเติม ตัวอย่างหนึ่งคือแนวทาง "การทับซ้อนแบบไฮเปอร์จีโอเมตริกอันดับ-อันดับ" [ 2 ]ซึ่งออกแบบมาเพื่อเปรียบเทียบการจัดอันดับของยีนที่อยู่ "ด้านบน" ของรายการยีนที่แสดงออกแตกต่างกันสองรายการที่เรียงลำดับ แนวทางที่คล้ายกันนี้ใช้โดย "การทับซ้อนแบบลำเอียงอันดับ (RBO)" [ 3 ]ซึ่งยังใช้ความน่าจะเป็นที่ปรับได้ p เพื่อปรับแต่งน้ำหนักที่กำหนดที่ระดับความลึกของการจัดอันดับที่ต้องการ แนวทางเหล่านี้มีข้อดีคือสามารถจัดการกับเซตที่ไม่ซ้ำกันเซตที่มีขนาดแตกต่างกัน และการถ่วงน้ำหนักสูงสุด (โดยคำนึงถึงตำแหน่งการจัดอันดับสัมบูรณ์ ซึ่งอาจถูกละเลยในวิธีการหาความสัมพันธ์อันดับแบบไม่ถ่วงน้ำหนักมาตรฐาน)
คำนิยาม
ให้เป็นเซตของตัวแปรสุ่ม โดยการเรียงลำดับตัวแปรเหล่านี้ เราได้กำหนดสถิติลำดับของตัวแปร เหล่านั้น [ 4 ]
ถ้าค่าทั้งหมดไม่ซ้ำกัน อันดับของตัวแปรหมายเลขจะเป็นคำตอบเดียวของสมการในกรณีที่มีค่าเท่ากัน เราอาจใช้ค่ากลาง (ซึ่งสอดคล้องกับ "อันดับเศษส่วน" ที่กล่าวถึงข้างต้น) ซึ่งกำหนดเป็นค่าเฉลี่ยของดัชนีทั้งหมดที่ทำให้หรืออันดับขึ้น (ซึ่งสอดคล้องกับ"การจัดอันดับการแข่งขันที่ปรับปรุงแล้ว" ) ซึ่งกำหนดโดย
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ อันดับ (สถิติ)
ในทาง สถิติ การจัดอันดับ คือ การแปลงข้อมูล โดยแทนที่ ค่า ตัวเลข หรือ ค่า ลำดับ ด้วยอันดับเมื่อข้อมูลถูกจัดเรียง
ใช้สำหรับการทดสอบ
การทดสอบทางสถิติ บางประเภทใช้การคำนวณโดยอิงตามลำดับ ตัวอย่างเช่น:
การคำนวณ
Microsoft Excel มีฟังก์ชันการจัดอันดับสองฟังก์ชัน ได้แก่ ฟังก์ชัน Rank.EQ ซึ่งกำหนดอันดับการแข่งขันในกรณีที่มีค่าเท่ากัน และ ฟังก์ชัน Rank.
การเปรียบเทียบอันดับ
การหาค่าสัมประสิทธิ์ สห สัมพันธ์ลำดับ สามารถใช้เปรียบเทียบการจัดอันดับสองรายการสำหรับชุดวัตถุเดียวกันได้ ตัวอย่างเช่น ค่าสัมประสิทธิ์สหสัมพันธ์ลำดับของสเปียร์แมน มีประโยชน์ในการวัดความสัมพันธ์ทางสถิติระหว่างการจัดอันดับของนักกีฬาในการแข่งขันสองรายการ และ...