กลับไปหน้าบทความ

อ่าน 8 นาที

ข้อมูลเชิงลำดับ

ข้อมูลเชิงลำดับ เป็น ประเภทข้อมูลเชิงสถิติ แบบจัดกลุ่ม โดยตัวแปรมีหมวดหมู่ที่เรียงลำดับตามธรรมชาติ และไม่ทราบระยะห่างระหว่างหมวดหมู่ [ 1 ] : 2 ข้อมูลเหล่านี้มีอยู่ใน...

ข้อมูลเชิงลำดับ

ข้อมูลเชิงลำดับเป็นประเภทข้อมูลเชิงสถิติ แบบจัดกลุ่ม โดยตัวแปรมีหมวดหมู่ที่เรียงลำดับตามธรรมชาติ และไม่ทราบระยะห่างระหว่างหมวดหมู่[ 1 ] : 2 ข้อมูลเหล่านี้มีอยู่ในมาตราส่วนเชิงลำดับซึ่งเป็นหนึ่งในสี่ระดับการวัด ที่ SS Stevensอธิบายไว้ในปี 1946 มาตราส่วนเชิงลำดับแตกต่างจากมาตราส่วนนามโดยมีลำดับ[ 2 ]นอกจากนี้ยังแตกต่างจากมาตราส่วนช่วงและมาตราส่วนอัตราส่วนโดยไม่มีความกว้างของหมวดหมู่ที่แสดงถึงการเพิ่มขึ้นที่เท่ากันของคุณลักษณะพื้นฐาน[ 3 ]

ตัวอย่างของข้อมูลเชิงลำดับ

ตัวอย่างที่รู้จักกันดีของข้อมูลเชิงลำดับคือมาตราส่วนลิเคิร์ตตัวอย่างของมาตราส่วนลิเคิร์ตคือ: [ 4 ] : 685

ชอบ คล้ายๆ นะ เป็นกลาง ไม่ค่อยชอบเท่าไหร่ ไม่ชอบ
1 2 3 4 5

ตัวอย่างของข้อมูลเชิงลำดับมักพบได้ในแบบสอบถาม เช่น คำถามสำรวจ "สุขภาพโดยรวมของคุณแย่ พอใช้ ดี หรือดีเยี่ยม?" อาจมีการเข้ารหัสคำตอบเหล่านั้นเป็น 1, 2, 3 และ 4 ตามลำดับ บางครั้งข้อมูลในมาตราส่วนช่วงหรือมาตราส่วนอัตราส่วนจะถูกจัดกลุ่มลงในมาตราส่วนเชิงลำดับ เช่น บุคคลที่ทราบรายได้อาจถูกจัดกลุ่มเป็นหมวดหมู่รายได้ 0–19,999 ดอลลาร์ 20,000–39,999 ดอลลาร์ 40,000–59,999 ดอลลาร์ ... ซึ่งอาจถูกเข้ารหัสเป็น 1, 2, 3, 4, ... ตัวอย่างอื่นๆ ของข้อมูลเชิงลำดับ ได้แก่ สถานะทางเศรษฐกิจและสังคม ยศทางทหาร และเกรดตัวอักษรสำหรับหลักสูตร[ 5 ]

วิธีการวิเคราะห์ข้อมูลเชิงลำดับ

การวิเคราะห์ข้อมูลเชิงลำดับต้องใช้ชุดการวิเคราะห์ที่แตกต่างจากตัวแปรเชิงคุณภาพอื่นๆ วิธีการเหล่านี้รวมเอาลำดับตามธรรมชาติของตัวแปรเพื่อหลีกเลี่ยงการสูญเสียพลัง[ 1 ] : 88 การคำนวณค่าเฉลี่ยของตัวอย่างข้อมูลเชิงลำดับนั้นไม่แนะนำ ควรใช้มาตรวัดแนวโน้มศูนย์กลางอื่นๆ เช่น มัธยฐานหรือฐานนิยม ซึ่งโดยทั่วไปแล้วจะเหมาะสมกว่า[ 6 ]

ทั่วไป

Stevens (1946) โต้แย้งว่า เนื่องจากสมมติฐานเรื่องระยะห่างที่เท่ากันระหว่างหมวดหมู่ไม่เป็นจริงสำหรับข้อมูลเชิงลำดับ การใช้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน ในการอธิบายการแจกแจงเชิงลำดับและสถิติเชิงอนุมานที่อิงตามค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานจึงไม่เหมาะสม ควรใช้มาตรวัดเชิงตำแหน่ง เช่น ค่ามัธยฐานและเปอร์เซ็นไทล์ รวมถึงสถิติเชิงพรรณนา ที่เหมาะสมสำหรับข้อมูลเชิงนาม (จำนวนกรณี ค่าฐานนิยม ความสัมพันธ์เชิงความน่าจะเป็น) แทน [ 3 ] : 678 วิธีการที่ไม่ใช้พารามิเตอร์ได้รับการเสนอให้เป็นวิธีการที่เหมาะสมที่สุดสำหรับสถิติเชิงอนุมานที่เกี่ยวข้องกับข้อมูลเชิงลำดับ (เช่นKendall's Wสัมประสิทธิ์สหสัมพันธ์ลำดับของ Spearmanเป็นต้น) โดยเฉพาะอย่างยิ่งวิธีการที่พัฒนาขึ้นสำหรับการวิเคราะห์การวัดแบบจัดอันดับ[ 5 ] : 25–28 อย่างไรก็ตาม การใช้สถิติเชิงพารามิเตอร์สำหรับข้อมูลเชิงลำดับอาจอนุญาตได้โดยมีข้อควรระวังบางประการเพื่อใช้ประโยชน์จากขั้นตอนทางสถิติที่มีอยู่หลากหลายมากขึ้น[ 7 ] [ 8 ] [ 4 ] : 90

สถิติตัวแปรเดียว

แทนที่จะใช้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน สถิติแบบเอกตัวแปรที่เหมาะสมสำหรับข้อมูลเชิงลำดับ ได้แก่ ค่ามัธยฐาน[ 9 ] : 59–61 เปอร์เซ็นไทล์อื่นๆ (เช่น ควาร์ไทล์และเดซิไล์) [ 9 ] : 71 และส่วนเบี่ยงเบนของควาร์ไทล์[ 9 ] : 77 การทดสอบตัวอย่างเดียวสำหรับข้อมูลเชิงลำดับ ได้แก่การทดสอบตัวอย่างเดียวของ Kolmogorov-Smirnov [ 5 ] : 51–55 การ ทดสอบ การวิ่งตัวอย่างเดียว[ 5 ] : 58–64 และการทดสอบจุดเปลี่ยน[ 5 ] : 64–71

สถิติแบบสองตัวแปร

แทนที่จะทดสอบความแตกต่างของค่าเฉลี่ยด้วยt -testความแตกต่างในการกระจายของข้อมูลเชิงลำดับจากสองตัวอย่างอิสระสามารถทดสอบได้ด้วยการทดสอบMann -Whitney [ 9 ] : 259–264 runs [ 9 ] : 253–259 Smirnov [ 9 ] : 266–269 และsigned-ranks [ 9 ] : 269–273 การทดสอบสำหรับสองตัวอย่างที่เกี่ยวข้องกันหรือจับคู่กัน ได้แก่ การทดสอบ sign test [ 5 ] : 80–87 และการทดสอบ Wilcoxon signed ranks test [ 5 ] : 87–95 การวิเคราะห์ความแปรปรวนด้วยอันดับ[ 9 ] : 367–369 และการทดสอบ Jonckheere สำหรับทางเลือกที่เรียงลำดับ[ 5 ] : 216–222 สามารถดำเนินการกับข้อมูลเชิงลำดับแทน ANOVAสำหรับตัวอย่างอิสระได้ การทดสอบสำหรับตัวอย่างที่เกี่ยวข้องกันมากกว่าสองตัวอย่าง ได้แก่การวิเคราะห์ความแปรปรวนแบบสองทางของฟรีดแมนโดยใช้ลำดับ[ 5 ] : 174–183 และการทดสอบของเพจสำหรับทางเลือกที่มีลำดับ [ 5 ] : 184–188 มาตร วัด ความสัมพันธ์ที่เหมาะสมสำหรับตัวแปรที่มีมาตราส่วนเชิงลำดับสองตัว ได้แก่เทาของเคนดัล[ 9 ] : 436–439 แกมมา[ 9 ] : 442–443 rs [ 9 ] : 434–436 และdyx / dxy [ 9 ] : 443

การประยุกต์ใช้การถดถอย

ข้อมูลเชิงลำดับสามารถพิจารณาได้ว่าเป็นตัวแปรเชิงปริมาณ ในการวิเคราะห์การถดถอยโลจิสติกสมการ

คือแบบจำลองและ c รับระดับที่กำหนดของมาตราส่วนเชิงหมวดหมู่[ 1 ] : 189 ในการวิเคราะห์การถดถอยผลลัพธ์ ( ตัวแปรตาม ) ที่เป็นตัวแปรเชิงลำดับสามารถทำนายได้โดยใช้การถดถอยเชิงลำดับ แบบต่างๆ เช่นโลจิตแบบเรียงลำดับหรือโพรบิตแบบ เรียงลำดับ

ในการวิเคราะห์การถดถอย/สหสัมพันธ์หลายตัวแปร ข้อมูลเชิงลำดับสามารถรองรับได้โดยใช้พหุนามกำลังและผ่านการปรับคะแนนและอันดับให้เป็นมาตรฐาน[ 10 ]

แนวโน้มเชิงเส้นยังใช้เพื่อหาความสัมพันธ์ระหว่างข้อมูลเชิงลำดับและตัวแปรเชิงหมวดหมู่อื่นๆ โดยปกติในตารางความสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์rจะพบระหว่างตัวแปร โดยที่rอยู่ระหว่าง -1 และ 1 ในการทดสอบแนวโน้ม จะใช้สถิติทดสอบดังนี้:

ใช้ในกรณีที่nคือขนาดตัวอย่าง[ 1 ] : 87

สามารถหาค่าR ได้โดยให้ เป็นคะแนนของแถว และเป็นคะแนนของคอลัมน์ ให้เป็นค่าเฉลี่ยของคะแนนแถว ในขณะที่แล้วคือความน่าจะเป็นของแถวแบบมาร์จินัล และคือความน่าจะเป็นของคอลัมน์แบบมาร์จินัลคำนวณค่า R ได้ดังนี้:

วิธีการจำแนกประเภท

วิธีการจำแนกประเภทได้รับการพัฒนาสำหรับข้อมูลเชิงลำดับด้วยเช่นกัน ข้อมูลจะถูกแบ่งออกเป็นหมวดหมู่ต่างๆ โดยที่การสังเกตแต่ละครั้งจะคล้ายคลึงกัน การกระจายจะถูกวัดและลดให้น้อยที่สุดในแต่ละกลุ่มเพื่อเพิ่มผลลัพธ์การจำแนกประเภทให้สูงสุด ฟังก์ชันการกระจายจะถูกใช้ในทฤษฎีสารสนเทศ[ 11 ]

แบบจำลองทางสถิติสำหรับข้อมูลเชิงลำดับ

มีแบบจำลองที่แตกต่างกันหลายแบบที่สามารถใช้เพื่ออธิบายโครงสร้างของข้อมูลเชิงลำดับได้[ 12 ]แบบจำลองหลักสี่ประเภทจะอธิบายไว้ด้านล่าง โดยแต่ละประเภทกำหนดไว้สำหรับตัวแปรสุ่มโดยมีระดับที่จัดทำดัชนีโดย

โปรดทราบว่าในคำจำกัดความของแบบจำลองด้านล่าง ค่าของและจะไม่เหมือนกันสำหรับทุกแบบจำลองสำหรับชุดข้อมูลเดียวกัน แต่สัญลักษณ์นี้ใช้เพื่อเปรียบเทียบโครงสร้างของแบบจำลองต่างๆ

แบบจำลองอัตราส่วนความน่าจะเป็น

แบบจำลองที่ใช้กันทั่วไปที่สุดสำหรับข้อมูลเชิงลำดับคือแบบจำลองอัตราส่วนความน่าจะเป็นแบบสัดส่วน ซึ่งกำหนดโดย

โดยที่พารามิเตอร์อธิบายการกระจายพื้นฐานของข้อมูลเชิงลำดับคือตัวแปรควบคุม และคือสัมประสิทธิ์ที่อธิบายผลกระทบของตัวแปรควบคุมเหล่านั้น

แบบจำลองนี้สามารถขยายความได้โดยการกำหนดแบบจำลองโดยใช้แทนซึ่งจะทำให้แบบจำลองนี้เหมาะสมสำหรับข้อมูลเชิงนาม (ซึ่งหมวดหมู่ไม่มีลำดับตามธรรมชาติ) เช่นเดียวกับข้อมูลเชิงอันดับ อย่างไรก็ตาม การขยายความในลักษณะนี้อาจทำให้การปรับแบบจำลองให้เข้ากับข้อมูลทำได้ยากขึ้นมาก

แบบจำลองโลจิตหมวดหมู่พื้นฐาน

แบบจำลองหมวดหมู่พื้นฐานถูกกำหนดโดย

แบบจำลองนี้ไม่ได้กำหนดลำดับให้กับหมวดหมู่ ดังนั้นจึงสามารถนำไปใช้กับข้อมูลเชิงนาม (nominal data) และข้อมูลเชิงลำดับ (ordinal data) ได้เช่นกัน

แบบจำลองสเตอริโอไทป์แบบเรียงลำดับ

แบบจำลองสเตอริโอไทป์แบบเรียงลำดับถูกกำหนดโดย

โดยที่พารามิเตอร์คะแนนถูกจำกัดไว้ดังนี้

นี่เป็นแบบจำลองที่กระชับและเฉพาะเจาะจงกว่าแบบจำลองโลจิตหมวดหมู่พื้นฐาน: สามารถคิดได้ว่าคล้ายกับ.

แบบจำลองภาพลักษณ์เหมารวมแบบไม่เรียงลำดับมีรูปแบบเดียวกันกับแบบจำลองภาพลักษณ์เหมารวมแบบเรียงลำดับ แต่ไม่มีการกำหนดลำดับไว้แบบจำลองนี้สามารถนำไปใช้กับข้อมูลนามนัยได้

โปรดสังเกตว่าคะแนนที่ได้จากการประมาณค่า บ่งชี้ว่าการแยกแยะความแตกต่างระหว่างระดับต่างๆ ของ นั้นง่ายเพียงใดหากแสดงว่าชุดข้อมูลปัจจุบันสำหรับตัวแปรอิสระไม่ได้ให้ข้อมูลมากพอที่จะแยกแยะความแตกต่างระหว่างระดับและแต่ไม่ได้หมายความว่าค่าจริงของและจะห่างกันมากเสมอไป และหากค่าของตัวแปรอิสระเปลี่ยนแปลงไป สำหรับข้อมูลใหม่นั้น คะแนนที่ได้จากการประมาณค่าและอาจห่างกันมากก็ได้

แบบจำลองโลจิตหมวดหมู่ที่อยู่ติดกัน

แบบจำลองหมวดหมู่ที่อยู่ติดกันถูกกำหนดโดย

แม้ว่ารูปแบบที่พบได้บ่อยที่สุด ซึ่งอ้างถึงในAgresti (2010) [ 12 ]ว่าเป็น "รูปแบบอัตราส่วนความน่าจะเป็นตามสัดส่วน" จะถูกกำหนดโดย

แบบจำลองนี้สามารถใช้ได้กับข้อมูลเชิงลำดับเท่านั้น เนื่องจากการสร้างแบบจำลองความน่าจะเป็นของการเปลี่ยนแปลงจากหมวดหมู่หนึ่งไปยังอีกหมวดหมู่หนึ่งนั้นหมายความว่าหมวดหมู่เหล่านั้นมีลำดับอยู่

แบบจำลองโลจิตของหมวดหมู่ที่อยู่ติดกันสามารถมองได้ว่าเป็นกรณีพิเศษของแบบจำลองโลจิตของหมวดหมู่พื้นฐาน โดยที่แบบจำลองโลจิตของหมวดหมู่ที่อยู่ติดกันยังสามารถมองได้ว่าเป็นกรณีพิเศษของแบบจำลองสเตอริโอไทป์แบบเรียงลำดับ โดยที่ กล่าวคือ ระยะห่างระหว่างถูกกำหนดไว้ล่วงหน้า แทนที่จะประมาณค่าจากข้อมูล

การเปรียบเทียบระหว่างโมเดลต่างๆ

แบบจำลองอัตราส่วนความน่าจะเป็นแบบสัดส่วนมีโครงสร้างที่แตกต่างจากแบบจำลองอีกสามแบบอย่างมาก และยังมีนัยสำคัญที่แตกต่างกันด้วย โปรดสังเกตว่าขนาดของกลุ่มอ้างอิงในแบบจำลองอัตราส่วนความน่าจะเป็นแบบสัดส่วนจะแปรผันตามเนื่องจากจะถูกเปรียบเทียบกับในขณะที่ในแบบจำลองอื่นๆ ขนาดของกลุ่มอ้างอิงจะคงที่ เนื่องจากจะถูกเปรียบเทียบกับ หรือ

โมเดลทั้งหมดมีหลายรูปแบบที่ใช้ฟังก์ชันเชื่อมโยงที่แตกต่างกัน เช่น ฟังก์ชันเชื่อมโยงแบบโพรบิต หรือฟังก์ชันเชื่อมโยงแบบคอมพลีเมนต์ล็อก-ล็อก

การทดสอบทางสถิติ

ความแตกต่างในข้อมูลเชิงลำดับสามารถทดสอบได้โดยใช้ การ ทดสอบ อันดับ

การแสดงภาพและการแสดงผล

ข้อมูลเชิงลำดับสามารถแสดงภาพได้หลายวิธี การแสดงผลทั่วไปคือแผนภูมิแท่งหรือแผนภูมิวงกลมตารางก็มีประโยชน์สำหรับการแสดงข้อมูลเชิงลำดับและความถี่เช่นกันแผนภูมิโมเสกสามารถใช้เพื่อแสดงความสัมพันธ์ระหว่างตัวแปรเชิงลำดับและตัวแปรนามหรือเชิงลำดับได้[ 13 ]แผนภูมินูน—แผนภูมิเส้นที่แสดงการจัดอันดับสัมพัทธ์ของรายการจากจุดเวลาหนึ่งไปยังจุดเวลาถัดไป—ก็เหมาะสมสำหรับข้อมูลเชิงลำดับเช่นกัน[ 14 ]

สามารถใช้การไล่ ระดับสีหรือ ระดับ สีเทาเพื่อแสดงลำดับของข้อมูลได้ มาตราส่วนทิศทางเดียว เช่น ช่วงรายได้ สามารถแสดงด้วยแผนภูมิแท่ง โดยที่ความอิ่มตัวหรือความสว่างของสีเดียวที่เพิ่มขึ้น (หรือลดลง) แสดงถึงรายได้ที่สูงขึ้น (หรือต่ำลง) การกระจายเชิงลำดับของตัวแปรที่วัดบนมาตราส่วนสองทิศทาง เช่น มาตราส่วนลิเคิร์ต ก็สามารถแสดงด้วยสีในแผนภูมิแท่งซ้อนกันได้เช่นกัน อาจใช้สีกลาง (ขาวหรือเทา) สำหรับจุดกึ่งกลาง (ศูนย์หรือเป็นกลาง) โดยใช้สีที่ตัดกันในทิศทางตรงกันข้ามจากจุดกึ่งกลาง โดยที่ความอิ่มตัวหรือความมืดของสีที่เพิ่มขึ้นสามารถบ่งบอกถึงหมวดหมู่ที่อยู่ห่างจากจุดกึ่งกลางมากขึ้น[ 15 ]แผนที่ Choroplethยังใช้การแรเงาสีหรือระดับสีเทาเพื่อแสดงข้อมูลเชิงลำดับ[ 16 ]

ตัวอย่างแผนภูมิแท่งแสดงความคิดเห็นเกี่ยวกับการใช้จ่ายด้านกลาโหม
ตัวอย่างกราฟแสดงความสัมพันธ์ระหว่างความคิดเห็นเกี่ยวกับการใช้จ่ายด้านกลาโหมตามพรรคการเมือง
ตัวอย่างแผนภาพโมเสกแสดงความคิดเห็นเกี่ยวกับการใช้จ่ายด้านกลาโหมแยกตามพรรคการเมือง
ตัวอย่างแผนภูมิแท่งซ้อนแสดงความคิดเห็นเกี่ยวกับการใช้จ่ายด้านกลาโหมแยกตามพรรคการเมือง

แอปพลิเคชัน

การใช้ข้อมูลเชิงลำดับสามารถพบได้ในงานวิจัยส่วนใหญ่ที่สร้างข้อมูลเชิงหมวดหมู่ บริบทที่มักมีการเก็บรวบรวมข้อมูลเชิงลำดับ ได้แก่ สังคมศาสตร์และพฤติกรรมศาสตร์ และภาครัฐและภาคธุรกิจ ซึ่งมีการเก็บรวบรวมข้อมูลจากการสังเกต การทดสอบ หรือแบบสอบถามจากบุคคลบริบททั่วไปสำหรับการเก็บรวบรวมข้อมูลเชิงลำดับ ได้แก่การวิจัยแบบสำรวจ [ 17 ] [ 18 ]และการ ทดสอบ สติปัญญาความถนัดบุคลิกภาพและการตัดสินใจ[ 2 ] [ 4 ] : 89–90

การคำนวณ 'ขนาดผลกระทบ' (Cliff's Delta d ) โดยใช้ข้อมูลเชิงลำดับได้รับการแนะนำให้เป็นการวัดความเหนือกว่าทางสถิติ[ 19 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Agresti, Alan (2010). การวิเคราะห์ข้อมูลเชิงหมวดหมู่เรียงลำดับ (ฉบับที่ 2). โฮโบเคน, นิวเจอร์ซีย์: ไวลีย์. ISBN 978-0-470-08289-8.
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Ordinal_data&oldid=1351010579 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ข้อมูลเชิงลำดับ

ข้อมูลเชิงลำดับ เป็น ประเภทข้อมูลเชิงสถิติ แบบจัดกลุ่ม โดยตัวแปรมีหมวดหมู่ที่เรียงลำดับตามธรรมชาติ และไม่ทราบระยะห่างระหว่างหมวดหมู่ [ 1 ] : 2 ข้อมูลเหล่านี้มีอยู่ใน...

ตัวอย่างของข้อมูลเชิงลำดับ

ตัวอย่างที่รู้จักกันดีของข้อมูลเชิงลำดับคือ มาตราส่วนลิเคิร์ต ตัวอย่างของมาตราส่วนลิเคิร์ตคือ: [ 4 ] : 685

วิธีการวิเคราะห์ข้อมูลเชิงลำดับ

การวิเคราะห์ข้อมูลเชิงลำดับต้องใช้ชุดการวิเคราะห์ที่แตกต่างจากตัวแปรเชิงคุณภาพอื่นๆ วิธีการเหล่านี้รวมเอาลำดับตามธรรมชาติของตัวแปรเพื่อหลีกเลี่ยงการสูญเสียพลัง [ 1 ] : 88 การคำนวณค่าเฉลี่ยของตัวอย่างข้อมูลเชิงลำดับนั้นไม่แนะนำ...

ทั่วไป

Stevens (1946) โต้แย้งว่า เนื่องจากสมมติฐานเรื่องระยะห่างที่เท่ากันระหว่างหมวดหมู่ไม่เป็นจริงสำหรับข้อมูลเชิงลำดับ การใช้ค่า เฉลี่ย และ ส่วนเบี่ยงเบนมาตรฐาน ในการอธิบายการแจกแจงเชิงลำดับและสถิติเชิงอนุมานที่อิงตามค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานจึงไม่เหมาะสม...