อ่าน 8 นาที
ข้อมูลเชิงลำดับ
ข้อมูลเชิงลำดับ เป็น ประเภทข้อมูลเชิงสถิติ แบบจัดกลุ่ม โดยตัวแปรมีหมวดหมู่ที่เรียงลำดับตามธรรมชาติ และไม่ทราบระยะห่างระหว่างหมวดหมู่ [ 1 ] : 2 ข้อมูลเหล่านี้มีอยู่ใน...
ข้อมูลเชิงลำดับ
ข้อมูลเชิงลำดับเป็นประเภทข้อมูลเชิงสถิติ แบบจัดกลุ่ม โดยตัวแปรมีหมวดหมู่ที่เรียงลำดับตามธรรมชาติ และไม่ทราบระยะห่างระหว่างหมวดหมู่[ 1 ] : 2 ข้อมูลเหล่านี้มีอยู่ในมาตราส่วนเชิงลำดับซึ่งเป็นหนึ่งในสี่ระดับการวัด ที่ SS Stevensอธิบายไว้ในปี 1946 มาตราส่วนเชิงลำดับแตกต่างจากมาตราส่วนนามโดยมีลำดับ[ 2 ]นอกจากนี้ยังแตกต่างจากมาตราส่วนช่วงและมาตราส่วนอัตราส่วนโดยไม่มีความกว้างของหมวดหมู่ที่แสดงถึงการเพิ่มขึ้นที่เท่ากันของคุณลักษณะพื้นฐาน[ 3 ]
ตัวอย่างของข้อมูลเชิงลำดับ
ตัวอย่างที่รู้จักกันดีของข้อมูลเชิงลำดับคือมาตราส่วนลิเคิร์ตตัวอย่างของมาตราส่วนลิเคิร์ตคือ: [ 4 ] : 685
| ชอบ | คล้ายๆ นะ | เป็นกลาง | ไม่ค่อยชอบเท่าไหร่ | ไม่ชอบ |
|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 |
ตัวอย่างของข้อมูลเชิงลำดับมักพบได้ในแบบสอบถาม เช่น คำถามสำรวจ "สุขภาพโดยรวมของคุณแย่ พอใช้ ดี หรือดีเยี่ยม?" อาจมีการเข้ารหัสคำตอบเหล่านั้นเป็น 1, 2, 3 และ 4 ตามลำดับ บางครั้งข้อมูลในมาตราส่วนช่วงหรือมาตราส่วนอัตราส่วนจะถูกจัดกลุ่มลงในมาตราส่วนเชิงลำดับ เช่น บุคคลที่ทราบรายได้อาจถูกจัดกลุ่มเป็นหมวดหมู่รายได้ 0–19,999 ดอลลาร์ 20,000–39,999 ดอลลาร์ 40,000–59,999 ดอลลาร์ ... ซึ่งอาจถูกเข้ารหัสเป็น 1, 2, 3, 4, ... ตัวอย่างอื่นๆ ของข้อมูลเชิงลำดับ ได้แก่ สถานะทางเศรษฐกิจและสังคม ยศทางทหาร และเกรดตัวอักษรสำหรับหลักสูตร[ 5 ]
วิธีการวิเคราะห์ข้อมูลเชิงลำดับ
การวิเคราะห์ข้อมูลเชิงลำดับต้องใช้ชุดการวิเคราะห์ที่แตกต่างจากตัวแปรเชิงคุณภาพอื่นๆ วิธีการเหล่านี้รวมเอาลำดับตามธรรมชาติของตัวแปรเพื่อหลีกเลี่ยงการสูญเสียพลัง[ 1 ] : 88 การคำนวณค่าเฉลี่ยของตัวอย่างข้อมูลเชิงลำดับนั้นไม่แนะนำ ควรใช้มาตรวัดแนวโน้มศูนย์กลางอื่นๆ เช่น มัธยฐานหรือฐานนิยม ซึ่งโดยทั่วไปแล้วจะเหมาะสมกว่า[ 6 ]
ทั่วไป
Stevens (1946) โต้แย้งว่า เนื่องจากสมมติฐานเรื่องระยะห่างที่เท่ากันระหว่างหมวดหมู่ไม่เป็นจริงสำหรับข้อมูลเชิงลำดับ การใช้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน ในการอธิบายการแจกแจงเชิงลำดับและสถิติเชิงอนุมานที่อิงตามค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานจึงไม่เหมาะสม ควรใช้มาตรวัดเชิงตำแหน่ง เช่น ค่ามัธยฐานและเปอร์เซ็นไทล์ รวมถึงสถิติเชิงพรรณนา ที่เหมาะสมสำหรับข้อมูลเชิงนาม (จำนวนกรณี ค่าฐานนิยม ความสัมพันธ์เชิงความน่าจะเป็น) แทน [ 3 ] : 678 วิธีการที่ไม่ใช้พารามิเตอร์ได้รับการเสนอให้เป็นวิธีการที่เหมาะสมที่สุดสำหรับสถิติเชิงอนุมานที่เกี่ยวข้องกับข้อมูลเชิงลำดับ (เช่นKendall's Wสัมประสิทธิ์สหสัมพันธ์ลำดับของ Spearmanเป็นต้น) โดยเฉพาะอย่างยิ่งวิธีการที่พัฒนาขึ้นสำหรับการวิเคราะห์การวัดแบบจัดอันดับ[ 5 ] : 25–28 อย่างไรก็ตาม การใช้สถิติเชิงพารามิเตอร์สำหรับข้อมูลเชิงลำดับอาจอนุญาตได้โดยมีข้อควรระวังบางประการเพื่อใช้ประโยชน์จากขั้นตอนทางสถิติที่มีอยู่หลากหลายมากขึ้น[ 7 ] [ 8 ] [ 4 ] : 90
สถิติตัวแปรเดียว
แทนที่จะใช้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน สถิติแบบเอกตัวแปรที่เหมาะสมสำหรับข้อมูลเชิงลำดับ ได้แก่ ค่ามัธยฐาน[ 9 ] : 59–61 เปอร์เซ็นไทล์อื่นๆ (เช่น ควาร์ไทล์และเดซิไล์) [ 9 ] : 71 และส่วนเบี่ยงเบนของควาร์ไทล์[ 9 ] : 77 การทดสอบตัวอย่างเดียวสำหรับข้อมูลเชิงลำดับ ได้แก่การทดสอบตัวอย่างเดียวของ Kolmogorov-Smirnov [ 5 ] : 51–55 การ ทดสอบ การวิ่งตัวอย่างเดียว[ 5 ] : 58–64 และการทดสอบจุดเปลี่ยน[ 5 ] : 64–71
สถิติแบบสองตัวแปร
แทนที่จะทดสอบความแตกต่างของค่าเฉลี่ยด้วยt -testความแตกต่างในการกระจายของข้อมูลเชิงลำดับจากสองตัวอย่างอิสระสามารถทดสอบได้ด้วยการทดสอบMann -Whitney [ 9 ] : 259–264 runs [ 9 ] : 253–259 Smirnov [ 9 ] : 266–269 และsigned-ranks [ 9 ] : 269–273 การทดสอบสำหรับสองตัวอย่างที่เกี่ยวข้องกันหรือจับคู่กัน ได้แก่ การทดสอบ sign test [ 5 ] : 80–87 และการทดสอบ Wilcoxon signed ranks test [ 5 ] : 87–95 การวิเคราะห์ความแปรปรวนด้วยอันดับ[ 9 ] : 367–369 และการทดสอบ Jonckheere สำหรับทางเลือกที่เรียงลำดับ[ 5 ] : 216–222 สามารถดำเนินการกับข้อมูลเชิงลำดับแทน ANOVAสำหรับตัวอย่างอิสระได้ การทดสอบสำหรับตัวอย่างที่เกี่ยวข้องกันมากกว่าสองตัวอย่าง ได้แก่การวิเคราะห์ความแปรปรวนแบบสองทางของฟรีดแมนโดยใช้ลำดับ[ 5 ] : 174–183 และการทดสอบของเพจสำหรับทางเลือกที่มีลำดับ [ 5 ] : 184–188 มาตร วัด ความสัมพันธ์ที่เหมาะสมสำหรับตัวแปรที่มีมาตราส่วนเชิงลำดับสองตัว ได้แก่เทาของเคนดัล[ 9 ] : 436–439 แกมมา[ 9 ] : 442–443 rs [ 9 ] : 434–436 และdyx / dxy [ 9 ] : 443
การประยุกต์ใช้การถดถอย
ข้อมูลเชิงลำดับสามารถพิจารณาได้ว่าเป็นตัวแปรเชิงปริมาณ ในการวิเคราะห์การถดถอยโลจิสติกสมการ
คือแบบจำลองและ c รับระดับที่กำหนดของมาตราส่วนเชิงหมวดหมู่[ 1 ] : 189 ในการวิเคราะห์การถดถอยผลลัพธ์ ( ตัวแปรตาม ) ที่เป็นตัวแปรเชิงลำดับสามารถทำนายได้โดยใช้การถดถอยเชิงลำดับ แบบต่างๆ เช่นโลจิตแบบเรียงลำดับหรือโพรบิตแบบ เรียงลำดับ
ในการวิเคราะห์การถดถอย/สหสัมพันธ์หลายตัวแปร ข้อมูลเชิงลำดับสามารถรองรับได้โดยใช้พหุนามกำลังและผ่านการปรับคะแนนและอันดับให้เป็นมาตรฐาน[ 10 ]
แนวโน้มเชิงเส้น
แนวโน้มเชิงเส้นยังใช้เพื่อหาความสัมพันธ์ระหว่างข้อมูลเชิงลำดับและตัวแปรเชิงหมวดหมู่อื่นๆ โดยปกติในตารางความสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์rจะพบระหว่างตัวแปร โดยที่rอยู่ระหว่าง -1 และ 1 ในการทดสอบแนวโน้ม จะใช้สถิติทดสอบดังนี้:
ใช้ในกรณีที่nคือขนาดตัวอย่าง[ 1 ] : 87
สามารถหาค่าR ได้โดยให้ เป็นคะแนนของแถว และเป็นคะแนนของคอลัมน์ ให้เป็นค่าเฉลี่ยของคะแนนแถว ในขณะที่แล้วคือความน่าจะเป็นของแถวแบบมาร์จินัล และคือความน่าจะเป็นของคอลัมน์แบบมาร์จินัลคำนวณค่า R ได้ดังนี้:
วิธีการจำแนกประเภท
วิธีการจำแนกประเภทได้รับการพัฒนาสำหรับข้อมูลเชิงลำดับด้วยเช่นกัน ข้อมูลจะถูกแบ่งออกเป็นหมวดหมู่ต่างๆ โดยที่การสังเกตแต่ละครั้งจะคล้ายคลึงกัน การกระจายจะถูกวัดและลดให้น้อยที่สุดในแต่ละกลุ่มเพื่อเพิ่มผลลัพธ์การจำแนกประเภทให้สูงสุด ฟังก์ชันการกระจายจะถูกใช้ในทฤษฎีสารสนเทศ[ 11 ]
แบบจำลองทางสถิติสำหรับข้อมูลเชิงลำดับ
มีแบบจำลองที่แตกต่างกันหลายแบบที่สามารถใช้เพื่ออธิบายโครงสร้างของข้อมูลเชิงลำดับได้[ 12 ]แบบจำลองหลักสี่ประเภทจะอธิบายไว้ด้านล่าง โดยแต่ละประเภทกำหนดไว้สำหรับตัวแปรสุ่มโดยมีระดับที่จัดทำดัชนีโดย
โปรดทราบว่าในคำจำกัดความของแบบจำลองด้านล่าง ค่าของและจะไม่เหมือนกันสำหรับทุกแบบจำลองสำหรับชุดข้อมูลเดียวกัน แต่สัญลักษณ์นี้ใช้เพื่อเปรียบเทียบโครงสร้างของแบบจำลองต่างๆ
แบบจำลองอัตราส่วนความน่าจะเป็น
แบบจำลองที่ใช้กันทั่วไปที่สุดสำหรับข้อมูลเชิงลำดับคือแบบจำลองอัตราส่วนความน่าจะเป็นแบบสัดส่วน ซึ่งกำหนดโดย
โดยที่พารามิเตอร์อธิบายการกระจายพื้นฐานของข้อมูลเชิงลำดับคือตัวแปรควบคุม และคือสัมประสิทธิ์ที่อธิบายผลกระทบของตัวแปรควบคุมเหล่านั้น
แบบจำลองนี้สามารถขยายความได้โดยการกำหนดแบบจำลองโดยใช้แทนซึ่งจะทำให้แบบจำลองนี้เหมาะสมสำหรับข้อมูลเชิงนาม (ซึ่งหมวดหมู่ไม่มีลำดับตามธรรมชาติ) เช่นเดียวกับข้อมูลเชิงอันดับ อย่างไรก็ตาม การขยายความในลักษณะนี้อาจทำให้การปรับแบบจำลองให้เข้ากับข้อมูลทำได้ยากขึ้นมาก
แบบจำลองโลจิตหมวดหมู่พื้นฐาน
แบบจำลองหมวดหมู่พื้นฐานถูกกำหนดโดย
แบบจำลองนี้ไม่ได้กำหนดลำดับให้กับหมวดหมู่ ดังนั้นจึงสามารถนำไปใช้กับข้อมูลเชิงนาม (nominal data) และข้อมูลเชิงลำดับ (ordinal data) ได้เช่นกัน
แบบจำลองสเตอริโอไทป์แบบเรียงลำดับ
แบบจำลองสเตอริโอไทป์แบบเรียงลำดับถูกกำหนดโดย
โดยที่พารามิเตอร์คะแนนถูกจำกัดไว้ดังนี้
นี่เป็นแบบจำลองที่กระชับและเฉพาะเจาะจงกว่าแบบจำลองโลจิตหมวดหมู่พื้นฐาน: สามารถคิดได้ว่าคล้ายกับ.
แบบจำลองภาพลักษณ์เหมารวมแบบไม่เรียงลำดับมีรูปแบบเดียวกันกับแบบจำลองภาพลักษณ์เหมารวมแบบเรียงลำดับ แต่ไม่มีการกำหนดลำดับไว้แบบจำลองนี้สามารถนำไปใช้กับข้อมูลนามนัยได้
โปรดสังเกตว่าคะแนนที่ได้จากการประมาณค่า บ่งชี้ว่าการแยกแยะความแตกต่างระหว่างระดับต่างๆ ของ นั้นง่ายเพียงใดหากแสดงว่าชุดข้อมูลปัจจุบันสำหรับตัวแปรอิสระไม่ได้ให้ข้อมูลมากพอที่จะแยกแยะความแตกต่างระหว่างระดับและแต่ไม่ได้หมายความว่าค่าจริงของและจะห่างกันมากเสมอไป และหากค่าของตัวแปรอิสระเปลี่ยนแปลงไป สำหรับข้อมูลใหม่นั้น คะแนนที่ได้จากการประมาณค่าและอาจห่างกันมากก็ได้
แบบจำลองโลจิตหมวดหมู่ที่อยู่ติดกัน
แบบจำลองหมวดหมู่ที่อยู่ติดกันถูกกำหนดโดย
แม้ว่ารูปแบบที่พบได้บ่อยที่สุด ซึ่งอ้างถึงในAgresti (2010) [ 12 ]ว่าเป็น "รูปแบบอัตราส่วนความน่าจะเป็นตามสัดส่วน" จะถูกกำหนดโดย
แบบจำลองนี้สามารถใช้ได้กับข้อมูลเชิงลำดับเท่านั้น เนื่องจากการสร้างแบบจำลองความน่าจะเป็นของการเปลี่ยนแปลงจากหมวดหมู่หนึ่งไปยังอีกหมวดหมู่หนึ่งนั้นหมายความว่าหมวดหมู่เหล่านั้นมีลำดับอยู่
แบบจำลองโลจิตของหมวดหมู่ที่อยู่ติดกันสามารถมองได้ว่าเป็นกรณีพิเศษของแบบจำลองโลจิตของหมวดหมู่พื้นฐาน โดยที่แบบจำลองโลจิตของหมวดหมู่ที่อยู่ติดกันยังสามารถมองได้ว่าเป็นกรณีพิเศษของแบบจำลองสเตอริโอไทป์แบบเรียงลำดับ โดยที่ กล่าวคือ ระยะห่างระหว่างถูกกำหนดไว้ล่วงหน้า แทนที่จะประมาณค่าจากข้อมูล
การเปรียบเทียบระหว่างโมเดลต่างๆ
แบบจำลองอัตราส่วนความน่าจะเป็นแบบสัดส่วนมีโครงสร้างที่แตกต่างจากแบบจำลองอีกสามแบบอย่างมาก และยังมีนัยสำคัญที่แตกต่างกันด้วย โปรดสังเกตว่าขนาดของกลุ่มอ้างอิงในแบบจำลองอัตราส่วนความน่าจะเป็นแบบสัดส่วนจะแปรผันตามเนื่องจากจะถูกเปรียบเทียบกับในขณะที่ในแบบจำลองอื่นๆ ขนาดของกลุ่มอ้างอิงจะคงที่ เนื่องจากจะถูกเปรียบเทียบกับ หรือ
ฟังก์ชันการเชื่อมโยงที่แตกต่างกัน
โมเดลทั้งหมดมีหลายรูปแบบที่ใช้ฟังก์ชันเชื่อมโยงที่แตกต่างกัน เช่น ฟังก์ชันเชื่อมโยงแบบโพรบิต หรือฟังก์ชันเชื่อมโยงแบบคอมพลีเมนต์ล็อก-ล็อก
การทดสอบทางสถิติ
ความแตกต่างในข้อมูลเชิงลำดับสามารถทดสอบได้โดยใช้ การ ทดสอบ อันดับ
การแสดงภาพและการแสดงผล
ข้อมูลเชิงลำดับสามารถแสดงภาพได้หลายวิธี การแสดงผลทั่วไปคือแผนภูมิแท่งหรือแผนภูมิวงกลมตารางก็มีประโยชน์สำหรับการแสดงข้อมูลเชิงลำดับและความถี่เช่นกันแผนภูมิโมเสกสามารถใช้เพื่อแสดงความสัมพันธ์ระหว่างตัวแปรเชิงลำดับและตัวแปรนามหรือเชิงลำดับได้[ 13 ]แผนภูมินูน—แผนภูมิเส้นที่แสดงการจัดอันดับสัมพัทธ์ของรายการจากจุดเวลาหนึ่งไปยังจุดเวลาถัดไป—ก็เหมาะสมสำหรับข้อมูลเชิงลำดับเช่นกัน[ 14 ]
สามารถใช้การไล่ ระดับสีหรือ ระดับ สีเทาเพื่อแสดงลำดับของข้อมูลได้ มาตราส่วนทิศทางเดียว เช่น ช่วงรายได้ สามารถแสดงด้วยแผนภูมิแท่ง โดยที่ความอิ่มตัวหรือความสว่างของสีเดียวที่เพิ่มขึ้น (หรือลดลง) แสดงถึงรายได้ที่สูงขึ้น (หรือต่ำลง) การกระจายเชิงลำดับของตัวแปรที่วัดบนมาตราส่วนสองทิศทาง เช่น มาตราส่วนลิเคิร์ต ก็สามารถแสดงด้วยสีในแผนภูมิแท่งซ้อนกันได้เช่นกัน อาจใช้สีกลาง (ขาวหรือเทา) สำหรับจุดกึ่งกลาง (ศูนย์หรือเป็นกลาง) โดยใช้สีที่ตัดกันในทิศทางตรงกันข้ามจากจุดกึ่งกลาง โดยที่ความอิ่มตัวหรือความมืดของสีที่เพิ่มขึ้นสามารถบ่งบอกถึงหมวดหมู่ที่อยู่ห่างจากจุดกึ่งกลางมากขึ้น[ 15 ]แผนที่ Choroplethยังใช้การแรเงาสีหรือระดับสีเทาเพื่อแสดงข้อมูลเชิงลำดับ[ 16 ]
แอปพลิเคชัน
การใช้ข้อมูลเชิงลำดับสามารถพบได้ในงานวิจัยส่วนใหญ่ที่สร้างข้อมูลเชิงหมวดหมู่ บริบทที่มักมีการเก็บรวบรวมข้อมูลเชิงลำดับ ได้แก่ สังคมศาสตร์และพฤติกรรมศาสตร์ และภาครัฐและภาคธุรกิจ ซึ่งมีการเก็บรวบรวมข้อมูลจากการสังเกต การทดสอบ หรือแบบสอบถามจากบุคคลบริบททั่วไปสำหรับการเก็บรวบรวมข้อมูลเชิงลำดับ ได้แก่การวิจัยแบบสำรวจ [ 17 ] [ 18 ]และการ ทดสอบ สติปัญญาความถนัดบุคลิกภาพและการตัดสินใจ[ 2 ] [ 4 ] : 89–90
การคำนวณ 'ขนาดผลกระทบ' (Cliff's Delta d ) โดยใช้ข้อมูลเชิงลำดับได้รับการแนะนำให้เป็นการวัดความเหนือกว่าทางสถิติ[ 19 ]
ดูเพิ่มเติม
อ่านเพิ่มเติม
- Agresti, Alan (2010). การวิเคราะห์ข้อมูลเชิงหมวดหมู่เรียงลำดับ (ฉบับที่ 2). โฮโบเคน, นิวเจอร์ซีย์: ไวลีย์. ISBN 978-0-470-08289-8.
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ข้อมูลเชิงลำดับ
ข้อมูลเชิงลำดับ เป็น ประเภทข้อมูลเชิงสถิติ แบบจัดกลุ่ม โดยตัวแปรมีหมวดหมู่ที่เรียงลำดับตามธรรมชาติ และไม่ทราบระยะห่างระหว่างหมวดหมู่ [ 1 ] : 2 ข้อมูลเหล่านี้มีอยู่ใน...
ตัวอย่างของข้อมูลเชิงลำดับ
ตัวอย่างที่รู้จักกันดีของข้อมูลเชิงลำดับคือ มาตราส่วนลิเคิร์ต ตัวอย่างของมาตราส่วนลิเคิร์ตคือ: [ 4 ] : 685
วิธีการวิเคราะห์ข้อมูลเชิงลำดับ
การวิเคราะห์ข้อมูลเชิงลำดับต้องใช้ชุดการวิเคราะห์ที่แตกต่างจากตัวแปรเชิงคุณภาพอื่นๆ วิธีการเหล่านี้รวมเอาลำดับตามธรรมชาติของตัวแปรเพื่อหลีกเลี่ยงการสูญเสียพลัง [ 1 ] : 88 การคำนวณค่าเฉลี่ยของตัวอย่างข้อมูลเชิงลำดับนั้นไม่แนะนำ...
ทั่วไป
Stevens (1946) โต้แย้งว่า เนื่องจากสมมติฐานเรื่องระยะห่างที่เท่ากันระหว่างหมวดหมู่ไม่เป็นจริงสำหรับข้อมูลเชิงลำดับ การใช้ค่า เฉลี่ย และ ส่วนเบี่ยงเบนมาตรฐาน ในการอธิบายการแจกแจงเชิงลำดับและสถิติเชิงอนุมานที่อิงตามค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานจึงไม่เหมาะสม...



