กลับไปหน้าบทความ

อ่าน 8 นาที

ความสัมพันธ์เชิงลำดับ

ใน ทางสถิติ สัมประสิทธิ์ สห สัมพันธ์ลำดับ (rank correlation) คือสถิติประเภทหนึ่งที่ใช้วัด ความสัมพันธ์เชิงลำดับ — ความสัมพันธ์ระหว่าง ลำดับ ของตัวแปร เชิงลำดับ...

ความสัมพันธ์เชิงลำดับ

ในทางสถิติ สัมประสิทธิ์สหสัมพันธ์ลำดับ (rank correlation)คือสถิติประเภทหนึ่งที่ใช้วัดความสัมพันธ์เชิงลำดับ — ความสัมพันธ์ระหว่างลำดับ ของตัวแปร เชิงลำดับที่แตกต่างกันหรือลำดับที่แตกต่างกันของตัวแปรเดียวกัน โดยที่ "ลำดับ" คือการกำหนดป้ายกำกับลำดับ "อันดับแรก" "อันดับสอง" "อันดับสาม" เป็นต้น ให้กับการสังเกตที่แตกต่างกันของตัวแปรเฉพาะตัวหนึ่งสัมประสิทธิ์สหสัมพันธ์ลำดับจะวัดระดับความคล้ายคลึงกันระหว่างสองลำดับ และสามารถใช้ประเมินความสำคัญของความสัมพันธ์ระหว่างกันได้ ตัวอย่างเช่น วิธีการวัดความสำคัญแบบ ไม่ใช้พารามิเตอร์ที่ใช้สัมประสิทธิ์สหสัมพันธ์ลำดับสองวิธีที่ใช้กันทั่วไป ได้แก่การทดสอบ Mann–Whitney Uและ การทดสอบ Wilcoxon signed-rank

บริบท

ตัวอย่างเช่น หากตัวแปรหนึ่งคือเอกลักษณ์ของโปรแกรมบาสเกตบอลของวิทยาลัย และอีกตัวแปรหนึ่งคือเอกลักษณ์ของโปรแกรมฟุตบอลของวิทยาลัย เราสามารถทดสอบความสัมพันธ์ระหว่างอันดับในโพลของโปรแกรมทั้งสองประเภทได้ เช่น วิทยาลัยที่มีโปรแกรมบาสเกตบอลอันดับสูงกว่า มักจะมีโปรแกรมฟุตบอลอันดับสูงกว่าด้วยหรือไม่ ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสามารถวัดความสัมพันธ์นั้นได้ และการวัดนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์อันดับสามารถแสดงให้เห็นว่าความสัมพันธ์ที่วัดได้นั้นเล็กพอที่จะเป็นเพียงความบังเอิญหรือไม่

หากมีตัวแปรเพียงตัวเดียว คือ เอกลักษณ์ของโปรแกรมฟุตบอลระดับวิทยาลัย แต่โปรแกรมนั้นอยู่ภายใต้การจัดอันดับสองแบบที่แตกต่างกัน (เช่น การจัดอันดับโดยโค้ช และการจัดอันดับโดยนักเขียนข่าวกีฬา) ความคล้ายคลึงกันของการจัดอันดับจากสองแบบนั้นสามารถวัดได้ด้วยสัมประสิทธิ์สหสัมพันธ์อันดับ

ตัวอย่างอื่น ในตารางความสัมพันธ์ที่มีรายได้ต่ำรายได้ปานกลางและรายได้สูงในตัวแปรแถว และระดับการศึกษา— ไม่ จบมัธยมปลาย จบมัธยมปลาย จบมหาวิทยาลัยในตัวแปรคอลัมน์[ 1 ]ค่าสัมประสิทธิ์สหสัมพันธ์ลำดับจะวัดความสัมพันธ์ระหว่างรายได้และระดับการศึกษา

สัมประสิทธิ์สหสัมพันธ์

สถิติ ความสัมพันธ์เชิงอันดับที่เป็นที่นิยมบางส่วน ได้แก่

  1. ค่า ρของสเปียร์แมน
  2. τของเคนดัลล์
  3. γของ Goodman และ Kruskal
  4. ซอมเมอร์ส ดี

ค่าสัมประสิทธิ์สหสัมพันธ์ลำดับที่เพิ่มขึ้นบ่งชี้ถึงความสอดคล้องกันระหว่างลำดับที่เพิ่มขึ้น ค่าสัมประสิทธิ์อยู่ในช่วง [−1, 1] และมีค่าดังนี้:

  • 1. ถ้าความสอดคล้องระหว่างอันดับทั้งสองสมบูรณ์แบบ อันดับทั้งสองก็จะเหมือนกัน
  • 0 หากการจัดอันดับเป็นอิสระต่อกันอย่างสมบูรณ์
  • -1 ถ้าความแตกต่างระหว่างอันดับทั้งสองสมบูรณ์แบบ กล่าวคือ อันดับหนึ่งเป็นค่าตรงข้ามกับอีกอันดับหนึ่ง

ตามแนวคิดของDiaconis (1988)การจัดอันดับสามารถมองได้ว่าเป็นการเรียงสับเปลี่ยนของเซตของวัตถุ ดังนั้นเราจึงสามารถมองการจัดอันดับที่สังเกตได้ว่าเป็นข้อมูลที่ได้มาเมื่อปริภูมิของตัวอย่าง (ระบุด้วย) กลุ่มสมมาตรจากนั้นเราสามารถแนะนำเมตริกทำให้กลุ่มสมมาตรกลายเป็นปริภูมิเมตริกเมตริกที่แตกต่างกันจะสอดคล้องกับความสัมพันธ์ของการจัดอันดับที่แตกต่างกัน

สัมประสิทธิ์สหสัมพันธ์ทั่วไป

Kendall 1970 [ 2 ]แสดงให้เห็นว่าค่า tau ของเขาและค่า rho ของ Spearman เป็นกรณีเฉพาะของสัมประสิทธิ์สหสัมพันธ์ทั่วไป

สมมติว่าเรามีเซตของวัตถุ ซึ่งกำลังถูกพิจารณาโดยสัมพันธ์กับคุณสมบัติสองประการ ซึ่งแทนด้วยและโดยก่อให้เกิดเซตของค่าและสำหรับบุคคลสองบุคคลใดๆ เช่นบุคคลที่ และบุคคลที่ เราจะกำหนดคะแนน -score ซึ่งแทนด้วยและคะแนน-score ซึ่งแทนด้วยข้อกำหนดเพียงอย่างเดียวสำหรับฟังก์ชันเหล่านี้คือ ต้องเป็นฟังก์ชันสมมาตรผกผัน ดังนั้นและ(โปรดทราบว่าโดยเฉพาะอย่างยิ่งถ้า) จากนั้นสัมประสิทธิ์สหสัมพันธ์ทั่วไปจะถูกกำหนดเป็น

ในทำนองเดียวกัน หากรวบรวมสัมประสิทธิ์ทั้งหมดไว้ในเมทริกซ์และโดยที่และแล้ว

โดย ที่ ผลคูณภายในของ Frobeniusและ นอร์ม ของFrobeniusคืออะไรโดยเฉพาะอย่างยิ่ง สัมประสิทธิ์สหสัมพันธ์ทั่วไปคือโคไซน์ของมุมระหว่างเมทริกซ์และ

ค่า τ ของ Kendall เป็นกรณีพิเศษ

ถ้าและคือลำดับของสมาชิกตามคุณภาพ และคุณภาพ ตามลำดับ เราสามารถกำหนดได้ว่า

ผลรวมคือจำนวนคู่ที่สอดคล้องกันลบด้วยจำนวนคู่ที่ไม่สอดคล้องกัน (ดูค่าสัมประสิทธิ์สหสัมพันธ์ลำดับเคนดัลเทา ) ผลรวมก็คือจำนวนพจน์นั่นเองดังนั้นในกรณีนี้

ค่า ρ ของสเปียร์แมนเป็นกรณีพิเศษ

ถ้าและคือลำดับของสมาชิก ตามและคุณภาพ ตามลำดับ เราอาจพิจารณาเมทริกซ์ที่กำหนดโดย

ผลรวมและเท่ากัน เนื่องจากทั้งและมีค่าตั้งแต่ถึงดังนั้น

เพื่อลดความซับซ้อนของนิพจน์นี้ ให้แทนผลต่างของอันดับสำหรับแต่ละนอกจากนี้ ให้เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีการแจกแจงแบบเอกรูปบนเนื่องจากอันดับเป็นเพียงการเรียงสับเปลี่ยนของเราจึงสามารถมองว่าทั้งสองเป็นตัวแปรสุ่มที่มีการแจกแจงแบบโดยใช้ผลลัพธ์การหาผลรวม พื้นฐาน จากคณิตศาสตร์แบบไม่ต่อเนื่อง เราสามารถเห็นได้ง่ายว่าสำหรับตัวแปรสุ่มที่มีการแจกแจงแบบเอกรูปเรามี และ และดังนั้น ทีนี้ การสังเกตสมมาตรทำให้เราสามารถคำนวณส่วนต่างๆ ของ ได้ ดังนี้:

และ

เพราะฉะนั้น

ความแตกต่างระหว่างอันดับอยู่ที่ไหน ซึ่งก็คือ ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมนนั่นเอง

ความสัมพันธ์แบบลำดับ-ไบซีเรียล

Gene Glass (1965) ตั้งข้อสังเกตว่าค่าสัมประสิทธิ์สหสัมพันธ์แบบลำดับ-ไบซีเรียลสามารถหาได้จากค่าสัมประสิทธิ์สหสัมพันธ์ของ Spearman “เราสามารถหาค่าสัมประสิทธิ์ที่กำหนดบนXซึ่งเป็นตัวแปรทวิภาค และYซึ่งเป็นตัวแปรลำดับ ซึ่งประมาณค่า rho ของ Spearman ระหว่าง X และ Y ในลักษณะเดียวกับที่ค่า r แบบไบซีเรียลประมาณค่าr ของ Pearson ระหว่างตัวแปรปกติสองตัว” (หน้า 91) ค่าสัมประสิทธิ์สหสัมพันธ์แบบลำดับ-ไบซีเรียลได้รับการแนะนำเมื่อเก้าปีก่อนโดย Edward Cureton (1956) ในฐานะมาตรวัดสหสัมพันธ์ลำดับเมื่อลำดับอยู่ในสองกลุ่ม[ 3 ]

สูตรความแตกต่างอย่างง่ายของเคอร์บี้

เดฟ เคอร์บี (2014) แนะนำให้ใช้ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสอง (rank-biserial) เป็นตัววัดเพื่อแนะนำนักเรียนให้รู้จักกับค่าสัมประสิทธิ์สหสัมพันธ์อันดับ เนื่องจากตรรกะทั่วไปสามารถอธิบายได้ในระดับเบื้องต้น ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสองนี้เป็นค่าสัมประสิทธิ์สหสัมพันธ์ที่ใช้กับการทดสอบ Mann–Whitney Uซึ่งเป็นวิธีการที่นิยมสอนในหลักสูตรสถิติเบื้องต้นระดับมหาวิทยาลัย ข้อมูลสำหรับการทดสอบนี้ประกอบด้วยสองกลุ่ม และสำหรับสมาชิกแต่ละคนในกลุ่ม ผลลัพธ์จะถูกจัดอันดับสำหรับการศึกษาทั้งหมด

เคอร์บีแสดงให้เห็นว่าค่าสัมประสิทธิ์สหสัมพันธ์ลำดับนี้สามารถแสดงได้ในแง่ของสองแนวคิด ได้แก่ เปอร์เซ็นต์ของข้อมูลที่สนับสนุนสมมติฐานที่ระบุไว้ และเปอร์เซ็นต์ของข้อมูลที่ไม่สนับสนุนสมมติฐานนั้น สูตรความแตกต่างอย่างง่ายของเคอร์บีระบุว่า ค่าสัมประสิทธิ์สหสัมพันธ์ลำดับสามารถแสดงได้เป็นผลต่างระหว่างสัดส่วนของหลักฐานที่สนับสนุน ( f ) ลบด้วยสัดส่วนของหลักฐานที่ไม่สนับสนุน ( u )

ตัวอย่างและการตีความ

เพื่ออธิบายการคำนวณ สมมติว่าโค้ชฝึกนักวิ่งระยะไกลเป็นเวลาหนึ่งเดือนโดยใช้สองวิธี กลุ่ม A มีนักวิ่ง 5 คน และกลุ่ม B มีนักวิ่ง 4 คน สมมติฐานที่ตั้งไว้คือ วิธี A ทำให้ได้นักวิ่งที่เร็วกว่า การแข่งขันเพื่อประเมินผลพบว่า นักวิ่งจากกลุ่ม A วิ่งได้เร็วกว่าจริง โดยได้อันดับดังนี้ 1, 2, 3, 4 และ 6 ส่วนนักวิ่งที่ช้ากว่าจากกลุ่ม B ได้อันดับ 5, 7, 8 และ 9

การวิเคราะห์ดำเนินการกับคู่ข้อมูล โดยกำหนดให้เป็นสมาชิกของกลุ่มหนึ่งเมื่อเทียบกับสมาชิกของอีกกลุ่มหนึ่ง ตัวอย่างเช่น นักวิ่งที่เร็วที่สุดในการศึกษาเป็นสมาชิกของสี่คู่ ได้แก่ (1,5), (1,7), (1,8) และ (1,9) ทั้งสี่คู่นี้สนับสนุนสมมติฐาน เพราะในแต่ละคู่ นักวิ่งจากกลุ่ม A เร็วกว่านักวิ่งจากกลุ่ม B มีทั้งหมด 20 คู่ และ 19 คู่สนับสนุนสมมติฐาน คู่เดียวที่ไม่สนับสนุนสมมติฐานคือนักวิ่งสองคนที่มีอันดับ 5 และ 6 เพราะในคู่นี้ นักวิ่งจากกลุ่ม B ทำเวลาได้เร็วกว่า จากสูตรความแตกต่างอย่างง่ายของ Kerby พบว่า 95% ของข้อมูลสนับสนุนสมมติฐาน (19 จาก 20 คู่) และ 5% ไม่สนับสนุน (1 จาก 20 คู่) ดังนั้นค่าสัมประสิทธิ์สหสัมพันธ์ของอันดับคือr = .95 − .05 = .90

ค่าสัมประสิทธิ์สหสัมพันธ์สูงสุดคือr = 1 ซึ่งหมายความว่า 100% ของคู่ข้อมูลสนับสนุนสมมติฐาน ค่าสัมประสิทธิ์สหสัมพันธ์r = 0 แสดงว่าครึ่งหนึ่งของคู่ข้อมูลสนับสนุนสมมติฐานและอีกครึ่งหนึ่งไม่สนับสนุน กล่าวอีกนัยหนึ่งคือ กลุ่มตัวอย่างไม่มีความแตกต่างกันในลำดับชั้น ดังนั้นจึงไม่มีหลักฐานว่าพวกเขามาจากประชากรสองกลุ่มที่แตกต่างกัน ขนาดผลกระทบr = 0 อาจกล่าวได้ว่าไม่มีความสัมพันธ์ระหว่างการเป็นสมาชิกกลุ่มและลำดับชั้นของสมาชิก

ในบทความเรื่อง “การปรับปรุงการรายงานทางสถิติในจิตวิทยา” แอนนา-เลนา ชูเบิร์ตและเพื่อนร่วมงาน (2025) ได้กำหนดแนวทางสำหรับการรายงานทางสถิติ โดยอ้างอิงจากคำแนะนำที่เป็นที่ยอมรับและแนวปฏิบัติที่ดีที่สุดที่กำลังเกิดขึ้น ในตารางที่ 5 พวกเขาได้นำเสนอภาพรวมของขนาดผลกระทบสำหรับแบบจำลองทางสถิติที่ใช้กันทั่วไป ในตารางนี้ พวกเขาได้อ้างอิงถึงบทความของเคอร์บี (2014) เป็นแหล่งข้อมูลสำคัญสำหรับการประยุกต์ใช้และการตีความความสัมพันธ์แบบลำดับสองกลุ่ม

อ่านเพิ่มเติม

  • Cureton, Edward E. (1956). "ความสัมพันธ์แบบลำดับ-ไบซีเรียล". Psychometrika . 21 (3): 287– 290. doi : 10.1007/BF02289138 . S2CID  122500836 .
  • เอเวอริตต์, บีเอส (2002), พจนานุกรมสถิติเคมบริดจ์ , เคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, ISBN 0-521-81099-X
  • Diaconis, P. (1988), การแทนกลุ่มในความน่าจะเป็นและสถิติ , เอกสารประกอบการบรรยาย-ชุดเอกสารวิจัย, Hayward, CA: สถาบันสถิติทางคณิตศาสตร์, ISBN 0-940600-14-5
  • Glass, Gene V. (1965). "ตัวแปรการจัดอันดับที่คล้ายกับสหสัมพันธ์แบบไบซีเรียล: นัยสำคัญสำหรับการวิเคราะห์รายการแบบย่อ" วารสารการวัดผลทางการศึกษา 2 ( 1): 91– 95. doi : 10.1111/j.1745-3984.1965.tb00396.x .
  • Kendall, MG (1970), วิธีการหาความสัมพันธ์เชิงลำดับ , ลอนดอน: Griffin, ISBN 0-85264-199-0
  • Kerby, Dave S. (2014). "สูตรความแตกต่างอย่างง่าย: แนวทางในการสอนความสัมพันธ์แบบไม่ใช้พารามิเตอร์"จิตวิทยาเชิงบูรณาการ 3 ( 1) 11.IT.3.1. doi : 10.2466/11.IT.3.1 .
  • Schubert, AL; Steinhilber, M.; Kang, H.; Quintana, DS (2025). "การปรับปรุงการรายงานทางสถิติในจิตวิทยา" . จิตวิทยาการสื่อสาร . 3 (1) 156. doi : 10.1038/s44271-025-00356-w . PMC  12618885 . PMID  41238797 .
  • คู่มือฉบับย่อโดยนักจิตวิทยาเชิงทดลอง คาร์ล แอล. เวนช์ - ขนาดผลกระทบแบบไม่ใช้พารามิเตอร์ (ลิขสิทธิ์ 2015 โดย คาร์ล แอล. เวนช์)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Rank_correlation&oldid=1338379645 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ความสัมพันธ์เชิงลำดับ

ใน ทางสถิติ สัมประสิทธิ์ สห สัมพันธ์ลำดับ (rank correlation) คือสถิติประเภทหนึ่งที่ใช้วัด ความสัมพันธ์เชิงลำดับ — ความสัมพันธ์ระหว่าง ลำดับ ของตัวแปร เชิงลำดับ...

บริบท

ตัวอย่างเช่น หากตัวแปรหนึ่งคือเอกลักษณ์ของโปรแกรมบาสเกตบอลของวิทยาลัย และอีกตัวแปรหนึ่งคือเอกลักษณ์ของโปรแกรมฟุตบอลของวิทยาลัย เราสามารถทดสอบความสัมพันธ์ระหว่างอันดับในโพลของโปรแกรมทั้งสองประเภทได้ เช่น วิทยาลัยที่มีโปรแกรมบาสเกตบอลอันดับสูงกว่า...

สัมประสิทธิ์สหสัมพันธ์

สถิติ ความสัมพันธ์เชิง อันดับที่เป็นที่นิยมบางส่วน ได้แก่

สัมประสิทธิ์สหสัมพันธ์ทั่วไป

Kendall 1970 [ 2 ] แสดงให้เห็นว่าค่า tau ของเขาและค่า rho ของ Spearman เป็นกรณีเฉพาะของสัมประสิทธิ์สหสัมพันธ์ทั่วไป τ {\displaystyle \tau } ρ {\displaystyle \rho }