ความสัมพันธ์เชิงลำดับ

Q: สัมประสิทธิ์สหสัมพันธ์

สถิติ ความสัมพันธ์เชิง อันดับที่เป็นที่นิยมบางส่วน ได้แก่

Q: สัมประสิทธิ์สหสัมพันธ์ทั่วไป

Kendall 1970 [ 2 ] แสดงให้เห็นว่าค่า tau ของเขาและค่า rho ของ Spearman เป็นกรณีเฉพาะของสัมประสิทธิ์สหสัมพันธ์ทั่วไป τ {\displaystyle \tau } ρ {\displaystyle \rho }

ในทางสถิติ สัมประสิทธิ์สหสัมพันธ์ลำดับ (rank correlation)คือสถิติประเภทหนึ่งที่ใช้วัดความสัมพันธ์เชิงลำดับ — ความสัมพันธ์ระหว่างลำดับ ของตัวแปร เชิงลำดับที่แตกต่างกันหรือลำดับที่แตกต่างกันของตัวแปรเดียวกัน โดยที่ "ลำดับ" คือการกำหนดป้ายกำกับลำดับ "อันดับแรก" "อันดับสอง" "อันดับสาม" เป็นต้น ให้กับการสังเกตที่แตกต่างกันของตัวแปรเฉพาะตัวหนึ่งสัมประสิทธิ์สหสัมพันธ์ลำดับจะวัดระดับความคล้ายคลึงกันระหว่างสองลำดับ และสามารถใช้ประเมินความสำคัญของความสัมพันธ์ระหว่างกันได้ ตัวอย่างเช่น วิธีการวัดความสำคัญแบบ ไม่ใช้พารามิเตอร์ที่ใช้สัมประสิทธิ์สหสัมพันธ์ลำดับสองวิธีที่ใช้กันทั่วไป ได้แก่การทดสอบ Mann–Whitney Uและ การทดสอบ Wilcoxon signed-rank

บริบท

ตัวอย่างเช่น หากตัวแปรหนึ่งคือเอกลักษณ์ของโปรแกรมบาสเกตบอลของวิทยาลัย และอีกตัวแปรหนึ่งคือเอกลักษณ์ของโปรแกรมฟุตบอลของวิทยาลัย เราสามารถทดสอบความสัมพันธ์ระหว่างอันดับในโพลของโปรแกรมทั้งสองประเภทได้ เช่น วิทยาลัยที่มีโปรแกรมบาสเกตบอลอันดับสูงกว่า มักจะมีโปรแกรมฟุตบอลอันดับสูงกว่าด้วยหรือไม่ ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสามารถวัดความสัมพันธ์นั้นได้ และการวัดนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์อันดับสามารถแสดงให้เห็นว่าความสัมพันธ์ที่วัดได้นั้นเล็กพอที่จะเป็นเพียงความบังเอิญหรือไม่

หากมีตัวแปรเพียงตัวเดียว คือ เอกลักษณ์ของโปรแกรมฟุตบอลระดับวิทยาลัย แต่โปรแกรมนั้นอยู่ภายใต้การจัดอันดับสองแบบที่แตกต่างกัน (เช่น การจัดอันดับโดยโค้ช และการจัดอันดับโดยนักเขียนข่าวกีฬา) ความคล้ายคลึงกันของการจัดอันดับจากสองแบบนั้นสามารถวัดได้ด้วยสัมประสิทธิ์สหสัมพันธ์อันดับ

ตัวอย่างอื่น ในตารางความสัมพันธ์ที่มีรายได้ต่ำรายได้ปานกลางและรายได้สูงในตัวแปรแถว และระดับการศึกษา— ไม่ จบมัธยมปลาย จบมัธยมปลาย จบมหาวิทยาลัย—ในตัวแปรคอลัมน์^{[ 1 ]}ค่าสัมประสิทธิ์สหสัมพันธ์ลำดับจะวัดความสัมพันธ์ระหว่างรายได้และระดับการศึกษา

สัมประสิทธิ์สหสัมพันธ์

สถิติ ความสัมพันธ์เชิงอันดับที่เป็นที่นิยมบางส่วน ได้แก่

ค่าสัมประสิทธิ์สหสัมพันธ์ลำดับที่เพิ่มขึ้นบ่งชี้ถึงความสอดคล้องกันระหว่างลำดับที่เพิ่มขึ้น ค่าสัมประสิทธิ์อยู่ในช่วง [−1, 1] และมีค่าดังนี้:

1. ถ้าความสอดคล้องระหว่างอันดับทั้งสองสมบูรณ์แบบ อันดับทั้งสองก็จะเหมือนกัน
0 หากการจัดอันดับเป็นอิสระต่อกันอย่างสมบูรณ์
-1 ถ้าความแตกต่างระหว่างอันดับทั้งสองสมบูรณ์แบบ กล่าวคือ อันดับหนึ่งเป็นค่าตรงข้ามกับอีกอันดับหนึ่ง

ตามแนวคิดของDiaconis (1988)การจัดอันดับสามารถมองได้ว่าเป็นการเรียงสับเปลี่ยนของเซตของวัตถุ ดังนั้นเราจึงสามารถมองการจัดอันดับที่สังเกตได้ว่าเป็นข้อมูลที่ได้มาเมื่อปริภูมิของตัวอย่าง (ระบุด้วย) กลุ่มสมมาตรจากนั้นเราสามารถแนะนำเมตริกทำให้กลุ่มสมมาตรกลายเป็นปริภูมิเมตริกเมตริกที่แตกต่างกันจะสอดคล้องกับความสัมพันธ์ของการจัดอันดับที่แตกต่างกัน

สัมประสิทธิ์สหสัมพันธ์ทั่วไป

Kendall 1970 ^{[ 2 ]}แสดงให้เห็นว่าค่า tau ของเขาและค่า rho ของ Spearman เป็นกรณีเฉพาะของสัมประสิทธิ์สหสัมพันธ์ทั่วไป $\tau$ $\rho$

สมมติว่าเรามีเซตของวัตถุ ซึ่งกำลังถูกพิจารณาโดยสัมพันธ์กับคุณสมบัติสองประการ ซึ่งแทนด้วยและโดยก่อให้เกิดเซตของค่าและสำหรับบุคคลสองบุคคลใดๆ เช่นบุคคลที่ และบุคคลที่ เราจะกำหนดคะแนน -score ซึ่งแทนด้วยและคะแนน-score ซึ่งแทนด้วยข้อกำหนดเพียงอย่างเดียวสำหรับฟังก์ชันเหล่านี้คือ ต้องเป็นฟังก์ชันสมมาตรผกผัน ดังนั้นและ(โปรดทราบว่าโดยเฉพาะอย่างยิ่งถ้า) จากนั้นสัมประสิทธิ์สหสัมพันธ์ทั่วไปจะถูกกำหนดเป็น $n$ $x$ $y$ $\{x_{i}\}_{i\leq n}$ $\{y_{i}\}_{i\leq n}$ $i$ $j$ $x$ $a_{ij}$ $y$ $b_{ij}$ $a_{ij}=-a_{ji}$ $b_{ij}=-b_{ji}$ $a_{ij}=b_{ij}=0$ $i=j$ $\Gamma$

\Gamma ={\frac {\sum _{i,j=1}^{n}a_{ij}b_{ij}}{\sqrt {\sum _{i,j=1}^{n}a_{ij}^{2}\sum _{i,j=1}^{n}b_{ij}^{2}}}}

ในทำนองเดียวกัน หากรวบรวมสัมประสิทธิ์ทั้งหมดไว้ในเมทริกซ์และโดยที่และแล้ว $A=(a_{ij})$ $B=(b_{ij})$ $A^{\textsf {T}}=-A$ $B^{\textsf {T}}=-B$

\Gamma ={\frac {\langle A,B\rangle _{\rm {F}}}{\|A\|_{\rm {F}}\|B\|_{\rm {F}}}}

โดย ที่ ผลคูณภายในของ Frobeniusและ นอร์ม ของFrobeniusคืออะไรโดยเฉพาะอย่างยิ่ง สัมประสิทธิ์สหสัมพันธ์ทั่วไปคือโคไซน์ของมุมระหว่างเมทริกซ์และ $\langle A,B\rangle _{\rm {F}}$ $\|A\|_{\rm {F}}={\sqrt {\langle A,A\rangle _{\rm {F}}}}$ $A$ $B$

ค่า τ ของ Kendall เป็นกรณีพิเศษ

ถ้าและคือลำดับของสมาชิกตามคุณภาพ และคุณภาพ ตามลำดับ เราสามารถกำหนดได้ว่า $r_{i}$ $s_{i}$ $i$ $x$ $y$

a_{ij}=\operatorname {sgn}(r_{j}-r_{i}),\quad b_{ij}=\operatorname {sgn}(s_{j}-s_{i}).

ผลรวมคือจำนวนคู่ที่สอดคล้องกันลบด้วยจำนวนคู่ที่ไม่สอดคล้องกัน (ดูค่าสัมประสิทธิ์สหสัมพันธ์ลำดับเคนดัลเทา ) ผลรวมก็คือจำนวนพจน์นั่นเองดังนั้นในกรณีนี้ $\sum a_{ij}b_{ij}$ $\sum a_{ij}^{2}$ $n(n-1)/2$ $a_{ij}$ $\sum b_{ij}^{2}$

\Gamma ={\frac {2\,(({\text{จำนวนคู่ที่สอดคล้องกัน}})-({\text{จำนวนคู่ที่ไม่สอดคล้องกัน}}))}{n(n-1)}}={\text{Kendall's }}\tau

ค่า ρ ของสเปียร์แมนเป็นกรณีพิเศษ

ถ้าและคือลำดับของสมาชิก ตามและคุณภาพ ตามลำดับ เราอาจพิจารณาเมทริกซ์ที่กำหนดโดย $r_{i}$ $s_{i}$ $i$ $x$ $y$ $a,b\in M(n\times n;\mathbb {R} )$

a_{ij}:=r_{j}-r_{i}

b_{ij}:=s_{j}-s_{i}

ผลรวมและเท่ากัน เนื่องจากทั้งและมีค่าตั้งแต่ถึงดังนั้น $\sum a_{ij}^{2}$ $\sum b_{ij}^{2}$ $r_{i}$ $s_{i}$ $1$ $n$

\Gamma ={\frac {\sum (r_{j}-r_{i})(s_{j}-s_{i})}{\sum (r_{j}-r_{i})^{2}}}

เพื่อลดความซับซ้อนของนิพจน์นี้ ให้แทนผลต่างของอันดับสำหรับแต่ละนอกจากนี้ ให้เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่มีการแจกแจงแบบเอกรูปบนเนื่องจากอันดับเป็นเพียงการเรียงสับเปลี่ยนของเราจึงสามารถมองว่าทั้งสองเป็นตัวแปรสุ่มที่มีการแจกแจงแบบโดยใช้ผลลัพธ์การหาผลรวม พื้นฐาน จากคณิตศาสตร์แบบไม่ต่อเนื่อง เราสามารถเห็นได้ง่ายว่าสำหรับตัวแปรสุ่มที่มีการแจกแจงแบบเอกรูปเรามี และ และดังนั้น ทีนี้ การสังเกตสมมาตรทำให้เราสามารถคำนวณส่วนต่างๆ ของ ได้ ดังนี้: $d_{i}:=r_{i}-s_{i}$ $i$ $U$ $\{1,2,\ldots ,n\}$ $r,s$ $1,2,\ldots ,n$ $U$ $U$ $\mathbb {E} [U]=\textstyle {\frac {n+1}{2}}$ $\mathbb {E} [U^{2}]=\textstyle {\frac {(n+1)(2n+1)}{6}}$ $\mathrm {Var} (U)=\textstyle {\frac {(n+1)(2n+1)}{6}}-\textstyle {\frac {(n+1)(n+1)}{4}}=\textstyle {\frac {n^{2}-1}{12}}$ $\Gamma$

{\begin{aligned}{\frac {1}{n^{2}}}\sum _{i,j=1}^{n}(r_{j}-r_{i})(s_{j}-s_{i})&=2\left({\frac {1}{n^{2}}}\cdot n\sum _{i=1}^{n}r_{i}s_{i}-\left({\frac {1}{n}}\sum _{i=1}^{n}r_{i}\right)\left({\frac {1}{n}}\sum _{j=1}^{n}s_{j}\right)\right)\\&={\frac {1}{n}}\sum _{i=1}^{n}(r_{i}^{2}+s_{i}^{2}-d_{i}^{2})-2\left(\mathbb {E} [U]\right)^{2}\\&={\frac {1}{n}}\sum _{i=1}^{n}r_{i}^{2}+{\frac {1}{n}}\sum _{i=1}^{n}s_{i}^{2}-{\frac {1}{n}}\sum _{i=1}^{n}d_{i}^{2}-2\left(\mathbb {E} [U]\right)^{2}\\&=2\left(\mathbb {E} [U^{2}]-(\mathbb {E} [U])^{2}\right)-{\frac {1}{n}}\sum _{i=1}^{n}d_{i}^{2}\\\end{aligned}}

และ

{\begin{aligned}{\frac {1}{n^{2}}}\sum _{i,j=1}^{n}(r_{j}-r_{i})^{2}&={\frac {1}{n^{2}}}\cdot n\sum _{i,j=1}^{n}(r_{i}^{2}+r_{j}^{2}-2r_{i}r_{j})\\&=2{\frac {1}{n}}\sum _{i=1}^{n}r_{i}^{2}-2\left({\frac {1}{n}}\sum _{i=1}^{n}r_{i}\right)\left({\frac {1}{n}}\sum _{j=1}^{n}r_{j}\right)\\&=2(\mathbb {E} [U^{2}]-(\mathbb {E} [U])^{2})\\\end{aligned}}

เพราะฉะนั้น

\Gamma =1-{\frac {\sum _{i=1}^{n}d_{i}^{2}}{2n\mathrm {Var} (U)}}=1-{\frac {6\sum _{i=1}^{n}d_{i}^{2}}{n(n^{2}-1)}}

ความแตกต่างระหว่างอันดับอยู่ที่ไหน ซึ่งก็คือ ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมนนั่นเอง $d_{i}=r_{i}-s_{i}$ $\rho$

ความสัมพันธ์แบบลำดับ-ไบซีเรียล

Gene Glass (1965) ตั้งข้อสังเกตว่าค่าสัมประสิทธิ์สหสัมพันธ์แบบลำดับ-ไบซีเรียลสามารถหาได้จากค่าสัมประสิทธิ์สหสัมพันธ์ของ Spearman “เราสามารถหาค่าสัมประสิทธิ์ที่กำหนดบนXซึ่งเป็นตัวแปรทวิภาค และYซึ่งเป็นตัวแปรลำดับ ซึ่งประมาณค่า rho ของ Spearman ระหว่าง X และ Y ในลักษณะเดียวกับที่ค่า r แบบไบซีเรียลประมาณค่าr ของ Pearson ระหว่างตัวแปรปกติสองตัว” (หน้า 91) ค่าสัมประสิทธิ์สหสัมพันธ์แบบลำดับ-ไบซีเรียลได้รับการแนะนำเมื่อเก้าปีก่อนโดย Edward Cureton (1956) ในฐานะมาตรวัดสหสัมพันธ์ลำดับเมื่อลำดับอยู่ในสองกลุ่ม^[³^] $\rho$

สูตรความแตกต่างอย่างง่ายของเคอร์บี้

เดฟ เคอร์บี (2014) แนะนำให้ใช้ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสอง (rank-biserial) เป็นตัววัดเพื่อแนะนำนักเรียนให้รู้จักกับค่าสัมประสิทธิ์สหสัมพันธ์อันดับ เนื่องจากตรรกะทั่วไปสามารถอธิบายได้ในระดับเบื้องต้น ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสองนี้เป็นค่าสัมประสิทธิ์สหสัมพันธ์ที่ใช้กับการทดสอบ Mann–Whitney Uซึ่งเป็นวิธีการที่นิยมสอนในหลักสูตรสถิติเบื้องต้นระดับมหาวิทยาลัย ข้อมูลสำหรับการทดสอบนี้ประกอบด้วยสองกลุ่ม และสำหรับสมาชิกแต่ละคนในกลุ่ม ผลลัพธ์จะถูกจัดอันดับสำหรับการศึกษาทั้งหมด

เคอร์บีแสดงให้เห็นว่าค่าสัมประสิทธิ์สหสัมพันธ์ลำดับนี้สามารถแสดงได้ในแง่ของสองแนวคิด ได้แก่ เปอร์เซ็นต์ของข้อมูลที่สนับสนุนสมมติฐานที่ระบุไว้ และเปอร์เซ็นต์ของข้อมูลที่ไม่สนับสนุนสมมติฐานนั้น สูตรความแตกต่างอย่างง่ายของเคอร์บีระบุว่า ค่าสัมประสิทธิ์สหสัมพันธ์ลำดับสามารถแสดงได้เป็นผลต่างระหว่างสัดส่วนของหลักฐานที่สนับสนุน ( f ) ลบด้วยสัดส่วนของหลักฐานที่ไม่สนับสนุน ( u )

r=f-u

ตัวอย่างและการตีความ

เพื่ออธิบายการคำนวณ สมมติว่าโค้ชฝึกนักวิ่งระยะไกลเป็นเวลาหนึ่งเดือนโดยใช้สองวิธี กลุ่ม A มีนักวิ่ง 5 คน และกลุ่ม B มีนักวิ่ง 4 คน สมมติฐานที่ตั้งไว้คือ วิธี A ทำให้ได้นักวิ่งที่เร็วกว่า การแข่งขันเพื่อประเมินผลพบว่า นักวิ่งจากกลุ่ม A วิ่งได้เร็วกว่าจริง โดยได้อันดับดังนี้ 1, 2, 3, 4 และ 6 ส่วนนักวิ่งที่ช้ากว่าจากกลุ่ม B ได้อันดับ 5, 7, 8 และ 9

การวิเคราะห์ดำเนินการกับคู่ข้อมูล โดยกำหนดให้เป็นสมาชิกของกลุ่มหนึ่งเมื่อเทียบกับสมาชิกของอีกกลุ่มหนึ่ง ตัวอย่างเช่น นักวิ่งที่เร็วที่สุดในการศึกษาเป็นสมาชิกของสี่คู่ ได้แก่ (1,5), (1,7), (1,8) และ (1,9) ทั้งสี่คู่นี้สนับสนุนสมมติฐาน เพราะในแต่ละคู่ นักวิ่งจากกลุ่ม A เร็วกว่านักวิ่งจากกลุ่ม B มีทั้งหมด 20 คู่ และ 19 คู่สนับสนุนสมมติฐาน คู่เดียวที่ไม่สนับสนุนสมมติฐานคือนักวิ่งสองคนที่มีอันดับ 5 และ 6 เพราะในคู่นี้ นักวิ่งจากกลุ่ม B ทำเวลาได้เร็วกว่า จากสูตรความแตกต่างอย่างง่ายของ Kerby พบว่า 95% ของข้อมูลสนับสนุนสมมติฐาน (19 จาก 20 คู่) และ 5% ไม่สนับสนุน (1 จาก 20 คู่) ดังนั้นค่าสัมประสิทธิ์สหสัมพันธ์ของอันดับคือr = .95 − .05 = .90

ค่าสัมประสิทธิ์สหสัมพันธ์สูงสุดคือr = 1 ซึ่งหมายความว่า 100% ของคู่ข้อมูลสนับสนุนสมมติฐาน ค่าสัมประสิทธิ์สหสัมพันธ์r = 0 แสดงว่าครึ่งหนึ่งของคู่ข้อมูลสนับสนุนสมมติฐานและอีกครึ่งหนึ่งไม่สนับสนุน กล่าวอีกนัยหนึ่งคือ กลุ่มตัวอย่างไม่มีความแตกต่างกันในลำดับชั้น ดังนั้นจึงไม่มีหลักฐานว่าพวกเขามาจากประชากรสองกลุ่มที่แตกต่างกัน ขนาดผลกระทบr = 0 อาจกล่าวได้ว่าไม่มีความสัมพันธ์ระหว่างการเป็นสมาชิกกลุ่มและลำดับชั้นของสมาชิก

ในบทความเรื่อง “การปรับปรุงการรายงานทางสถิติในจิตวิทยา” แอนนา-เลนา ชูเบิร์ตและเพื่อนร่วมงาน (2025) ได้กำหนดแนวทางสำหรับการรายงานทางสถิติ โดยอ้างอิงจากคำแนะนำที่เป็นที่ยอมรับและแนวปฏิบัติที่ดีที่สุดที่กำลังเกิดขึ้น ในตารางที่ 5 พวกเขาได้นำเสนอภาพรวมของขนาดผลกระทบสำหรับแบบจำลองทางสถิติที่ใช้กันทั่วไป ในตารางนี้ พวกเขาได้อ้างอิงถึงบทความของเคอร์บี (2014) เป็นแหล่งข้อมูลสำคัญสำหรับการประยุกต์ใช้และการตีความความสัมพันธ์แบบลำดับสองกลุ่ม

อ่านเพิ่มเติม

Cureton, Edward E. (1956). "ความสัมพันธ์แบบลำดับ-ไบซีเรียล". Psychometrika . 21 (3): 287– 290. doi : 10.1007/BF02289138 . S2CID 122500836 .
เอเวอริตต์, บีเอส (2002), พจนานุกรมสถิติเคมบริดจ์ , เคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, ISBN 0-521-81099-X
Diaconis, P. (1988), การแทนกลุ่มในความน่าจะเป็นและสถิติ , เอกสารประกอบการบรรยาย-ชุดเอกสารวิจัย, Hayward, CA: สถาบันสถิติทางคณิตศาสตร์, ISBN 0-940600-14-5
Glass, Gene V. (1965). "ตัวแปรการจัดอันดับที่คล้ายกับสหสัมพันธ์แบบไบซีเรียล: นัยสำคัญสำหรับการวิเคราะห์รายการแบบย่อ" วารสารการวัดผลทางการศึกษา 2 ( 1): 91– 95. doi : 10.1111/j.1745-3984.1965.tb00396.x .
Kendall, MG (1970), วิธีการหาความสัมพันธ์เชิงลำดับ , ลอนดอน: Griffin, ISBN 0-85264-199-0
Kerby, Dave S. (2014). "สูตรความแตกต่างอย่างง่าย: แนวทางในการสอนความสัมพันธ์แบบไม่ใช้พารามิเตอร์"จิตวิทยาเชิงบูรณาการ 3 ( 1) 11.IT.3.1. doi : 10.2466/11.IT.3.1 .
Schubert, AL; Steinhilber, M.; Kang, H.; Quintana, DS (2025). "การปรับปรุงการรายงานทางสถิติในจิตวิทยา" . จิตวิทยาการสื่อสาร . 3 (1) 156. doi : 10.1038/s44271-025-00356-w . PMC 12618885 . PMID 41238797 .

ลิงก์ภายนอก

คู่มือฉบับย่อโดยนักจิตวิทยาเชิงทดลอง คาร์ล แอล. เวนช์ - ขนาดผลกระทบแบบไม่ใช้พารามิเตอร์ (ลิขสิทธิ์ 2015 โดย คาร์ล แอล. เวนช์)

[ 1 ]

[ 2 ]

[