อ่าน 4 นาที
สัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียล
สัมประสิทธิ์สหสัมพันธ์แบบจุดไบซีเรียล ( r pb ) เป็น สัมประสิทธิ์สหสัมพันธ์ ที่ใช้เมื่อตัวแปรหนึ่ง (เช่น Y ) เป็น ตัวแปรแบบสองค่า โดย Y อาจเป็นตัวแปรแบบสองค่าโดย "ธรรมชาติ" เช่น...
สัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียล
สัมประสิทธิ์สหสัมพันธ์แบบจุดไบซีเรียล ( r pb )เป็นสัมประสิทธิ์สหสัมพันธ์ที่ใช้เมื่อตัวแปรหนึ่ง (เช่นY ) เป็นตัวแปรแบบสองค่าโดยYอาจเป็นตัวแปรแบบสองค่าโดย "ธรรมชาติ" เช่น การที่เหรียญออกหัวหรือก้อย หรือเป็นตัวแปรแบบสองค่าที่สร้างขึ้นมา ในสถานการณ์ส่วนใหญ่ ไม่ควรสร้างตัวแปรแบบสองค่าขึ้นมา[ 1 ]เมื่อตัวแปรใหม่ถูกสร้างให้เป็นตัวแปรแบบสองค่าขึ้นมา ตัวแปรแบบสองค่าใหม่นี้อาจถูกมองว่ามีความต่อเนื่องอยู่เบื้องหลัง หากเป็นเช่นนั้น การคำนวณ สหสัมพันธ์แบบไบซีเรียลจะเหมาะสมกว่า
ค่าสัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลนั้นเทียบเท่าทางคณิตศาสตร์กับค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (ผลคูณโมเมนต์)กล่าวคือ ถ้าเรามีตัวแปรที่วัดได้ต่อเนื่องหนึ่งตัวXและตัวแปรแบบสองค่าY ค่า r XY = r pbซึ่งสามารถแสดงได้โดยการกำหนดค่าตัวเลขสองค่าที่แตกต่างกันให้กับตัวแปรแบบสองค่า
การคำนวณ
ในการคำนวณr pbให้สมมติว่าตัวแปรทวิภาคYมีค่าสองค่าคือ 0 และ 1 ถ้าเราแบ่งชุดข้อมูลออกเป็นสองกลุ่ม กลุ่มที่ 1 ได้รับค่า "1" บนYและกลุ่มที่ 2 ได้รับค่า "0" บนYสัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลจะคำนวณได้ดังนี้:
โดยที่s nคือค่าเบี่ยงเบนมาตรฐานที่ใช้เมื่อมีข้อมูลสำหรับสมาชิกทุกคนในประชากร:
โดยที่ M 1คือค่าเฉลี่ยของตัวแปรต่อเนื่องXสำหรับจุดข้อมูลทั้งหมดในกลุ่มที่ 1 และM 0คือค่าเฉลี่ยของตัวแปรต่อเนื่องXสำหรับจุดข้อมูลทั้งหมดในกลุ่มที่ 2 นอกจากนี้n 1คือจำนวนจุดข้อมูลในกลุ่มที่ 1, n 0คือจำนวนจุดข้อมูลในกลุ่มที่ 2 และnคือขนาดตัวอย่างทั้งหมด สูตรนี้เป็นสูตรคำนวณที่ได้มาจากสูตรสำหรับr XYเพื่อลดขั้นตอนในการคำนวณ ทำให้คำนวณได้ง่ายกว่า r XY
มีสูตรเทียบเท่าที่ใช้s n −1 :
โดยที่s n −1คือค่าเบี่ยงเบนมาตรฐานที่ใช้เมื่อมีข้อมูลเฉพาะสำหรับกลุ่มตัวอย่างของประชากรเท่านั้น:
สูตรเวอร์ชันที่ใช้s n −1มีประโยชน์หากกำลังคำนวณสัมประสิทธิ์สหสัมพันธ์แบบจุดสองอนุกรมในภาษาโปรแกรมหรือสภาพแวดล้อมการพัฒนาอื่นๆ ที่มีฟังก์ชันสำหรับการคำนวณs n −1แต่ไม่มีฟังก์ชันสำหรับการคำนวณs n [ 2 ]
นอกจากนี้ ค่ากำลังสองของสัมประสิทธิ์สหสัมพันธ์แบบจุดสองกลุ่มสามารถเขียนได้ดังนี้:
เราสามารถทดสอบสมมติฐานว่างที่ว่าค่าสัมประสิทธิ์สหสัมพันธ์เป็นศูนย์ในประชากรได้ การคำนวณทางพีชคณิตเล็กน้อยแสดงให้เห็นว่าสูตรปกติสำหรับการประเมินความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ เมื่อนำไปใช้กับr pbจะเหมือนกับสูตรสำหรับการทดสอบt แบบไม่จับคู่ ดังนั้น
เป็นไปตามการแจกแจงแบบ t ของนักเรียนโดยมีองศาอิสระ ( n 1 + n 0 − 2) เมื่อสมมติฐานว่างเป็นจริง
ข้อเสียอย่างหนึ่งของสัมประสิทธิ์ไบซีเรียลแบบจุดคือ ยิ่งการกระจายของYอยู่ห่างจาก 50/50 มากเท่าไร ช่วงค่าที่สัมประสิทธิ์สามารถรับได้ก็จะยิ่งถูกจำกัดมากขึ้นเท่านั้น หากสามารถสันนิษฐานได้ว่าตัวแปรสองค่าYมีการกระจายแบบปกติ ดัชนีเชิงพรรณนาที่ดีกว่าจะได้รับจากสัมประสิทธิ์ไบซีเรียล: [ 3 ]
โดยที่คือความหนาแน่นของการแจกแจงปกติที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง และคือฟังก์ชันการแจกแจงสะสมผกผัน ของมัน การคำนวณค่านี้ไม่ใช่เรื่องง่าย และสัมประสิทธิ์ไบซีเรียลก็ไม่ได้ถูกนำมาใช้กันอย่างแพร่หลายในทางปฏิบัติ
กรณีเฉพาะของการสหสัมพันธ์แบบไบซีเรียลเกิดขึ้นเมื่อXเป็นผลรวมของตัวแปรทวิภาคจำนวนหนึ่งซึ่งYเป็นหนึ่งในนั้น ตัวอย่างเช่น เมื่อX เป็นคะแนนรวมของบุคคลในการทดสอบที่ประกอบด้วยข้อสอบ แบบทวิภาคจำนวน nข้อ สถิติที่น่าสนใจ (ซึ่งเป็นดัชนีการจำแนก) คือสหสัมพันธ์ระหว่างการตอบสนองต่อข้อสอบแต่ละข้อกับคะแนนรวมของการทดสอบที่สอดคล้องกัน มีการคำนวณสามแบบที่ใช้กันอย่างแพร่หลาย[ 4 ]ซึ่งทั้งหมดเรียกว่าสหสัมพันธ์แบบจุดไบซีเรียล : (i) สหสัมพันธ์เพียร์สันระหว่างคะแนนข้อสอบแต่ละข้อกับคะแนนรวมของการทดสอบโดยรวมคะแนนข้อสอบแต่ละข้อ (ii) สหสัมพันธ์เพียร์สันระหว่างคะแนนข้อสอบแต่ละข้อกับคะแนนรวมของการทดสอบโดยไม่รวมคะแนนข้อสอบแต่ละข้อ และ (iii) สหสัมพันธ์ที่ปรับแก้สำหรับอคติที่เกิดจากการรวมคะแนนข้อสอบแต่ละข้อในคะแนนการทดสอบ สหสัมพันธ์ (iii) คือ
สัมประสิทธิ์ไบซีเรียลแบบจุดมีรูปแบบที่แตกต่างออกไปเล็กน้อย คือ สัมประสิทธิ์ไบซีเรียลแบบอันดับ ซึ่งเกิดขึ้นเมื่อตัวแปรXประกอบด้วยอันดับ ในขณะที่Yเป็นตัวแปรทวิภาค เราสามารถคำนวณสัมประสิทธิ์ในลักษณะเดียวกับกรณีที่Xเป็นตัวแปรต่อเนื่องได้ แต่จะมีข้อเสียเช่นเดียวกันคือ ช่วงของค่าที่สัมประสิทธิ์สามารถรับได้จะแคบลงเมื่อการกระจายของYไม่เท่ากันมากขึ้น เพื่อแก้ไขปัญหานี้ เราสังเกตว่าสัมประสิทธิ์จะมีค่ามากที่สุดเมื่ออันดับที่เล็กที่สุดอยู่ตรงข้ามกับ 0 และอันดับที่ใหญ่ที่สุดอยู่ตรงข้ามกับ 1 ค่าที่น้อยที่สุดจะเกิดขึ้นเมื่อเป็นกรณีตรงกันข้าม ค่าเหล่านี้คือบวกและลบ ( n1 + n0 ) /2 ตามลำดับ ดังนั้นเราจึงสามารถใช้ส่วนกลับของค่านี้เพื่อปรับขนาดความแตกต่างระหว่างค่าเฉลี่ยอันดับที่สังเกตได้ ให้อยู่ในช่วงตั้งแต่บวกหนึ่งถึงลบหนึ่ง ผลลัพธ์คือ
โดยที่M 1และM 0คือค่าเฉลี่ยของอันดับที่สอดคล้องกับคะแนน 1 และ 0 ของตัวแปรทวิภาค ตามลำดับ สูตรนี้ซึ่งช่วยลดความซับซ้อนของการคำนวณจากการนับความสอดคล้องและการผกผัน เป็นผลงานของ Gene V Glass (1966)
สามารถใช้สิ่งนี้เพื่อทดสอบสมมติฐานว่างของการไม่มีความสัมพันธ์ในประชากรที่สุ่มตัวอย่างมาได้ หากคำนวณ r rb ตามข้างต้นแล้ว ค่าที่น้อยกว่าของ
และ
มีการแจกแจงแบบMann–Whitney Uโดยมีขนาดตัวอย่างn 1และn 0เมื่อสมมติฐานว่างเป็นจริง
ลิงก์ภายนอก
- สัมประสิทธิ์จุดไบซีเรียล (คีธ คาลกินส์, 2005)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ สัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียล
สัมประสิทธิ์สหสัมพันธ์แบบจุดไบซีเรียล ( r pb ) เป็น สัมประสิทธิ์สหสัมพันธ์ ที่ใช้เมื่อตัวแปรหนึ่ง (เช่น Y ) เป็น ตัวแปรแบบสองค่า โดย Y อาจเป็นตัวแปรแบบสองค่าโดย "ธรรมชาติ" เช่น...
การคำนวณ
ในการคำนวณ r pb ให้สมมติว่าตัวแปรทวิภาค Y มีค่าสองค่าคือ 0 และ 1 ถ้าเราแบ่ง ชุดข้อมูล ออกเป็นสองกลุ่ม กลุ่มที่ 1 ได้รับค่า "1" บน Y และกลุ่มที่ 2 ได้รับค่า "0" บน Y สัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลจะคำนวณได้ดังนี้:
ลิงก์ภายนอก
สัมประสิทธิ์จุดไบซีเรียล (คีธ คาลกินส์, 2005) ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Point-biserial_correlation_coefficient&oldid=1289424476 "