อ่าน 7 นาที
การควบคุม (สถิติ)
ใน ทางสถิติ และ การวิเคราะห์การ ถดถอย การ ปรับเปลี่ยน (หรือที่เรียกว่า การปรับเปลี่ยนผลกระทบ ) เกิดขึ้นเมื่อความสัมพันธ์ระหว่างตัวแปรสองตัวขึ้นอยู่กับตัวแปรที่สาม...
การควบคุม (สถิติ)
ในทางสถิติและการวิเคราะห์การถดถอย การ ปรับเปลี่ยน (หรือที่เรียกว่าการปรับเปลี่ยนผลกระทบ ) เกิดขึ้นเมื่อความสัมพันธ์ระหว่างตัวแปรสองตัวขึ้นอยู่กับตัวแปรที่สาม ตัวแปรที่สามนี้เรียกว่าตัวแปรปรับเปลี่ยน (หรือตัวปรับเปลี่ยนผลกระทบ ) หรือเรียกง่ายๆ ว่าตัวแปรปรับเปลี่ยน (หรือตัวปรับเปลี่ยน ) [ 1 ] [ 2 ]ผลกระทบของตัวแปรปรับเปลี่ยนมีลักษณะทางสถิติเป็นปฏิสัมพันธ์[ 1 ]กล่าวคือ ตัวแปร เชิงหมวดหมู่ (เช่น เพศ เชื้อชาติ ชนชั้น) หรือตัวแปรต่อเนื่อง (เช่น อายุ ระดับรางวัล) ที่เกี่ยวข้องกับทิศทางและ/หรือขนาดของความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระโดยเฉพาะอย่างยิ่งภายใน กรอบการวิเคราะห์ ความสัมพันธ์ตัวแปรปรับเปลี่ยนคือตัวแปรที่สามที่ส่งผลต่อความสัมพันธ์ลำดับศูนย์ระหว่างตัวแปรอื่นสองตัว หรือค่าความชันของตัวแปรตามบนตัวแปรอิสระ ในแง่ของการวิเคราะห์ความแปรปรวน (ANOVA) ผลกระทบของตัวแปรปรับเปลี่ยนพื้นฐานสามารถแสดงได้เป็นปฏิสัมพันธ์ระหว่าง ตัวแปร อิสระ เป้าหมาย และปัจจัยที่ระบุเงื่อนไขที่เหมาะสมสำหรับการทำงานของมัน[ 3 ]
ตัวอย่าง


การวิเคราะห์การปรับเปลี่ยนในวิทยาศาสตร์พฤติกรรมเกี่ยวข้องกับการใช้การวิเคราะห์การถดถอยเชิงเส้นหลายตัวแปรหรือการสร้างแบบจำลองเชิงสาเหตุ[ 1 ]เพื่อหาปริมาณผลของตัวแปรปรับเปลี่ยนในการวิเคราะห์การถดถอยหลายตัวแปร โดยการถดถอยตัวแปรสุ่มYบนXจะมีการเพิ่มพจน์เพิ่มเติมเข้าไปในแบบจำลอง พจน์นี้คือปฏิสัมพันธ์ระหว่างXและตัวแปรปรับเปลี่ยนที่เสนอ[ 1 ]
ดังนั้น สำหรับการตอบสนองYและตัวแปรสองตัว ได้แก่x 1และตัวแปรควบคุมx 2 ,:
ในกรณีนี้ บทบาทของx 2ในฐานะตัวแปรควบคุมจะเกิดขึ้นได้โดยการประเมินb 3ซึ่งเป็นค่าประมาณพารามิเตอร์สำหรับพจน์ปฏิสัมพันธ์[ 1 ] ดูการถดถอยเชิงเส้นสำหรับการอภิปรายเกี่ยวกับการประเมินทางสถิติของค่าประมาณพารามิเตอร์ในการวิเคราะห์การถดถอย
ปัญหาความสัมพันธ์เชิงเส้นหลายตัวแปรในการถดถอยแบบมีตัวแปรควบคุม
ในการวิเคราะห์การถดถอยแบบมีตัวแปรควบคุม จะมีการคำนวณตัวทำนาย ปฏิสัมพันธ์ ใหม่ ( ) อย่างไรก็ตาม ตัวแปรปฏิสัมพันธ์ใหม่นี้อาจมีความสัมพันธ์กับตัวแปรผลกระทบหลักสองตัวที่ใช้ในการคำนวณ ซึ่งเป็นปัญหาของ ภาวะ ความสัมพันธ์ร่วมหลายตัวแปร (multicollinearity ) ในการถดถอยแบบมีตัวแปรควบคุม ภาวะความสัมพันธ์ร่วมหลายตัวแปรนี้มักทำให้ค่าสัมประสิทธิ์ที่ประมาณได้มีค่าความคลาดเคลื่อนมาตรฐาน สูงขึ้น และส่งผลให้มีความไม่แน่นอนมากขึ้น
การปรับค่าเฉลี่ยให้อยู่ตรงกลาง (การลบคะแนนดิบออกจากค่าเฉลี่ย) อาจช่วยลดความสัมพันธ์เชิงเส้นหลายตัวแปร ส่งผลให้ค่าสัมประสิทธิ์การถดถอยสามารถตีความได้ง่ายขึ้น[ 4 ] [ 5 ]อย่างไรก็ตาม มันไม่ได้ส่งผลต่อความเหมาะสมของแบบจำลองโดยรวม
การตรวจสอบปฏิสัมพันธ์ภายหลัง
เช่นเดียวกับการวิเคราะห์ผลกระทบหลักแบบง่ายใน ANOVA ในการตรวจสอบปฏิสัมพันธ์แบบ post-hoc ในการถดถอย เราจะตรวจสอบความชันแบบง่ายของตัวแปรอิสระตัวหนึ่งที่ค่าเฉพาะของตัวแปรอิสระอีกตัวหนึ่ง ด้านล่างนี้เป็นตัวอย่างของการตรวจสอบปฏิสัมพันธ์แบบสองทาง ในส่วนต่อไปนี้ สมการการถดถอยที่มีตัวแปรสองตัวคือ A และ B และพจน์ปฏิสัมพันธ์ A*B
จะได้รับการพิจารณา[ 6 ]
ตัวแปรอิสระเชิงหมวดหมู่สองตัว
ถ้าตัวแปรอิสระทั้งสองเป็นตัวแปรเชิงหมวดหมู่ เราสามารถวิเคราะห์ผลลัพธ์ของการถดถอยสำหรับตัวแปรอิสระตัวหนึ่งที่ระดับเฉพาะของตัวแปรอิสระอีกตัวหนึ่งได้ ตัวอย่างเช่น สมมติว่า A และ B เป็นตัวแปรดัมมี่แบบเดี่ยว (0,1) และ A แทนเชื้อชาติ (0 = ชาวอเมริกันเชื้อสายยุโรป, 1 = ชาวเอเชียตะวันออก) และ B แทนเงื่อนไขในการศึกษา (0 = กลุ่มควบคุม, 1 = กลุ่มทดลอง) จากนั้นผลกระทบปฏิสัมพันธ์จะแสดงให้เห็นว่าผลของเงื่อนไขต่อตัวแปรตาม Y แตกต่างกันสำหรับชาวอเมริกันเชื้อสายยุโรปและชาวเอเชียตะวันออกหรือไม่ และผลของสถานะทางเชื้อชาติแตกต่างกันสำหรับสองเงื่อนไขหรือไม่ สัมประสิทธิ์ของ A แสดงผลของเชื้อชาติที่มีต่อ Y สำหรับกลุ่มควบคุม ในขณะที่สัมประสิทธิ์ของ B แสดงผลของการกำหนดเงื่อนไขการทดลองสำหรับผู้เข้าร่วมชาวอเมริกันเชื้อสายยุโรป
เพื่อตรวจสอบว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างชาวอเมริกันเชื้อสายยุโรปและชาวเอเชียตะวันออกในเงื่อนไขการทดลองหรือไม่ เราสามารถทำการวิเคราะห์โดยกลับรหัสตัวแปรเงื่อนไข (0 = ทดลอง, 1 = ควบคุม) เพื่อให้ค่าสัมประสิทธิ์ของเชื้อชาติแสดงถึงผลกระทบของเชื้อชาติต่อ Y ในเงื่อนไขการทดลอง ในทำนองเดียวกัน หากเราต้องการดูว่าการทดลองมีผลต่อผู้เข้าร่วมชาวเอเชียตะวันออกหรือไม่ เราสามารถกลับรหัสตัวแปรเชื้อชาติ (0 = ชาวเอเชียตะวันออก, 1 = ชาวอเมริกันเชื้อสายยุโรป)
ตัวแปรอิสระหนึ่งตัวเป็นตัวแปรเชิงหมวดหมู่ และอีกหนึ่งตัวเป็นตัวแปรต่อเนื่อง

ถ้าตัวแปรอิสระตัวแรกเป็นตัวแปรเชิงหมวดหมู่ (เช่น เพศ) และตัวแปรอิสระตัวที่สองเป็นตัวแปรต่อเนื่อง (เช่น คะแนนจากแบบประเมินความพึงพอใจในชีวิต (SWLS)) แล้วb 1จะแสดงถึงความแตกต่างของตัวแปรตามระหว่างเพศชายและเพศหญิงเมื่อความพึงพอใจในชีวิตเป็นศูนย์ อย่างไรก็ตาม คะแนนศูนย์ในแบบประเมินความพึงพอใจในชีวิตนั้นไม่มีความหมาย เนื่องจากช่วงคะแนนอยู่ระหว่าง 7 ถึง 35 นี่คือจุดที่การปรับค่าเฉลี่ยเข้ามามีบทบาท ถ้าเราลบค่าเฉลี่ยของคะแนน SWLS สำหรับกลุ่มตัวอย่างออกจากคะแนนของผู้เข้าร่วมแต่ละคน ค่าเฉลี่ยของคะแนน SWLS ที่ปรับค่าเฉลี่ยแล้วจะเป็นศูนย์ เมื่อทำการวิเคราะห์อีกครั้งb 1จะแสดงถึงความแตกต่างระหว่างเพศชายและเพศหญิงที่ระดับค่าเฉลี่ยของคะแนน SWLS ของกลุ่มตัวอย่าง

Cohen et al. (2003) แนะนำให้ใช้สิ่งต่อไปนี้เพื่อตรวจสอบผลกระทบง่ายๆ ของเพศต่อตัวแปรตาม ( Y ) ที่ระดับสามระดับของตัวแปรอิสระต่อเนื่อง: สูง (หนึ่งส่วนเบี่ยงเบนมาตรฐานเหนือค่าเฉลี่ย), ปานกลาง (ที่ค่าเฉลี่ย) และต่ำ (หนึ่งส่วนเบี่ยงเบนมาตรฐานต่ำกว่าค่าเฉลี่ย) [ 7 ]หากคะแนนของตัวแปรต่อเนื่องไม่ได้ถูกทำให้เป็นมาตรฐาน เราสามารถคำนวณค่าทั้งสามนี้ได้โดยการบวกหรือลบหนึ่งส่วนเบี่ยงเบนมาตรฐานของคะแนนเดิม หากคะแนนของตัวแปรต่อเนื่องถูกทำให้เป็นมาตรฐาน เราสามารถคำนวณค่าทั้งสามได้ดังนี้: สูง = คะแนนมาตรฐานลบ 1, ปานกลาง (ค่าเฉลี่ย = 0), ต่ำ = คะแนนมาตรฐานบวก 1 จากนั้นเราสามารถสำรวจผลกระทบของเพศต่อตัวแปรตาม ( Y ) ที่ระดับสูง ปานกลาง และต่ำของคะแนน SWLS เช่นเดียวกับตัวแปรอิสระเชิงหมวดหมู่สองตัวb2 แสดงถึงผลกระทบของคะแนน SWLS ต่อตัวแปรตามสำหรับเพศหญิง โดยการกลับรหัสตัวแปรเพศ เราสามารถได้รับผลกระทบของคะแนน SWLS ต่อตัวแปรตามสำหรับเพศชาย
การเข้ารหัสในการถดถอยแบบมีตัวแปรควบคุม


เมื่อพิจารณาตัวแปรเชิงหมวดหมู่ เช่น กลุ่มชาติพันธุ์และการทดลองเป็นตัวแปรอิสระในการถดถอยแบบมีตัวแปรควบคุม จำเป็นต้องเข้ารหัสตัวแปรเพื่อให้ตัวแปรที่เข้ารหัสแต่ละตัวแสดงถึงการตั้งค่าเฉพาะของตัวแปรเชิงหมวดหมู่ มีวิธีการเข้ารหัสพื้นฐานสามวิธี ได้แก่ การเข้ารหัสตัวแปรดัมมี่ การเข้ารหัสความแตกต่าง และการเข้ารหัสผลกระทบ ด้านล่างนี้เป็นการแนะนำระบบการเข้ารหัสเหล่านี้[ 8 ] [ 9 ]

การเข้ารหัสแบบดัมมี่ (Dummy coding)เปรียบเทียบกลุ่มอ้างอิง (เช่น กลุ่มควบคุมในการทดลอง) กับกลุ่มทดลองอื่นๆ แต่ละกลุ่ม ในกรณีนี้ ค่าคงที่ (Intercept) คือค่าเฉลี่ยของกลุ่มอ้างอิง สัมประสิทธิ์การถดถอยที่ไม่เป็นมาตรฐานแต่ละตัวคือผลต่างของค่าเฉลี่ยตัวแปรตามระหว่างกลุ่มทดลองกับกลุ่มอ้างอิง ระบบการเข้ารหัสนี้คล้ายกับการวิเคราะห์ ANOVA
การเข้ารหัสแบบเปรียบเทียบความแตกต่าง ( Contrast coding ) ตรวจสอบความแตกต่างเชิงตั้งฉาก (การเปรียบเทียบกลุ่ม) หลายชุด ค่าจุดตัด (Intercept) คือค่าเฉลี่ยที่ไม่ถ่วงน้ำหนักของค่าเฉลี่ยแต่ละกลุ่ม ค่าสัมประสิทธิ์การถดถอยที่ไม่เป็นมาตรฐาน (Unstandardized regression coefficient) แสดงถึงความแตกต่างระหว่างสองกลุ่ม ระบบการเข้ารหัสนี้เหมาะสมเมื่อนักวิจัยมีสมมติฐานเบื้องต้นเกี่ยวกับความแตกต่างเฉพาะระหว่างค่าเฉลี่ยของกลุ่มต่างๆ
การเข้ารหัส แบบ Effects codingใช้เมื่อไม่มีกลุ่มอ้างอิงหรือความแตกต่างเชิงตั้งฉาก ค่าคงที่คือค่าเฉลี่ยรวม (ค่าเฉลี่ยของทุกเงื่อนไข) สัมประสิทธิ์การถดถอยคือผลต่างระหว่างค่าเฉลี่ยของกลุ่มหนึ่งกับค่าเฉลี่ยของค่าเฉลี่ยของทุกกลุ่ม ระบบการเข้ารหัสนี้เหมาะสมเมื่อกลุ่มต่างๆ แสดงถึงหมวดหมู่ตามธรรมชาติ
ตัวแปรอิสระต่อเนื่องสองตัว



หากตัวแปรอิสระทั้งสองเป็นตัวแปรต่อเนื่อง จะเป็นประโยชน์ต่อการตีความหากทำการปรับค่าศูนย์กลางหรือทำให้เป็นมาตรฐานตัวแปรอิสระXและZ (การปรับค่าศูนย์กลางเกี่ยวข้องกับการลบค่าเฉลี่ยของตัวอย่างทั้งหมดออกจากค่าเดิม การทำให้เป็นมาตรฐานทำเช่นเดียวกันแล้วหารด้วยค่าเบี่ยงเบนมาตรฐานของตัวอย่างทั้งหมด) โดยการปรับค่าศูนย์กลางหรือทำให้เป็นมาตรฐานตัวแปรอิสระ ค่าสัมประสิทธิ์ของXหรือZสามารถตีความได้ว่าเป็นผลกระทบของตัวแปรนั้นต่อ Y ที่ระดับค่าเฉลี่ยของตัวแปรอิสระอีกตัวหนึ่ง[ 10 ]
เพื่อตรวจสอบผลกระทบของการปฏิสัมพันธ์ มักจะเป็นประโยชน์ที่จะพล็อตผลกระทบของXต่อYที่ค่าZ ต่ำและสูง (บางคนอาจชอบพล็อตผลกระทบที่ค่าZ ปานกลางด้วย แต่ไม่จำเป็น) โดยทั่วไปจะเลือกค่าZที่อยู่เหนือและต่ำกว่าค่าเฉลี่ยหนึ่งส่วนเบี่ยงเบนมาตรฐาน แต่สามารถใช้ค่าใดๆ ก็ได้ที่เหมาะสม (และในบางกรณีอาจมีค่าที่มีความหมายมากกว่าให้เลือก) โดยปกติจะวาดกราฟโดยการประเมินค่าYสำหรับค่าXและZ สูงและต่ำ และสร้างเส้นสองเส้นเพื่อแสดงผลกระทบของXต่อY ที่ค่า Zสองค่าบางครั้งจะเสริมด้วยการวิเคราะห์ความชันอย่างง่าย ซึ่งจะกำหนดว่าผลกระทบของXต่อYมีนัยสำคัญทางสถิติที่ค่า Z เฉพาะ หรือไม่ เทคนิคทั่วไปสำหรับการวิเคราะห์ความชันอย่างง่ายคือวิธีการของ Johnson-Neyman [ 11 ]มีเครื่องมือต่างๆ บนอินเทอร์เน็ตที่ช่วยให้นักวิจัยพล็อตและตีความปฏิสัมพันธ์แบบสองทางดังกล่าวได้[ 12 ]

ปฏิสัมพันธ์ระดับสูง
หลักการสำหรับการปฏิสัมพันธ์แบบสองทางสามารถนำมาใช้ได้เมื่อเราต้องการสำรวจปฏิสัมพันธ์แบบสามทางหรือระดับที่สูงกว่านั้น ตัวอย่างเช่น หากเรามีปฏิสัมพันธ์แบบสามทางระหว่างA , BและCสมการการถดถอยจะเป็นดังนี้:
ผลกระทบลำดับสูงที่ไม่ถูกต้อง
เป็นที่น่าสังเกตว่าความน่าเชื่อถือของพจน์ลำดับสูงกว่านั้นขึ้นอยู่กับความน่าเชื่อถือของพจน์ลำดับต่ำกว่า ตัวอย่างเช่น หากความน่าเชื่อถือของตัวแปรAคือ 0.70 ความน่าเชื่อถือของตัวแปรBคือ 0.80 และความสัมพันธ์ของตัวแปรทั้งสองคือr = 0.2 ความน่าเชื่อถือของตัวแปรปฏิสัมพันธ์A * Bก็คือ[ 13 ]ในกรณีนี้ ความน่าเชื่อถือต่ำของพจน์ปฏิสัมพันธ์ส่งผลให้กำลังการทดสอบต่ำ ดังนั้น เราอาจไม่สามารถค้นหาผลกระทบปฏิสัมพันธ์ระหว่าง A และ B ที่มีอยู่จริงได้ วิธีแก้ปัญหานี้คือการใช้มาตรวัดที่มีความน่าเชื่อถือสูงสำหรับตัวแปรอิสระแต่ละตัว
ข้อควรระวังอีกประการหนึ่งในการ ตีความผลกระทบจากการปฏิสัมพันธ์คือ เมื่อตัวแปรAและตัวแปรBมีความสัมพันธ์กันสูง พจน์ A * Bก็จะมีความสัมพันธ์สูงกับ ตัวแปร A² ที่ถูกละเว้น ดังนั้นสิ่งที่ดูเหมือนจะเป็นผลกระทบการปรับเปลี่ยนที่มีนัยสำคัญ อาจเป็นผลกระทบที่ไม่เป็นเชิงเส้นที่มีนัยสำคัญของAเพียงอย่างเดียว หากเป็นเช่นนั้น ควรทดสอบแบบจำลองการถดถอยที่ไม่เป็นเชิงเส้นโดยการเพิ่มพจน์ที่ไม่เป็นเชิงเส้นในตัวแปรแต่ละตัวลงในการวิเคราะห์การถดถอยแบบปรับเปลี่ยนเพื่อดูว่าการปฏิสัมพันธ์ยังคงมีนัยสำคัญหรือไม่ หากผลกระทบจากการปฏิสัมพันธ์A * Bยังคงมีนัยสำคัญ เราจะมั่นใจมากขึ้นว่ามีผลกระทบการปรับเปลี่ยนอยู่จริง อย่างไรก็ตาม หากผลกระทบจากการปฏิสัมพันธ์ไม่มีนัยสำคัญอีกต่อไปหลังจากเพิ่มพจน์ที่ไม่เป็นเชิงเส้น เราจะไม่แน่ใจเกี่ยวกับการมีอยู่ของผลกระทบการปรับเปลี่ยน และจะเลือกใช้แบบจำลองที่ไม่เป็นเชิงเส้นเพราะมีความกระชับกว่า
การวิเคราะห์การถดถอยแบบมีตัวแปรควบคุมมักจะรวมตัวแปรเพิ่มเติม ซึ่งถือเป็นตัวแปรควบคุมที่ไม่สนใจ อย่างไรก็ตาม การมีอยู่ของตัวแปรควบคุมเหล่านี้สามารถทำให้เกิดผลที่ไม่พึงประสงค์ได้เมื่อ (1) ตัวแปรควบคุม ( C ) มีความสัมพันธ์กับตัวแปรหลักที่สนใจตัวใดตัวหนึ่ง (เช่น ตัวแปรAหรือB ) หรือ (2) เมื่อตัวแปรควบคุมนั้นเป็นตัวแปรควบคุมความสัมพันธ์ระหว่างAหรือBกับY [ 14 ] [ 15 ] [ 16 ] วิธีแก้ปัญหาคือ การรวมพจน์ปฏิสัมพันธ์เพิ่มเติมในแบบจำลอง สำหรับปฏิสัมพันธ์ระหว่างตัวแปรแทรกซ้อนแต่ละตัวกับตัวแปรหลักดังต่อไปนี้:
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การควบคุม (สถิติ)
ใน ทางสถิติ และ การวิเคราะห์การ ถดถอย การ ปรับเปลี่ยน (หรือที่เรียกว่า การปรับเปลี่ยนผลกระทบ ) เกิดขึ้นเมื่อความสัมพันธ์ระหว่างตัวแปรสองตัวขึ้นอยู่กับตัวแปรที่สาม...
ตัวอย่าง
การวิเคราะห์การปรับเปลี่ยนใน วิทยาศาสตร์พฤติกรรม เกี่ยวข้องกับการใช้ การวิเคราะห์การถดถอยเชิงเส้นหลายตัวแปร หรือการ สร้างแบบจำลองเชิงสาเหตุ [ 1 ] เพื่อหาปริมาณผลของตัวแปรปรับเปลี่ยนในการวิเคราะห์การถดถอยหลาย ตัวแปร โดยการถดถอยตัวแปรสุ่ม Y บน X...
ปัญหาความสัมพันธ์เชิงเส้นหลายตัวแปรในการถดถอยแบบมีตัวแปรควบคุม
ในการวิเคราะห์การถดถอยแบบมีตัวแปรควบคุม จะมีการคำนวณตัวทำนาย ปฏิสัมพันธ์ ใหม่ ( ) อย่างไรก็ตาม ตัวแปรปฏิสัมพันธ์ใหม่นี้อาจมีความสัมพันธ์กับตัวแปรผลกระทบหลักสองตัวที่ใช้ในการคำนวณ ซึ่งเป็นปัญหาของ ภาวะ ความสัมพันธ์ร่วมหลายตัวแปร (multicollinearity )...
การตรวจสอบปฏิสัมพันธ์ภายหลัง
เช่นเดียวกับการวิเคราะห์ผลกระทบหลักแบบง่ายใน ANOVA ในการตรวจสอบปฏิสัมพันธ์แบบ post-hoc ในการถดถอย เราจะตรวจสอบความชันแบบง่ายของตัวแปรอิสระตัวหนึ่งที่ค่าเฉพาะของตัวแปรอิสระอีกตัวหนึ่ง ด้านล่างนี้เป็นตัวอย่างของการตรวจสอบปฏิสัมพันธ์แบบสองทาง ในส่วนต่อไปนี้...