อ่าน 5 นาที
การแก้ไขของเฮ็กแมน
การแก้ไข ของ Heckman เป็นเทคนิคทางสถิติเพื่อแก้ไข อคติ จาก ตัวอย่างที่ไม่ได้เลือกแบบสุ่ม หรือ ตัวแปรตามที่ถูกตัดทอน โดยบังเอิญ ซึ่งเป็นปัญหาที่พบได้ทั่วไปใน วิทยาศาสตร์สังคม...
การแก้ไขของเฮ็กแมน
การแก้ไข ของHeckmanเป็นเทคนิคทางสถิติเพื่อแก้ไขอคติจากตัวอย่างที่ไม่ได้เลือกแบบสุ่มหรือตัวแปรตามที่ถูกตัดทอน โดยบังเอิญ ซึ่งเป็นปัญหาที่พบได้ทั่วไปในวิทยาศาสตร์สังคม เชิงปริมาณ เมื่อใช้ข้อมูลจากการสังเกต[ 1 ]ในเชิงแนวคิด การแก้ไขนี้ทำได้โดยการสร้างแบบจำลองความน่าจะเป็นของการสุ่มตัวอย่างแต่ละรายการของการสังเกต (ที่เรียกว่าสมการการเลือก) ร่วมกับความคาดหวังแบบมีเงื่อนไขของตัวแปรตาม (ที่เรียกว่าสมการผลลัพธ์) ฟังก์ชันความน่าจะ เป็นที่ได้นั้น มีความคล้ายคลึงทางคณิตศาสตร์กับแบบจำลอง tobitสำหรับตัวแปรตามที่ถูกตัดทอน ซึ่งเป็นการเชื่อมโยงที่ James Heckmanค้นพบเป็นครั้งแรกในปี 1974 [ 2 ] Heckman ยังได้พัฒนา วิธี การควบคุมฟังก์ชันแบบ สองขั้นตอน เพื่อประมาณแบบจำลองนี้[ 3 ]ซึ่งหลีกเลี่ยงภาระการคำนวณที่ต้องประมาณสมการทั้งสองร่วมกันแม้ว่าจะต้องแลกมาด้วยประสิทธิภาพที่ลดลงก็ตาม[ 4 ] Heckman ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ในปี 2000 จากผลงานของเขาในสาขานี้[ 5 ]
วิธี
การวิเคราะห์ทางสถิติโดยใช้ตัวอย่างที่ไม่ได้เลือกแบบสุ่มอาจนำไปสู่ข้อสรุปที่ผิดพลาดได้ การแก้ไขของเฮ็กแมน (Heckman correction) ซึ่งเป็นวิธีการทางสถิติสองขั้นตอน ช่วยแก้ไขปัญหาที่เกิดจากตัวอย่างที่ไม่ได้เลือกแบบสุ่มได้
เฮ็กแมนได้กล่าวถึงอคติที่เกิดจากการใช้ตัวอย่างที่ไม่ได้เลือกแบบสุ่มในการประมาณความสัมพันธ์เชิงพฤติกรรมว่าเป็นข้อผิดพลาดในการกำหนดแบบจำลอง เขาเสนอวิธีการประมาณค่าแบบสองขั้นตอนเพื่อแก้ไขอคติดังกล่าว การแก้ไขนี้ใช้ แนวคิด ฟังก์ชันควบคุมและง่ายต่อการนำไปใช้ การแก้ไขของเฮ็กแมนเกี่ยวข้องกับ การตั้งสมมติฐานเรื่องการกระจาย แบบปกติมีการทดสอบอคติจากการเลือกตัวอย่าง และมีสูตรสำหรับแบบจำลองที่แก้ไขอคติแล้ว
สมมติว่านักวิจัยต้องการประมาณปัจจัยกำหนดข้อเสนอค่าจ้าง แต่มีข้อมูลค่าจ้างเฉพาะสำหรับผู้ที่ทำงานเท่านั้น เนื่องจากผู้ที่ทำงานไม่ได้ถูกเลือกแบบสุ่มจากประชากร การประมาณปัจจัยกำหนดค่าจ้างจากกลุ่มย่อยของผู้ที่ทำงานอาจทำให้เกิดอคติได้ การแก้ไขของ Heckman เกิดขึ้นในสองขั้นตอน
ในขั้นตอนแรก นักวิจัยจะสร้างแบบจำลองโดยอิงตามทฤษฎีเศรษฐศาสตร์สำหรับความน่าจะเป็นของการทำงาน รูปแบบมาตรฐานสำหรับความสัมพันธ์นี้คือ การถดถอยแบบโพร บิตในรูปแบบ
โดยที่Dแสดงถึงการจ้างงาน ( D = 1 ถ้าผู้ตอบแบบสอบถามมีงานทำ และD = 0 ถ้าไม่มีงานทำ) Zคือเวกเตอร์ของตัวแปรอธิบายคือเวกเตอร์ของพารามิเตอร์ที่ไม่ทราบค่า และ Φ คือฟังก์ชันการกระจายสะสมของการแจกแจงปกติ มาตรฐาน การประมาณค่าแบบจำลองจะให้ผลลัพธ์ที่สามารถนำมาใช้ในการทำนายความน่าจะเป็นของการจ้างงานสำหรับแต่ละบุคคลได้
ในขั้นตอนที่สอง นักวิจัยจะแก้ไขปัญหาการเลือกตนเองโดยการรวมการแปลงค่าความน่าจะเป็นส่วนบุคคลที่คาดการณ์ไว้เหล่านี้เป็นตัวแปรอธิบายเพิ่มเติม สมการค่าจ้างอาจระบุได้ดังนี้
โดยที่หมายถึงข้อเสนอค่าจ้างพื้นฐาน ซึ่งจะไม่ปรากฏหากผู้ตอบแบบสอบถามไม่ได้ทำงาน ดังนั้น ความคาดหวังแบบมีเงื่อนไขของค่าจ้างเมื่อบุคคลนั้นทำงาน จึงเป็นดังนี้
ภายใต้สมมติฐานที่ว่าค่าความคลาดเคลื่อนมีการกระจายแบบปกติร่วมกันเราจะได้ว่า
โดยที่ρคือค่าสหสัมพันธ์ระหว่างปัจจัยที่ไม่สามารถสังเกตได้ของแนวโน้มที่จะทำงานและปัจจัยที่ไม่สามารถสังเกตได้ของข้อเสนอค่าจ้างu , σuคือค่าเบี่ยงเบนมาตรฐานของและคืออัตราส่วน Mills ผกผันที่ประเมินที่ สม การนี้แสดงให้เห็นถึงความเข้าใจของ Heckman ที่ว่าการเลือกตัวอย่างสามารถมองได้ว่าเป็นรูปแบบหนึ่งของอคติจากตัวแปรที่ถูกละเว้นเนื่องจากเมื่อพิจารณาทั้งXและ แล้วตัวอย่างจะถูกเลือกแบบสุ่ม สมการค่าจ้างสามารถประมาณได้โดยการแทนที่ด้วยค่าประมาณ Probit จากขั้นตอนแรก สร้างเทอม และรวมไว้เป็นตัวแปรอธิบายเพิ่มเติมใน การประมาณค่า ถดถอยเชิงเส้นของสมการค่าจ้าง เนื่องจากสัมประสิทธิ์ของจะเป็นศูนย์ได้ก็ต่อเมื่อดังนั้นการทดสอบสมมติฐานว่างที่ว่าสัมประสิทธิ์ของเป็นศูนย์จึงเทียบเท่ากับการทดสอบการเลือกตัวอย่าง
ความสำเร็จของ Heckman ได้ก่อให้เกิดการประยุกต์ใช้เชิงประจักษ์จำนวนมากในเศรษฐศาสตร์ รวมถึงในสังคมศาสตร์อื่นๆ วิธีการดั้งเดิมได้รับการขยายความในภายหลังโดย Heckman และผู้อื่น[ 6 ]
การอนุมานทางสถิติ
การแก้ไขของ Heckman เป็นตัวประมาณค่า M สองขั้นตอนโดยที่เมทริกซ์ความแปรปรวนร่วมที่สร้างขึ้นโดยการประมาณค่า OLS ในขั้นตอนที่สองไม่สอดคล้องกัน[ 7 ]ข้อผิดพลาดมาตรฐานที่ถูกต้องและสถิติอื่นๆ สามารถสร้างได้จากการประมาณค่าแบบไม่จำกัดหรือโดยการสุ่มตัวอย่างซ้ำ เช่น ผ่านการบูตสแตรป[ 8 ]
ข้อเสีย
- ตัวประมาณค่าแบบสองขั้นตอนที่กล่าวถึงข้างต้นเป็นตัวประมาณค่าความน่าจะเป็นสูงสุดที่มีข้อมูลจำกัด (LIML) ในทฤษฎีเชิงอะซิมโทติกและในตัวอย่างจำกัดดังที่แสดงโดยการจำลองมอนเตคาร์โล ตัวประมาณค่าที่มีข้อมูลครบถ้วน (FIML) แสดงคุณสมบัติทางสถิติที่ดีกว่า อย่างไรก็ตาม ตัวประมาณค่า FIML นั้นยากต่อการนำไปใช้ในเชิงคำนวณมากกว่า[ 9 ]
- แบบจำลองมาตรฐานถือว่าข้อผิดพลาดเป็นแบบปกติร่วมกัน หากสมมติฐานนั้นไม่เป็นจริง ตัวประมาณค่าโดยทั่วไปจะไม่สอดคล้องกันและอาจให้การอนุมานที่ทำให้เข้าใจผิดในตัวอย่างขนาดเล็ก[ 10 ]สามารถใช้วิธีการกึ่งพาราเมตริกและทางเลือกที่แข็งแกร่งอื่นๆ ในกรณีดังกล่าวได้[ 11 ]
- แบบจำลองได้รับการระบุอย่างเป็นทางการจากสมมติฐานความปกติเมื่อตัวแปรเสริมเดียวกันปรากฏในสมการการเลือกและสมการที่สนใจ แต่การระบุจะเปราะบางเว้นแต่จะมีข้อมูลจำนวนมากในส่วนหางที่มีความไม่เป็นเชิงเส้นอย่างมากในอัตราส่วน Mills ผกผัน โดยทั่วไป จำเป็นต้องมีข้อจำกัดการยกเว้นเพื่อสร้างค่าประมาณที่น่าเชื่อถือ: ต้องมีตัวแปรอย่างน้อยหนึ่งตัวที่ปรากฏด้วยสัมประสิทธิ์ที่ไม่เป็นศูนย์ในสมการการเลือก แต่ไม่ปรากฏในสมการที่สนใจ ซึ่งโดยพื้นฐานแล้วคือเครื่องมือหากไม่มีตัวแปรดังกล่าว อาจเป็นเรื่องยากที่จะแก้ไขการเลือกตัวอย่าง[ 9 ]เหตุผลสำหรับเรื่องนี้มีสองประการ: หากไม่มีเครื่องมือ การระบุจะขึ้นอยู่กับสมมติฐานรูปแบบฟังก์ชันซึ่งโดยทั่วไปถือว่าอ่อนแอมาก[ 12 ]นอกจากนี้ แม้ว่าสมมติฐานจะเป็นจริง ฟังก์ชันที่เลือกอาจใกล้เคียงกับรูปแบบฟังก์ชันเชิงเส้นในพื้นที่ที่กำลังตรวจสอบ ทำให้เกิดปัญหาความสัมพันธ์เชิงเส้นหลายตัวในขั้นตอนที่สอง
การนำไปใช้ในแพ็กเกจทางสถิติ
- R : ขั้นตอนประเภท Heckman มีให้บริการเป็นส่วนหนึ่งของ
sampleSelectionแพ็คเกจ[ 13 ] [ 14 ] - Stata : คำสั่งนี้
heckmanให้โมเดลการเลือกของ Heckman [ 15 ] [ 16 ]
ดูเพิ่มเติม
- การจับคู่คะแนนความโน้มเอียง – เทคนิคการจับคู่ทางสถิติ
- แบบจำลองรอย – แบบจำลองสำหรับการเลือกตนเองในทางเศรษฐศาสตร์
อ่านเพิ่มเติม
- Achen, Christopher H. (1986). " การประมาณผลของการรักษาในการทดลองแบบกึ่งทดลอง: กรณีของข้อมูลที่ถูกตัดทอน"การวิเคราะห์ทางสถิติของการทดลองแบบกึ่งทดลองเบิร์กลีย์: สำนักพิมพ์มหาวิทยาลัยแคลิฟอร์เนีย หน้า 97–137 ISBN 0-520-04723-0.
- Breen, Richard (1996). แบบจำลองการถดถอย: ข้อมูลที่ถูกตัดทอน ข้อมูลที่เลือกจากตัวอย่าง หรือข้อมูลที่ถูกตัดทอน . Thousand Oaks: Sage. หน้า 33–48 . ISBN 0-8039-5710-6.
- Fu, Vincent Kang; Winship, Christopher ; Mare, Robert D. (2004). "แบบจำลองอคติในการเลือกตัวอย่าง" ใน Hardy, Melissa; Bryman, Alan (บรรณาธิการ). คู่มือการวิเคราะห์ข้อมูล . ลอนดอน: Sage. หน้า 409–430 . doi : 10.4135/9781848608184.n18 . ISBN 0-7619-6652-8.
- กรีน, วิลเลียม เอช. (2012). "การตัดทอนโดยบังเอิญและการเลือกตัวอย่าง" การวิเคราะห์ทางเศรษฐมิติ (ฉบับที่เจ็ด). บอสตัน: เพียร์สัน. หน้า 912–27 . ISBN 978-0-273-75356-8.
- Vella, Francis (1998). "การประมาณแบบจำลองที่มีอคติในการเลือกตัวอย่าง: การสำรวจ" วารสารทรัพยากรมนุษย์ 33 (1): 127– 169. doi : 10.2307/146317 . JSTOR 146317 .
ลิงก์ภายนอก
- ข้อเท็จจริงเกี่ยวกับรางวัลโนเบลของเฮ็กแมน
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การแก้ไขของเฮ็กแมน
การแก้ไข ของ Heckman เป็นเทคนิคทางสถิติเพื่อแก้ไข อคติ จาก ตัวอย่างที่ไม่ได้เลือกแบบสุ่ม หรือ ตัวแปรตามที่ถูกตัดทอน โดยบังเอิญ ซึ่งเป็นปัญหาที่พบได้ทั่วไปใน วิทยาศาสตร์สังคม...
วิธี
การวิเคราะห์ทางสถิติโดยใช้ตัวอย่างที่ไม่ได้เลือกแบบสุ่มอาจนำไปสู่ข้อสรุปที่ผิดพลาดได้ การแก้ไขของเฮ็กแมน (Heckman correction) ซึ่งเป็นวิธีการทางสถิติสองขั้นตอน ช่วยแก้ไขปัญหาที่เกิดจากตัวอย่างที่ไม่ได้เลือกแบบสุ่มได้
การอนุมานทางสถิติ
การแก้ไขของ Heckman เป็น ตัวประมาณค่า M สองขั้นตอน โดยที่เมทริกซ์ความแปรปรวนร่วมที่สร้างขึ้นโดยการประมาณค่า OLS ในขั้นตอนที่สองไม่สอดคล้องกัน [ 7 ] ข้อผิดพลาดมาตรฐานที่ถูกต้องและสถิติอื่นๆ สามารถสร้างได้จากการประมาณค่าแบบไม่จำกัดหรือโดยการสุ่มตัวอย่างซ้ำ เช่น...
ข้อเสีย
ตัวประมาณค่าแบบสองขั้นตอนที่กล่าวถึงข้างต้นเป็นตัวประมาณค่าความน่าจะเป็นสูงสุดที่มีข้อมูลจำกัด (LIML) ในทฤษฎีเชิงอะซิมโทติกและในตัวอย่างจำกัดดังที่แสดงโดยการจำลองมอนเตคาร์โล ตัวประมาณค่าที่มีข้อมูลครบถ้วน (FIML) แสดงคุณสมบัติทางสถิติที่ดีกว่า อย่างไรก็ตาม...