การแก้ไขของเฮ็กแมน

การแก้ไข ของHeckmanเป็นเทคนิคทางสถิติเพื่อแก้ไขอคติจากตัวอย่างที่ไม่ได้เลือกแบบสุ่มหรือตัวแปรตามที่ถูกตัดทอน โดยบังเอิญ ซึ่งเป็นปัญหาที่พบได้ทั่วไปในวิทยาศาสตร์สังคม เชิงปริมาณ เมื่อใช้ข้อมูลจากการสังเกต^{[ 1 ]}ในเชิงแนวคิด การแก้ไขนี้ทำได้โดยการสร้างแบบจำลองความน่าจะเป็นของการสุ่มตัวอย่างแต่ละรายการของการสังเกต (ที่เรียกว่าสมการการเลือก) ร่วมกับความคาดหวังแบบมีเงื่อนไขของตัวแปรตาม (ที่เรียกว่าสมการผลลัพธ์) ฟังก์ชันความน่าจะ เป็นที่ได้นั้น มีความคล้ายคลึงทางคณิตศาสตร์กับแบบจำลอง tobitสำหรับตัวแปรตามที่ถูกตัดทอน ซึ่งเป็นการเชื่อมโยงที่ James Heckmanค้นพบเป็นครั้งแรกในปี 1974 ^{[ 2 ]} Heckman ยังได้พัฒนา วิธี การควบคุมฟังก์ชันแบบ สองขั้นตอน เพื่อประมาณแบบจำลองนี้^{[ 3 ]}ซึ่งหลีกเลี่ยงภาระการคำนวณที่ต้องประมาณสมการทั้งสองร่วมกันแม้ว่าจะต้องแลกมาด้วยประสิทธิภาพที่ลดลงก็ตาม^{[ 4 ]} Heckman ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ในปี 2000 จากผลงานของเขาในสาขานี้^{[ 5 ]}

วิธี

การวิเคราะห์ทางสถิติโดยใช้ตัวอย่างที่ไม่ได้เลือกแบบสุ่มอาจนำไปสู่ข้อสรุปที่ผิดพลาดได้ การแก้ไขของเฮ็กแมน (Heckman correction) ซึ่งเป็นวิธีการทางสถิติสองขั้นตอน ช่วยแก้ไขปัญหาที่เกิดจากตัวอย่างที่ไม่ได้เลือกแบบสุ่มได้

เฮ็กแมนได้กล่าวถึงอคติที่เกิดจากการใช้ตัวอย่างที่ไม่ได้เลือกแบบสุ่มในการประมาณความสัมพันธ์เชิงพฤติกรรมว่าเป็นข้อผิดพลาดในการกำหนดแบบจำลอง เขาเสนอวิธีการประมาณค่าแบบสองขั้นตอนเพื่อแก้ไขอคติดังกล่าว การแก้ไขนี้ใช้ แนวคิด ฟังก์ชันควบคุมและง่ายต่อการนำไปใช้ การแก้ไขของเฮ็กแมนเกี่ยวข้องกับ การตั้งสมมติฐานเรื่องการกระจาย แบบปกติมีการทดสอบอคติจากการเลือกตัวอย่าง และมีสูตรสำหรับแบบจำลองที่แก้ไขอคติแล้ว

สมมติว่านักวิจัยต้องการประมาณปัจจัยกำหนดข้อเสนอค่าจ้าง แต่มีข้อมูลค่าจ้างเฉพาะสำหรับผู้ที่ทำงานเท่านั้น เนื่องจากผู้ที่ทำงานไม่ได้ถูกเลือกแบบสุ่มจากประชากร การประมาณปัจจัยกำหนดค่าจ้างจากกลุ่มย่อยของผู้ที่ทำงานอาจทำให้เกิดอคติได้ การแก้ไขของ Heckman เกิดขึ้นในสองขั้นตอน

ในขั้นตอนแรก นักวิจัยจะสร้างแบบจำลองโดยอิงตามทฤษฎีเศรษฐศาสตร์สำหรับความน่าจะเป็นของการทำงาน รูปแบบมาตรฐานสำหรับความสัมพันธ์นี้คือ การถดถอยแบบโพร บิตในรูปแบบ

\operatorname {Prob} (D=1|Z)=\Phi (Z\gamma ),

โดยที่Dแสดงถึงการจ้างงาน ( D = 1 ถ้าผู้ตอบแบบสอบถามมีงานทำ และD = 0 ถ้าไม่มีงานทำ) Zคือเวกเตอร์ของตัวแปรอธิบายคือเวกเตอร์ของพารามิเตอร์ที่ไม่ทราบค่า และ Φ คือฟังก์ชันการกระจายสะสมของการแจกแจงปกติ มาตรฐาน การประมาณค่าแบบจำลองจะให้ผลลัพธ์ที่สามารถนำมาใช้ในการทำนายความน่าจะเป็นของการจ้างงานสำหรับแต่ละบุคคลได้ $\gamma$

ในขั้นตอนที่สอง นักวิจัยจะแก้ไขปัญหาการเลือกตนเองโดยการรวมการแปลงค่าความน่าจะเป็นส่วนบุคคลที่คาดการณ์ไว้เหล่านี้เป็นตัวแปรอธิบายเพิ่มเติม สมการค่าจ้างอาจระบุได้ดังนี้

w^{*}=X\เบต้า +u

โดยที่หมายถึงข้อเสนอค่าจ้างพื้นฐาน ซึ่งจะไม่ปรากฏหากผู้ตอบแบบสอบถามไม่ได้ทำงาน ดังนั้น ความคาดหวังแบบมีเงื่อนไขของค่าจ้างเมื่อบุคคลนั้นทำงาน จึงเป็นดังนี้ $w^{*}$

E[w|X,D=1]=X\beta +E[u|X,D=1].

ภายใต้สมมติฐานที่ว่าค่าความคลาดเคลื่อนมีการกระจายแบบปกติร่วมกันเราจะได้ว่า

E[w|X,D=1]=X\beta +\rho \sigma _{u}\lambda (Z\gamma ),

โดยที่ρคือค่าสหสัมพันธ์ระหว่างปัจจัยที่ไม่สามารถสังเกตได้ของแนวโน้มที่จะทำงานและปัจจัยที่ไม่สามารถสังเกตได้ของข้อเสนอค่าจ้างu , σuคือค่าเบี่ยงเบนมาตรฐานของและคืออัตราส่วน Mills ผกผันที่ประเมินที่ สม _การนี้แสดงให้เห็นถึงความเข้าใจของ Heckman ที่ว่าการเลือกตัวอย่างสามารถมองได้ว่าเป็นรูปแบบหนึ่งของอคติจากตัวแปรที่ถูกละเว้นเนื่องจากเมื่อพิจารณาทั้งXและ แล้วตัวอย่างจะถูกเลือกแบบสุ่ม สมการค่าจ้างสามารถประมาณได้โดยการแทนที่ด้วยค่าประมาณ Probit จากขั้นตอนแรก สร้างเทอม และรวมไว้เป็นตัวแปรอธิบายเพิ่มเติมใน การประมาณค่า ถดถอยเชิงเส้นของสมการค่าจ้าง เนื่องจากสัมประสิทธิ์ของจะเป็นศูนย์ได้ก็ต่อเมื่อดังนั้นการทดสอบสมมติฐานว่างที่ว่าสัมประสิทธิ์ของเป็นศูนย์จึงเทียบเท่ากับการทดสอบการเลือกตัวอย่าง $\varepsilon$ $u$ $\lambda$ $Z\gamma$ $\lambda$ $\gamma$ $\lambda$ $\sigma _{u}>0$ $\lambda$ $\rho =0$ $\lambda$

ความสำเร็จของ Heckman ได้ก่อให้เกิดการประยุกต์ใช้เชิงประจักษ์จำนวนมากในเศรษฐศาสตร์ รวมถึงในสังคมศาสตร์อื่นๆ วิธีการดั้งเดิมได้รับการขยายความในภายหลังโดย Heckman และผู้อื่น^{[ 6 ]}

การอนุมานทางสถิติ

การแก้ไขของ Heckman เป็นตัวประมาณค่า M สองขั้นตอนโดยที่เมทริกซ์ความแปรปรวนร่วมที่สร้างขึ้นโดยการประมาณค่า OLS ในขั้นตอนที่สองไม่สอดคล้องกัน^{[ 7 ]}ข้อผิดพลาดมาตรฐานที่ถูกต้องและสถิติอื่นๆ สามารถสร้างได้จากการประมาณค่าแบบไม่จำกัดหรือโดยการสุ่มตัวอย่างซ้ำ เช่น ผ่านการบูตสแตรป^{[ 8 ]}

ข้อเสีย

ตัวประมาณค่าแบบสองขั้นตอนที่กล่าวถึงข้างต้นเป็นตัวประมาณค่าความน่าจะเป็นสูงสุดที่มีข้อมูลจำกัด (LIML) ในทฤษฎีเชิงอะซิมโทติกและในตัวอย่างจำกัดดังที่แสดงโดยการจำลองมอนเตคาร์โล ตัวประมาณค่าที่มีข้อมูลครบถ้วน (FIML) แสดงคุณสมบัติทางสถิติที่ดีกว่า อย่างไรก็ตาม ตัวประมาณค่า FIML นั้นยากต่อการนำไปใช้ในเชิงคำนวณมากกว่า^{[ 9 ]}
แบบจำลองมาตรฐานถือว่าข้อผิดพลาดเป็นแบบปกติร่วมกัน หากสมมติฐานนั้นไม่เป็นจริง ตัวประมาณค่าโดยทั่วไปจะไม่สอดคล้องกันและอาจให้การอนุมานที่ทำให้เข้าใจผิดในตัวอย่างขนาดเล็ก^{[ 10 ]}สามารถใช้วิธีการกึ่งพาราเมตริกและทางเลือกที่แข็งแกร่งอื่นๆ ในกรณีดังกล่าวได้^{[ 11 ]}
แบบจำลองได้รับการระบุอย่างเป็นทางการจากสมมติฐานความปกติเมื่อตัวแปรเสริมเดียวกันปรากฏในสมการการเลือกและสมการที่สนใจ แต่การระบุจะเปราะบางเว้นแต่จะมีข้อมูลจำนวนมากในส่วนหางที่มีความไม่เป็นเชิงเส้นอย่างมากในอัตราส่วน Mills ผกผัน โดยทั่วไป จำเป็นต้องมีข้อจำกัดการยกเว้นเพื่อสร้างค่าประมาณที่น่าเชื่อถือ: ต้องมีตัวแปรอย่างน้อยหนึ่งตัวที่ปรากฏด้วยสัมประสิทธิ์ที่ไม่เป็นศูนย์ในสมการการเลือก แต่ไม่ปรากฏในสมการที่สนใจ ซึ่งโดยพื้นฐานแล้วคือเครื่องมือหากไม่มีตัวแปรดังกล่าว อาจเป็นเรื่องยากที่จะแก้ไขการเลือกตัวอย่าง^{[ 9 ]}เหตุผลสำหรับเรื่องนี้มีสองประการ: หากไม่มีเครื่องมือ การระบุจะขึ้นอยู่กับสมมติฐานรูปแบบฟังก์ชันซึ่งโดยทั่วไปถือว่าอ่อนแอมาก^{[ 12 ]}นอกจากนี้ แม้ว่าสมมติฐานจะเป็นจริง ฟังก์ชันที่เลือกอาจใกล้เคียงกับรูปแบบฟังก์ชันเชิงเส้นในพื้นที่ที่กำลังตรวจสอบ ทำให้เกิดปัญหาความสัมพันธ์เชิงเส้นหลายตัวในขั้นตอนที่สอง

การนำไปใช้ในแพ็กเกจทางสถิติ

R : ขั้นตอนประเภท Heckman มีให้บริการเป็นส่วนหนึ่งของsampleSelectionแพ็คเกจ^{[ 13 ]}^{[ 14 ]}
Stata : คำสั่งนี้heckmanให้โมเดลการเลือกของ Heckman ^{[ 15 ]}^{[ 16 ]}

ดูเพิ่มเติม

การจับคู่คะแนนความโน้มเอียง – เทคนิคการจับคู่ทางสถิติ
แบบจำลองรอย – แบบจำลองสำหรับการเลือกตนเองในทางเศรษฐศาสตร์

อ่านเพิ่มเติม

Achen, Christopher H. (1986). " การประมาณผลของการรักษาในการทดลองแบบกึ่งทดลอง: กรณีของข้อมูลที่ถูกตัดทอน"การวิเคราะห์ทางสถิติของการทดลองแบบกึ่งทดลองเบิร์กลีย์: สำนักพิมพ์มหาวิทยาลัยแคลิฟอร์เนีย หน้า 97–137 ISBN 0-520-04723-0.
Breen, Richard (1996). แบบจำลองการถดถอย: ข้อมูลที่ถูกตัดทอน ข้อมูลที่เลือกจากตัวอย่าง หรือข้อมูลที่ถูกตัดทอน . Thousand Oaks: Sage. หน้า 33–48 . ISBN 0-8039-5710-6.
Fu, Vincent Kang; Winship, Christopher ; Mare, Robert D. (2004). "แบบจำลองอคติในการเลือกตัวอย่าง" ใน Hardy, Melissa; Bryman, Alan (บรรณาธิการ). คู่มือการวิเคราะห์ข้อมูล . ลอนดอน: Sage. หน้า 409–430 . doi : 10.4135/9781848608184.n18 . ISBN 0-7619-6652-8.
กรีน, วิลเลียม เอช. (2012). "การตัดทอนโดยบังเอิญและการเลือกตัวอย่าง" การวิเคราะห์ทางเศรษฐมิติ (ฉบับที่เจ็ด). บอสตัน: เพียร์สัน. หน้า 912–27 . ISBN 978-0-273-75356-8.
Vella, Francis (1998). "การประมาณแบบจำลองที่มีอคติในการเลือกตัวอย่าง: การสำรวจ" วารสารทรัพยากรมนุษย์ 33 (1): 127– 169. doi : 10.2307/146317 . JSTOR 146317 .

ลิงก์ภายนอก

ข้อเท็จจริงเกี่ยวกับรางวัลโนเบลของเฮ็กแมน

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]