กลับไปหน้าบทความ

อ่าน 5 นาที

การแก้ไขของเฮ็กแมน

การแก้ไข ของ Heckman เป็นเทคนิคทางสถิติเพื่อแก้ไข อคติ จาก ตัวอย่างที่ไม่ได้เลือกแบบสุ่ม หรือ ตัวแปรตามที่ถูกตัดทอน โดยบังเอิญ ซึ่งเป็นปัญหาที่พบได้ทั่วไปใน วิทยาศาสตร์สังคม...

การแก้ไขของเฮ็กแมน

การแก้ไข ของHeckmanเป็นเทคนิคทางสถิติเพื่อแก้ไขอคติจากตัวอย่างที่ไม่ได้เลือกแบบสุ่มหรือตัวแปรตามที่ถูกตัดทอน โดยบังเอิญ ซึ่งเป็นปัญหาที่พบได้ทั่วไปในวิทยาศาสตร์สังคม เชิงปริมาณ เมื่อใช้ข้อมูลจากการสังเกต[ 1 ]ในเชิงแนวคิด การแก้ไขนี้ทำได้โดยการสร้างแบบจำลองความน่าจะเป็นของการสุ่มตัวอย่างแต่ละรายการของการสังเกต (ที่เรียกว่าสมการการเลือก) ร่วมกับความคาดหวังแบบมีเงื่อนไขของตัวแปรตาม (ที่เรียกว่าสมการผลลัพธ์) ฟังก์ชันความน่าจะ เป็นที่ได้นั้น มีความคล้ายคลึงทางคณิตศาสตร์กับแบบจำลอง tobitสำหรับตัวแปรตามที่ถูกตัดทอน ซึ่งเป็นการเชื่อมโยงที่ James Heckmanค้นพบเป็นครั้งแรกในปี 1974 [ 2 ] Heckman ยังได้พัฒนา วิธี การควบคุมฟังก์ชันแบบ สองขั้นตอน เพื่อประมาณแบบจำลองนี้[ 3 ]ซึ่งหลีกเลี่ยงภาระการคำนวณที่ต้องประมาณสมการทั้งสองร่วมกันแม้ว่าจะต้องแลกมาด้วยประสิทธิภาพที่ลดลงก็ตาม[ 4 ] Heckman ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ในปี 2000 จากผลงานของเขาในสาขานี้[ 5 ]

วิธี

การวิเคราะห์ทางสถิติโดยใช้ตัวอย่างที่ไม่ได้เลือกแบบสุ่มอาจนำไปสู่ข้อสรุปที่ผิดพลาดได้ การแก้ไขของเฮ็กแมน (Heckman correction) ซึ่งเป็นวิธีการทางสถิติสองขั้นตอน ช่วยแก้ไขปัญหาที่เกิดจากตัวอย่างที่ไม่ได้เลือกแบบสุ่มได้

เฮ็กแมนได้กล่าวถึงอคติที่เกิดจากการใช้ตัวอย่างที่ไม่ได้เลือกแบบสุ่มในการประมาณความสัมพันธ์เชิงพฤติกรรมว่าเป็นข้อผิดพลาดในการกำหนดแบบจำลอง เขาเสนอวิธีการประมาณค่าแบบสองขั้นตอนเพื่อแก้ไขอคติดังกล่าว การแก้ไขนี้ใช้ แนวคิด ฟังก์ชันควบคุมและง่ายต่อการนำไปใช้ การแก้ไขของเฮ็กแมนเกี่ยวข้องกับ การตั้งสมมติฐานเรื่องการกระจาย แบบปกติมีการทดสอบอคติจากการเลือกตัวอย่าง และมีสูตรสำหรับแบบจำลองที่แก้ไขอคติแล้ว

สมมติว่านักวิจัยต้องการประมาณปัจจัยกำหนดข้อเสนอค่าจ้าง แต่มีข้อมูลค่าจ้างเฉพาะสำหรับผู้ที่ทำงานเท่านั้น เนื่องจากผู้ที่ทำงานไม่ได้ถูกเลือกแบบสุ่มจากประชากร การประมาณปัจจัยกำหนดค่าจ้างจากกลุ่มย่อยของผู้ที่ทำงานอาจทำให้เกิดอคติได้ การแก้ไขของ Heckman เกิดขึ้นในสองขั้นตอน

ในขั้นตอนแรก นักวิจัยจะสร้างแบบจำลองโดยอิงตามทฤษฎีเศรษฐศาสตร์สำหรับความน่าจะเป็นของการทำงาน รูปแบบมาตรฐานสำหรับความสัมพันธ์นี้คือ การถดถอยแบบโพร บิตในรูปแบบ

โดยที่Dแสดงถึงการจ้างงาน ( D  = 1 ถ้าผู้ตอบแบบสอบถามมีงานทำ และD  = 0 ถ้าไม่มีงานทำ) Zคือเวกเตอร์ของตัวแปรอธิบายคือเวกเตอร์ของพารามิเตอร์ที่ไม่ทราบค่า และ Φ คือฟังก์ชันการกระจายสะสมของการแจกแจงปกติ มาตรฐาน การประมาณค่าแบบจำลองจะให้ผลลัพธ์ที่สามารถนำมาใช้ในการทำนายความน่าจะเป็นของการจ้างงานสำหรับแต่ละบุคคลได้

ในขั้นตอนที่สอง นักวิจัยจะแก้ไขปัญหาการเลือกตนเองโดยการรวมการแปลงค่าความน่าจะเป็นส่วนบุคคลที่คาดการณ์ไว้เหล่านี้เป็นตัวแปรอธิบายเพิ่มเติม สมการค่าจ้างอาจระบุได้ดังนี้

โดยที่หมายถึงข้อเสนอค่าจ้างพื้นฐาน ซึ่งจะไม่ปรากฏหากผู้ตอบแบบสอบถามไม่ได้ทำงาน ดังนั้น ความคาดหวังแบบมีเงื่อนไขของค่าจ้างเมื่อบุคคลนั้นทำงาน จึงเป็นดังนี้

ภายใต้สมมติฐานที่ว่าค่าความคลาดเคลื่อนมีการกระจายแบบปกติร่วมกันเราจะได้ว่า

โดยที่ρคือค่าสหสัมพันธ์ระหว่างปัจจัยที่ไม่สามารถสังเกตได้ของแนวโน้มที่จะทำงานและปัจจัยที่ไม่สามารถสังเกตได้ของข้อเสนอค่าจ้างu , σuคือค่าเบี่ยงเบนมาตรฐานของและคืออัตราส่วน Mills ผกผันที่ประเมินที่ สม การนี้แสดงให้เห็นถึงความเข้าใจของ Heckman ที่ว่าการเลือกตัวอย่างสามารถมองได้ว่าเป็นรูปแบบหนึ่งของอคติจากตัวแปรที่ถูกละเว้นเนื่องจากเมื่อพิจารณาทั้งXและ แล้วตัวอย่างจะถูกเลือกแบบสุ่ม สมการค่าจ้างสามารถประมาณได้โดยการแทนที่ด้วยค่าประมาณ Probit จากขั้นตอนแรก สร้างเทอม และรวมไว้เป็นตัวแปรอธิบายเพิ่มเติมใน การประมาณค่า ถดถอยเชิงเส้นของสมการค่าจ้าง เนื่องจากสัมประสิทธิ์ของจะเป็นศูนย์ได้ก็ต่อเมื่อดังนั้นการทดสอบสมมติฐานว่างที่ว่าสัมประสิทธิ์ของเป็นศูนย์จึงเทียบเท่ากับการทดสอบการเลือกตัวอย่าง  

ความสำเร็จของ Heckman ได้ก่อให้เกิดการประยุกต์ใช้เชิงประจักษ์จำนวนมากในเศรษฐศาสตร์ รวมถึงในสังคมศาสตร์อื่นๆ วิธีการดั้งเดิมได้รับการขยายความในภายหลังโดย Heckman และผู้อื่น[ 6 ]

การอนุมานทางสถิติ

การแก้ไขของ Heckman เป็นตัวประมาณค่า M สองขั้นตอนโดยที่เมทริกซ์ความแปรปรวนร่วมที่สร้างขึ้นโดยการประมาณค่า OLS ในขั้นตอนที่สองไม่สอดคล้องกัน[ 7 ]ข้อผิดพลาดมาตรฐานที่ถูกต้องและสถิติอื่นๆ สามารถสร้างได้จากการประมาณค่าแบบไม่จำกัดหรือโดยการสุ่มตัวอย่างซ้ำ เช่น ผ่านการบูตสแตร[ 8 ]

ข้อเสีย

  • ตัวประมาณค่าแบบสองขั้นตอนที่กล่าวถึงข้างต้นเป็นตัวประมาณค่าความน่าจะเป็นสูงสุดที่มีข้อมูลจำกัด (LIML) ในทฤษฎีเชิงอะซิมโทติกและในตัวอย่างจำกัดดังที่แสดงโดยการจำลองมอนเตคาร์โล ตัวประมาณค่าที่มีข้อมูลครบถ้วน (FIML) แสดงคุณสมบัติทางสถิติที่ดีกว่า อย่างไรก็ตาม ตัวประมาณค่า FIML นั้นยากต่อการนำไปใช้ในเชิงคำนวณมากกว่า[ 9 ]
  • แบบจำลองมาตรฐานถือว่าข้อผิดพลาดเป็นแบบปกติร่วมกัน หากสมมติฐานนั้นไม่เป็นจริง ตัวประมาณค่าโดยทั่วไปจะไม่สอดคล้องกันและอาจให้การอนุมานที่ทำให้เข้าใจผิดในตัวอย่างขนาดเล็ก[ 10 ]สามารถใช้วิธีการกึ่งพาราเมตริกและทางเลือกที่แข็งแกร่งอื่นๆ ในกรณีดังกล่าวได้[ 11 ]
  • แบบจำลองได้รับการระบุอย่างเป็นทางการจากสมมติฐานความปกติเมื่อตัวแปรเสริมเดียวกันปรากฏในสมการการเลือกและสมการที่สนใจ แต่การระบุจะเปราะบางเว้นแต่จะมีข้อมูลจำนวนมากในส่วนหางที่มีความไม่เป็นเชิงเส้นอย่างมากในอัตราส่วน Mills ผกผัน โดยทั่วไป จำเป็นต้องมีข้อจำกัดการยกเว้นเพื่อสร้างค่าประมาณที่น่าเชื่อถือ: ต้องมีตัวแปรอย่างน้อยหนึ่งตัวที่ปรากฏด้วยสัมประสิทธิ์ที่ไม่เป็นศูนย์ในสมการการเลือก แต่ไม่ปรากฏในสมการที่สนใจ ซึ่งโดยพื้นฐานแล้วคือเครื่องมือหากไม่มีตัวแปรดังกล่าว อาจเป็นเรื่องยากที่จะแก้ไขการเลือกตัวอย่าง[ 9 ]เหตุผลสำหรับเรื่องนี้มีสองประการ: หากไม่มีเครื่องมือ การระบุจะขึ้นอยู่กับสมมติฐานรูปแบบฟังก์ชันซึ่งโดยทั่วไปถือว่าอ่อนแอมาก[ 12 ]นอกจากนี้ แม้ว่าสมมติฐานจะเป็นจริง ฟังก์ชันที่เลือกอาจใกล้เคียงกับรูปแบบฟังก์ชันเชิงเส้นในพื้นที่ที่กำลังตรวจสอบ ทำให้เกิดปัญหาความสัมพันธ์เชิงเส้นหลายตัวในขั้นตอนที่สอง

การนำไปใช้ในแพ็กเกจทางสถิติ

  • R : ขั้นตอนประเภท Heckman มีให้บริการเป็นส่วนหนึ่งของsampleSelectionแพ็คเกจ[ 13 ] [ 14 ]
  • Stata : คำสั่งนี้heckmanให้โมเดลการเลือกของ Heckman [ 15 ] [ 16 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Achen, Christopher H. (1986). " การประมาณผลของการรักษาในการทดลองแบบกึ่งทดลอง: กรณีของข้อมูลที่ถูกตัดทอน"การวิเคราะห์ทางสถิติของการทดลองแบบกึ่งทดลองเบิร์กลีย์: สำนักพิมพ์มหาวิทยาลัยแคลิฟอร์เนีย หน้า  97–137 ISBN 0-520-04723-0.
  • Breen, Richard (1996). แบบจำลองการถดถอย: ข้อมูลที่ถูกตัดทอน ข้อมูลที่เลือกจากตัวอย่าง หรือข้อมูลที่ถูกตัดทอน . Thousand Oaks: Sage. หน้า  33–48 . ISBN 0-8039-5710-6.
  • Fu, Vincent Kang; Winship, Christopher ; Mare, Robert D. (2004). "แบบจำลองอคติในการเลือกตัวอย่าง" ใน Hardy, Melissa; Bryman, Alan (บรรณาธิการ). คู่มือการวิเคราะห์ข้อมูล . ลอนดอน: Sage. หน้า  409–430 . doi : 10.4135/9781848608184.n18 . ISBN 0-7619-6652-8.
  • กรีน, วิลเลียม เอช. (2012). "การตัดทอนโดยบังเอิญและการเลือกตัวอย่าง" การวิเคราะห์ทางเศรษฐมิติ (ฉบับที่เจ็ด). บอสตัน: เพียร์สัน. หน้า  912–27 . ISBN 978-0-273-75356-8.
  • Vella, Francis (1998). "การประมาณแบบจำลองที่มีอคติในการเลือกตัวอย่าง: การสำรวจ" วารสารทรัพยากรมนุษย์ 33 (1): 127– 169. doi : 10.2307/146317 . JSTOR  146317 .
  • ข้อเท็จจริงเกี่ยวกับรางวัลโนเบลของเฮ็กแมน
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Heckman_correction&oldid=1360438293 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การแก้ไขของเฮ็กแมน

การแก้ไข ของ Heckman เป็นเทคนิคทางสถิติเพื่อแก้ไข อคติ จาก ตัวอย่างที่ไม่ได้เลือกแบบสุ่ม หรือ ตัวแปรตามที่ถูกตัดทอน โดยบังเอิญ ซึ่งเป็นปัญหาที่พบได้ทั่วไปใน วิทยาศาสตร์สังคม...

วิธี

การวิเคราะห์ทางสถิติโดยใช้ตัวอย่างที่ไม่ได้เลือกแบบสุ่มอาจนำไปสู่ข้อสรุปที่ผิดพลาดได้ การแก้ไขของเฮ็กแมน (Heckman correction) ซึ่งเป็นวิธีการทางสถิติสองขั้นตอน ช่วยแก้ไขปัญหาที่เกิดจากตัวอย่างที่ไม่ได้เลือกแบบสุ่มได้

การอนุมานทางสถิติ

การแก้ไขของ Heckman เป็น ตัวประมาณค่า M สองขั้นตอน โดยที่เมทริกซ์ความแปรปรวนร่วมที่สร้างขึ้นโดยการประมาณค่า OLS ในขั้นตอนที่สองไม่สอดคล้องกัน [ 7 ] ข้อผิดพลาดมาตรฐานที่ถูกต้องและสถิติอื่นๆ สามารถสร้างได้จากการประมาณค่าแบบไม่จำกัดหรือโดยการสุ่มตัวอย่างซ้ำ เช่น...

ข้อเสีย

ตัวประมาณค่าแบบสองขั้นตอนที่กล่าวถึงข้างต้นเป็นตัวประมาณค่าความน่าจะเป็นสูงสุดที่มีข้อมูลจำกัด (LIML) ในทฤษฎีเชิงอะซิมโทติกและในตัวอย่างจำกัดดังที่แสดงโดยการจำลองมอนเตคาร์โล ตัวประมาณค่าที่มีข้อมูลครบถ้วน (FIML) แสดงคุณสมบัติทางสถิติที่ดีกว่า อย่างไรก็ตาม...