กลับไปหน้าบทความ

อ่าน 10 นาที

แบบจำลองผลกระทบคงที่

ใน ทางสถิติ โมเดล ผลกระทบคงที่ (fixed effects model) คือ โมเดลทางสถิติ ที่ พารามิเตอร์ ของโมเดล เป็นค่าคงที่หรือไม่สุ่ม ซึ่งแตกต่างจาก โมเดลผลกระทบสุ่ม (random effects model) และ...

แบบจำลองผลกระทบคงที่

ในทางสถิติโมเดลผลกระทบคงที่ (fixed effects model)คือโมเดลทางสถิติที่พารามิเตอร์ ของโมเดล เป็นค่าคงที่หรือไม่สุ่ม ซึ่งแตกต่างจากโมเดลผลกระทบสุ่ม (random effects model)และโมเดลผสม (mixed models)ที่พารามิเตอร์ของโมเดลทั้งหมดหรือบางส่วนเป็นตัวแปรสุ่ม ในการใช้งานหลายอย่าง รวมถึงเศรษฐศาสตร์เชิงปริมาณ[ 1 ]และชีวสถิติ[ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ]โมเดลผลกระทบคงที่หมายถึงโมเดลการถดถอยที่ค่าเฉลี่ยของกลุ่มเป็นค่าคงที่ (ไม่สุ่ม) ตรงข้ามกับโมเดลผลกระทบสุ่มที่ค่าเฉลี่ยของกลุ่มเป็นตัวอย่างสุ่มจากประชากร[ 7 ] [ 6 ]โดยทั่วไป ข้อมูลสามารถจัดกลุ่มตามปัจจัยที่สังเกตได้หลายประการ ค่าเฉลี่ยของกลุ่มสามารถจำลองเป็นผลกระทบคงที่หรือผลกระทบสุ่มสำหรับแต่ละกลุ่ม ในโมเดลผลกระทบคงที่ ค่าเฉลี่ยของแต่ละกลุ่มเป็นค่าคงที่เฉพาะกลุ่ม

ในข้อมูลแบบพาเนล (panel data)ที่มีการสังเกตการณ์ตามช่วงเวลาสำหรับบุคคลเดียวกัน ผลกระทบแบบคงที่ (fixed effects) จะแสดงถึงค่าเฉลี่ยเฉพาะบุคคล ในการวิเคราะห์ข้อมูลแบบพาเนลคำว่า ตัวประมาณ ค่าผลกระทบแบบคงที่ (fixed effects estimator ) (หรือที่เรียกว่า ตัวประมาณค่าภายใน (within estimator )) ใช้เพื่ออ้างถึงตัวประมาณค่าสำหรับสัมประสิทธิ์ในแบบจำลองการถดถอยที่รวมผลกระทบแบบคงที่เหล่านั้น (ค่าคงที่ที่ไม่เปลี่ยนแปลงตามเวลาหนึ่งค่าสำหรับแต่ละบุคคล)

คำอธิบายเชิงคุณภาพ

แบบจำลองดังกล่าวช่วยควบคุมอคติจากตัวแปรที่ถูกละเลยอันเนื่องมาจากความแตกต่างที่ไม่สามารถสังเกตได้ เมื่อความแตกต่างนี้คงที่ตลอดเวลา ความแตกต่างนี้สามารถกำจัดออกจากข้อมูลได้โดยการหาผลต่าง เช่น โดยการลบค่าเฉลี่ยระดับกลุ่มตลอดเวลา หรือโดยการหาผลต่างครั้งแรกซึ่งจะกำจัดส่วนประกอบที่ไม่เปลี่ยนแปลงตามเวลาของแบบจำลองออกไป

มีข้อสมมติฐานทั่วไปสองประการเกี่ยวกับผลกระทบเฉพาะบุคคล ได้แก่ ข้อสมมติฐานผลกระทบแบบสุ่มและข้อสมมติฐานผลกระทบแบบคงที่ ข้อสมมติฐาน ผลกระทบแบบสุ่มคือ ผลกระทบเฉพาะบุคคลไม่มีความสัมพันธ์กับตัวแปรอิสระ ข้อสมมติฐานผลกระทบแบบคงที่คือ ผลกระทบเฉพาะบุคคลมีความสัมพันธ์กับตัวแปรอิสระ หากข้อสมมติฐานผลกระทบแบบสุ่มเป็นจริง ตัวประมาณค่าผลกระทบแบบสุ่มจะมีประสิทธิภาพ มากกว่า ตัวประมาณค่าผลกระทบแบบคงที่ อย่างไรก็ตาม หากข้อสมมติฐานนี้ไม่เป็นจริง ตัวประมาณค่าผลกระทบแบบสุ่มจะไม่สอดคล้องกันการทดสอบ Durbin–Wu–Hausmanมักใช้เพื่อแยกแยะระหว่างแบบจำลองผลกระทบแบบคงที่และแบบสุ่ม[ 8 ] [ 9 ]

แบบจำลองเชิงทางการและข้อสมมติฐาน

พิจารณาแบบจำลองผลกระทบที่ไม่สามารถสังเกตได้เชิงเส้นสำหรับข้อมูลสังเกตการณ์และช่วงเวลา:

สำหรับและ

ที่ไหน:

  • คือตัวแปรตามที่สังเกตได้สำหรับแต่ละบุคคลณ เวลาt
  • คือเวกเตอร์ตัวแปรอิสระที่เปลี่ยนแปลงตามเวลา(จำนวนตัวแปรอิสระ)
  • คือเมทริกซ์ของพารามิเตอร์
  • คือผลกระทบเฉพาะบุคคลที่ไม่สามารถสังเกตได้และไม่เปลี่ยนแปลงตามเวลา ตัวอย่างเช่น ความสามารถโดยกำเนิดของแต่ละบุคคล หรือปัจจัยทางประวัติศาสตร์และสถาบันของประเทศ
  • คือค่าความคลาดเคลื่อน

ต่างจากกรณีที่ไม่สามารถสังเกตได้โดยตรง

แตกต่างจากแบบจำลองผลกระทบแบบสุ่ม (random effects model)ที่ตัวแปรที่ไม่สามารถสังเกตได้เป็นอิสระจาก ตัวแปรอิสระ สำหรับทุกตัวแบบจำลองผลกระทบแบบคงที่ (fixed effects model: FE) อนุญาตให้ตัวแปรอิสระมีความสัมพันธ์กับเมทริกซ์ตัวแปรอิสระได้อย่างไรก็ตามยังคงต้องมี ความเป็นอิสระอย่างเคร่งครัดในส่วนของพจน์ความคลาดเคลื่อนเฉพาะตัว

การประมาณค่าทางสถิติ

ตัวประมาณผลกระทบคงที่

เนื่องจากไม่สามารถสังเกตได้โดยตรง จึงไม่สามารถควบคุมได้โดยตรง แบบจำลอง FE จึงกำจัดปัญหานี้โดยการลบค่าเฉลี่ยของตัวแปรโดยใช้ การแปลง ภายใน :

โดยที่, , และ.

เนื่องจากมีค่าคงที่ดังนั้นผลกระทบจึงถูกกำจัดไป ตัวประมาณค่า FE จึงได้มาจากการถดถอย OLS ของ บน

มีทางเลือกอย่างน้อยสามทางสำหรับ การแปลง ภายในโดยมีรูปแบบที่แตกต่างกันดังนี้:

  • วิธีหนึ่งคือการเพิ่มตัวแปรดัมมี่สำหรับแต่ละบุคคล(โดยละเว้นบุคคลแรกเนื่องจากความสัมพันธ์เชิงเส้นหลายตัวแปร ) วิธีนี้เทียบเท่ากับแบบจำลองผลกระทบคงที่ในเชิงตัวเลข แต่ไม่เทียบเท่าในเชิงการคำนวณ และจะใช้ได้ผลก็ต่อเมื่อผลรวมของจำนวนอนุกรมและจำนวนพารามิเตอร์ทั่วโลกน้อยกว่าจำนวนการสังเกต[ 10 ]วิธีการใช้ตัวแปรดัมมี่มีความต้องการหน่วยความจำคอมพิวเตอร์สูงเป็นพิเศษ และไม่แนะนำสำหรับปัญหาที่มีขนาดใหญ่เกินกว่า RAM ที่มีอยู่ และการคอมไพล์โปรแกรมที่ใช้จะรองรับได้
  • ทางเลือกที่สองคือการใช้แนวทางการทำซ้ำต่อเนื่องเพื่อการประมาณค่าในระดับท้องถิ่นและระดับโลก[ 11 ]แนวทางนี้เหมาะสมอย่างยิ่งสำหรับระบบที่มีหน่วยความจำต่ำ ซึ่งมีประสิทธิภาพในการคำนวณมากกว่าแนวทางตัวแปรดัมมี่มาก
  • แนวทางที่สามคือการประมาณค่าแบบซ้อนกัน โดยการประมาณค่าเฉพาะที่สำหรับแต่ละอนุกรมจะถูกตั้งโปรแกรมไว้เป็นส่วนหนึ่งของคำจำกัดความของแบบจำลอง[ 12 ]แนวทางนี้มีประสิทธิภาพในการคำนวณและใช้หน่วยความจำมากที่สุด แต่ต้องใช้ทักษะการเขียนโปรแกรมที่เชี่ยวชาญและการเข้าถึงรหัสการเขียนโปรแกรมแบบจำลอง แม้ว่าจะสามารถเขียนโปรแกรมได้รวมถึงใน SAS [ 13 ] [ 14 ]

สุดท้ายนี้ ทางเลือกแต่ละข้อข้างต้นสามารถปรับปรุงได้หากการประมาณค่าเฉพาะอนุกรมเป็นเชิงเส้น (ภายในแบบจำลองที่ไม่เป็นเชิงเส้น) ซึ่งในกรณีนี้ วิธีแก้ปัญหาเชิงเส้นโดยตรงสำหรับแต่ละอนุกรมสามารถตั้งโปรแกรมเป็นส่วนหนึ่งของคำจำกัดความแบบจำลองที่ไม่เป็นเชิงเส้นได้[ 15 ]

ตัวประมาณความแตกต่างอันดับแรก

ทางเลือกอื่นนอกเหนือจากการแปลงภายในคือ การแปลง ความแตกต่างครั้งแรกซึ่งจะสร้างตัวประมาณค่าที่แตกต่างกัน สำหรับ:

จากนั้นจะได้ ตัวประมาณค่า FD โดยใช้การถดถอย OLS ของ บน

เมื่อตัวประมาณค่าความแตกต่างแรกและผลกระทบคงที่นั้นมีค่าเท่ากันในเชิงตัวเลข สำหรับจะไม่เท่ากัน หากเงื่อนไขความคลาดเคลื่อนเป็นแบบ homoskedasticโดยไม่มีความสัมพันธ์แบบอนุกรม ตัวประมาณค่าผลกระทบคงที่นั้นจะมีประสิทธิภาพ มากกว่า ตัวประมาณค่าความแตกต่างแรก อย่างไรก็ตาม หากเป็นไปตามการเดินแบบสุ่มตัวประมาณค่าความแตกต่างแรกจะมีประสิทธิภาพมากกว่า[ 16 ]

ความเท่าเทียมกันของตัวประมาณผลกระทบคงที่และตัวประมาณความแตกต่างอันดับแรกเมื่อ T=2

สำหรับกรณีพิเศษสองช่วงเวลา ( ) ตัวประมาณค่าแบบผลกระทบคงที่ (FE) และตัวประมาณค่าแบบผลต่างอันดับแรก (FD) มีค่าเท่ากันในเชิงตัวเลข เนื่องจากตัวประมาณค่า FE นั้น "เพิ่มขนาดชุดข้อมูลเป็นสองเท่า" ที่ใช้ในตัวประมาณค่า FD เพื่อให้เห็นเช่นนี้ ให้พิจารณาว่าตัวประมาณค่าแบบผลกระทบคงที่คือ:

เนื่องจากแต่ละประโยคสามารถเขียนใหม่ได้เป็น ดังนั้นเราจะเขียนประโยคใหม่เป็น:

วิธีการของแชมเบอร์เลน

วิธีการของGary Chamberlain ซึ่งเป็นการขยายความของตัวประมาณค่าภายใน (within estimator) จะแทนที่ ด้วยการฉายภาพเชิงเส้น (linear projection)บนตัวแปรอธิบาย โดยเขียนการฉายภาพเชิงเส้นได้ดังนี้:

ซึ่งจะได้สมการดังต่อไปนี้:

ซึ่งสามารถประมาณได้โดยการประมาณระยะทางขั้นต่ำ[ 17 ]

วิธีเฮาส์แมน-เทย์เลอร์

จำเป็นต้องมีตัวแปรอิสระที่เปลี่ยนแปลงตามเวลามากกว่าหนึ่งตัว ( ) และตัวแปรอิสระที่ไม่เปลี่ยนแปลงตามเวลา ( ) และอย่างน้อยหนึ่งตัวและหนึ่งตัวที่ ไม่สัมพันธ์กับ

แบ่งตัวแปรและออกเป็นส่วนๆ โดยที่และไม่มีความสัมพันธ์กับจำเป็นต้องใช้

การประมาณค่าโดยใช้วิธี OLS โดยใช้และเป็นตัวแปรเครื่องมือ จะให้ค่าประมาณที่สอดคล้องกัน

การสรุปทั่วไปโดยคำนึงถึงความไม่แน่นอนของข้อมูลป้อนเข้า

เมื่อมีความไม่แน่นอนในการป้อนข้อมูล ค่า ดังกล่าวควรถูกทำให้น้อยที่สุด แทนที่จะเป็นผลรวมของค่าตกค้างยกกำลังสอง[ 18 ]ซึ่งสามารถทำได้โดยตรงจากกฎการแทนที่:

,

จากนั้นค่าและค่าเบี่ยงเบนมาตรฐานสำหรับและสามารถหาได้โดยใช้วิธี การวิเคราะห์ กำลังสองน้อยที่สุด แบบคลาสสิก และ เมท ริก ซ์ความแปรปรวนร่วม

ใช้เพื่อทดสอบความสม่ำเสมอ

ตัวประมาณค่าแบบผลกระทบสุ่มอาจไม่สอดคล้องกันในบางครั้งเมื่อพิจารณาอนุกรมเวลาในระยะยาว หากระบุผลกระทบสุ่มไม่ถูกต้อง (เช่น แบบจำลองที่เลือกสำหรับผลกระทบสุ่มไม่ถูกต้อง) อย่างไรก็ตาม แบบจำลองผลกระทบคงที่อาจยังคงสอดคล้องกันในบางสถานการณ์ ตัวอย่างเช่น หากอนุกรมเวลาที่กำลังสร้างแบบจำลองไม่เป็นอนุกรมเวลาคงที่ แบบจำลองผลกระทบสุ่มที่สมมติว่าอนุกรมเวลาคงที่อาจไม่สอดคล้องกันเมื่อพิจารณาอนุกรมเวลาในระยะยาว ตัวอย่างหนึ่งของกรณีนี้คือ หากอนุกรมเวลามีแนวโน้มเพิ่มขึ้น เมื่ออนุกรมเวลายาวขึ้น แบบจำลองจะปรับค่าประมาณสำหรับค่าเฉลี่ยของช่วงเวลาก่อนหน้าให้สูงขึ้น ทำให้การคาดการณ์ค่าสัมประสิทธิ์มีความลำเอียงมากขึ้นเรื่อยๆ อย่างไรก็ตาม แบบจำลองที่มีผลกระทบคงที่ในช่วงเวลาจะไม่รวบรวมข้อมูลข้ามเวลา และด้วยเหตุนี้ ค่าประมาณก่อนหน้าจึงจะไม่ได้รับผลกระทบ

ในสถานการณ์เช่นนี้ เมื่อทราบว่าแบบจำลองผลกระทบคงที่นั้นมีความสอดคล้องแล้วสามารถใช้การทดสอบ Durbin-Wu-Hausman เพื่อทดสอบว่าแบบจำลองผลกระทบสุ่มที่เลือกนั้นมีความสอดคล้องหรือไม่ ถ้า เป็นจริง ทั้งและมีความสอดคล้อง แต่มีเพียง เท่านั้นที่มีประสิทธิภาพ ถ้าเป็นจริง ความสอดคล้องของไม่สามารถรับประกันได้

ดูเพิ่มเติม

หมายเหตุ

  1. ^Greene, W.H., 2011. Econometric Analysis, 7th ed., Prentice Hall
  2. ^Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analysis of Longitudinal Data (2nd ed.). Oxford University Press. pp. 169–171. ISBN 0-19-852484-6.
  3. ^Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. pp. 326–328. ISBN 0-471-21487-6.
  4. ^Laird, Nan M.; Ware, James H. (1982). "Random-Effects Models for Longitudinal Data". Biometrics. 38 (4): 963–974. doi:10.2307/2529876. JSTOR 2529876.
  5. ^Gardiner, Joseph C.; Luo, Zhehui; Roman, Lee Anne (2009). "Fixed effects, random effects and GEE: What are the differences?". Statistics in Medicine. 28 (2): 221–239. doi:10.1002/sim.3478. PMID 19012297. S2CID 16277040.
  6. ^ abGomes, Dylan G.E. (20 January 2022). "Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model?". PeerJ. 10 e12794. doi:10.7717/peerj.12794. PMC 8784019. PMID 35116198.
  7. ^Ramsey, F., Schafer, D., 2002. The Statistical Sleuth: A Course in Methods of Data Analysis, 2nd ed. Duxbury Press
  8. ^Cameron, A. Colin; Trivedi, Pravin K. (2005). Microeconometrics: Methods and Applications. Cambridge University Press. pp. 717–19. ISBN 978-0-521-84805-3.
  9. ^Nerlove, Marc (2005). Essays in Panel Data Econometrics. Cambridge University Press. pp. 36–39. ISBN 978-0-521-02246-0.
  10. ^Garcia, Oscar. (1983). "A stochastic differential equation model for the height growth of forest stands". Biometrics. 39 (4): 1059–1072. doi:10.2307/2531339. JSTOR 2531339.
  11. ^ Tait, David; Cieszewski, Chris J.; Bella, Imre E. (1986). "พลวัตของป่าสนล็อกโพล". Can. J. For. Res . 18 (10): 1255– 1260. doi : 10.1139/x88-193 .
  12. ^ Strub, Mike; Cieszewski, Chris J. (2006). "คุณสมบัติการคงสภาพตามอายุฐานของสองเทคนิคในการประมาณค่าพารามิเตอร์ของแบบจำลองดัชนีไซต์" Forest Science . 52 (2): 182– 186. doi : 10.1093/forestscience/52.2.182 .
  13. ^ Strub, Mike; Cieszewski, Chris J. (2003). Burkhart, HA (บรรณาธิการ). การปรับพารามิเตอร์ดัชนีไซต์ทั่วโลกเมื่อดัชนีไซต์แปลงหรือต้นไม้ถือเป็นพารามิเตอร์รบกวนเฉพาะที่รายงานการประชุมสัมมนาเรื่องสถิติและเทคโนโลยีสารสนเทศในวนศาสตร์; 8-12 กันยายน 2545; แบล็กส์เบิร์ก รัฐเวอร์จิเนีย: สถาบันเทคโนโลยีเวอร์จิเนียและมหาวิทยาลัยแห่งรัฐ หน้า  97–107
  14. ^ Cieszewski, Chris J.; Harrison, Mike; Martin, Stacey W. (2000). "วิธีการปฏิบัติสำหรับการประมาณค่าพารามิเตอร์ที่ไม่เอนเอียงในแบบจำลองการเติบโตและผลผลิตแบบอ้างอิงตนเอง" (PDF)รายงานทางเทคนิคของ PMRC 2000 ( 7): 12. เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 2016-03-04 สืบค้นเมื่อ2015-12-24
  15. ^ Schnute, Jon; McKinnell, Skip (1984). "แนวทางที่มีความหมายทางชีววิทยาในการวิเคราะห์พื้นผิวการตอบสนอง" Can. J. Fish. Aquat. Sci . 41 (6): 936– 953. doi : 10.1139/f84-108 .
  16. ^ Wooldridge, Jeffrey M. (2001). การวิเคราะห์ทางเศรษฐมิติของข้อมูลภาคตัดขวางและข้อมูลแผง . สำนักพิมพ์ MIT. หน้า  279–291 . ISBN 978-0-262-23219-7.
  17. ^ Chamberlain, Gary (1984). บทที่ 22 ข้อมูลแบบพาเนล . คู่มือเศรษฐศาสตร์เชิงปริมาณ. เล่ม 2. หน้า  1247–1318 . doi : 10.1016/S1573-4412(84)02014-6 . ISBN 978-0-444-86186-3ISSN 1573-4412 ​
  18. ^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M.; Pueyo, Laurent; Debes, John H.; Poteet, Charles A.; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A.; Hines, Dean C.; Schneider, Glenn; Soummer, Rémi (2018). "ภาพดิสก์ MWC 758 ตลอดทศวรรษ: ดาวเคราะห์ที่ขับเคลื่อนแขนก้นหอยอยู่ที่ไหน?" . The Astrophysical Journal Letters . 857 (1): L9. arXiv : 1803.06776 . Bibcode : 2018ApJ...857L...9R . doi : 10.3847/2041-8213/aab7f5 . S2CID 59427417 . 
  • แบบจำลองผลกระทบคงที่และแบบสุ่ม
  • ตัวอย่างของแบบจำลอง ANOVA และ ANCOVA ทั้งหมดที่มีปัจจัยการรักษาได้สูงสุดสามปัจจัย รวมถึงแบบบล็อกสุ่ม แบบแบ่งแปลง แบบวัดซ้ำ และแบบลาตินสแควร์ และการวิเคราะห์ใน R
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Fixed_effects_model&oldid=1314242050 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ แบบจำลองผลกระทบคงที่

ใน ทางสถิติ โมเดล ผลกระทบคงที่ (fixed effects model) คือ โมเดลทางสถิติ ที่ พารามิเตอร์ ของโมเดล เป็นค่าคงที่หรือไม่สุ่ม ซึ่งแตกต่างจาก โมเดลผลกระทบสุ่ม (random effects model) และ...

คำอธิบายเชิงคุณภาพ

แบบจำลองดังกล่าวช่วยควบคุม อคติจากตัวแปรที่ถูกละเลยอันเนื่อง มาจากความแตกต่างที่ไม่สามารถสังเกตได้ เมื่อความแตกต่างนี้คงที่ตลอดเวลา ความแตกต่างนี้สามารถกำจัดออกจากข้อมูลได้โดยการหาผลต่าง เช่น โดยการลบค่าเฉลี่ยระดับกลุ่มตลอดเวลา หรือโดยการหา ผลต่างครั้งแรก...

แบบจำลองเชิงทางการและข้อสมมติฐาน

พิจารณาแบบจำลองผลกระทบที่ไม่สามารถสังเกตได้เชิงเส้นสำหรับข้อมูลสังเกตการณ์และช่วงเวลา: เอ็น {\displaystyle N} ที {\displaystyle T}

ตัวประมาณผลกระทบคงที่

เนื่องจากไม่สามารถสังเกตได้โดยตรง จึงไม่สามารถ ควบคุม ได้โดยตรง แบบจำลอง FE จึงกำจัดปัญหานี้โดยการลบค่าเฉลี่ยของตัวแปรโดยใช้ การแปลง ภายใน : α ฉัน {\displaystyle \alpha _{i}} α ฉัน {\displaystyle \alpha _{i}}