อ่าน 10 นาที
แบบจำลองผลกระทบคงที่
ใน ทางสถิติ โมเดล ผลกระทบคงที่ (fixed effects model) คือ โมเดลทางสถิติ ที่ พารามิเตอร์ ของโมเดล เป็นค่าคงที่หรือไม่สุ่ม ซึ่งแตกต่างจาก โมเดลผลกระทบสุ่ม (random effects model) และ...
แบบจำลองผลกระทบคงที่
| ส่วนหนึ่งของชุดบทความเกี่ยวกับ |
| การวิเคราะห์การถดถอย |
|---|
| นางแบบ |
| การประมาณการ |
| พื้นหลัง |
ในทางสถิติโมเดลผลกระทบคงที่ (fixed effects model)คือโมเดลทางสถิติที่พารามิเตอร์ ของโมเดล เป็นค่าคงที่หรือไม่สุ่ม ซึ่งแตกต่างจากโมเดลผลกระทบสุ่ม (random effects model)และโมเดลผสม (mixed models)ที่พารามิเตอร์ของโมเดลทั้งหมดหรือบางส่วนเป็นตัวแปรสุ่ม ในการใช้งานหลายอย่าง รวมถึงเศรษฐศาสตร์เชิงปริมาณ[ 1 ]และชีวสถิติ[ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ]โมเดลผลกระทบคงที่หมายถึงโมเดลการถดถอยที่ค่าเฉลี่ยของกลุ่มเป็นค่าคงที่ (ไม่สุ่ม) ตรงข้ามกับโมเดลผลกระทบสุ่มที่ค่าเฉลี่ยของกลุ่มเป็นตัวอย่างสุ่มจากประชากร[ 7 ] [ 6 ]โดยทั่วไป ข้อมูลสามารถจัดกลุ่มตามปัจจัยที่สังเกตได้หลายประการ ค่าเฉลี่ยของกลุ่มสามารถจำลองเป็นผลกระทบคงที่หรือผลกระทบสุ่มสำหรับแต่ละกลุ่ม ในโมเดลผลกระทบคงที่ ค่าเฉลี่ยของแต่ละกลุ่มเป็นค่าคงที่เฉพาะกลุ่ม
ในข้อมูลแบบพาเนล (panel data)ที่มีการสังเกตการณ์ตามช่วงเวลาสำหรับบุคคลเดียวกัน ผลกระทบแบบคงที่ (fixed effects) จะแสดงถึงค่าเฉลี่ยเฉพาะบุคคล ในการวิเคราะห์ข้อมูลแบบพาเนลคำว่า ตัวประมาณ ค่าผลกระทบแบบคงที่ (fixed effects estimator ) (หรือที่เรียกว่า ตัวประมาณค่าภายใน (within estimator )) ใช้เพื่ออ้างถึงตัวประมาณค่าสำหรับสัมประสิทธิ์ในแบบจำลองการถดถอยที่รวมผลกระทบแบบคงที่เหล่านั้น (ค่าคงที่ที่ไม่เปลี่ยนแปลงตามเวลาหนึ่งค่าสำหรับแต่ละบุคคล)
คำอธิบายเชิงคุณภาพ
แบบจำลองดังกล่าวช่วยควบคุมอคติจากตัวแปรที่ถูกละเลยอันเนื่องมาจากความแตกต่างที่ไม่สามารถสังเกตได้ เมื่อความแตกต่างนี้คงที่ตลอดเวลา ความแตกต่างนี้สามารถกำจัดออกจากข้อมูลได้โดยการหาผลต่าง เช่น โดยการลบค่าเฉลี่ยระดับกลุ่มตลอดเวลา หรือโดยการหาผลต่างครั้งแรกซึ่งจะกำจัดส่วนประกอบที่ไม่เปลี่ยนแปลงตามเวลาของแบบจำลองออกไป
มีข้อสมมติฐานทั่วไปสองประการเกี่ยวกับผลกระทบเฉพาะบุคคล ได้แก่ ข้อสมมติฐานผลกระทบแบบสุ่มและข้อสมมติฐานผลกระทบแบบคงที่ ข้อสมมติฐาน ผลกระทบแบบสุ่มคือ ผลกระทบเฉพาะบุคคลไม่มีความสัมพันธ์กับตัวแปรอิสระ ข้อสมมติฐานผลกระทบแบบคงที่คือ ผลกระทบเฉพาะบุคคลมีความสัมพันธ์กับตัวแปรอิสระ หากข้อสมมติฐานผลกระทบแบบสุ่มเป็นจริง ตัวประมาณค่าผลกระทบแบบสุ่มจะมีประสิทธิภาพ มากกว่า ตัวประมาณค่าผลกระทบแบบคงที่ อย่างไรก็ตาม หากข้อสมมติฐานนี้ไม่เป็นจริง ตัวประมาณค่าผลกระทบแบบสุ่มจะไม่สอดคล้องกันการทดสอบ Durbin–Wu–Hausmanมักใช้เพื่อแยกแยะระหว่างแบบจำลองผลกระทบแบบคงที่และแบบสุ่ม[ 8 ] [ 9 ]
แบบจำลองเชิงทางการและข้อสมมติฐาน
พิจารณาแบบจำลองผลกระทบที่ไม่สามารถสังเกตได้เชิงเส้นสำหรับข้อมูลสังเกตการณ์และช่วงเวลา:
- สำหรับและ
ที่ไหน:
- คือตัวแปรตามที่สังเกตได้สำหรับแต่ละบุคคลณ เวลาt
- คือเวกเตอร์ตัวแปรอิสระที่เปลี่ยนแปลงตามเวลา(จำนวนตัวแปรอิสระ)
- คือเมทริกซ์ของพารามิเตอร์
- คือผลกระทบเฉพาะบุคคลที่ไม่สามารถสังเกตได้และไม่เปลี่ยนแปลงตามเวลา ตัวอย่างเช่น ความสามารถโดยกำเนิดของแต่ละบุคคล หรือปัจจัยทางประวัติศาสตร์และสถาบันของประเทศ
- คือค่าความคลาดเคลื่อน
ต่างจากกรณีที่ไม่สามารถสังเกตได้โดยตรง
แตกต่างจากแบบจำลองผลกระทบแบบสุ่ม (random effects model)ที่ตัวแปรที่ไม่สามารถสังเกตได้เป็นอิสระจาก ตัวแปรอิสระ สำหรับทุกตัวแบบจำลองผลกระทบแบบคงที่ (fixed effects model: FE) อนุญาตให้ตัวแปรอิสระมีความสัมพันธ์กับเมทริกซ์ตัวแปรอิสระได้อย่างไรก็ตามยังคงต้องมี ความเป็นอิสระอย่างเคร่งครัดในส่วนของพจน์ความคลาดเคลื่อนเฉพาะตัว
การประมาณค่าทางสถิติ
ตัวประมาณผลกระทบคงที่
เนื่องจากไม่สามารถสังเกตได้โดยตรง จึงไม่สามารถควบคุมได้โดยตรง แบบจำลอง FE จึงกำจัดปัญหานี้โดยการลบค่าเฉลี่ยของตัวแปรโดยใช้ การแปลง ภายใน :
โดยที่, , และ.
เนื่องจากมีค่าคงที่ดังนั้นผลกระทบจึงถูกกำจัดไป ตัวประมาณค่า FE จึงได้มาจากการถดถอย OLS ของ บน
มีทางเลือกอย่างน้อยสามทางสำหรับ การแปลง ภายในโดยมีรูปแบบที่แตกต่างกันดังนี้:
- วิธีหนึ่งคือการเพิ่มตัวแปรดัมมี่สำหรับแต่ละบุคคล(โดยละเว้นบุคคลแรกเนื่องจากความสัมพันธ์เชิงเส้นหลายตัวแปร ) วิธีนี้เทียบเท่ากับแบบจำลองผลกระทบคงที่ในเชิงตัวเลข แต่ไม่เทียบเท่าในเชิงการคำนวณ และจะใช้ได้ผลก็ต่อเมื่อผลรวมของจำนวนอนุกรมและจำนวนพารามิเตอร์ทั่วโลกน้อยกว่าจำนวนการสังเกต[ 10 ]วิธีการใช้ตัวแปรดัมมี่มีความต้องการหน่วยความจำคอมพิวเตอร์สูงเป็นพิเศษ และไม่แนะนำสำหรับปัญหาที่มีขนาดใหญ่เกินกว่า RAM ที่มีอยู่ และการคอมไพล์โปรแกรมที่ใช้จะรองรับได้
- ทางเลือกที่สองคือการใช้แนวทางการทำซ้ำต่อเนื่องเพื่อการประมาณค่าในระดับท้องถิ่นและระดับโลก[ 11 ]แนวทางนี้เหมาะสมอย่างยิ่งสำหรับระบบที่มีหน่วยความจำต่ำ ซึ่งมีประสิทธิภาพในการคำนวณมากกว่าแนวทางตัวแปรดัมมี่มาก
- แนวทางที่สามคือการประมาณค่าแบบซ้อนกัน โดยการประมาณค่าเฉพาะที่สำหรับแต่ละอนุกรมจะถูกตั้งโปรแกรมไว้เป็นส่วนหนึ่งของคำจำกัดความของแบบจำลอง[ 12 ]แนวทางนี้มีประสิทธิภาพในการคำนวณและใช้หน่วยความจำมากที่สุด แต่ต้องใช้ทักษะการเขียนโปรแกรมที่เชี่ยวชาญและการเข้าถึงรหัสการเขียนโปรแกรมแบบจำลอง แม้ว่าจะสามารถเขียนโปรแกรมได้รวมถึงใน SAS [ 13 ] [ 14 ]
สุดท้ายนี้ ทางเลือกแต่ละข้อข้างต้นสามารถปรับปรุงได้หากการประมาณค่าเฉพาะอนุกรมเป็นเชิงเส้น (ภายในแบบจำลองที่ไม่เป็นเชิงเส้น) ซึ่งในกรณีนี้ วิธีแก้ปัญหาเชิงเส้นโดยตรงสำหรับแต่ละอนุกรมสามารถตั้งโปรแกรมเป็นส่วนหนึ่งของคำจำกัดความแบบจำลองที่ไม่เป็นเชิงเส้นได้[ 15 ]
ตัวประมาณความแตกต่างอันดับแรก
ทางเลือกอื่นนอกเหนือจากการแปลงภายในคือ การแปลง ความแตกต่างครั้งแรกซึ่งจะสร้างตัวประมาณค่าที่แตกต่างกัน สำหรับ:
จากนั้นจะได้ ตัวประมาณค่า FD โดยใช้การถดถอย OLS ของ บน
เมื่อตัวประมาณค่าความแตกต่างแรกและผลกระทบคงที่นั้นมีค่าเท่ากันในเชิงตัวเลข สำหรับจะไม่เท่ากัน หากเงื่อนไขความคลาดเคลื่อนเป็นแบบ homoskedasticโดยไม่มีความสัมพันธ์แบบอนุกรม ตัวประมาณค่าผลกระทบคงที่นั้นจะมีประสิทธิภาพ มากกว่า ตัวประมาณค่าความแตกต่างแรก อย่างไรก็ตาม หากเป็นไปตามการเดินแบบสุ่มตัวประมาณค่าความแตกต่างแรกจะมีประสิทธิภาพมากกว่า[ 16 ]
ความเท่าเทียมกันของตัวประมาณผลกระทบคงที่และตัวประมาณความแตกต่างอันดับแรกเมื่อ T=2
สำหรับกรณีพิเศษสองช่วงเวลา ( ) ตัวประมาณค่าแบบผลกระทบคงที่ (FE) และตัวประมาณค่าแบบผลต่างอันดับแรก (FD) มีค่าเท่ากันในเชิงตัวเลข เนื่องจากตัวประมาณค่า FE นั้น "เพิ่มขนาดชุดข้อมูลเป็นสองเท่า" ที่ใช้ในตัวประมาณค่า FD เพื่อให้เห็นเช่นนี้ ให้พิจารณาว่าตัวประมาณค่าแบบผลกระทบคงที่คือ:
เนื่องจากแต่ละประโยคสามารถเขียนใหม่ได้เป็น ดังนั้นเราจะเขียนประโยคใหม่เป็น:
วิธีการของแชมเบอร์เลน
วิธีการของGary Chamberlain ซึ่งเป็นการขยายความของตัวประมาณค่าภายใน (within estimator) จะแทนที่ ด้วยการฉายภาพเชิงเส้น (linear projection)บนตัวแปรอธิบาย โดยเขียนการฉายภาพเชิงเส้นได้ดังนี้:
ซึ่งจะได้สมการดังต่อไปนี้:
ซึ่งสามารถประมาณได้โดยการประมาณระยะทางขั้นต่ำ[ 17 ]
วิธีเฮาส์แมน-เทย์เลอร์
จำเป็นต้องมีตัวแปรอิสระที่เปลี่ยนแปลงตามเวลามากกว่าหนึ่งตัว ( ) และตัวแปรอิสระที่ไม่เปลี่ยนแปลงตามเวลา ( ) และอย่างน้อยหนึ่งตัวและหนึ่งตัวที่ ไม่สัมพันธ์กับ
แบ่งตัวแปรและออกเป็นส่วนๆ โดยที่และไม่มีความสัมพันธ์กับจำเป็นต้องใช้
การประมาณค่าโดยใช้วิธี OLS โดยใช้และเป็นตัวแปรเครื่องมือ จะให้ค่าประมาณที่สอดคล้องกัน
การสรุปทั่วไปโดยคำนึงถึงความไม่แน่นอนของข้อมูลป้อนเข้า
เมื่อมีความไม่แน่นอนในการป้อนข้อมูล ค่า ดังกล่าวควรถูกทำให้น้อยที่สุด แทนที่จะเป็นผลรวมของค่าตกค้างยกกำลังสอง[ 18 ]ซึ่งสามารถทำได้โดยตรงจากกฎการแทนที่:
- ,
จากนั้นค่าและค่าเบี่ยงเบนมาตรฐานสำหรับและสามารถหาได้โดยใช้วิธี การวิเคราะห์ กำลังสองน้อยที่สุด แบบคลาสสิก และ เมท ริก ซ์ความแปรปรวนร่วม
ใช้เพื่อทดสอบความสม่ำเสมอ
ตัวประมาณค่าแบบผลกระทบสุ่มอาจไม่สอดคล้องกันในบางครั้งเมื่อพิจารณาอนุกรมเวลาในระยะยาว หากระบุผลกระทบสุ่มไม่ถูกต้อง (เช่น แบบจำลองที่เลือกสำหรับผลกระทบสุ่มไม่ถูกต้อง) อย่างไรก็ตาม แบบจำลองผลกระทบคงที่อาจยังคงสอดคล้องกันในบางสถานการณ์ ตัวอย่างเช่น หากอนุกรมเวลาที่กำลังสร้างแบบจำลองไม่เป็นอนุกรมเวลาคงที่ แบบจำลองผลกระทบสุ่มที่สมมติว่าอนุกรมเวลาคงที่อาจไม่สอดคล้องกันเมื่อพิจารณาอนุกรมเวลาในระยะยาว ตัวอย่างหนึ่งของกรณีนี้คือ หากอนุกรมเวลามีแนวโน้มเพิ่มขึ้น เมื่ออนุกรมเวลายาวขึ้น แบบจำลองจะปรับค่าประมาณสำหรับค่าเฉลี่ยของช่วงเวลาก่อนหน้าให้สูงขึ้น ทำให้การคาดการณ์ค่าสัมประสิทธิ์มีความลำเอียงมากขึ้นเรื่อยๆ อย่างไรก็ตาม แบบจำลองที่มีผลกระทบคงที่ในช่วงเวลาจะไม่รวบรวมข้อมูลข้ามเวลา และด้วยเหตุนี้ ค่าประมาณก่อนหน้าจึงจะไม่ได้รับผลกระทบ
ในสถานการณ์เช่นนี้ เมื่อทราบว่าแบบจำลองผลกระทบคงที่นั้นมีความสอดคล้องแล้วสามารถใช้การทดสอบ Durbin-Wu-Hausman เพื่อทดสอบว่าแบบจำลองผลกระทบสุ่มที่เลือกนั้นมีความสอดคล้องหรือไม่ ถ้า เป็นจริง ทั้งและมีความสอดคล้อง แต่มีเพียง เท่านั้นที่มีประสิทธิภาพ ถ้าเป็นจริง ความสอดคล้องของไม่สามารถรับประกันได้
ดูเพิ่มเติม
- แบบจำลองผลกระทบแบบสุ่ม
- แบบจำลองผสม
- แบบจำลองผลกระทบที่ไม่สามารถสังเกตได้แบบไดนามิก
- แบบจำลองปัวซงแบบผลกระทบคงที่
- การวิเคราะห์แผง
- ตัวประมาณค่าความแตกต่างอันดับแรก
หมายเหตุ
- ^Greene, W.H., 2011. Econometric Analysis, 7th ed., Prentice Hall
- ^Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analysis of Longitudinal Data (2nd ed.). Oxford University Press. pp. 169–171. ISBN 0-19-852484-6.
- ^Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. pp. 326–328. ISBN 0-471-21487-6.
- ^Laird, Nan M.; Ware, James H. (1982). "Random-Effects Models for Longitudinal Data". Biometrics. 38 (4): 963–974. doi:10.2307/2529876. JSTOR 2529876.
- ^Gardiner, Joseph C.; Luo, Zhehui; Roman, Lee Anne (2009). "Fixed effects, random effects and GEE: What are the differences?". Statistics in Medicine. 28 (2): 221–239. doi:10.1002/sim.3478. PMID 19012297. S2CID 16277040.
- ^ abGomes, Dylan G.E. (20 January 2022). "Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model?". PeerJ. 10 e12794. doi:10.7717/peerj.12794. PMC 8784019. PMID 35116198.
- ^Ramsey, F., Schafer, D., 2002. The Statistical Sleuth: A Course in Methods of Data Analysis, 2nd ed. Duxbury Press
- ^Cameron, A. Colin; Trivedi, Pravin K. (2005). Microeconometrics: Methods and Applications. Cambridge University Press. pp. 717–19. ISBN 978-0-521-84805-3.
- ^Nerlove, Marc (2005). Essays in Panel Data Econometrics. Cambridge University Press. pp. 36–39. ISBN 978-0-521-02246-0.
- ^Garcia, Oscar. (1983). "A stochastic differential equation model for the height growth of forest stands". Biometrics. 39 (4): 1059–1072. doi:10.2307/2531339. JSTOR 2531339.
- ^ Tait, David; Cieszewski, Chris J.; Bella, Imre E. (1986). "พลวัตของป่าสนล็อกโพล". Can. J. For. Res . 18 (10): 1255– 1260. doi : 10.1139/x88-193 .
- ^ Strub, Mike; Cieszewski, Chris J. (2006). "คุณสมบัติการคงสภาพตามอายุฐานของสองเทคนิคในการประมาณค่าพารามิเตอร์ของแบบจำลองดัชนีไซต์" Forest Science . 52 (2): 182– 186. doi : 10.1093/forestscience/52.2.182 .
- ^ Strub, Mike; Cieszewski, Chris J. (2003). Burkhart, HA (บรรณาธิการ). การปรับพารามิเตอร์ดัชนีไซต์ทั่วโลกเมื่อดัชนีไซต์แปลงหรือต้นไม้ถือเป็นพารามิเตอร์รบกวนเฉพาะที่รายงานการประชุมสัมมนาเรื่องสถิติและเทคโนโลยีสารสนเทศในวนศาสตร์; 8-12 กันยายน 2545; แบล็กส์เบิร์ก รัฐเวอร์จิเนีย: สถาบันเทคโนโลยีเวอร์จิเนียและมหาวิทยาลัยแห่งรัฐ หน้า 97–107
- ^ Cieszewski, Chris J.; Harrison, Mike; Martin, Stacey W. (2000). "วิธีการปฏิบัติสำหรับการประมาณค่าพารามิเตอร์ที่ไม่เอนเอียงในแบบจำลองการเติบโตและผลผลิตแบบอ้างอิงตนเอง" (PDF)รายงานทางเทคนิคของ PMRC 2000 ( 7): 12. เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 2016-03-04 สืบค้นเมื่อ2015-12-24
- ^ Schnute, Jon; McKinnell, Skip (1984). "แนวทางที่มีความหมายทางชีววิทยาในการวิเคราะห์พื้นผิวการตอบสนอง" Can. J. Fish. Aquat. Sci . 41 (6): 936– 953. doi : 10.1139/f84-108 .
- ^ Wooldridge, Jeffrey M. (2001). การวิเคราะห์ทางเศรษฐมิติของข้อมูลภาคตัดขวางและข้อมูลแผง . สำนักพิมพ์ MIT. หน้า 279–291 . ISBN 978-0-262-23219-7.
- ^ Chamberlain, Gary (1984). บทที่ 22 ข้อมูลแบบพาเนล . คู่มือเศรษฐศาสตร์เชิงปริมาณ. เล่ม 2. หน้า 1247–1318 . doi : 10.1016/S1573-4412(84)02014-6 . ISBN 978-0-444-86186-3ISSN 1573-4412
- ^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M.; Pueyo, Laurent; Debes, John H.; Poteet, Charles A.; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A.; Hines, Dean C.; Schneider, Glenn; Soummer, Rémi (2018). "ภาพดิสก์ MWC 758 ตลอดทศวรรษ: ดาวเคราะห์ที่ขับเคลื่อนแขนก้นหอยอยู่ที่ไหน?" . The Astrophysical Journal Letters . 857 (1): L9. arXiv : 1803.06776 . Bibcode : 2018ApJ...857L...9R . doi : 10.3847/2041-8213/aab7f5 . S2CID 59427417 .
ลิงก์ภายนอก
- แบบจำลองผลกระทบคงที่และแบบสุ่ม
- ตัวอย่างของแบบจำลอง ANOVA และ ANCOVA ทั้งหมดที่มีปัจจัยการรักษาได้สูงสุดสามปัจจัย รวมถึงแบบบล็อกสุ่ม แบบแบ่งแปลง แบบวัดซ้ำ และแบบลาตินสแควร์ และการวิเคราะห์ใน R
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ แบบจำลองผลกระทบคงที่
ใน ทางสถิติ โมเดล ผลกระทบคงที่ (fixed effects model) คือ โมเดลทางสถิติ ที่ พารามิเตอร์ ของโมเดล เป็นค่าคงที่หรือไม่สุ่ม ซึ่งแตกต่างจาก โมเดลผลกระทบสุ่ม (random effects model) และ...
คำอธิบายเชิงคุณภาพ
แบบจำลองดังกล่าวช่วยควบคุม อคติจากตัวแปรที่ถูกละเลยอันเนื่อง มาจากความแตกต่างที่ไม่สามารถสังเกตได้ เมื่อความแตกต่างนี้คงที่ตลอดเวลา ความแตกต่างนี้สามารถกำจัดออกจากข้อมูลได้โดยการหาผลต่าง เช่น โดยการลบค่าเฉลี่ยระดับกลุ่มตลอดเวลา หรือโดยการหา ผลต่างครั้งแรก...
แบบจำลองเชิงทางการและข้อสมมติฐาน
พิจารณาแบบจำลองผลกระทบที่ไม่สามารถสังเกตได้เชิงเส้นสำหรับข้อมูลสังเกตการณ์และช่วงเวลา: เอ็น {\displaystyle N} ที {\displaystyle T}
ตัวประมาณผลกระทบคงที่
เนื่องจากไม่สามารถสังเกตได้โดยตรง จึงไม่สามารถ ควบคุม ได้โดยตรง แบบจำลอง FE จึงกำจัดปัญหานี้โดยการลบค่าเฉลี่ยของตัวแปรโดยใช้ การแปลง ภายใน : α ฉัน {\displaystyle \alpha _{i}} α ฉัน {\displaystyle \alpha _{i}}