อ่าน 4 นาที
วิธีการความน่าจะเป็นบางส่วนสำหรับข้อมูลแบบพาเนล
การประมาณค่าความน่าจะเป็นแบบบางส่วน (แบบรวม) สำหรับข้อมูลแบบพาเนลเป็น วิธี การประมาณค่าความน่าจะเป็นสูงสุดแบบกึ่งสมบูรณ์สำหรับการวิเคราะห์แบบพาเนลซึ่งสมมติว่าความหนาแน่นของตัวแปรที...
วิธีการความน่าจะเป็นบางส่วนสำหรับข้อมูลแบบพาเนล
การประมาณค่าความน่าจะเป็นแบบบางส่วน (แบบรวม) สำหรับข้อมูลแบบพาเนลเป็น วิธี การประมาณค่าความน่าจะเป็นสูงสุดแบบกึ่งสมบูรณ์สำหรับการวิเคราะห์แบบพาเนลซึ่งสมมติว่าความหนาแน่นของตัวแปรที่กำหนดนั้นระบุไว้อย่างถูกต้องสำหรับแต่ละช่วงเวลา แต่ก็อนุญาตให้มีการระบุค่าความหนาแน่นแบบมีเงื่อนไขของตัวแปร ที่กำหนดผิดพลาด ได้
คำอธิบาย
โดยเฉพาะอย่างยิ่ง การประมาณค่าความน่าจะเป็นบางส่วนใช้ผลคูณของความหนาแน่นแบบมีเงื่อนไขเป็นความหนาแน่นของการแจกแจงแบบมีเงื่อนไขร่วมกัน ความทั่วไปนี้อำนวยความสะดวกให้กับ วิธี การประมาณค่าความน่าจะเป็นสูงสุดในการตั้งค่าข้อมูลแผง เนื่องจากการระบุการแจกแจงแบบมีเงื่อนไขของy i อย่างครบถ้วน อาจต้องใช้การคำนวณมาก[ 1 ]ในทางกลับกัน การอนุญาตให้มีการระบุผิดพลาดโดยทั่วไปจะส่งผลให้เกิดการละเมิดความเท่าเทียมกันของข้อมูล และดังนั้นจึงต้องใช้ตัวประมาณค่าความคลาดเคลื่อนมาตรฐานที่แข็งแกร่งสำหรับการอนุมาน
ในการนำเสนอต่อไปนี้ เราจะปฏิบัติตามการรักษาใน Wooldridge [ 1 ]โดยเฉพาะอย่างยิ่ง การหาอนุพันธ์เชิงอะซิมโทติกจะทำภายใต้การตั้งค่า T คงที่และ N ที่เพิ่มขึ้น
เมื่อเขียนความหนาแน่นแบบมีเงื่อนไขของ y itเมื่อกำหนดx itเป็นf t ( y it | x it ;θ) ตัวประมาณค่าความน่าจะเป็นสูงสุดแบบบางส่วนจะแก้ปัญหาดังนี้:
ในการกำหนดสูตรนี้ ความหนาแน่นร่วมแบบมีเงื่อนไขของy iเมื่อกำหนดx iจะถูกจำลองเป็นΠ t f t ( y it | x it ; θ) เราสมมติว่าf t (y it | x it ; θ)ถูกกำหนดอย่างถูกต้องสำหรับแต่ละt = 1,..., Tและมีθ 0 ∈ Θ ที่ทำให้E[f t (y it │x it ; θ)] มีค่าสูงสุดเพียงค่าเดียว แต่ไม่ได้สมมติว่าความหนาแน่นร่วมแบบมีเงื่อนไขถูกกำหนดอย่างถูกต้อง ภายใต้เงื่อนไขความสม่ำเสมอบางประการ ค่าประมาณความน่าจะเป็นสูงสุดแบบบางส่วน (partial MLE) จะมีความสอดคล้องและเป็นแบบปกติเชิงอะซิมโทติก
ตามข้อโต้แย้งปกติสำหรับตัวประมาณค่า M (รายละเอียดใน Wooldridge [ 1 ] ) ความแปรปรวนเชิงอะซิมโทติกของ√ N (θ MLE - θ 0 ) คือ A −1 BA −1โดยที่A −1 = E[ Σ t ∇ 2 θ logf t (y it │x it ; θ)] −1และ B=E[( Σ t ∇ θ logf t (y it │x it ; θ) ) ( Σ t ∇ θ logf t (y it │x it ; θ ) ) T ]หากความหนาแน่นร่วมแบบมีเงื่อนไขของ y iเมื่อกำหนด x iถูกต้อง สูตรข้างต้นสำหรับความแปรปรวนเชิงอะซิมโทติกจะง่ายขึ้นเนื่องจากความเท่าเทียมกันของข้อมูลกล่าวว่าB= A อย่างไรก็ตาม ยกเว้นในกรณีพิเศษความหนาแน่นร่วมที่จำลองโดย MLE บางส่วนนั้นไม่ถูกต้อง ดังนั้น เพื่อการอนุมานที่ถูกต้อง ควรใช้สูตรข้างต้นสำหรับความแปรปรวนเชิงอะซิมโทติก สำหรับความเท่าเทียมกันของข้อมูล เงื่อนไขที่เพียงพอประการหนึ่งคือ คะแนนของความหนาแน่นสำหรับแต่ละช่วงเวลาไม่มีความสัมพันธ์กัน ในแบบจำลองที่สมบูรณ์แบบไดนามิก เงื่อนไขนี้เป็นจริง ดังนั้นความแปรปรวนเชิงอะซิมโทติกแบบง่ายจึงถูกต้อง[ 1 ]
QMLE แบบรวมสำหรับแบบจำลองปัวซง
Pooled QMLE เป็นเทคนิคที่ช่วยในการประมาณค่าพารามิเตอร์เมื่อ มี ข้อมูลแบบพาเนลที่มีผลลัพธ์แบบปัวซง ตัวอย่างเช่น อาจมีข้อมูลเกี่ยวกับจำนวนสิทธิบัตรที่ยื่นโดยบริษัทต่างๆ ในช่วงเวลาต่างๆ Pooled QMLE ไม่จำเป็นต้องมีผลกระทบที่ไม่สามารถสังเกตได้ (ซึ่งอาจเป็นผลกระทบแบบสุ่มหรือผลกระทบแบบคงที่ ) และวิธีการประมาณค่านี้ถูกเสนอขึ้นมาเพื่อวัตถุประสงค์เหล่านี้เป็นหลัก ข้อกำหนดด้านการคำนวณนั้นไม่เข้มงวดมากนัก โดยเฉพาะเมื่อเทียบกับแบบจำลองปัวซงแบบผลกระทบคงที่แต่ข้อเสียคือสมมติฐานที่อาจเข้มงวดมากเกี่ยวกับการไม่มีความแตกต่างที่ไม่สามารถสังเกตได้คำว่า Pooled หมายถึงการรวมข้อมูลในช่วงเวลาต่างๆTเข้าด้วยกัน ในขณะที่ QMLE หมายถึงเทคนิคการประมาณค่าความน่าจะเป็นสูงสุดแบบกึ่ง (quasi-maximum likelihood)
การแจกแจงปัวซงที่กำหนดจะระบุไว้ดังนี้: [ 2 ]
จุดเริ่มต้นสำหรับ QMLE แบบรวมของ Poisson คือสมมติฐานค่าเฉลี่ยแบบมีเงื่อนไข โดยเฉพาะอย่างยิ่ง เราสมมติว่าสำหรับบางค่าในพื้นที่พารามิเตอร์B ที่กระชับ ค่าเฉลี่ยแบบมีเงื่อนไขจะกำหนดโดย[ 2 ]
เงื่อนไขพื้นที่พารามิเตอร์ขนาดกะทัดรัดถูกกำหนดขึ้นเพื่อเปิดใช้งานการใช้เทคนิคการประมาณค่า Mในขณะที่ค่าเฉลี่ยแบบมีเงื่อนไขสะท้อนให้เห็นว่าค่าเฉลี่ยประชากรของกระบวนการปัวซงเป็นพารามิเตอร์ที่น่าสนใจ ในกรณีนี้ พารามิเตอร์ที่ควบคุมกระบวนการปัวซงสามารถเปลี่ยนแปลงได้โดยสัมพันธ์กับเวกเตอร์[ 2 ] ใน ทางทฤษฎี ฟังก์ชันmสามารถเปลี่ยนแปลงได้ตลอดเวลา แม้ว่าจะมักถูกระบุว่าคงที่ตลอดเวลา[ 3 ]โปรดทราบว่ามีการระบุเฉพาะฟังก์ชันค่าเฉลี่ยแบบมีเงื่อนไขเท่านั้น และเราจะได้รับค่าประมาณที่สอดคล้องกันของตราบใดที่เงื่อนไขค่าเฉลี่ยนี้ถูกระบุอย่างถูกต้อง ซึ่งนำไปสู่เงื่อนไขอันดับแรกต่อไปนี้ ซึ่งแสดงถึงความน่าจะเป็นแบบกึ่งลอการิทึมสำหรับการประมาณค่าปัวซงแบบรวม: [ 2 ]
ตัวเลือกที่นิยมคือเนื่องจากกระบวนการปัวซงถูกกำหนดไว้บนเส้นจำนวนจริงบวก[ 3 ]ซึ่งลดโมเมนต์แบบมีเงื่อนไขให้เหลือเพียงฟังก์ชันดัชนีเลขชี้กำลัง โดยที่คือดัชนีเชิงเส้น และ exp คือฟังก์ชันเชื่อมโยง[ 4 ]