การทดสอบวอลด์

ในทางสถิติการทดสอบ Wald (ตั้งชื่อตามAbraham Wald ) ประเมินข้อจำกัดของพารามิเตอร์ทางสถิติโดยพิจารณาจากระยะทางถ่วงน้ำหนักระหว่างค่าประมาณที่ไม่จำกัดและค่าที่สมมติขึ้นภายใต้สมมติฐานว่างโดยที่น้ำหนักคือความแม่นยำของค่าประมาณ^{[ 1 ]}^{[ 2 ]}ตามสัญชาตญาณ ยิ่งระยะทางถ่วงน้ำหนักนี้มากเท่าใด โอกาสที่ข้อจำกัดจะเป็นจริงก็จะยิ่งน้อยลงเท่านั้น แม้ว่าการแจกแจงตัวอย่างจำกัดของการทดสอบ Wald โดยทั่วไปจะไม่เป็นที่รู้จัก^{[ 3 ]}^{: 138}แต่ก็มีการแจกแจง แบบ χ² เชิงอะซิม ^โท ติก ภายใต้สมมติฐานว่าง ซึ่งเป็นข้อเท็จจริงที่สามารถนำมาใช้ในการพิจารณาความสำคัญทางสถิติได้^{[ 4 ]}

การทดสอบ Wald ร่วมกับการทดสอบตัวคูณลากรางจ์และการทดสอบอัตราส่วนความน่าจะ เป็น เป็นหนึ่งในสามแนวทางคลาสสิกใน การทดสอบสมมติฐานข้อดีของการทดสอบ Wald เหนืออีกสองวิธีคือ การทดสอบ Wald ต้องการเพียงการประมาณค่าแบบจำลองที่ไม่จำกัด ซึ่งช่วยลดภาระการคำนวณเมื่อเทียบกับการทดสอบอัตราส่วนความน่าจะเป็น อย่างไรก็ตาม ข้อเสียที่สำคัญคือ (ในตัวอย่างจำกัด) การทดสอบ Wald ไม่คงที่ต่อการเปลี่ยนแปลงในการแสดงสมมติฐานว่าง กล่าวคือนิพจน์ ที่เทียบเท่าทางพีชคณิต ของการจำกัดพารามิเตอร์ที่ไม่เป็นเชิงเส้นอาจนำไปสู่ค่าสถิติการทดสอบที่แตกต่างกัน^{[ 5 ]}^{[ 6 ]}นั่นเป็นเพราะสถิติ Wald ได้มาจากการขยายอนุกรมเทย์เลอร์ [ ⁷^]และวิธีการเขียนนิพจน์ที่ไม่เป็นเชิงเส้นที่เทียบเท่ากันที่แตกต่างกันจะนำไปสู่ความแตกต่างที่ไม่สำคัญในสัมประสิทธิ์เทย์เลอร์ที่สอดคล้อง^กัน^{[ 8 ]}ความผิดปกติอีกอย่างหนึ่งที่เรียกว่าปรากฏการณ์ Hauck–Donner ^{[ 9 ]}สามารถเกิดขึ้นได้ในแบบจำลองทวินามเมื่อพารามิเตอร์ที่ประมาณค่า (ไม่ถูกจำกัด) อยู่ใกล้กับขอบเขตของพื้นที่พารามิเตอร์ —ตัวอย่างเช่น ความน่าจะเป็นที่เหมาะสมใกล้เคียงกับศูนย์หรือหนึ่งมาก—ซึ่งส่งผลให้การทดสอบ Wald ไม่เพิ่มขึ้นอย่างต่อเนื่องตามระยะห่างระหว่างพารามิเตอร์ที่ไม่ถูกจำกัดและพารามิเตอร์ที่ถูกจำกัด^{[ 10 ]}^{[ 11 ]}

รายละเอียดทางคณิตศาสตร์

ภายใต้การทดสอบของ Wald ค่าประมาณที่พบว่าเป็นค่าสูงสุดของอาร์กิวเมนต์ของฟังก์ชันความน่าจะ เป็นแบบไม่มี ข้อจำกัด จะถูกนำมาเปรียบเทียบกับค่าที่สมมติขึ้นโดยเฉพาะอย่างยิ่ง ผลต่างกำลังสองจะถูกถ่วงน้ำหนักด้วยความโค้งของฟังก์ชันลอการิทึมความน่าจะเป็น ${\hat {\theta }}$ $\theta _{0}$ ${\hat {\theta }}-\theta _{0}$

ทดสอบด้วยพารามิเตอร์เดียว

หากสมมติฐานเกี่ยวข้องกับการจำกัดพารามิเตอร์เพียงตัวเดียว สถิติ Wald จะมีรูปแบบดังต่อไปนี้:

W={\frac {{({\widehat {\theta }}-\theta _{0})}^{2}}{\operatorname {var} ({\hat {\theta }})}}

ซึ่งภายใต้สมมติฐานว่างจะเป็นไปตามการแจกแจง χ² แบบไม่จำกัด^ที่มีองศาอิสระหนึ่งองศา รากที่สองของสถิติ Wald ข้อจำกัดเดียวสามารถเข้าใจได้ว่าเป็นอัตราส่วน t (เทียม) ซึ่งอย่างไรก็ตามไม่ได้มีการแจกแจง แบบ t จริงๆ ยกเว้นกรณีพิเศษของการถดถอยเชิงเส้นที่มีข้อผิดพลาดที่แจกแจงแบบปกติ^{[ 12 ]}โดยทั่วไปแล้ว จะเป็นไปตามการแจกแจง z แบบไม่จำกัด ^{[ 13 ]}

{\sqrt {W}}={\frac {{\widehat {\theta }}-\theta _{0}}{\operatorname {se} ({\hat {\theta }})}}

โดยที่ค่าความคลาดเคลื่อนมาตรฐาน (SE) ของการประมาณค่าความน่าจะเป็นสูงสุด (MLE) คือรากที่สองของความแปรปรวน มีหลายวิธีในการประมาณเมทริกซ์ความแปรปรวนอย่างสม่ำเสมอซึ่งในตัวอย่างจำกัดจะนำไปสู่การประมาณค่าความคลาดเคลื่อนมาตรฐานทางเลือกและสถิติการทดสอบที่เกี่ยวข้องและค่าp [ ³^]^:¹²⁹ความถูกต้องของการยังคงได้รับการกระจายแบบปกติเชิงอะซิมโทติกหลังจากเสียบ ค่าประมาณ MLEของลงในSEขึ้นอยู่กับทฤษฎีบทของ Slutsky $\operatorname {se} ({\widehat {\theta }})$ ${\hat {\theta }}$

การทดสอบกับพารามิเตอร์หลายตัว

การทดสอบ Wald สามารถใช้ทดสอบสมมติฐานเดียวเกี่ยวกับพารามิเตอร์หลายตัว รวมถึงใช้ทดสอบสมมติฐานหลายข้อร่วมกันเกี่ยวกับพารามิเตอร์เดียว/หลายตัวได้ ให้เป็นตัวประมาณค่าตัวอย่างของ พารามิเตอร์ P ตัว (กล่าวคือเป็นเวกเตอร์) ซึ่งคาดว่าจะมีการแจกแจงแบบปกติในเชิงอะซิมโทติก โดยมีเมทริกซ์ความแปรปรวนร่วมVการทดสอบสมมติฐานQข้อเกี่ยวกับ พารามิเตอร์ Pตัว จะแสดงด้วยเมทริกซ์ Rดังนี้: ${\hat {\theta }}_{n}$ ${\hat {\theta }}_{n}$ $P\times 1$ ${\sqrt {n}}({\hat {\theta }__{n}-\theta )\,\xrightarrow {\mathcal {D}} \,N(0,V)$ $Q\times P$

H_{0}:R\theta =r

H_{1}:R\theta \neq r

การแจกแจงของค่าสถิติการทดสอบภายใต้สมมติฐานว่างคือ

(R{\hat {\theta }}_{n}-r)'[R({\hat {V}}_{n}/n)R']^{-1}(R{\hat {\theta }}_{n}-r)/Q\quad \xrightarrow {\mathcal {D}} \quad F(Q,nP)\quad {\xrightarrow[{n\rightarrow \infty }]{\mathcal {D}}}\quad \chi _{Q}^{2}/Q,

ซึ่งในทางกลับกันก็หมายความว่า

(R{\hat {\theta }}_{n}-r)'[R({\hat {V}}_{n}/n)R']^{-1}(R{\hat {\theta }}_{n}-r)\quad {\xrightarrow[{n\rightarrow \infty }]{\mathcal {D}}}\quad \chi _{Q}^{2},

โดยที่เป็นตัวประมาณค่าของเมทริกซ์ความแปรปรวนร่วม^[¹⁴^] ${\หมวก {V}__{n}$

การพิสูจน์

สมมติว่า. จากนั้น โดยทฤษฎีบทของ Slutskyและคุณสมบัติของการแจกแจงปกติการคูณด้วย R จะมีการแจกแจงดังนี้: ${\sqrt {n}}({\hat {\theta }__{n}-\theta )\,\xrightarrow {\mathcal {D}} \,N(0,V)$

R{\sqrt {n}}({\hat {\theta }`{n}-\theta )={\sqrt {n}}(R{\hat {\theta }}_{n}-r)\,\xrightarrow {\mathcal {D}} \,N(0,RVR')

เมื่อพิจารณาว่ารูปแบบกำลังสองของการแจกแจงปกติมีการแจกแจงแบบไคกำลังสอง :

{\sqrt {n}}(R{\hat {\theta }`{n}-r)'[RVR']^{-1}{\sqrt {n}}(R{\hat {\theta }`{n}-r)\,\xrightarrow {\mathcal {D}} \,\chi _{Q}^{2}

เมื่อจัดเรียงnใหม่จะได้ผลลัพธ์ดังนี้:

(R{\hat {\theta }}_{n}-r)'[R(V/n)R']^{-1}(R{\hat {\theta }}_{n}-r)\quad \xrightarrow {\mathcal {D}} \quad \chi _{Q}^{2}

ถ้าเมทริกซ์ความแปรปรวนร่วมไม่เป็นที่ทราบล่วงหน้าและจำเป็นต้องประมาณค่าจากข้อมูลล่ะ? ถ้าเรามี ตัวประมาณค่า ที่สอดคล้องกัน ซึ่งมีดีเทอร์มิแนนต์ที่มีการกระจายแบบแล้วโดยความเป็นอิสระของตัวประมาณค่าความแปรปรวนร่วมและสมการข้างต้น เราจะได้ว่า: ${\หมวก {V}__{n}$ $V$ $V^{-1}{\หมวก {V}__{n}$ $\chi _{nP}^{2}$

(R{\hat {\theta }}_{n}-r)'[R({\hat {V}}_{n}/n)R']^{-1}(R{\hat {\theta }}_{n}-r)/Q\quad \xrightarrow {\mathcal {D}} \quad F(Q,nP)

สมมติฐานที่ไม่เป็นเชิงเส้น

ในรูปแบบมาตรฐาน การทดสอบ Wald ใช้เพื่อทดสอบสมมติฐานเชิงเส้นที่สามารถแสดงได้ด้วยเมทริกซ์ R เพียงเมทริกซ์เดียว หากต้องการทดสอบสมมติฐานที่ไม่เป็นเชิงเส้นในรูปแบบ:

H_{0}:c(\theta )=0

H_{1}:c(\theta )\neq 0

ค่าสถิติการทดสอบจึงเป็นดังนี้:

c\left({\hat {\theta }}_{n}\right)'\left[c'\left({\hat {\theta }}_{n}\right)\left({\hat {V}}_{n}/n\right)c'\left({\hat {\theta }}_{n}\right)'\right]^{-1}c\left({\hat {\theta }}_{n}\right)\quad {\xrightarrow {\mathcal {D}}}\quad \chi _{Q}^{2}

โดยที่คืออนุพันธ์ของ c ที่ประเมินค่า ณ ตัวประมาณค่าตัวอย่าง ผลลัพธ์นี้ได้มาจากการใช้วิธีเดลต้าซึ่งใช้การประมาณค่าความแปรปรวนอันดับแรก $c'({\hat {\theta }}_{n})$

ความไม่คงที่ต่อการกำหนดพารามิเตอร์ใหม่

ข้อเท็จจริงที่ว่าการใช้ค่าประมาณของความแปรปรวนนั้นมีข้อเสียคือสถิติ Wald ไม่คงที่ต่อการแปลง/การกำหนดพารามิเตอร์ใหม่ของสมมติฐานแบบไม่เชิงเส้น: มันสามารถให้คำตอบที่แตกต่างกันสำหรับคำถามเดียวกัน ขึ้นอยู่กับวิธีการตั้งคำถาม^{[ 15 ]}^{[ 5 ]}ตัวอย่างเช่น การถามว่าR = 1 เหมือนกับการถามว่า log R = 0 หรือไม่ แต่สถิติ Wald สำหรับR = 1 ไม่เหมือนกับสถิติ Wald สำหรับ log R = 0 (เนื่องจากโดยทั่วไปแล้วไม่มีความสัมพันธ์ที่ชัดเจนระหว่างค่าความคลาดเคลื่อนมาตรฐานของRและ log Rดังนั้นจึงจำเป็นต้องมีการประมาณค่า) ^{[ 16 ]}

ทางเลือกอื่นนอกเหนือจากการทดสอบ Wald

มีทางเลือกอื่นอีกหลายอย่างนอกเหนือจากการทดสอบ Wald ได้แก่การทดสอบอัตราส่วนความน่าจะเป็นและการทดสอบตัวคูณลากรางจ์ (หรือที่รู้จักกันในชื่อการทดสอบคะแนน) Robert F. Engleแสดงให้เห็นว่าการทดสอบทั้งสามนี้ ได้แก่ การทดสอบ Wald การทดสอบอัตราส่วนความน่าจะเป็นและการทดสอบตัวคูณลากรางจ์ มีความสมมูลกันใน เชิงอะซิมโท ติก^{[ 17 ]}แม้ว่าจะมีความสมมูลกันในเชิงอะซิมโทติก แต่ในตัวอย่างที่มีขนาดจำกัด ผลลัพธ์อาจไม่ตรงกันมากพอที่จะนำไปสู่ข้อสรุปที่แตกต่างกัน

มีเหตุผลหลายประการที่ควรเลือกใช้การทดสอบอัตราส่วนความน่าจะเป็นหรือตัวคูณลากรางจ์แทนการทดสอบวอลด์: ^{[ 18 ]}^{[ 19 ]}^{[ 20 ]}

ความไม่คงที่: ดังที่ได้กล่าวไว้ข้างต้น การทดสอบ Wald ไม่คงที่ภายใต้การกำหนดพารามิเตอร์ใหม่ ในขณะที่การทดสอบอัตราส่วนความน่าจะเป็นจะให้คำตอบที่เหมือนกันทุกประการ ไม่ว่าเราจะทำงานกับR , log R หรือการแปลง แบบโมโนโทนิกอื่นใดของ Rก็ตาม^{[ 5 ]}
เหตุผลอีกประการหนึ่งคือ การทดสอบ Wald ใช้การประมาณค่าสองแบบ (ซึ่งเรารู้ค่าความคลาดเคลื่อนมาตรฐานหรือข้อมูล Fisherและการประมาณค่าความน่าจะเป็นสูงสุด) ในขณะที่การทดสอบอัตราส่วนความน่าจะเป็นขึ้นอยู่กับอัตราส่วนของฟังก์ชันความน่าจะเป็นภายใต้สมมติฐานว่างและสมมติฐานทางเลือกเท่านั้น
การทดสอบ Wald ต้องการการประมาณค่าโดยใช้อาร์กิวเมนต์ที่เพิ่มค่าสูงสุด ซึ่งสอดคล้องกับแบบจำลอง "เต็ม" ในบางกรณี แบบจำลองจะง่ายกว่าภายใต้สมมติฐานว่าง ดังนั้นอาจเลือกใช้การทดสอบคะแนน (เรียกอีกอย่างว่าการทดสอบตัวคูณลากรางจ์) ซึ่งมีข้อดีคือสามารถกำหนดสูตรได้ในสถานการณ์ที่ความแปรปรวนขององค์ประกอบที่เพิ่มค่าสูงสุดนั้นยากต่อการประมาณค่า หรือการคำนวณค่าประมาณตามตัวประมาณค่าความน่าจะเป็นสูงสุดนั้นยาก เช่นการทดสอบ Cochran–Mantel–Haenzelเป็นการทดสอบคะแนน^{[ 21 ]}

ดูเพิ่มเติม

อ่านเพิ่มเติม

กรีน, วิลเลียม เอช. (2012). การวิเคราะห์เชิงเศรษฐศาสตร์ (ฉบับนานาชาติครั้งที่ 7). บอสตัน: เพียร์สัน. หน้า 155–161 . ISBN 978-0-273-75356-8.
Kmenta, Jan (1986). องค์ประกอบของเศรษฐศาสตร์เชิงปริมาณ (ฉบับพิมพ์ครั้งที่สอง). นิวยอร์ก: Macmillan. หน้า 492–493 . ISBN 0-02-365070-2.
Thomas, RL (1993). เศรษฐศาสตร์เชิงปริมาณเบื้องต้น: ทฤษฎีและการประยุกต์ใช้ (ฉบับพิมพ์ครั้งที่สอง). ลอนดอน: Longman. หน้า 73–77 . ISBN 0-582-07378-2.

ลิงก์ภายนอก

การทดสอบของวอลด์เกี่ยวกับการใช้คำศัพท์ทางคณิตศาสตร์บางคำที่เก่าแก่ที่สุดเท่าที่ทราบ

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

7

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]