กลับไปหน้าบทความ

อ่าน 8 นาที

การทดสอบวอลด์

ใน ทางสถิติ การ ทดสอบ Wald (ตั้งชื่อตาม Abraham Wald ) ประเมิน ข้อจำกัด ของ พารามิเตอร์ทางสถิติ โดยพิจารณาจากระยะทางถ่วงน้ำหนักระหว่าง ค่าประมาณที่ไม่จำกัด...

การทดสอบวอลด์

ในทางสถิติการทดสอบ Wald (ตั้งชื่อตามAbraham Wald ) ประเมินข้อจำกัดของพารามิเตอร์ทางสถิติโดยพิจารณาจากระยะทางถ่วงน้ำหนักระหว่างค่าประมาณที่ไม่จำกัดและค่าที่สมมติขึ้นภายใต้สมมติฐานว่างโดยที่น้ำหนักคือความแม่นยำของค่าประมาณ[ 1 ] [ 2 ]ตามสัญชาตญาณ ยิ่งระยะทางถ่วงน้ำหนักนี้มากเท่าใด โอกาสที่ข้อจำกัดจะเป็นจริงก็จะยิ่งน้อยลงเท่านั้น แม้ว่าการแจกแจงตัวอย่างจำกัดของการทดสอบ Wald โดยทั่วไปจะไม่เป็นที่รู้จัก[ 3 ] : 138 แต่ก็มีการแจกแจง แบบ χ² เชิงอะซิม โท ติก ภายใต้สมมติฐานว่าง ซึ่งเป็นข้อเท็จจริงที่สามารถนำมาใช้ในการพิจารณาความสำคัญทางสถิติได้[ 4 ]

การทดสอบ Wald ร่วมกับการทดสอบตัวคูณลากรางจ์และการทดสอบอัตราส่วนความน่าจะ เป็น เป็นหนึ่งในสามแนวทางคลาสสิกใน การทดสอบสมมติฐานข้อดีของการทดสอบ Wald เหนืออีกสองวิธีคือ การทดสอบ Wald ต้องการเพียงการประมาณค่าแบบจำลองที่ไม่จำกัด ซึ่งช่วยลดภาระการคำนวณเมื่อเทียบกับการทดสอบอัตราส่วนความน่าจะเป็น อย่างไรก็ตาม ข้อเสียที่สำคัญคือ (ในตัวอย่างจำกัด) การทดสอบ Wald ไม่คงที่ต่อการเปลี่ยนแปลงในการแสดงสมมติฐานว่าง กล่าวคือนิพจน์ ที่เทียบเท่าทางพีชคณิต ของการจำกัดพารามิเตอร์ที่ไม่เป็นเชิงเส้นอาจนำไปสู่ค่าสถิติการทดสอบที่แตกต่างกัน[ 5 ] [ 6 ]นั่นเป็นเพราะสถิติ Wald ได้มาจากการขยายอนุกรมเทย์เลอร์ [ 7 ]และวิธีการเขียนนิพจน์ที่ไม่เป็นเชิงเส้นที่เทียบเท่ากันที่แตกต่างกันจะนำไปสู่ความแตกต่างที่ไม่สำคัญในสัมประสิทธิ์เทย์เลอร์ที่สอดคล้องกัน[ 8 ]ความผิดปกติอีกอย่างหนึ่งที่เรียกว่าปรากฏการณ์ Hauck–Donner [ 9 ]สามารถเกิดขึ้นได้ในแบบจำลองทวินามเมื่อพารามิเตอร์ที่ประมาณค่า (ไม่ถูกจำกัด) อยู่ใกล้กับขอบเขตของพื้นที่พารามิเตอร์ —ตัวอย่างเช่น ความน่าจะเป็นที่เหมาะสมใกล้เคียงกับศูนย์หรือหนึ่งมาก—ซึ่งส่งผลให้การทดสอบ Wald ไม่เพิ่มขึ้นอย่างต่อเนื่องตามระยะห่างระหว่างพารามิเตอร์ที่ไม่ถูกจำกัดและพารามิเตอร์ที่ถูกจำกัด[ 10 ] [ 11 ]

รายละเอียดทางคณิตศาสตร์

ภายใต้การทดสอบของ Wald ค่าประมาณที่พบว่าเป็นค่าสูงสุดของอาร์กิวเมนต์ของฟังก์ชันความน่าจะ เป็นแบบไม่มี ข้อจำกัด จะถูกนำมาเปรียบเทียบกับค่าที่สมมติขึ้นโดยเฉพาะอย่างยิ่ง ผลต่างกำลังสองจะถูกถ่วงน้ำหนักด้วยความโค้งของฟังก์ชันลอการิทึมความน่าจะเป็น

ทดสอบด้วยพารามิเตอร์เดียว

หากสมมติฐานเกี่ยวข้องกับการจำกัดพารามิเตอร์เพียงตัวเดียว สถิติ Wald จะมีรูปแบบดังต่อไปนี้:

ซึ่งภายใต้สมมติฐานว่างจะเป็นไปตามการแจกแจง χ² แบบไม่จำกัดที่มีองศาอิสระหนึ่งองศา รากที่สองของสถิติ Wald ข้อจำกัดเดียวสามารถเข้าใจได้ว่าเป็นอัตราส่วนt (เทียม) ซึ่งอย่างไรก็ตามไม่ได้มีการแจกแจงแบบ t จริงๆ ยกเว้นกรณีพิเศษของการถดถอยเชิงเส้นที่มีข้อผิดพลาดที่แจกแจงแบบปกติ[ 12 ]โดยทั่วไปแล้ว จะเป็นไปตามการแจกแจงz แบบไม่จำกัด [ 13 ]

โดยที่ค่าความคลาดเคลื่อนมาตรฐาน (SE) ของการประมาณค่าความน่าจะเป็นสูงสุด (MLE) คือรากที่สองของความแปรปรวน มีหลายวิธีในการประมาณเมทริกซ์ความแปรปรวนอย่างสม่ำเสมอซึ่งในตัวอย่างจำกัดจะนำไปสู่การประมาณค่าความคลาดเคลื่อนมาตรฐานทางเลือกและสถิติการทดสอบที่เกี่ยวข้องและค่าp [ 3 ] : 129 ความถูกต้องของการยังคงได้รับการกระจายแบบปกติเชิงอะซิมโทติกหลังจากเสียบ ค่าประมาณ MLEของลงในSEขึ้นอยู่กับทฤษฎีบทของ Slutsky

การทดสอบกับพารามิเตอร์หลายตัว

การทดสอบ Wald สามารถใช้ทดสอบสมมติฐานเดียวเกี่ยวกับพารามิเตอร์หลายตัว รวมถึงใช้ทดสอบสมมติฐานหลายข้อร่วมกันเกี่ยวกับพารามิเตอร์เดียว/หลายตัวได้ ให้เป็นตัวประมาณค่าตัวอย่างของ พารามิเตอร์ P ตัว (กล่าวคือเป็นเวกเตอร์) ซึ่งคาดว่าจะมีการแจกแจงแบบปกติในเชิงอะซิมโทติก โดยมีเมทริกซ์ความแปรปรวนร่วมVการทดสอบสมมติฐานQข้อเกี่ยวกับ พารามิเตอร์ Pตัว จะแสดงด้วยเมทริกซ์  Rดังนี้:  

การแจกแจงของค่าสถิติการทดสอบภายใต้สมมติฐานว่างคือ

ซึ่งในทางกลับกันก็หมายความว่า

โดยที่เป็นตัวประมาณค่าของเมทริกซ์ความแปรปรวนร่วม[ 14 ]

การพิสูจน์

สมมติว่า. จากนั้น โดยทฤษฎีบทของ Slutskyและคุณสมบัติของการแจกแจงปกติการคูณด้วย R จะมีการแจกแจงดังนี้:

เมื่อพิจารณาว่ารูปแบบกำลังสองของการแจกแจงปกติมีการแจกแจงแบบไคกำลังสอง :

เมื่อจัดเรียงnใหม่จะได้ผลลัพธ์ดังนี้:

ถ้าเมทริกซ์ความแปรปรวนร่วมไม่เป็นที่ทราบล่วงหน้าและจำเป็นต้องประมาณค่าจากข้อมูลล่ะ? ถ้าเรามี ตัวประมาณค่า ที่สอดคล้องกัน ซึ่งมีดีเทอร์มิแนนต์ที่มีการกระจายแบบแล้วโดยความเป็นอิสระของตัวประมาณค่าความแปรปรวนร่วมและสมการข้างต้น เราจะได้ว่า:

สมมติฐานที่ไม่เป็นเชิงเส้น

ในรูปแบบมาตรฐาน การทดสอบ Wald ใช้เพื่อทดสอบสมมติฐานเชิงเส้นที่สามารถแสดงได้ด้วยเมทริกซ์  R เพียงเมทริกซ์เดียว หากต้องการทดสอบสมมติฐานที่ไม่เป็นเชิงเส้นในรูปแบบ:

ค่าสถิติการทดสอบจึงเป็นดังนี้:

โดยที่คืออนุพันธ์ของ c ที่ประเมินค่า ณ ตัวประมาณค่าตัวอย่าง ผลลัพธ์นี้ได้มาจากการใช้วิธีเดลต้าซึ่งใช้การประมาณค่าความแปรปรวนอันดับแรก

ความไม่คงที่ต่อการกำหนดพารามิเตอร์ใหม่

ข้อเท็จจริงที่ว่าการใช้ค่าประมาณของความแปรปรวนนั้นมีข้อเสียคือสถิติ Wald ไม่คงที่ต่อการแปลง/การกำหนดพารามิเตอร์ใหม่ของสมมติฐานแบบไม่เชิงเส้น: มันสามารถให้คำตอบที่แตกต่างกันสำหรับคำถามเดียวกัน ขึ้นอยู่กับวิธีการตั้งคำถาม[ 15 ] [ 5 ]ตัวอย่างเช่น การถามว่าR  = 1 เหมือนกับการถามว่า log  R  = 0 หรือไม่ แต่สถิติ Wald สำหรับR  = 1 ไม่เหมือนกับสถิติ Wald สำหรับ log  R  = 0 (เนื่องจากโดยทั่วไปแล้วไม่มีความสัมพันธ์ที่ชัดเจนระหว่างค่าความคลาดเคลื่อนมาตรฐานของRและ log  Rดังนั้นจึงจำเป็นต้องมีการประมาณค่า) [ 16 ]

ทางเลือกอื่นนอกเหนือจากการทดสอบ Wald

มีทางเลือกอื่นอีกหลายอย่างนอกเหนือจากการทดสอบ Wald ได้แก่การทดสอบอัตราส่วนความน่าจะเป็นและการทดสอบตัวคูณลากรางจ์ (หรือที่รู้จักกันในชื่อการทดสอบคะแนน) Robert F. Engleแสดงให้เห็นว่าการทดสอบทั้งสามนี้ ได้แก่ การทดสอบ Wald การทดสอบอัตราส่วนความน่าจะเป็นและการทดสอบตัวคูณลากรางจ์ มีความสมมูลกันใน เชิงอะซิมโท ติก[ 17 ]แม้ว่าจะมีความสมมูลกันในเชิงอะซิมโทติก แต่ในตัวอย่างที่มีขนาดจำกัด ผลลัพธ์อาจไม่ตรงกันมากพอที่จะนำไปสู่ข้อสรุปที่แตกต่างกัน

มีเหตุผลหลายประการที่ควรเลือกใช้การทดสอบอัตราส่วนความน่าจะเป็นหรือตัวคูณลากรางจ์แทนการทดสอบวอลด์: [ 18 ] [ 19 ] [ 20 ]

  • ความไม่คงที่: ดังที่ได้กล่าวไว้ข้างต้น การทดสอบ Wald ไม่คงที่ภายใต้การกำหนดพารามิเตอร์ใหม่ ในขณะที่การทดสอบอัตราส่วนความน่าจะเป็นจะให้คำตอบที่เหมือนกันทุกประการ ไม่ว่าเราจะทำงานกับR , log  R หรือการแปลง แบบโมโนโทนิกอื่นใดของ  Rก็ตาม[ 5 ]
  • เหตุผลอีกประการหนึ่งคือ การทดสอบ Wald ใช้การประมาณค่าสองแบบ (ซึ่งเรารู้ค่าความคลาดเคลื่อนมาตรฐานหรือข้อมูล Fisherและการประมาณค่าความน่าจะเป็นสูงสุด) ในขณะที่การทดสอบอัตราส่วนความน่าจะเป็นขึ้นอยู่กับอัตราส่วนของฟังก์ชันความน่าจะเป็นภายใต้สมมติฐานว่างและสมมติฐานทางเลือกเท่านั้น
  • การทดสอบ Wald ต้องการการประมาณค่าโดยใช้อาร์กิวเมนต์ที่เพิ่มค่าสูงสุด ซึ่งสอดคล้องกับแบบจำลอง "เต็ม" ในบางกรณี แบบจำลองจะง่ายกว่าภายใต้สมมติฐานว่าง ดังนั้นอาจเลือกใช้การทดสอบคะแนน (เรียกอีกอย่างว่าการทดสอบตัวคูณลากรางจ์) ซึ่งมีข้อดีคือสามารถกำหนดสูตรได้ในสถานการณ์ที่ความแปรปรวนขององค์ประกอบที่เพิ่มค่าสูงสุดนั้นยากต่อการประมาณค่า หรือการคำนวณค่าประมาณตามตัวประมาณค่าความน่าจะเป็นสูงสุดนั้นยาก เช่นการทดสอบ Cochran–Mantel–Haenzelเป็นการทดสอบคะแนน[ 21 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • กรีน, วิลเลียม เอช. (2012). การวิเคราะห์เชิงเศรษฐศาสตร์ (ฉบับนานาชาติครั้งที่ 7). บอสตัน: เพียร์สัน. หน้า  155–161 . ISBN 978-0-273-75356-8.
  • Kmenta, Jan (1986). องค์ประกอบของเศรษฐศาสตร์เชิงปริมาณ (ฉบับพิมพ์ครั้งที่สอง). นิวยอร์ก: Macmillan. หน้า  492–493 . ISBN 0-02-365070-2.
  • Thomas, RL (1993). เศรษฐศาสตร์เชิงปริมาณเบื้องต้น: ทฤษฎีและการประยุกต์ใช้ (ฉบับพิมพ์ครั้งที่สอง). ลอนดอน: Longman. หน้า  73–77 . ISBN 0-582-07378-2.
  • การทดสอบของวอลด์เกี่ยวกับการใช้คำศัพท์ทางคณิตศาสตร์บางคำที่เก่าแก่ที่สุดเท่าที่ทราบ
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Wald_test&oldid=1349317839 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การทดสอบวอลด์

ใน ทางสถิติ การ ทดสอบ Wald (ตั้งชื่อตาม Abraham Wald ) ประเมิน ข้อจำกัด ของ พารามิเตอร์ทางสถิติ โดยพิจารณาจากระยะทางถ่วงน้ำหนักระหว่าง ค่าประมาณที่ไม่จำกัด...

รายละเอียดทางคณิตศาสตร์

ภายใต้การทดสอบของ Wald ค่าประมาณที่พบว่าเป็น ค่าสูงสุด ของ อาร์กิวเมนต์ของฟังก์ชันความน่าจะ เป็นแบบไม่มี ข้อจำกัด จะถูกนำมาเปรียบเทียบกับค่าที่สมมติขึ้นโดยเฉพาะอย่างยิ่ง ผลต่างกำลังสองจะถูกถ่วงน้ำหนักด้วยความโค้งของฟังก์ชันลอการิทึมความน่าจะเป็น θ ^...

ทดสอบด้วยพารามิเตอร์เดียว

หากสมมติฐานเกี่ยวข้องกับการจำกัดพารามิเตอร์เพียงตัวเดียว สถิติ Wald จะมีรูปแบบดังต่อไปนี้:

การทดสอบกับพารามิเตอร์หลายตัว

การทดสอบ Wald สามารถใช้ทดสอบสมมติฐานเดียวเกี่ยวกับพารามิเตอร์หลายตัว รวมถึงใช้ทดสอบสมมติฐานหลายข้อร่วมกันเกี่ยวกับพารามิเตอร์เดียว/หลายตัวได้ ให้เป็นตัวประมาณค่าตัวอย่างของ พารามิเตอร์ P ตัว (กล่าวคือเป็นเวกเตอร์) ซึ่งคาดว่าจะมีการแจกแจงแบบปกติใน...