กลับไปหน้าบทความ

อ่าน 6 นาที

การทดสอบ F

การ ทดสอบ F เป็นการ ทดสอบทางสถิติ ที่เปรียบเทียบความแปรปรวน ใช้เพื่อตรวจสอบว่าความแปรปรวนของสองตัวอย่าง หรืออัตราส่วนของความแปรปรวนระหว่างหลายตัวอย่าง...

การทดสอบF

กราฟ ความหนาแน่นความน่าจะเป็นของการทดสอบ Fโดยที่ d1 และ d2 = 10 ที่ระดับนัยสำคัญ 0.05 (บริเวณที่แรเงาสีแดงแสดงถึงบริเวณวิกฤต)

การทดสอบFเป็นการทดสอบทางสถิติที่เปรียบเทียบความแปรปรวน ใช้เพื่อตรวจสอบว่าความแปรปรวนของสองตัวอย่าง หรืออัตราส่วนของความแปรปรวนระหว่างหลายตัวอย่าง แตกต่างกันอย่างมีนัยสำคัญหรือไม่ การทดสอบจะคำนวณค่าสถิติซึ่งแทนด้วยตัวแปรสุ่ม F และตรวจสอบว่าเป็นไปตามการแจกแจงF หรือไม่ การตรวจสอบนี้ถือว่าถูกต้องหากสมมติฐานว่างเป็นจริงและข้อสมมติมาตรฐานเกี่ยวกับข้อผิดพลาด (ε) ในข้อมูลเป็นไปตามที่กำหนด[ 1 ]

การทดสอบ Fมักใช้เพื่อเปรียบเทียบแบบจำลองทางสถิติต่างๆ และหาแบบจำลองที่อธิบายประชากรที่ข้อมูลมาจากได้ดีที่สุด เมื่อสร้างแบบจำลองโดยใช้วิธีกำลังสองน้อยที่สุด การทดสอบ F ที่ได้ มักเรียกว่าการทดสอบF แบบ "แม่นยำ" สถิติ Fได้รับการพัฒนาโดยRonald Fisherในช่วงทศวรรษ 1920 ในชื่ออัตราส่วนความแปรปรวน และต่อมาได้รับการตั้งชื่อเพื่อเป็นเกียรติแก่เขาโดยGeorge W. Snedecor [ 2 ]

ตัวอย่างทั่วไป

ตัวอย่างทั่วไปของการใช้ การทดสอบ Fได้แก่ การศึกษาในกรณีต่อไปนี้

การทดสอบ Fเพื่อตรวจสอบความเท่าเทียมกันของความแปรปรวนสองค่า

การทดสอบF มี ความไวต่อภาวะที่ไม่เป็นไปตาม การแจกแจง ปกติ[ 3 ] [ 4 ]ในการวิเคราะห์ความแปรปรวน (ANOVA) การทดสอบทางเลือกอื่นๆ ได้แก่ การทดสอบ ของLevene การทดสอบของ Bartlettและการทดสอบ Brown–Forsytheอย่างไรก็ตาม เมื่อทำการทดสอบใดๆ เหล่านี้เพื่อทดสอบสมมติฐานพื้นฐานของhomoscedasticity ( เช่นความเป็นเอกรูปของความแปรปรวน) ซึ่งเป็นขั้นตอนเบื้องต้นในการทดสอบผลกระทบของค่าเฉลี่ย จะมีการเพิ่มขึ้นของอัตราความผิดพลาดประเภทที่ 1 ของการทดลองโดยรวม [ 5 ]

สูตรและการคำนวณ

การทดสอบ Fส่วนใหญ่เกิดขึ้นจากการพิจารณาการแยกส่วนความแปรปรวนในชุดข้อมูลในแง่ของผลรวมกำลังสองสถิติการทดสอบในการ ทดสอบ Fคืออัตราส่วนของผลรวมกำลังสองที่ปรับขนาดแล้วสองค่า ซึ่งสะท้อนถึงแหล่งที่มาของความแปรปรวนที่แตกต่างกัน ผลรวมกำลังสองเหล่านี้ถูกสร้างขึ้นเพื่อให้สถิติมีแนวโน้มที่จะมากขึ้นเมื่อสมมติฐานว่างไม่เป็นจริง เพื่อให้สถิติเป็นไปตามการแจกแจงFภายใต้สมมติฐานว่าง ผลรวมกำลังสองควรเป็นอิสระทางสถิติและแต่ละค่าควรเป็นไปตามการแจกแจง χ² ที่ปรับขนาดแล้ว เงื่อนไขหลังนี้รับประกันได้หากค่าข้อมูลเป็นอิสระและมีการแจกแจงแบบปกติโดย มีค่าความแปรปรวน ร่วมกัน

การวิเคราะห์ความแปรปรวนแบบทางเดียว

สูตรสำหรับค่าสถิติF ของ ANOVA แบบทางเดียว คือ

หรือ

"ความแปรปรวนที่อธิบายได้" หรือ "ความแปรปรวนระหว่างกลุ่ม" คือ

โดยที่แทนค่าเฉลี่ยของตัวอย่างใน กลุ่มที่ i , คือจำนวนข้อมูลใน กลุ่มที่ i , แทนค่าเฉลี่ยโดยรวมของข้อมูล และแทนจำนวนกลุ่ม

"ความแปรปรวนที่อธิบายไม่ได้" หรือ "ความแปรปรวนภายในกลุ่ม" คือ

โดยที่คือ การสังเกต ครั้งที่jในกลุ่มที่i และคือขนาดตัวอย่างโดยรวมสถิติF นี้เป็นไปตาม การแจกแจงFที่มีองศาอิสระและอยู่ภายใต้สมมติฐานว่าง สถิตินี้จะมีค่ามากหากความแปรปรวนระหว่างกลุ่มมีค่ามากเมื่อเทียบกับความแปรปรวนภายในกลุ่ม ซึ่งไม่น่าจะเกิดขึ้นหากค่าเฉลี่ยประชากรของทุกกลุ่มมีค่าเท่ากัน

ตาราง F : ค่าวิกฤตที่ระดับ 5% ซึ่งประกอบด้วยระดับความเป็นอิสระสำหรับทั้งตัวหารและตัวตั้ง โดยมีค่าตั้งแต่ 1-20

ผลลัพธ์ของ การทดสอบ Fสามารถกำหนดได้โดยการเปรียบเทียบค่าF ที่คำนวณได้กับค่า F วิกฤต ที่ระดับนัยสำคัญที่กำหนด (เช่น 5%) ตาราง Fทำหน้าที่เป็นคู่มืออ้างอิงที่มี ค่า F วิกฤต สำหรับการกระจายของ สถิติ Fภายใต้สมมติฐานของสมมติฐานว่างที่เป็นจริง ออกแบบมาเพื่อช่วยกำหนดเกณฑ์ที่ คาดว่าสถิติ Fจะเกินเปอร์เซ็นต์ที่ควบคุมได้ (เช่น 5%) เมื่อสมมติฐานว่างถูกต้อง ในการหา ค่า F วิกฤต ใน ตาราง Fจำเป็นต้องใช้ระดับความเป็นอิสระที่เกี่ยวข้อง ซึ่งเกี่ยวข้องกับการระบุแถวและคอลัมน์ที่เหมาะสมใน ตาราง Fที่สอดคล้องกับระดับนัยสำคัญที่กำลังทดสอบ (เช่น 5%) [ 6 ]

วิธีการใช้ค่า F วิกฤต:

ถ้า ค่าสถิติ F น้อยกว่า ค่า Fวิกฤต

  • ไม่สามารถปฏิเสธสมมติฐานว่างได้
  • ปฏิเสธสมมติฐานทางเลือก
  • ไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างค่าเฉลี่ยของกลุ่มตัวอย่าง
  • ความแตกต่างที่สังเกตได้ระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างนั้น อาจเกิดจากความบังเอิญได้
  • ผลลัพธ์ที่ได้ไม่มีนัยสำคัญทางสถิติ

ถ้า ค่าสถิติ F มากกว่า ค่า Fวิกฤต

  • ยอมรับสมมติฐานทางเลือก
  • ปฏิเสธสมมติฐานว่าง
  • มีความแตกต่างอย่างมีนัยสำคัญระหว่างค่าเฉลี่ยของกลุ่มตัวอย่าง
  • ความแตกต่างที่สังเกตได้ระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างนั้น ไม่น่าจะเกิดจากความบังเอิญโดยสมบูรณ์
  • ผลลัพธ์นี้มีความสำคัญทางสถิติ

โปรดทราบว่าเมื่อมีเพียงสองกลุ่มสำหรับการทดสอบF ของ ANOVA แบบทางเดียว โดยที่tคือค่าสถิติของ Student

ข้อดี

  • ประสิทธิภาพในการเปรียบเทียบหลายกลุ่ม: ช่วยให้สามารถเปรียบเทียบหลายกลุ่มพร้อมกันได้ ซึ่งจะช่วยเพิ่มประสิทธิภาพโดยเฉพาะในสถานการณ์ที่มีกลุ่มมากกว่าสองกลุ่ม
  • ความชัดเจนในการเปรียบเทียบความแปรปรวน: นำเสนอการตีความความแตกต่างของความแปรปรวนระหว่างกลุ่มได้อย่างตรงไปตรงมา ช่วยให้เข้าใจรูปแบบข้อมูลที่สังเกตได้ชัดเจนยิ่งขึ้น
  • ความสามารถรอบด้านข้ามสาขาวิชา: แสดงให้เห็นถึงการประยุกต์ใช้ในวงกว้างในหลากหลายสาขา รวมถึงสังคมศาสตร์ วิทยาศาสตร์ธรรมชาติ และวิศวกรรมศาสตร์

ข้อเสีย

  • ความไวต่อข้อสมมติ: การทดสอบ Fมีความไวสูงต่อข้อสมมติบางประการ เช่น ความเป็นเอกรูปของความแปรปรวนและความเป็นปกติ ซึ่งอาจส่งผลต่อความแม่นยำของผลการทดสอบ
  • ข้อจำกัดด้านขอบเขตในการเปรียบเทียบกลุ่ม: การทดสอบ Fถูกออกแบบมาเพื่อเปรียบเทียบความแปรปรวนระหว่างกลุ่ม ทำให้ไม่เหมาะสมสำหรับการวิเคราะห์ที่อยู่นอกเหนือขอบเขตเฉพาะนี้
  • ความท้าทายในการตีความ: การทดสอบ Fไม่ได้ระบุกลุ่มคู่ที่เฉพาะเจาะจงซึ่งมีความแปรปรวนที่แตกต่างกัน การตีความอย่างระมัดระวังจึงเป็นสิ่งจำเป็น และการทดสอบเพิ่มเติมแบบ post hoc มักมีความสำคัญต่อการทำความเข้าใจความแตกต่างระหว่างกลุ่มอย่างละเอียดมากขึ้น

ปัญหาเกี่ยวกับการวิเคราะห์ความแปรปรวนแบบเปรียบเทียบหลายกลุ่ม

การ ทดสอบ Fในการวิเคราะห์ความแปรปรวนแบบทางเดียว ( ANOVA ) ใช้เพื่อประเมินว่าค่าที่คาดหวังของตัวแปรเชิงปริมาณภายในกลุ่มที่กำหนดไว้ล่วงหน้าหลายกลุ่มนั้นแตกต่างกันหรือไม่ ตัวอย่างเช่น สมมติว่าการทดลองทางการแพทย์เปรียบเทียบการรักษา 4 วิธี การทดสอบ F ของ ANOVA สามารถใช้เพื่อประเมินว่าการรักษาใดโดยเฉลี่ยแล้วดีกว่าหรือแย่กว่าการรักษาอื่น ๆ เมื่อเทียบกับสมมติฐานว่างที่ว่าการรักษาทั้ง 4 วิธีให้ผลลัพธ์เฉลี่ยเท่ากัน นี่เป็นตัวอย่างของการทดสอบแบบ "omnibus" ซึ่งหมายความว่าการทดสอบเพียงครั้งเดียวจะดำเนินการเพื่อตรวจหาความแตกต่างที่เป็นไปได้หลายอย่าง หรืออีกทางหนึ่ง เราสามารถทำการทดสอบแบบจับคู่ระหว่างการรักษาได้ (ตัวอย่างเช่น ในตัวอย่างการทดลองทางการแพทย์ที่มีการรักษา 4 วิธี เราสามารถทำการทดสอบ 6 ครั้งระหว่างการรักษาแต่ละคู่) ข้อดีของ การทดสอบ F ของ ANOVA คือเราไม่จำเป็นต้องระบุล่วงหน้าว่าการรักษาใดที่จะนำมาเปรียบเทียบ และเราไม่จำเป็นต้องปรับค่าสำหรับการเปรียบเทียบหลายครั้ง ข้อเสียของ การทดสอบ F ใน ANOVA คือ หากเราปฏิเสธสมมติฐานว่างเราจะไม่ทราบว่าการรักษาใดบ้างที่แตกต่างจากการรักษาอื่นอย่างมีนัยสำคัญ และหาก ทำการทดสอบ Fที่ระดับ α เราจะไม่สามารถระบุได้ว่าคู่การรักษาที่มีความแตกต่างของค่าเฉลี่ยมากที่สุดนั้นแตกต่างกันอย่างมีนัยสำคัญที่ระดับ α

ปัญหาการถดถอย

พิจารณาสองแบบจำลอง คือแบบจำลองที่ 1 และแบบจำลองที่ 2 โดยที่แบบจำลองที่ 1 เป็นแบบจำลองที่ 'ซ้อน' อยู่ภายในแบบจำลองที่ 2 แบบจำลองที่ 1 เป็นแบบจำลองที่มีข้อจำกัด และแบบจำลองที่ 2 เป็นแบบจำลองที่ไม่มีข้อจำกัด กล่าวคือ แบบจำลองที่ 1 มีพารามิเตอร์ p₁ และแบบจำลองที่ 2 มีพารามิเตอร์ p₂ โดยที่ p₁ < p₂และสำหรับ  การ  เลือก พารามิเตอร์ใดๆ ในแบบจำลอง ที่ 1 เส้นโค้งการถดถอยเดียวกันสามารถได้มาจากการเลือกพารามิเตอร์บางอย่างในแบบจำลองที่ 2

บริบททั่วไปอย่างหนึ่งในเรื่องนี้คือ การตัดสินใจว่าแบบจำลองหนึ่งเหมาะสมกับข้อมูลได้ดีกว่าแบบจำลองพื้นฐานหรือไม่ ซึ่งในแบบจำลองพื้นฐานนั้น ตัวแปรอธิบายเพียงอย่างเดียวคือค่าคงที่ ทำให้ค่าที่ทำนายได้ทั้งหมดของตัวแปรตามเท่ากับค่าเฉลี่ยของตัวแปรนั้นในตัวอย่าง แบบจำลองพื้นฐานเป็นแบบจำลองที่ถูกจำกัด เนื่องจากสัมประสิทธิ์ของตัวแปรอธิบายที่เป็นไปได้ทั้งหมดถูกจำกัดให้เท่ากับศูนย์

อีกบริบทหนึ่งที่พบได้บ่อยคือการตัดสินใจว่ามีจุดเปลี่ยนโครงสร้างในข้อมูลหรือไม่ ในกรณีนี้แบบจำลองแบบจำกัดจะใช้ข้อมูลทั้งหมดในการวิเคราะห์การถดถอยครั้งเดียว ในขณะที่แบบจำลองแบบไม่จำกัดจะใช้การวิเคราะห์การถดถอยแยกกันสำหรับชุดข้อมูลย่อยสองชุดที่แตกต่างกัน การใช้ การทดสอบ F ในลักษณะนี้ เรียกว่า การ ทดสอบ Chow

แบบจำลองที่มีพารามิเตอร์มากกว่าจะสามารถปรับให้เข้ากับข้อมูลได้ดีอย่างน้อยก็เท่ากับแบบจำลองที่มีพารามิเตอร์น้อยกว่า ดังนั้นโดยทั่วไปแล้วแบบจำลองที่ 2 จะให้ผลลัพธ์ที่เหมาะสมกับข้อมูลได้ดีกว่า (เช่น ข้อผิดพลาดต่ำกว่า) แบบจำลองที่ 1 แต่บ่อยครั้งที่เราต้องการตรวจสอบว่าแบบจำลองที่ 2 ให้ผลลัพธ์ที่ เหมาะสมกับข้อมูลได้ดีกว่า อย่างมีนัยสำคัญหรือไม่ วิธีหนึ่งในการแก้ปัญหานี้คือการใช้การทดสอบ F

หากมี จุดข้อมูล nจุดสำหรับประมาณค่าพารามิเตอร์ของทั้งสองแบบจำลอง ก็สามารถคำนวณค่า สถิติ Fได้ดังนี้

โดยที่ RSS iคือผลรวมกำลังสองของค่าคลาดเคลื่อนของแบบจำลองiหากแบบจำลองการถดถอยคำนวณโดยใช้ค่าน้ำหนัก ให้แทนที่ RSS iด้วย χ² ซึ่งเป็นผลรวมกำลังสองของค่าคลาดเคลื่อนแบบถ่วงน้ำหนัก ภายใต้สมมติฐานว่างที่ว่าแบบจำลอง 2 ไม่ได้ให้ความเหมาะสมที่ดีกว่าแบบจำลอง 1 อย่างมีนัยสำคัญค่าFจะมี การแจกแจง แบบ F โดยมี องศาอิสระ ( p₁np₂ )สมมติฐานว่างจะถูกปฏิเสธหากค่าFที่คำนวณจากข้อมูลมากกว่าค่าวิกฤตของการแจกแจงแบบF สำหรับความน่าจะเป็นของการปฏิเสธเท็จที่ต้องการ (เช่น 0.05) เนื่องจากFเป็นฟังก์ชันเอกภาคของสถิติอัตราส่วนความน่าจะเป็น การทดสอบF จึง เป็นการ ทดสอบอัตราส่วนความน่าจะเป็น

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • ฟ็อกซ์, คาร์ล เอ. (1980). สถิติเศรษฐศาสตร์ระดับกลาง (ฉบับพิมพ์ครั้งที่สอง). นิวยอร์ก: จอห์น ไวลีย์ แอนด์ ซันส์. หน้า  290–310 . ISBN 0-88275-521-8.
  • จอห์นสตัน, จอห์น (1972). วิธีการทางเศรษฐมิติ (ฉบับพิมพ์ครั้งที่สอง). นิวยอร์ก: แมคกรอว์-ฮิลล์. หน้า  35–38 .
  • Kmenta, Jan (1986). องค์ประกอบของเศรษฐศาสตร์เชิงปริมาณ (ฉบับพิมพ์ครั้งที่สอง). นิวยอร์ก: Macmillan. หน้า  147–148 . ISBN 0-02-365070-2.
  • มัดดาลา, GS ; ลาฮิรี, คาจัล (2009) เศรษฐมิติเบื้องต้น (ฉบับที่สี่) ชิเชสเตอร์: ไวลีย์ หน้า  155– 160. ไอเอสบีเอ็น 978-0-470-01512-4.
  • ตารางค่าวิกฤตของการทดสอบF
  • เครื่องคำนวณฟรีสำหรับการทดสอบF
  • การ ทดสอบ Fสำหรับการถดถอยเชิงเส้น
  • วิดีโอการบรรยายวิชาเศรษฐศาสตร์เชิงปริมาณ (หัวข้อ: การทดสอบสมมติฐาน)บน YouTubeโดย Mark Thoma
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=F-test&oldid=1360657314 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การทดสอบ F

การ ทดสอบ F เป็นการ ทดสอบทางสถิติ ที่เปรียบเทียบความแปรปรวน ใช้เพื่อตรวจสอบว่าความแปรปรวนของสองตัวอย่าง หรืออัตราส่วนของความแปรปรวนระหว่างหลายตัวอย่าง...

ตัวอย่างทั่วไป

ตัวอย่างทั่วไปของการใช้ การทดสอบ F ได้แก่ การศึกษาในกรณีต่อไปนี้

การทดสอบ F เพื่อตรวจสอบความเท่าเทียมกันของความแปรปรวนสองค่า

การทดสอบ F มี ความไวต่อ ภาวะที่ไม่เป็นไป ตาม การแจกแจง ปกติ [ 3 ] [ 4 ] ใน การวิเคราะห์ความแปรปรวน (ANOVA) การทดสอบทางเลือกอื่นๆ ได้แก่ การทดสอบ ของ Levene การทดสอบของ Bartlett และ การทดสอบ Brown–Forsythe อย่างไรก็ตาม เมื่อทำการทดสอบใดๆ...

สูตรและการคำนวณ

การทดสอบ F ส่วนใหญ่เกิดขึ้นจากการพิจารณาการแยกส่วน ความแปรปรวน ในชุดข้อมูลในแง่ของ ผลรวมกำลังสอง สถิติการทดสอบ ในการ ทดสอบ F คืออัตราส่วนของผลรวมกำลังสองที่ปรับขนาดแล้วสองค่า ซึ่งสะท้อนถึงแหล่งที่มาของความแปรปรวนที่แตกต่างกัน...