กลับไปหน้าบทความ

อ่าน 4 นาที

การทดสอบความปกติ

ใน ทางสถิติ การ ทดสอบภาวะปกติ ใช้เพื่อตรวจสอบว่า ชุดข้อมูล นั้น เหมาะสมกับแบบจำลอง การแจกแจงแบบปกติ หรือไม่ และเพื่อคำนวณว่า ตัวแปรสุ่ม...

การทดสอบความปกติ

ในทางสถิติการทดสอบภาวะปกติใช้เพื่อตรวจสอบว่าชุดข้อมูล นั้น เหมาะสมกับแบบจำลองการแจกแจงแบบปกติหรือไม่ และเพื่อคำนวณว่าตัวแปรสุ่มที่อยู่เบื้องหลังชุดข้อมูลนั้นมีแนวโน้มที่จะแจกแจงแบบปกติ มากน้อยเพียงใด

กล่าวโดยละเอียด การทดสอบเหล่านี้เป็นรูปแบบหนึ่งของการเลือกแบบจำลองและสามารถตีความได้หลายวิธี ขึ้นอยู่กับการตีความความน่าจะเป็น ของแต่ละบุคคล :

  • ใน แง่ของ สถิติเชิงพรรณนาเราจะวัดความเหมาะสมของแบบจำลองการแจกแจงปกติกับข้อมูล – หากแบบจำลองไม่เหมาะสม แสดงว่าข้อมูลนั้นไม่สามารถจำลองได้ดีด้วยการแจกแจงปกติ โดยไม่ตัดสินว่าตัวแปรพื้นฐานใดเป็นสาเหตุ
  • ในสถิติเชิงความถี่การทดสอบสมมติฐานทางสถิติข้อมูลจะถูกทดสอบกับสมมติฐานว่างที่ว่าข้อมูลนั้นมีการกระจายแบบปกติ
  • ในสถิติแบบเบย์เซียนเราไม่ได้ "ทดสอบความเป็นปกติ" โดยตรง แต่เราคำนวณความน่าจะเป็นที่ข้อมูลมาจากการแจกแจงแบบปกติที่มีพารามิเตอร์μและσ ที่กำหนด (สำหรับทุกμและσ ) แล้วเปรียบเทียบกับความน่าจะเป็นที่ข้อมูลมาจากการแจกแจงอื่นๆ ที่กำลังพิจารณา โดยวิธีที่ง่ายที่สุดคือการใช้Bayes factor (ซึ่งให้ความน่าจะเป็นสัมพัทธ์ของการเห็นข้อมูลภายใต้แบบจำลองต่างๆ) หรือวิธีที่ละเอียดกว่านั้นคือการใช้การแจกแจงแบบก่อนหน้า (prior distribution) สำหรับแบบจำลองและพารามิเตอร์ที่เป็นไปได้ แล้วคำนวณการแจกแจงแบบภายหลัง (posterior distribution) โดยพิจารณา จากความน่าจะเป็นที่คำนวณได้

การทดสอบความปกติใช้เพื่อตรวจสอบว่าข้อมูลตัวอย่างได้มาจากประชากรที่มีการกระจายแบบปกติหรือไม่ (ภายในค่าความคลาดเคลื่อนที่ยอมรับได้) การทดสอบทางสถิติหลายอย่าง เช่นการทดสอบtของนักเรียนและ การวิเคราะห์ความแปรปรวน แบบทางเดียวและสองทาง (ANOVA) จำเป็นต้องใช้ประชากรตัวอย่างที่มีการกระจายแบบปกติ

วิธีการทางกราฟิก

วิธีการทดสอบภาวะปกติอย่างไม่เป็นทางการคือการเปรียบเทียบฮิสโตแกรมของข้อมูลตัวอย่างกับเส้นโค้งความน่าจะเป็นแบบปกติ การกระจายตัวเชิงประจักษ์ของข้อมูล (ฮิสโตแกรม) ควรมีรูปร่างคล้ายระฆังคว่ำและคล้ายกับการกระจายตัวแบบปกติ ซึ่งอาจทำได้ยากหากตัวอย่างมีขนาดเล็ก ในกรณีนี้ อาจดำเนินการโดยการวิเคราะห์การถดถอยของข้อมูลกับควอนไทล์ของการกระจายตัวแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนเท่ากับตัวอย่าง การที่ข้อมูลไม่ตรงกับเส้นถดถอยแสดงว่ามีการเบี่ยงเบนจากภาวะปกติ (ดูสัมประสิทธิ์ Anderson Darling และโปรแกรม minitab)

เครื่องมือเชิงกราฟิกสำหรับการประเมินภาวะปกติคือแผนภาพความน่าจะเป็นปกติหรือแผนภาพควอนไทล์-ควอนไทล์ (แผนภาพ QQ) ของข้อมูลที่ได้มาตรฐานเทียบกับการแจกแจงปกติมาตรฐานในที่นี้ความสัมพันธ์ระหว่างข้อมูลตัวอย่างและควอนไทล์ปกติ (ซึ่งเป็นตัววัดความเหมาะสมของแบบจำลอง) จะวัดว่าข้อมูลนั้นถูกจำลองโดยการแจกแจงปกติได้ดีเพียงใด สำหรับข้อมูลปกติ จุดที่พล็อตในแผนภาพ QQ ควรอยู่บนเส้นตรงโดยประมาณ ซึ่งบ่งชี้ถึงความสัมพันธ์เชิงบวกสูง แผนภาพเหล่านี้ตีความได้ง่าย และยังมีข้อดีคือสามารถระบุค่าผิดปกติได้ง่ายอีกด้วย

การทดสอบแบบคร่าวๆ

การทดสอบ อย่างง่ายโดยใช้หลักการ คร่าวๆ คือ นำค่าสูงสุดและต่ำสุดของตัวอย่าง มา คำนวณหาค่า z-scoreหรือที่ถูกต้องกว่าคือค่า t-statistic (จำนวนค่าเบี่ยงเบนมาตรฐานของตัวอย่างที่ค่าตัวอย่างอยู่เหนือหรือต่ำกว่าค่าเฉลี่ยของตัวอย่าง) แล้วนำไปเปรียบเทียบกับกฎ 68–95–99.7 : หากมีเหตุการณ์ 3 σ (หรือที่ถูกต้องกว่าคือเหตุการณ์ 3 s ) และมีจำนวนตัวอย่างน้อยกว่า 300 ตัวอย่าง หรือเหตุการณ์ 4 sและมีจำนวนตัวอย่างน้อยกว่า 15,000 ตัวอย่าง การแจกแจงแบบปกติจะประเมินค่าความเบี่ยงเบนสูงสุดในข้อมูลตัวอย่างต่ำกว่าความเป็นจริง

การทดสอบนี้มีประโยชน์ในกรณีที่เผชิญกับความเสี่ยงจากค่าความโค้ง (kurtosis)ซึ่งค่าเบี่ยงเบนขนาดใหญ่มีความสำคัญ และมีข้อดีคือคำนวณและสื่อสารได้ง่ายมาก ผู้ที่ไม่ใช่ผู้เชี่ยวชาญด้านสถิติสามารถเข้าใจได้ง่ายว่าเหตุการณ์ 6 σ นั้น หายากมากใน1การแจกแจงแบบปกติ

การทดสอบความถี่

การทดสอบความปกติของตัวแปรเดี่ยวประกอบด้วยสิ่งต่อไปนี้:

การศึกษาในปี 2011 สรุปว่า Shapiro–Wilk มีกำลัง ที่ดีที่สุด สำหรับระดับนัยสำคัญที่กำหนด ตามมาด้วย Anderson–Darling อย่างใกล้ชิดเมื่อเปรียบเทียบการทดสอบ Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors และ Anderson–Darling [ 1 ]

งานวิจัยที่ตีพิมพ์บางฉบับแนะนำการทดสอบ Jarque–Bera [ 2 ] [ 3 ]แต่การทดสอบนี้มีจุดอ่อน โดยเฉพาะอย่างยิ่ง การทดสอบนี้มีกำลังต่ำสำหรับการกระจายที่มีหางสั้น โดยเฉพาะอย่างยิ่งสำหรับการกระจายแบบสองยอด[ 4 ]ผู้เขียนบางคนปฏิเสธที่จะรวมผลลัพธ์ไว้ในการศึกษาของพวกเขาเนื่องจากประสิทธิภาพโดยรวมที่ไม่ดี[ 5 ]

ในอดีต โมเมนต์มาตรฐานลำดับที่สามและสี่( ความเบี่ยงเบนและความโค้ง ) เป็นหนึ่งในการทดสอบความปกติในยุคแรกๆการทดสอบ Lin–Mudholkarมุ่งเป้าไปที่ทางเลือกที่ไม่สมมาตรโดยเฉพาะ[ 6 ]การทดสอบ Jarque–Beraนั้นได้มาจาก ค่าประมาณ ความเบี่ยงเบนและความโค้งการทดสอบความเบี่ยงเบนและความโค้งแบบหลายตัวแปรของ Mardia ได้ขยายการทดสอบโมเมนต์ไปสู่กรณีหลายตัวแปร[ 7 ]สถิติการทดสอบในยุคแรกอื่นๆได้แก่ อัตราส่วนของค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยต่อค่าเบี่ยงเบนมาตรฐาน และอัตราส่วนของช่วงต่อค่าเบี่ยงเบนมาตรฐาน[ 8 ]

การทดสอบความปกติที่ทันสมัยกว่า ได้แก่ การทดสอบพลังงาน[ 9 ] (Székely และ Rizzo) และการทดสอบตามฟังก์ชันลักษณะเชิงประจักษ์ (ECF) (เช่น Epps และ Pulley, [ 10 ] Henze–Zirkler, [ 11 ]การทดสอบ BHEP [ 12 ] ) การทดสอบพลังงานและ ECF เป็นการทดสอบที่มีประสิทธิภาพซึ่งใช้สำหรับการทดสอบความปกติแบบตัวแปรเดียวหรือหลายตัวแปรและมีความสอดคล้องทางสถิติกับทางเลือกทั่วไป

การแจกแจงปกติมีเอนโทรปีสูงสุดเมื่อเทียบกับการแจกแจงอื่นๆ สำหรับค่าเบี่ยงเบนมาตรฐานที่กำหนด มีการทดสอบความปกติหลายอย่างโดยอาศัยคุณสมบัตินี้ โดยการทดสอบครั้งแรกเป็นผลงานของ Vasicek [ 13 ]

การทดสอบแบบเบย์เซียน

ความแตกต่างของ Kullback–Leiblerระหว่างการแจกแจงความน่าจะเป็นภายหลังทั้งหมดของความชันและความแปรปรวนไม่ได้บ่งชี้ถึงความไม่ปกติ อย่างไรก็ตาม อัตราส่วนของความคาดหวังของความน่าจะเป็นภายหลังเหล่านี้และความคาดหวังของอัตราส่วนให้ผลลัพธ์ที่คล้ายคลึงกันกับสถิติ Shapiro–Wilk ยกเว้นตัวอย่างขนาดเล็กมาก เมื่อใช้ไพรเออร์ที่ไม่ให้ข้อมูล[ 14 ]

Spiegelhalter แนะนำให้ใช้Bayes factorเพื่อเปรียบเทียบความปกติกับทางเลือกการกระจายตัวประเภทอื่น[ 15 ] แนวทางนี้ได้รับการขยายโดย Farrell และ Rogers-Stewart [ 16 ]

แอปพลิเคชัน

การประยุกต์ใช้การทดสอบความปกติอย่างหนึ่งคือการทดสอบค่าตกค้างจากแบบจำลองการถดถอยเชิงเส้น[ 17 ]หากค่าตกค้างไม่ได้มีการกระจายแบบปกติ ก็ไม่ควรใช้ค่าตกค้างในการทดสอบ Z หรือการทดสอบอื่นๆ ที่ได้มาจากการกระจายแบบปกติ เช่นการทดสอบ t การทดสอบ Fและการทดสอบไคกำลังสองหากค่าตกค้างไม่ได้มีการกระจายแบบปกติ แสดงว่าตัวแปรตามหรือตัวแปรอธิบาย อย่างน้อยหนึ่งตัว อาจมีรูปแบบฟังก์ชันที่ไม่ถูกต้อง หรือตัวแปรสำคัญอาจหายไป เป็นต้น การแก้ไขข้อผิดพลาดที่เป็นระบบ อย่างน้อยหนึ่งข้อ อาจทำให้ค่าตกค้างมีการกระจายแบบปกติ กล่าวอีกนัยหนึ่ง การที่ค่าตกค้างไม่มีการกระจายแบบปกติมักเป็นข้อบกพร่องของแบบจำลองมากกว่าปัญหาของข้อมูล[ 18 ]

ดูเพิ่มเติม

หมายเหตุ

  1. ^ Razali, Nornadiah; Wah, Yap Bee (2011). "การเปรียบเทียบกำลังของการทดสอบ Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors และ Anderson–Darling" (PDF)วารสารการสร้างแบบจำลองทางสถิติและการวิเคราะห์ 2 ( 1): 21– 33. เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 30 มิถุนายน 2015
  2. ^ Judge, George G.; Griffiths, WE; Hill, R. Carter; Lütkepohl, Helmut ; Lee, T. (1988). Introduction to the Theory and Practice of Econometrics (Second ed.). Wiley. pp.  890–892 . ISBN 978-0-471-08277-4.
  3. ^ Gujarati, Damodar N. (2002). เศรษฐศาสตร์เชิงปริมาณขั้นพื้นฐาน (ฉบับที่สี่). McGraw Hill. หน้า  147–148 . ISBN 978-0-07-123017-9.
  4. ^ Thadewald, Thorsten; Büning, Herbert (1 มกราคม 2550). "การทดสอบ Jarque–Bera และคู่แข่งสำหรับการทดสอบภาวะปกติ – การเปรียบเทียบกำลังการทดสอบ" วารสารสถิติประยุกต์34 (1): 87– 105. CiteSeerX 10.1.1.507.1186 . doi : 10.1080/02664760600994539 . S2CID 13866566 .  
  5. ^ Sürücü, Barış (1 กันยายน 2551). "การเปรียบเทียบกำลังและการศึกษาจำลองของการทดสอบความเหมาะสม"คอมพิวเตอร์และคณิตศาสตร์ประยุกต์ 56 ( 6): 1617– 1625. doi : 10.1016/j.camwa.2008.03.010 . hdl : 11511/46797 .
  6. ^ Lin, CC; Mudholkar, GS (1980). "การทดสอบความปกติอย่างง่ายเทียบกับทางเลือกที่ไม่สมมาตร" Biometrika . 67 ( 2): 455– 461. doi : 10.1093/biomet/67.2.455 .
  7. ^ Mardia, KV (ธันวาคม 1970). "การวัดค่าความเบี่ยงเบนและความโค้งของข้อมูลหลายตัวแปรพร้อมการประยุกต์ใช้" Biometrika . 57 ( 3): 519– 530. doi : 10.2307/2334770 .
  8. ^ Filliben, JJ (กุมภาพันธ์ 1975). "การทดสอบสัมประสิทธิ์สหสัมพันธ์พล็อตความน่าจะเป็นสำหรับภาวะปกติ" Technometrics . 17 (1): 111– 117. doi : 10.2307/1268008 . JSTOR 1268008 . 
  9. ^ Székely, GJ และ Rizzo, ML (2005) การทดสอบใหม่สำหรับความปกติของตัวแปรหลายตัว วารสารการวิเคราะห์ตัวแปรหลายตัว 93, 58–80
  10. ^ Epps, TW และ Pulley, LB (1983). การทดสอบความปกติโดยอาศัยฟังก์ชันลักษณะเชิงประจักษ์ Biometrika 70, 723–726.
  11. ^ Henze, N. และ Zirkler, B. (1990). กลุ่มของการทดสอบความปกติแบบคงที่และสอดคล้องกันสำหรับตัวแปรหลายตัว Communications in Statistics – Theory and Methods 19, 3595–3617.
  12. ^ Henze, N. และ Wagner, T. (1997). แนวทางใหม่สำหรับการทดสอบ BHEP สำหรับความปกติของตัวแปรหลายตัววารสารการวิเคราะห์ตัวแปรหลายตัว 62, 1–23.
  13. ^ Vasicek, Oldrich (1976). "การทดสอบความ ปกติโดยอาศัยเอนโทรปีของตัวอย่าง" วารสารของราชสมาคมสถิติซีรีส์ B (ระเบียบวิธี) 38 (1): 54– 59. JSTOR 2984828 
  14. ^ Young KDS (1993), "การวินิจฉัยแบบเบย์เซียนสำหรับการตรวจสอบสมมติฐานของความปกติ"วารสารการคำนวณทางสถิติและการจำลอง 47 (3–4), 167–180
  15. ^ Spiegelhalter, DJ (1980). การทดสอบแบบรวมสำหรับความปกติของตัวอย่างขนาดเล็ก Biometrika, 67, 493–496. doi : 10.1093/biomet/67.2.493
  16. ^ Farrell, PJ, Rogers-Stewart, K. (2006) "การศึกษาอย่างครอบคลุมเกี่ยวกับการทดสอบความปกติและความสมมาตร: การขยายการทดสอบ Spiegelhalter"วารสารการคำนวณทางสถิติและการจำลอง 76(9), 803 – 816. doi : 10.1080/10629360500109023
  17. ^ Portney, Leslie Gross; Watkins, Mary P. (2000). พื้นฐานของการวิจัยทางคลินิก: การประยุกต์ใช้ในทางปฏิบัติ (ฉบับที่ 2). นิวเจอร์ซีย์: Prentice Hall . หน้า  516–517 . ISBN 0-8385-2695-0.
  18. ^ Pek, Jolynn; Wong, Octavia; Wong, Augustine CM (2018-11-06). "วิธีการจัดการกับภาวะที่ไม่ปกติ: การจำแนกประเภทของแนวทางต่างๆ ที่ได้รับการทบทวนและแสดงตัวอย่าง" . Frontiers in Psychology . 9 : 2104. doi : 10.3389/fpsyg.2018.02104 . ISSN 1664-1078 . PMC 6232275 . PMID 30459683 .   

อ่านเพิ่มเติม

  • Ralph B. D'Agostino (1986). "การทดสอบการแจกแจงแบบปกติ". ใน D'Agostino, RB; Stephens, MA (บรรณาธิการ). เทคนิคการทดสอบความเหมาะสมของแบบจำลอง . นิวยอร์ก: Marcel Dekker. ISBN 978-0-8247-7487-5.
  • Henry C. Thode , Jr. (2002). การทดสอบความปกติ . นิวยอร์ก: Marcel Dekker, Inc. หน้า  479. ISBN 978-0-8247-9613-6.

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Normality_test&oldid=1326848330 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การทดสอบความปกติ

ใน ทางสถิติ การ ทดสอบภาวะปกติ ใช้เพื่อตรวจสอบว่า ชุดข้อมูล นั้น เหมาะสมกับแบบจำลอง การแจกแจงแบบปกติ หรือไม่ และเพื่อคำนวณว่า ตัวแปรสุ่ม...

วิธีการทางกราฟิก

วิธีการทดสอบภาวะปกติอย่างไม่เป็นทางการคือการเปรียบเทียบ ฮิสโตแกรม ของข้อมูลตัวอย่างกับเส้นโค้งความน่าจะเป็นแบบปกติ การกระจายตัวเชิงประจักษ์ของข้อมูล (ฮิสโตแกรม) ควรมีรูปร่างคล้ายระฆังคว่ำและคล้ายกับการกระจายตัวแบบปกติ ซึ่งอาจทำได้ยากหากตัวอย่างมีขนาดเล็ก...

การทดสอบแบบคร่าวๆ

การทดสอบ อย่างง่าย โดยใช้หลักการ คร่าวๆ คือ นำ ค่าสูงสุดและต่ำสุดของตัวอย่าง มา คำนวณหา ค่า z-score หรือที่ถูกต้องกว่าคือ ค่า t-statistic (จำนวนค่าเบี่ยงเบนมาตรฐานของตัวอย่างที่ค่าตัวอย่างอยู่เหนือหรือต่ำกว่าค่าเฉลี่ยของตัวอย่าง) แล้วนำไปเปรียบเทียบกับ กฎ...

การทดสอบความถี่

การทดสอบความปกติของตัวแปรเดี่ยวประกอบด้วยสิ่งต่อไปนี้: