กลับไปหน้าบทความ

อ่าน 9 นาที

ความแปรปรวนคงที่และความแปรปรวนไม่คงที่

ใน ทางสถิติ ลำดับของ ตัวแปร สุ่ม เรียกว่า homoscedastic ( / ˌ h oʊ m oʊ s k ə ˈ d æ s t ɪ k / ) ถ้าตัวแปรสุ่มทั้งหมดมี ค่าความแปรปรวน จำกัดเท่ากัน ซึ่งเรียกอีกอย่างว่า...

ความแปรปรวนคงที่และความแปรปรวนไม่คงที่

กราฟแสดงข้อมูลสุ่มที่แสดงให้เห็นถึงความแปรปรวนคงที่: ที่แต่ละค่าของxค่าyของจุดต่างๆ จะมีค่าความแปรปรวน ใกล้เคียง กัน
กราฟแสดงข้อมูลสุ่มที่แสดงให้เห็นถึงความแปรปรวนที่ไม่คงที่: ความแปรปรวนของ ค่า yของจุดต่างๆ จะเพิ่มขึ้นตามค่าxที่ เพิ่มขึ้น

ในทางสถิติลำดับของตัวแปรสุ่มเรียกว่าhomoscedastic ( / ˌ h m s k ə ˈ d æ s t ɪ k / ) ถ้าตัวแปรสุ่มทั้งหมดมีค่าความแปรปรวน จำกัดเท่ากัน ซึ่งเรียกอีกอย่างว่าความเป็นเอกรูปของความแปรปรวน แนวคิดที่ตรงกันข้ามเรียกว่าheteroscedasticityหรือเรียกอีกอย่างว่าความเป็นเอกรูปของความแปรปรวน[ a ] ​​คำนี้มีที่มาจากภาษากรีกโบราณσκεδάννυμι skedánnymiซึ่งหมายถึง 'กระจาย' [ 1 ] [ 2 ] [ 3 ]

การสมมติว่าตัวแปรเป็นแบบ homoscedastic ทั้งที่ในความเป็นจริงเป็นแบบ heteroscedastic ( / ˌ h ɛ t ər s k ə ˈ d æ s t ɪ k / ) ส่งผลให้ค่าประมาณจุดไม่เอนเอียงแต่ไม่มีประสิทธิภาพ และค่าประมาณ ความคลาดเคลื่อนมาตรฐานเอนเอียงและอาจส่งผลให้ประเมินความเหมาะสมของแบบจำลอง สูงเกินไป เมื่อวัดด้วยสัมประสิทธิ์เพียร์สัน

การมีอยู่ของความแปรปรวนที่ไม่คงที่ (heteroscedasticity) เป็นปัญหาสำคัญใน การวิเคราะห์การถดถอยและการวิเคราะห์ความแปรปรวนเนื่องจากทำให้การทดสอบความสำคัญทางสถิติที่ถือว่าข้อผิดพลาดในการสร้างแบบจำลองทั้งหมดมีความแปรปรวนเท่ากันนั้นไม่ถูกต้อง แม้ว่า ตัวประมาณ ค่ากำลังสองน้อยที่สุดแบบธรรมดา (OLS) จะยังคงไม่เอนเอียงในกรณีที่มีความแปรปรวนที่ไม่คงที่ แต่ก็ไม่มีประสิทธิภาพ และการอนุมานโดยอาศัยสมมติฐานของความแปรปรวนคงที่ (homoskedasticity) นั้นทำให้เข้าใจผิด ในกรณีดังกล่าวในอดีตมักใช้กำลังสองน้อยที่สุดแบบทั่วไป (GLS) [ 4 ] [ 5 ]ปัจจุบัน แนวปฏิบัติมาตรฐานในเศรษฐศาสตร์คือการรวมค่าความคลาดเคลื่อนมาตรฐานที่สอดคล้องกับความแปรปรวนที่ไม่คงที่ แทนที่จะใช้ GLS เนื่องจาก GLS อาจแสดงอคติอย่างมากในตัวอย่างขนาดเล็ก หากไม่ทราบฟังก์ชันความแปรปรวน ที่แท้จริง [ 6 ]

เนื่องจากความแปรปรวนไม่คงที่เกี่ยวข้องกับความคาดหวัง ของ โมเมนต์ที่สองของข้อผิดพลาด การมีอยู่ของความแปรปรวนไม่คงที่จึงเรียกว่าการกำหนดผิดพลาดลำดับที่สอง[ 7 ]

โรเบิร์ต เอนเกิลนักเศรษฐศาสตร์เชิงปริมาณ ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ประจำ ปี 2003 จากการศึกษาการวิเคราะห์การถดถอยในกรณีที่มีความแปรปรวนไม่คงที่ ซึ่งนำไปสู่การกำหนด เทคนิคการสร้างแบบจำลอง ความแปรปรวนไม่คงที่แบบมีเงื่อนไขอัตโนมัติ (ARCH) [ 8 ]

คำนิยาม

พิจารณาสมการการถดถอยเชิงเส้นโดยที่ตัวแปรสุ่มตามเท่ากับตัวแปรเชิงกำหนด คูณด้วย สัมประสิทธิ์บวกกับพจน์รบกวนแบบสุ่มที่มีค่าเฉลี่ยเป็นศูนย์ พจน์รบกวนจะเรียกว่ามีความแปรปรวนคงที่ (homoscedastic) ถ้าความแปรปรวนของ เป็นค่าคง ที่ มิฉะนั้นจะเรียกว่ามีความแปรปรวนไม่คงที่ (heteroscedastic) โดยเฉพาะอย่างยิ่ง พจน์รบกวนจะเรียกว่ามีความแปรปรวนไม่คงที่ ถ้าความแปรปรวนของขึ้นอยู่กับหรือค่าของวิธีหนึ่งที่อาจทำให้เกิดความแปรปรวนไม่คงที่ได้คือ ถ้า(ตัวอย่างของฟังก์ชันความแปรปรวน ) ดังนั้นความแปรปรวนจึงเป็นสัดส่วนกับค่าของ

โดยทั่วไป หากเมทริกซ์ความแปรปรวนร่วมของความคลาดเคลื่อนมีค่าแนวทแยงที่ไม่คงที่ ความคลาดเคลื่อนนั้นจะเป็นแบบเฮเทอโรสเคดาสติก[ 9 ] เมทริกซ์ด้านล่างเป็นเมทริกซ์ความแปรปรวนร่วมเมื่อมีเพียงสามการสังเกตในช่วงเวลา ความคลาดเคลื่อนในเมทริกซ์ A เป็นแบบโฮโมสเคดาสติก ซึ่งเป็นกรณีง่ายๆ ที่ OLS เป็นตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียงที่ดีที่สุด ความคลาดเคลื่อนในเมทริกซ์ B และ C เป็นแบบเฮเทอโรสเคดาสติก ในเมทริกซ์ B ความแปรปรวนเปลี่ยนแปลงตามเวลา เพิ่มขึ้นอย่างต่อเนื่องตลอดเวลา ในเมทริกซ์ C ความแปรปรวนขึ้นอยู่กับค่าของ ความคลาดเคลื่อนในเมทริกซ์ D เป็นแบบโฮโมสเคดาสติกเนื่องจากความแปรปรวนในแนวทแยงคงที่ แม้ว่าความแปรปรวนร่วมที่อยู่นอกแนวทแยงจะไม่เป็นศูนย์ และวิธีการกำลังสองน้อยที่สุดแบบธรรมดาไม่มีประสิทธิภาพด้วยเหตุผลที่แตกต่างกัน คือ ความสัมพันธ์แบบอนุกรม

ตัวอย่าง

ความแปรปรวนที่ไม่คงที่ (Heteroscedasticity) มักเกิดขึ้นเมื่อขนาดของข้อมูลที่สังเกตได้มีความแตกต่างกันมาก

ตัวอย่างคลาสสิกของความแปรปรวนที่ไม่คงที่ (heteroscedasticity) คือ รายได้เทียบกับค่าใช้จ่ายด้านอาหาร คนร่ำรวยอาจกินอาหารราคาถูกบ้างและกินอาหารราคาแพงบ้าง ในขณะที่คนยากจนมักจะกินอาหารราคาถูกเสมอ ดังนั้น คนที่มีรายได้สูงจึงมีความแปรปรวนในค่าใช้จ่ายด้านอาหารมากกว่า

ในการปล่อยจรวด ผู้สังเกตการณ์จะวัดระยะทางที่จรวดเคลื่อนที่ไปได้ทุกๆ หนึ่งวินาที ในช่วงสองสามวินาทีแรก การวัดอาจมีความแม่นยำถึงระดับเซนติเมตร แต่หลังจากห้านาที ความแม่นยำของการวัดอาจดีขึ้นเพียง 100 เมตรเท่านั้น เนื่องจากระยะทางที่เพิ่มขึ้น การบิดเบือนของชั้นบรรยากาศ และปัจจัยอื่นๆ อีกมากมาย ดังนั้น การวัดระยะทางจึงอาจแสดงให้เห็นถึงความแปรปรวนที่ไม่คงที่ (heteroscedasticity)

ผลที่ตามมา

หนึ่งในข้อสมมติฐานของแบบจำลองการถดถอยเชิงเส้นแบบคลาสสิกคือไม่มีความแปรปรวนไม่คงที่( heteroscedasticity) การละเมิดข้อสมมติฐานนี้หมายความว่าทฤษฎีบทเกาส์-มาร์คอฟ ( Gauss–Markov theorem)ไม่สามารถนำมาใช้ได้ ซึ่งหมายความว่า ตัวประมาณค่า OLSไม่ใช่ ตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียงที่ดีที่สุด (Best Linear Unbiased Estimators หรือ BLUE) และความแปรปรวนของตัวประมาณค่าเหล่านี้ ไม่ใช่ค่าต่ำสุดในบรรดาตัวประมาณค่าที่ไม่เอนเอียงอื่นๆ ความแปรปรวนไม่คงที่ไม่ได้ทำให้ค่าประมาณสัมประสิทธิ์แบบกำลังสองน้อยที่สุด (OLS) เอนเอียง แม้ว่ามันอาจทำให้ค่าประมาณความแปรปรวน (และดังนั้น ค่าความคลาดเคลื่อนมาตรฐาน) ของสัมประสิทธิ์แบบกำลังสองน้อยที่สุดเอนเอียงได้ อาจจะสูงกว่าหรือต่ำกว่าความแปรปรวนที่แท้จริงของประชากร ดังนั้น การวิเคราะห์การถดถอยโดยใช้ข้อมูลที่มีความแปรปรวนไม่คงที่จะยังคงให้ค่าประมาณที่ไม่เอนเอียงสำหรับความสัมพันธ์ระหว่างตัวแปรทำนายและผลลัพธ์ แต่ค่าความคลาดเคลื่อนมาตรฐานและข้อสรุปที่ได้จากการวิเคราะห์ข้อมูลนั้นอาจไม่น่าเชื่อถือ ค่าความคลาดเคลื่อนมาตรฐานที่เอนเอียงนำไปสู่ข้อสรุปที่เอนเอียง ดังนั้นผลลัพธ์ของการทดสอบสมมติฐานจึงอาจผิดพลาดได้ ตัวอย่างเช่น หากทำการวิเคราะห์ OLS กับชุดข้อมูลที่มีความแปรปรวนไม่คงที่ ซึ่งจะทำให้การประมาณค่าความคลาดเคลื่อนมาตรฐานมีอคติ นักวิจัยอาจไม่สามารถปฏิเสธสมมติฐานว่างที่ ระดับ นัยสำคัญ ที่กำหนดได้ ทั้งที่สมมติฐานว่างนั้นไม่ตรงกับลักษณะของประชากรจริง (ซึ่งเป็นความผิดพลาดประเภทที่ 2 )

ภายใต้สมมติฐานบางประการ ตัวประมาณค่า OLS มีการกระจายแบบปกติเชิงอะซิมโทติกเมื่อมีการปรับมาตรฐานและจัดศูนย์กลางอย่างเหมาะสม (แม้ว่าข้อมูลจะไม่ได้มาจากการกระจายแบบปกติก็ตาม) ผลลัพธ์นี้ใช้เพื่อพิสูจน์การใช้การกระจายแบบปกติ หรือการกระจายแบบไคสแควร์ (ขึ้นอยู่กับวิธีการคำนวณสถิติการทดสอบ ) เมื่อทำการ ทดสอบสมมติฐานสิ่งนี้ยังคงใช้ได้แม้ภายใต้ภาวะความแปรปรวนไม่คงที่ กล่าวคือ ตัวประมาณค่า OLS ในกรณีที่มีความแปรปรวนไม่คงที่ จะมีการกระจายแบบปกติเชิงอะซิมโทติก เมื่อมีการปรับมาตรฐานและจัดศูนย์กลางอย่างเหมาะสม โดยมีเมทริกซ์ ความแปรปรวนร่วม ที่แตกต่างจากกรณีที่มีความแปรปรวนคงที่ ในปี 1980 ไวท์ได้เสนอตัวประมาณค่าที่สอดคล้องกันสำหรับเมทริกซ์ความแปรปรวนร่วมของการกระจายเชิงอะซิมโทติกของตัวประมาณค่า OLS [ 2 ]สิ่งนี้ยืนยันการใช้การทดสอบสมมติฐานโดยใช้ตัวประมาณค่า OLS และตัวประมาณค่าความแปรปรวนร่วมของไวท์ภายใต้ภาวะความแปรปรวนไม่คงที่

ความแปรปรวนที่ไม่คงที่ (Heteroscedasticity) ยังเป็นปัญหาสำคัญในทางปฏิบัติที่พบในปัญหาANOVA อีกด้วย [ 10 ] การทดสอบ Fยังคงสามารถใช้ได้ในบางสถานการณ์[ 11 ]

อย่างไรก็ตาม มีการกล่าวว่านักศึกษาในวิชาเศรษฐศาสตร์เชิงปริมาณไม่ควรตอบสนองต่อความแปรปรวนที่ไม่เท่ากันมากเกินไป[ 3 ]ผู้เขียนคนหนึ่งเขียนว่า "ความแปรปรวนของข้อผิดพลาดที่ไม่เท่ากันควรได้รับการแก้ไขก็ต่อเมื่อปัญหารุนแรงเท่านั้น" [ 12 ]นอกจากนี้ ยังมีคำเตือนอีกประการหนึ่งว่า "ความแปรปรวนที่ไม่เท่ากันไม่เคยเป็นเหตุผลที่จะทิ้งแบบจำลองที่ดีอยู่แล้ว" [ 3 ] [ 13 ]ด้วยการเกิดขึ้นของค่าความคลาดเคลื่อนมาตรฐานที่สอดคล้องกับความแปรปรวนที่ไม่เท่ากันทำให้สามารถอนุมานได้โดยไม่ต้องระบุโมเมนต์ที่สองแบบมีเงื่อนไขของพจน์ข้อผิดพลาด การทดสอบความแปรปรวนคงที่แบบมีเงื่อนไขจึงไม่สำคัญเท่าในอดีต[ 6 ]

อย่างไรก็ตามสำหรับแบบจำลองที่ไม่เป็นเชิงเส้นใดๆ (เช่น แบบจำลอง LogitและProbit ) ความแปรปรวนที่ไม่คงที่จะมีผลกระทบที่รุนแรงกว่า: ค่าประมาณความน่าจะเป็นสูงสุด (MLE) ของพารามิเตอร์มักจะเอนเอียงและไม่สอดคล้องกัน (เว้นแต่ฟังก์ชันความน่าจะเป็นจะถูกปรับเปลี่ยนเพื่อให้คำนึงถึงรูปแบบที่แม่นยำของความแปรปรวนที่ไม่คงที่ หรือการกระจายตัวเป็นสมาชิกของตระกูลเลขชี้กำลังเชิงเส้นและฟังก์ชันความคาดหวังแบบมีเงื่อนไขได้รับการระบุอย่างถูกต้อง) [ 14 ] [ 15 ]อย่างไรก็ตาม ในบริบทของแบบจำลองการเลือกแบบไบนารี ( LogitหรือProbit ) ความแปรปรวนที่ไม่คงที่จะส่งผลให้เกิดผลกระทบเชิงบวกต่อค่าเฉลี่ยเชิงเส้นกำกับของ MLE ที่ระบุไม่ถูกต้อง (เช่น แบบจำลองที่ละเลยความแปรปรวนที่ไม่คงที่) [ 16 ]ด้วยเหตุนี้ การคาดการณ์ที่อิงตาม MLE ที่ระบุไม่ถูกต้องจึงยังคงถูกต้อง นอกจากนี้ MLE ของ Probit และ Logit ที่ระบุผิดพลาดจะมีการกระจายแบบปกติเชิงอะซิมโทติก ซึ่งช่วยให้สามารถทำการทดสอบความสำคัญตามปกติได้ (ด้วยเมทริกซ์ความแปรปรวนร่วมที่เหมาะสม) อย่างไรก็ตาม ในส่วนของการทดสอบสมมติฐานทั่วไป ดังที่Greene ชี้ให้เห็น ว่า "การคำนวณเมทริกซ์ความแปรปรวนร่วมที่แข็งแกร่งสำหรับตัวประมาณค่าที่ไม่สอดคล้องกันนั้นไม่ได้ช่วยแก้ไขสถานการณ์ ดังนั้น คุณค่าของเมทริกซ์ความแปรปรวนร่วมที่แข็งแกร่งในบริบทนี้จึงไม่ชัดเจน" [ 17 ]

การแก้ไข

มีวิธีการแก้ไขความแปรปรวนที่ไม่คงที่ (heteroscedasticity) ที่ใช้กันทั่วไปอยู่หลายวิธี ได้แก่:

  • การแปลงข้อมูลให้มีเสถียรภาพมากขึ้น เช่น การใช้ลอการิทึมกับ ข้อมูล อนุกรมข้อมูลที่ไม่ผ่านการแปลงเป็นลอการิทึมซึ่งเติบโตแบบทวีคูณ มักจะแสดงให้เห็นว่ามีความผันแปรเพิ่มขึ้นเรื่อยๆ ตามเวลา อย่างไรก็ตาม ความผันแปรในแง่ของเปอร์เซ็นต์อาจค่อนข้างคงที่
  • ใช้ข้อกำหนดที่แตกต่างกันสำหรับแบบจำลอง ( ตัวแปร X ที่แตกต่างกัน หรืออาจเป็นการแปลงแบบไม่เชิงเส้นของ ตัวแปร X )
  • ใช้ ระเบียบวิธีประมาณ ค่ากำลังสองน้อยที่สุดแบบถ่วงน้ำหนักโดยที่ OLS จะถูกนำไปใช้กับค่าXและY ที่แปลงหรือถ่วงน้ำหนัก แล้ว น้ำหนักจะแตกต่างกันไปตามการสังเกต โดยปกติจะขึ้นอยู่กับความแปรปรวนของข้อผิดพลาดที่เปลี่ยนแปลงไป ในรูปแบบหนึ่ง น้ำหนักจะสัมพันธ์โดยตรงกับขนาดของตัวแปรตาม และสิ่งนี้สอดคล้องกับการถดถอยร้อยละกำลังสองน้อยที่สุด[ 18 ]
  • ค่าความคลาดเคลื่อนมาตรฐานที่สอดคล้องกับความแปรปรวนไม่คงที่ (HCSE) แม้จะยังมีความลำเอียงอยู่บ้าง แต่ก็ปรับปรุงการประมาณค่า OLS ให้ ดีขึ้น [ 2 ] HCSE เป็นตัวประมาณค่าความคลาดเคลื่อนมาตรฐานที่สอดคล้องกับแบบจำลองการถดถอยที่มีความแปรปรวนไม่คงที่ วิธีนี้แก้ไขความแปรปรวนไม่คงที่โดยไม่เปลี่ยนแปลงค่าสัมประสิทธิ์ วิธีนี้อาจเหนือกว่า OLS ทั่วไป เพราะหากมีความแปรปรวนไม่คงที่ วิธีนี้จะแก้ไขได้ อย่างไรก็ตาม หากข้อมูลมีความแปรปรวนคงที่ ค่าความคลาดเคลื่อนมาตรฐานจะเทียบเท่ากับค่าความคลาดเคลื่อนมาตรฐานแบบดั้งเดิมที่ประมาณโดย OLS มีการเสนอการปรับเปลี่ยนวิธีของ White ในการคำนวณค่าความคลาดเคลื่อนมาตรฐานที่สอดคล้องกับความแปรปรวนไม่คงที่หลายวิธี เพื่อเป็นการแก้ไขที่มีคุณสมบัติที่ดีกว่าในตัวอย่างขนาดเล็ก
  • การบูตสแตรปแบบ Wildสามารถใช้เป็นวิธีการสุ่มตัวอย่างซ้ำที่คำนึงถึงความแตกต่างในความแปรปรวนแบบมีเงื่อนไขของพจน์ความคลาดเคลื่อนได้ ทางเลือกอื่นคือการสุ่มตัวอย่างซ้ำจากข้อมูลสังเกตการณ์แทนที่จะเป็นความคลาดเคลื่อน โปรดทราบว่าการสุ่มตัวอย่างซ้ำจากความคลาดเคลื่อนโดยไม่คำนึงถึงค่าที่เกี่ยวข้องกับข้อมูลสังเกตการณ์จะบังคับให้เกิดภาวะความแปรปรวนคงที่ (homoskedasticity) ซึ่งจะทำให้ได้ข้อสรุปที่ไม่ถูกต้อง
  • ใช้MINQUEหรือแม้แต่ตัวประมาณค่าตามปกติ(สำหรับตัวอย่างอิสระที่มีการสังเกตแต่ละครั้ง) ซึ่งการสูญเสียประสิทธิภาพจะไม่มากนักเมื่อจำนวนการสังเกตต่อตัวอย่างมีขนาดใหญ่ ( ) โดยเฉพาะอย่างยิ่งสำหรับจำนวนตัวอย่างอิสระจำนวนน้อย[ 19 ]

การทดสอบ

ค่าสัมบูรณ์ของค่าความคลาดเคลื่อนสำหรับข้อมูลเฮเทอโรสเคดาสติกอันดับแรกที่จำลองขึ้น

สามารถทดสอบค่าตกค้างเพื่อหาค่าความแปรปรวนคงที่ได้โดยใช้การทดสอบ Breusch–Pagan [ 20 ]ซึ่งทำการถดถอยเสริมของค่าตกค้างยกกำลังสองกับตัวแปรอิสระ จากการถดถอยเสริมนี้ ผลรวมกำลังสองที่อธิบายได้จะถูกเก็บไว้ หารด้วยสอง แล้วกลายเป็นสถิติการทดสอบสำหรับการแจกแจงไคกำลังสองที่มีองศาอิสระเท่ากับจำนวนตัวแปรอิสระ[ 21 ]สมมติฐานว่างของการทดสอบไคกำลังสองนี้คือค่าความแปรปรวนคงที่ และสมมติฐานทางเลือกจะบ่งชี้ถึงค่าความแปรปรวนไม่คงที่ เนื่องจากการทดสอบ Breusch–Pagan มีความไวต่อการเบี่ยงเบนจากภาวะปกติหรือขนาดตัวอย่างเล็ก จึงมักใช้การทดสอบ Koenker–Bassett หรือ 'Breusch–Pagan แบบทั่วไป' แทน[ 22 ]จากการถดถอยเสริม จะเก็บค่า R-squared ไว้ จากนั้นคูณด้วยขนาดตัวอย่าง และกลายเป็นสถิติการทดสอบสำหรับการแจกแจงไคกำลังสอง (และใช้ระดับความเป็นอิสระเดียวกัน) แม้ว่าจะไม่จำเป็นสำหรับการทดสอบ Koenker–Bassett แต่การทดสอบ Breusch–Pagan ต้องการให้ค่าความคลาดเคลื่อนกำลังสองหารด้วยผลรวมกำลังสองของความคลาดเคลื่อนหารด้วยขนาดตัวอย่างด้วย[ 22 ] การทดสอบความแปรปรวนที่ไม่เท่ากันระหว่างกลุ่มสามารถทำได้ด้วยการทดสอบ Goldfeld–Quandt [ 23 ]

เนื่องจากการใช้ค่าความคลาดเคลื่อนมาตรฐานที่สอดคล้องกับความแปรปรวนไม่คงที่และปัญหาการทดสอบเบื้องต้นนักเศรษฐศาสตร์ในปัจจุบันจึงไม่ค่อยใช้การทดสอบความแปรปรวนไม่คงที่แบบมีเงื่อนไข[ 6 ]

รายการการทดสอบ

แม้ว่าการทดสอบความแปรปรวนที่ไม่เท่ากันระหว่างกลุ่มจะสามารถพิจารณาได้ว่าเป็นกรณีพิเศษของการทดสอบภายในแบบจำลองการถดถอย แต่การทดสอบบางอย่างก็มีโครงสร้างเฉพาะสำหรับกรณีนี้

การสรุปโดยทั่วไป

การแจกแจงแบบโฮโมสเคดาสติก

การแจกแจงปกติสองหรือมากกว่านั้นถือเป็นโฮโมสเคดาสติกทั้งคู่และไม่มีความสัมพันธ์แบบอนุกรมหากการแจกแจงเหล่านั้นมีเส้นทแยงมุมเดียวกันในเมทริกซ์ความแปรปรวนร่วมและค่าที่ไม่ใช่เส้นทแยงมุมเป็นศูนย์ การแจกแจงโฮโมสเคดาสติกมีประโยชน์อย่างยิ่งในการสร้าง อัลกอริทึม การจดจำรูปแบบ ทางสถิติ และการเรียนรู้ของเครื่องตัวอย่างยอดนิยมของอัลกอริทึมที่ถือว่าโฮโมสเคดาสติกคือการวิเคราะห์การจำแนกเชิงเส้น ของฟิชเชอร์ แนวคิดของโฮโมสเคดาสติกสามารถนำไปใช้กับการแจกแจงบนทรงกลมได้[ 27 ]

ข้อมูลหลายตัวแปร

การศึกษาเรื่องความแปรปรวนคงที่และความแปรปรวนไม่คงที่ได้รับการขยายไปสู่กรณีหลายตัวแปร ซึ่งเกี่ยวข้องกับความแปรปรวนร่วมของการสังเกตเวกเตอร์แทนที่จะเป็นความแปรปรวนของการสังเกตสเกลาร์ เวอร์ชันหนึ่งของเรื่องนี้คือการใช้เมทริกซ์ความแปรปรวนร่วมเป็นมาตรวัดการกระจายตัวแบบหลายตัวแปร ผู้เขียนหลายคนได้พิจารณาการทดสอบในบริบทนี้ ทั้งในสถานการณ์การถดถอยและข้อมูลแบบกลุ่ม[ 28 ] [ 29 ]การทดสอบของ Bartlettสำหรับความแปรปรวนไม่คงที่ระหว่างข้อมูลแบบกลุ่ม ซึ่งใช้กันทั่วไปในกรณีตัวแปรเดียว ได้รับการขยายไปสู่กรณีหลายตัวแปรเช่นกัน แต่มีวิธีแก้ปัญหาที่ใช้งานได้จริงเฉพาะสำหรับ 2 กลุ่มเท่านั้น[ 30 ]มีการประมาณค่าสำหรับมากกว่าสองกลุ่ม และทั้งสองเรียกว่า การทดสอบ M ของ Box

ดูเพิ่มเติม

หมายเหตุ

  1. ^การสะกดคำว่า homos k edasticityและ heteros k edasticityก็มีการใช้บ่อยเช่นกัน

อ่านเพิ่มเติม

ตำราสถิติส่วนใหญ่จะมีเนื้อหาเกี่ยวกับภาวะความแปรปรวนคงที่ (homoscedasticity) และภาวะความแปรปรวนไม่คงที่ (heteroscedasticity) อย่างน้อยบางส่วน ตัวอย่างเช่น:

  • Asteriou, Dimitros; Hall, Stephen G. (2011). เศรษฐศาสตร์ประยุกต์ (ฉบับพิมพ์ครั้งที่สอง). Palgrave MacMillan. หน้า  109–147 . ISBN 978-0-230-27182-1.
  • Davidson, Russell; MacKinnon, James G. (1993). การประมาณค่าและการอนุมานในเศรษฐศาสตร์เชิงปริมาณ . นิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด. หน้า  547–582 . ISBN 978-0-19-506011-9.
  • ดอเฮอร์ตี้, คริสโตเฟอร์ (2011). บทนำสู่เศรษฐศาสตร์เชิงปริมาณ . นิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด. หน้า  280–299 . ISBN 978-0-19-956708-9.
  • Gujarati, Damodar N. ; Porter, Dawn C. (2009). เศรษฐศาสตร์เชิงปริมาณขั้นพื้นฐาน (ฉบับที่ห้า). นิวยอร์ก: McGraw-Hill Irwin. หน้า  365–411 . ISBN 978-0-07-337577-9.
  • Kmenta, Jan (1986). องค์ประกอบของเศรษฐศาสตร์เชิงปริมาณ (ฉบับพิมพ์ครั้งที่สอง). นิวยอร์ก: Macmillan. หน้า  269–298 . ISBN 978-0-02-365070-3.
  • Maddala, GS ; Lahiri, Kajal (2009). บทนำสู่เศรษฐศาสตร์เชิงปริมาณ (ฉบับที่สี่). นิวยอร์ก: Wiley. หน้า  211–238 . ISBN 978-0-470-01512-4.
  • วิดีโอบรรยายวิชาเศรษฐศาสตร์เชิงปริมาณ (หัวข้อ: ความแปรปรวนที่ไม่คงที่)บน YouTubeโดย Mark Thoma
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Homoscedasticity_and_heteroscedasticity&oldid=1341240264 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ความแปรปรวนคงที่และความแปรปรวนไม่คงที่

ใน ทางสถิติ ลำดับของ ตัวแปร สุ่ม เรียกว่า homoscedastic ( / ˌ h oʊ m oʊ s k ə ˈ d æ s t ɪ k / ) ถ้าตัวแปรสุ่มทั้งหมดมี ค่าความแปรปรวน จำกัดเท่ากัน ซึ่งเรียกอีกอย่างว่า...

คำนิยาม

พิจารณาสมการ การถดถอยเชิงเส้น โดยที่ตัวแปรสุ่มตามเท่ากับตัวแปรเชิงกำหนด คูณด้วย สัมประสิทธิ์บวกกับพจน์รบกวนแบบสุ่มที่มีค่าเฉลี่ยเป็นศูนย์ พจน์รบกวนจะเรียกว่ามีความแปรปรวนคงที่ (homoscedastic) ถ้าความแปรปรวนของ เป็นค่าคง ที่...

ตัวอย่าง

ความแปรปรวนที่ไม่คงที่ (Heteroscedasticity) มักเกิดขึ้นเมื่อขนาดของข้อมูลที่สังเกตได้มีความแตกต่างกันมาก

ผลที่ตามมา

หนึ่งในข้อสมมติฐานของแบบจำลองการถดถอยเชิงเส้นแบบคลาสสิกคือไม่มีความแปรปรวนไม่คงที่ ( heteroscedasticity) การละเมิดข้อสมมติฐานนี้หมายความว่าทฤษฎีบทเกาส์-มาร์คอฟ ( Gauss–Markov theorem) ไม่สามารถนำมาใช้ได้ ซึ่งหมายความว่า ตัวประมาณค่า OLS ไม่ใช่...