กลับไปหน้าบทความ

อ่าน 27 นาที

กำลังสองน้อยที่สุดแบบธรรมดา

ในทางสถิติวิธีการกำลังสองน้อยที่สุดแบบธรรมดา ( OLS ) เป็น วิธีการกำลังสองน้อยที่สุดเชิงเส้นประเภทหนึ่ง สำหรับการเลือก พารามิเตอร์ ที่ไม่ทราบค่า ใน แบบจำลอง...

กำลังสองน้อยที่สุดแบบธรรมดา

กฎของโอกุนในเศรษฐศาสตร์ มหภาค ระบุว่า ในระบบเศรษฐกิจ การเติบโตของ GDPควรขึ้นอยู่กับการเปลี่ยนแปลงของอัตราการว่างงานในเชิงเส้นตรง ในที่นี้ใช้วิธีถดถอยกำลังสองน้อยที่สุดแบบธรรมดาในการสร้างเส้นถดถอยที่อธิบายกฎนี้

ในทางสถิติวิธีการกำลังสองน้อยที่สุดแบบธรรมดา ( OLS ) เป็น วิธีการกำลังสองน้อยที่สุดเชิงเส้นประเภทหนึ่ง สำหรับการเลือก พารามิเตอร์ ที่ไม่ทราบค่า ใน แบบจำลอง การถดถอยเชิงเส้นโดยใช้หลักการกำลังสองน้อยที่สุด : การลดผลรวมของกำลังสองของความแตกต่างระหว่างตัวแปรตาม ที่สังเกตได้ (ค่าของตัวแปรที่ถูกสังเกต) ในชุดข้อมูล อินพุต และผลลัพธ์ของฟังก์ชัน (เชิงเส้น) ของตัวแปรอิสระ แหล่งข้อมูลบางแหล่งถือว่า OLS เป็นการถดถอยเชิงเส้น[ 1 ]

ในทางเรขาคณิต ค่าประมาณนี้สามารถมองได้ว่าเป็นผลรวมของระยะทางกำลังสองที่ขนานกับแกนของตัวแปรตาม ระหว่างแต่ละจุดข้อมูลในชุดข้อมูลกับจุดที่สอดคล้องกันบนพื้นผิวการถดถอย ยิ่งความแตกต่างน้อยเท่าไร แบบจำลองก็จะยิ่งเหมาะสมกับข้อมูลมากขึ้นเท่านั้นค่าประมาณ ที่ได้ สามารถแสดงได้ด้วยสูตรอย่างง่าย โดยเฉพาะอย่างยิ่งในกรณีของการถดถอยเชิงเส้นอย่างง่ายซึ่งมีตัวแปรอิสระ เพียงตัวเดียว ทางด้านขวาของสมการถดถอย

ตัวประมาณค่า OLS มีความสอดคล้องสำหรับผลกระทบคงที่ระดับหนึ่งเมื่อตัวแปรอิสระเป็นตัวแปรภายนอกและก่อให้เกิดความสัมพันธ์เชิงเส้น ที่สมบูรณ์แบบ (เงื่อนไขอันดับ) มีความสอดคล้องสำหรับการประมาณค่าความแปรปรวนของค่าตกค้างเมื่อตัวแปรอิสระมีโมเมนต์ที่สี่จำกัด[ 2 ]และ—ตามทฤษฎีบท Gauss–Markov— เหมาะสมที่สุดในกลุ่มตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียงเมื่อข้อผิดพลาดมีความแปรปรวน คงที่ และไม่มีความสัมพันธ์แบบอนุกรมภายใต้เงื่อนไขเหล่านี้ วิธีการของ OLS ให้ การประมาณค่า ที่ไม่เอนเอียงค่าเฉลี่ยที่มีความแปรปรวนต่ำสุดเมื่อข้อผิดพลาดมีความแปรปรวน จำกัด ภาย ใต้สมมติฐานเพิ่มเติมที่ว่าข้อผิดพลาดมีการกระจายแบบปกติโดยมีค่าเฉลี่ยเป็นศูนย์ OLS เป็นตัวประมาณค่าความน่าจะเป็นสูงสุดที่ทำงานได้ดีกว่าตัวประมาณค่าที่ไม่เอนเอียงแบบไม่เชิงเส้นใดๆ

แบบจำลองเชิงเส้น

สมมติว่าข้อมูลประกอบด้วยค่าสังเกตแต่ละค่าสังเกตประกอบด้วยตัวแปรตอบสนองแบบสเกลาร์และเวกเตอร์คอลัมน์ของพารามิเตอร์ (ตัวแปรอิสระ) เช่นในแบบจำลองการถดถอยเชิงเส้นตัวแปรตอบสนองคือฟังก์ชันเชิงเส้นของตัวแปรอิสระ:

หรือในรูปแบบ เวกเตอร์

โดย ที่ตามที่ได้กล่าวไว้ก่อนหน้านี้ คือเวกเตอร์คอลัมน์ของการสังเกตครั้งที่ ของตัวแปรอธิบายทั้งหมดคือเวกเตอร์ของพารามิเตอร์ที่ไม่ทราบค่า และค่าสเกลาร์แทนตัวแปรสุ่มที่ไม่สามารถสังเกตได้ ( ข้อผิดพลาด ) ของการสังเกตครั้งที่อธิบายถึงอิทธิพลที่มีต่อการตอบสนองจากแหล่งอื่นนอกเหนือจากตัวแปรอธิบายแบบจำลองนี้สามารถเขียนในรูปแบบเมทริกซ์ได้ดังนี้

โดยที่และเป็นเวกเตอร์ของตัวแปรตอบสนองและข้อผิดพลาดของการสังเกต และเป็นเมทริกซ์ของตัวแปรอิสระ หรือบางครั้งเรียกว่าเมทริกซ์การออกแบบซึ่งแถวที่คือและประกอบด้วยการสังเกตครั้งที่ บนตัวแปรอธิบายทั้งหมด

โดยทั่วไปแล้ว ค่าคงที่จะถูกรวมอยู่ในชุดตัวแปรอิสระเช่น โดยการเลือกสำหรับทุกค่า สัมประสิทธิ์ที่สอดคล้องกับตัวแปรอิสระนี้เรียกว่า ค่า คงที่จุดตัดแกน y หากไม่มีค่าคงที่จุดตัดแกน y เส้นที่ได้จากการประมาณค่าจะถูกบังคับให้ตัดผ่านจุดกำเนิดเมื่อ n = 0

ตัวแปรอิสระไม่จำเป็นต้องเป็นอิสระต่อกันเพื่อให้การประมาณค่ามีความสอดคล้องกัน เช่น อาจมีความสัมพันธ์แบบไม่เป็นเชิงเส้นก็ได้ หากไม่มีภาวะความสัมพันธ์ร่วมเชิงเส้นที่สมบูรณ์แบบ การประมาณค่าพารามิเตอร์อาจยังคงมีความสอดคล้องกัน อย่างไรก็ตาม เมื่อภาวะความสัมพันธ์ร่วมเชิงเส้นสูงขึ้น ค่าความคลาดเคลื่อนมาตรฐานรอบการประมาณค่าดังกล่าวก็จะเพิ่มขึ้นและลดความแม่นยำของการประมาณค่าเหล่านั้น เมื่อมีภาวะความสัมพันธ์ร่วมเชิงเส้นที่สมบูรณ์แบบ จะไม่สามารถหาค่าประมาณที่ไม่ซ้ำกันสำหรับสัมประสิทธิ์ของตัวแปรอิสระที่เกี่ยวข้องได้อีกต่อไป การประมาณค่าพารามิเตอร์เหล่านี้จะไม่สามารถลู่เข้าได้ (ดังนั้นจึงไม่สามารถมีความสอดคล้องกัน)

ตัวอย่างที่เป็นรูปธรรมในกรณีที่ตัวแปรอิสระมีความสัมพันธ์แบบไม่เป็นเชิงเส้น แต่การประมาณค่าอาจยังคงสอดคล้องกัน เราอาจสงสัยว่าตัวแปรตอบสนองมีความสัมพันธ์เชิงเส้นกับทั้งค่าและกำลังสองของค่านั้น ในกรณีนี้ เราจะรวมตัวแปรอิสระตัวหนึ่งที่มีค่าเป็นกำลังสองของตัวแปรอิสระอีกตัวหนึ่ง ในกรณีนั้น แบบจำลองจะเป็นแบบกำลังสองในตัวแปรอิสระตัวที่สอง แต่ถึงกระนั้นก็ยังถือว่าเป็น แบบจำลอง เชิงเส้นเพราะแบบจำลอง ยังคง เป็นเชิงเส้นในพารามิเตอร์ ( )

การกำหนดสูตรเมทริกซ์/เวกเตอร์

พิจารณาระบบที่กำหนดไว้เกินกำหนด

ของสมการเชิงเส้นที่มีสัมประสิทธิ์ที่ไม่ทราบค่า, , โดยที่สามารถเขียนในรูปแบบ เมทริกซ์ ได้ดังนี้

ที่ไหน

(หมายเหตุ: สำหรับแบบจำลองเชิงเส้นดังข้างต้น ไม่ใช่ทุกองค์ประกอบในจะมีข้อมูลเกี่ยวกับจุดข้อมูล คอลัมน์แรกจะมีค่าเป็น 1 เท่านั้น ส่วนคอลัมน์อื่นๆ จะมีข้อมูลจริง ดังนั้น ในที่นี้จึงเท่ากับจำนวนตัวแปรอิสระบวกหนึ่ง)

ระบบดังกล่าวโดยทั่วไปไม่มีคำตอบที่แน่นอน ดังนั้นเป้าหมายจึงอยู่ที่การหาค่าสัมประสิทธิ์ที่เหมาะสมกับสมการ "ดีที่สุด" ในแง่ของการแก้ปัญหา การหาค่าต่ำสุดของกำลังสอง

โดยที่ฟังก์ชันเป้าหมายกำหนดโดย:

เหตุผลในการเลือกเกณฑ์นี้ได้ระบุไว้ในคุณสมบัติด้านล่าง ปัญหาการหาค่าต่ำสุดนี้มีคำตอบเดียว หากคอลัมน์ของเมทริกซ์เป็นอิสระเชิงเส้น ซึ่งได้มาจากการแก้สม การปกติที่เรียกว่า:

เมทริกซ์นี้เรียกว่าเมทริกซ์ปกติหรือเมทริกซ์แกรมและเมทริกซ์นี้เรียกว่าเมทริกซ์โมเมนต์ของตัวแปรตามโดยตัวแปรตาม[ 3 ]สุดท้ายเวกเตอร์สัมประสิทธิ์ของระนาบ กำลังสองน้อยที่สุด แสดงเป็น

หรือ

การประมาณการ

สมมติว่าbเป็นค่า "ผู้สมัคร" สำหรับเวกเตอร์พารามิเตอร์βปริมาณy ix i T bซึ่งเรียกว่าค่าตกค้างสำหรับ การสังเกตครั้งที่ iจะวัดระยะทางแนวตั้งระหว่างจุดข้อมูล( x i , y i )และระนาบไฮเปอร์y = x T bและด้วยเหตุนี้จึงประเมินระดับความพอดีระหว่างข้อมูลจริงกับแบบจำลอง ผลรวมของกำลังสองของค่าตกค้าง ( SSR ) (เรียกอีกอย่างว่าผลรวมกำลังสองของข้อผิดพลาด ( ESS ) หรือผลรวมกำลังสองของค่าตกค้าง ( RSS )) [ 4 ]เป็นการวัดความพอดีของแบบจำลองโดยรวม:

โดยที่Tแทนการสลับ แถวและคอลัมน์ของเมทริกซ์ และแถวของXซึ่งแทนค่าของตัวแปรอิสระทั้งหมดที่เกี่ยวข้องกับค่าเฉพาะของตัวแปรตาม คือX i = x i Tค่าของbที่ทำให้ผลรวมนี้น้อยที่สุดเรียกว่าตัวประมาณ OLS สำหรับβฟังก์ชันS ( b ) เป็นฟังก์ชันกำลังสองในb ที่มีเมทริกซ์ เฮสเซียนบวกแน่นอนดังนั้นฟังก์ชันนี้จึงมีค่าต่ำสุดทั่วโลกที่ไม่ซ้ำกันที่ซึ่งสามารถกำหนดได้ด้วยสูตรที่ชัดเจน[ 5 ] [พิสูจน์]

ผลคูณN = X T Xคือเมทริกซ์แกรมและเมทริกซ์ผกผันQ = N −1 คือเมทริกซ์โคแฟกเตอร์ของ β [ 6 ] [ 7 ] [ 8 ]ซึ่งมีความเกี่ยวข้องอย่างใกล้ชิดกับเมทริกซ์ความแปรปรวนร่วมC βเมทริกซ์ ( X T X ) −1  X T =  Q X T เรียก ว่าเมทริก ซ์ ผกผันเทียมมัวร์-เพนโรสของXสูตรนี้เน้นย้ำประเด็นที่ว่าการประมาณค่าสามารถดำเนินการได้ก็ต่อเมื่อไม่มีความสัมพันธ์เชิงเส้นร่วม ที่สมบูรณ์แบบ ระหว่างตัวแปรอธิบาย (ซึ่งจะทำให้เมทริกซ์แกรมไม่มีเมทริกซ์ผกผัน)

การทำนาย

หลังจากที่เราได้ประมาณค่า βแล้ว ค่าที่ได้จากการปรับให้เหมาะสม (หรือค่าที่ทำนายได้ ) จากการถดถอยจะเป็นดังนี้

โดยที่P = X ( X T X ) −1 X Tคือเมทริกซ์การฉายภาพไปยังพื้นที่Vที่ครอบคลุมโดยคอลัมน์ของX เมทริกซ์ Pนี้บางครั้งเรียกว่าเมทริกซ์หมวกเพราะมัน "สวมหมวก" ให้กับตัวแปรyเมทริกซ์อีกตัวหนึ่งที่เกี่ยวข้องอย่างใกล้ชิดกับPคือเมทริกซ์ทำลายM = I nPซึ่งเป็นเมทริกซ์การฉายภาพไปยังพื้นที่ตั้งฉากกับV เมทริกซ์ PและMทั้งสองเป็น เมทริก ซ์สมมาตรและเอกลักษณ์ (หมายความว่าP 2 = PและM 2 = M ) และเกี่ยวข้องกับเมทริกซ์ข้อมูลXผ่านเอกลักษณ์PX = XและMX = 0 [ 9 ] เมทริกซ์Mสร้างค่าตกค้างจากการถดถอย:

ค่าความแปรปรวนของค่าที่ทำนายได้จะพบได้ในแนวทแยงหลักของเมทริกซ์ความแปรปรวนร่วมของค่าที่ทำนายได้:

โดยที่Pคือเมทริกซ์การฉายภาพและs 2คือความแปรปรวนของตัวอย่าง[ 10 ] เมทริกซ์ทั้งหมดมีขนาดใหญ่มาก องค์ประกอบแนวทแยงมุมสามารถคำนวณแยกกันได้ดังนี้:

โดยที่X iคือ แถว ที่ iของเมทริกซ์X

สถิติตัวอย่าง

เมื่อใช้ ค่าส่วนเหลือเหล่านี้ เราสามารถประมาณค่าความแปรปรวนของตัวอย่างโดยใช้ สถิติ ไคกำลังสองแบบลดรูปได้ :

ตัวหารnpคือระดับความเป็นอิสระทางสถิติปริมาณแรกคือค่าประมาณ OLS สำหรับσ² ในขณะที่ปริมาณที่สองคือค่าประมาณ MLE สำหรับσ² ตัวประมาณทั้งสองค่อนข้างคล้ายกันในตัวอย่างขนาดใหญ่ ตัวประมาณแรกจะไม่เอนเอียง เสมอ ในขณะที่ตัวประมาณที่สองจะเอนเอียงแต่มีค่าความคลาดเคลื่อนกำลังสองเฉลี่ย ที่เล็กกว่า ในทางปฏิบัติถูกใช้บ่อยกว่า เนื่องจากสะดวกกว่าสำหรับการทดสอบสมมติฐาน รากที่สองของเรียกว่า ค่าความคลาดเคลื่อนมาตรฐาน ของการถดถอย[ 11 ] ค่าความ คลาดเคลื่อนมาตรฐานของการถดถอย [ 12 ] [ 13 ]หรือค่าความคลาดเคลื่อนมาตรฐานของสมการ[ 9 ]

โดยทั่วไปแล้ว การประเมินความเหมาะสมของแบบจำลองการถดถอย OLS จะทำโดยการเปรียบเทียบว่าความแปรปรวนเริ่มต้นในตัวอย่างจะลดลงได้มากน้อยเพียงใดเมื่อทำการถดถอยกับX ค่าสัมประสิทธิ์การกำหนดถูกกำหนดให้เป็นอัตราส่วนของความแปรปรวนที่ "อธิบายได้" ต่อความแปรปรวน "ทั้งหมด" ของตัวแปรตามyในกรณีที่ผลรวมกำลังสองของการถดถอยเท่ากับผลรวมกำลังสองของค่าตกค้าง: [ 14 ]

โดยที่ TSS คือผลรวมกำลังสองทั้งหมดของตัวแปรตามและคือ เมทริกซ์ n × nที่ประกอบด้วยเลข 1 ทั้งหมด ( คือเมทริกซ์ศูนย์กลางซึ่งเทียบเท่ากับการถดถอยบนค่าคงที่ โดยจะลบค่าเฉลี่ยออกจากตัวแปร) เพื่อให้มีความหมาย เมทริกซ์Xของข้อมูลเกี่ยวกับตัวแปรอิสระจะต้องมีเวกเตอร์คอลัมน์ที่ประกอบด้วยเลข 1 ทั้งหมดเพื่อแทนค่าคงที่ซึ่งสัมประสิทธิ์ของมันคือค่าจุดตัดของการถดถอย ในกรณีนั้นจะมีค่าอยู่ระหว่าง 0 ถึง 1 เสมอ โดยค่าที่ใกล้เคียงกับ 1 แสดงถึงความเหมาะสมที่ ดี

แบบจำลองการถดถอยเชิงเส้นอย่างง่าย

ถ้าเมทริกซ์ข้อมูลXประกอบด้วยตัวแปรเพียงสองตัว คือ ค่าคงที่และตัวแปรอิสระx iเราจะเรียกว่า "แบบจำลองการถดถอยอย่างง่าย" กรณีนี้มักถูกกล่าวถึงในชั้นเรียนสถิติเบื้องต้น เนื่องจากมีสูตรที่ง่ายกว่ามาก เหมาะสำหรับการคำนวณด้วยมือ พารามิเตอร์มักจะแสดงด้วย( α , β ) :

ในกรณีนี้ ค่าประมาณกำลังสองน้อยที่สุดได้มาจากสูตรอย่างง่าย

อนุพันธ์ทางเลือก

ในส่วนก่อนหน้านี้ ตัวประมาณค่ากำลังสองน้อยที่สุดได้มาจากการหาค่าที่ทำให้ผลรวมของกำลังสองของส่วนเหลือของแบบจำลองมีค่าน้อยที่สุด อย่างไรก็ตาม ยังสามารถหาตัวประมาณค่าเดียวกันนี้ได้จากวิธีการอื่นๆ ในทุกกรณี สูตรสำหรับตัวประมาณค่า OLS ยังคงเหมือนเดิม คือ^ β = ( X T X ) −1 X T y ; ความแตกต่างเพียงอย่างเดียวคือวิธีการตีความผลลัพธ์นี้

การฉายภาพ

การประมาณค่าแบบ OLS สามารถมองได้ว่าเป็นการฉายภาพลงบนพื้นที่เชิงเส้นที่ครอบคลุมโดยตัวแปรอิสระ (ในที่นี้และ แต่ละ ค่า หมายถึงคอลัมน์ของเมทริกซ์ข้อมูล)
วิธีการกำลังสองน้อยที่สุดคือการฉายภาพของ y ลงบน col(X) สำหรับการสังเกตสามครั้ง; ŷ = Xβ ให้ค่าที่เหมาะสม และ y − ŷ คือค่าความคลาดเคลื่อน

สำหรับนักคณิตศาสตร์ OLS คือคำตอบโดยประมาณของระบบสมการเชิงเส้นที่มีตัวแปรเกินจำนวนที่กำหนดyโดยที่βคือตัวแปรที่ไม่ทราบค่า สมมติว่าระบบนี้ไม่สามารถหาคำตอบที่แน่นอนได้ (จำนวนสมการnมีมากกว่าจำนวนตัวแปรที่ไม่ทราบค่าp มาก ) เรากำลังมองหาคำตอบที่ให้ค่าความคลาดเคลื่อนน้อยที่สุดระหว่างด้านขวาและด้านซ้ายของสมการ กล่าวอีกนัยหนึ่ง เรากำลังมองหาคำตอบที่สอดคล้องกับเงื่อนไขต่อไปนี้

โดยที่·คือ นอร์มL 2 มาตรฐาน ในปริภูมิยุคลิดnมิติR nปริมาณที่ทำนายได้เป็นเพียงการรวมเชิงเส้นบางอย่างของเวกเตอร์ของตัวแปรอิสระ ดังนั้น เวกเตอร์ส่วนเหลือyจะมีความยาวน้อยที่สุดเมื่อyถูกฉายแบบตั้งฉากไปยังปริภูมิย่อยเชิงเส้นที่เกิดจากคอลัมน์ของXตัวประมาณค่า OLS ในกรณีนี้สามารถตีความได้ว่าเป็นสัมประสิทธิ์ของการแยกส่วนเวกเตอร์ของ^ y = Pyตามฐานของ X

กล่าวอีกนัยหนึ่ง สมการความชัน ณ จุดต่ำสุดสามารถเขียนได้ดังนี้:

การตีความเชิงเรขาคณิตของสมการเหล่านี้คือ เวกเตอร์ของค่าความคลาดเคลื่อนนั้นตั้งฉากกับปริภูมิคอลัมน์ของXเนื่องจากผลคูณดอทมีค่าเท่ากับศูนย์สำหรับเวกเตอร์คอนฟอร์มอลใดๆvซึ่งหมายความว่าเป็นเวกเตอร์ที่สั้นที่สุดในบรรดาเวกเตอร์ที่เป็นไปได้ทั้งหมดนั่นคือ ความแปรปรวนของค่าความคลาดเคลื่อนมีค่าน้อยที่สุดเท่าที่จะเป็นไปได้ ดังแสดงในภาพด้านขวา

เมื่อนำเมทริกซ์K มาใช้ โดยสมมติว่าเมทริกซ์นั้นไม่เป็นเมทริกซ์เอกฐาน และK T X = 0 (ดูการฉายภาพเชิงตั้งฉาก ) เวกเตอร์ส่วนเหลือควรเป็นไปตามสมการต่อไปนี้:

สมการและวิธีการแก้ปัญหาของวิธีกำลังสองน้อยที่สุดเชิงเส้น สามารถอธิบายได้ดังนี้:

อีกวิธีหนึ่งในการมองเรื่องนี้คือการพิจารณาเส้นถดถอยว่าเป็นค่าเฉลี่ยถ่วงน้ำหนักของเส้นที่ผ่านจุดสองจุดใดๆ ในชุดข้อมูล[ 15 ]แม้ว่าวิธีการคำนวณแบบนี้จะใช้ทรัพยากรการคำนวณมากกว่า แต่ก็ช่วยให้เข้าใจ OLS ได้ดีขึ้น

ความน่าจะเป็นสูงสุด

ตัวประมาณค่า OLS เหมือนกับตัวประมาณค่าความน่าจะเป็นสูงสุด (MLE) ภายใต้สมมติฐานความปกติของเทอมความคลาดเคลื่อน[ 16 ] [พิสูจน์]สมมติฐานความปกตินี้มีความสำคัญทางประวัติศาสตร์ เนื่องจากเป็นพื้นฐานสำหรับงานในช่วงแรกในการวิเคราะห์การถดถอยเชิงเส้นโดยYuleและPearsonจากคุณสมบัติของ MLE เราสามารถอนุมานได้ว่าตัวประมาณค่า OLS มีประสิทธิภาพเชิงอะซิมโทติก (ในแง่ของการบรรลุขอบเขต Cramér–Raoสำหรับความแปรปรวน) หากสมมติฐานความปกติเป็นไปตามเงื่อนไข[ 17 ]

วิธีโมเมนต์ทั่วไป

ใน กรณีที่ตัวแปรสุ่มเป็นอิสระและมีการกระจาย เหมือนกัน (iid)ตัวประมาณค่า OLS สามารถมองได้ว่าเป็น ตัวประมาณค่า GMMที่เกิดขึ้นจากเงื่อนไขโมเมนต์

เงื่อนไขโมเมนต์เหล่านี้ระบุว่าตัวแปรอิสระควรไม่มีความสัมพันธ์กับค่าความคลาดเคลื่อน เนื่องจากx iเป็น เวกเตอร์ p มิติจำนวนเงื่อนไขโมเมนต์จึงเท่ากับมิติของเวกเตอร์พารามิเตอร์βดังนั้นระบบจึงสามารถระบุได้อย่างแม่นยำ นี่คือกรณี GMM แบบคลาสสิกที่เรียกว่า เมื่อตัวประมาณค่าไม่ขึ้นอยู่กับการเลือกเมทริกซ์ถ่วงน้ำหนัก

โปรดทราบว่าสมมติฐานความเป็นอิสระอย่างเข้มงวดดั้งเดิมE[ ε i | x i ] = 0 บ่งบอกถึงเงื่อนไขโมเมนต์ที่ซับซ้อนกว่าที่กล่าวไว้ข้างต้นมาก โดยเฉพาะอย่างยิ่ง สมมติฐานนี้หมายความว่าสำหรับฟังก์ชันเวกเตอร์ƒ ใดๆ เงื่อนไขโมเมนต์E[ ƒ ( x iε i ] = 0จะเป็นจริง อย่างไรก็ตาม สามารถแสดงได้โดยใช้ทฤษฎีบทเกาส์-มาร์คอฟว่าตัวเลือกฟังก์ชันƒ ที่เหมาะสมที่สุด คือการเลือกƒ ( x ) = xซึ่งส่งผลให้ได้สมการโมเมนต์ที่แสดงไว้ข้างต้น

ข้อสมมติฐาน

มีกรอบการทำงานที่แตกต่างกันหลายแบบที่ สามารถนำ แบบจำลองการถดถอยเชิงเส้นมาใช้เพื่อให้เทคนิค OLS สามารถใช้งานได้ แต่ละกรอบการทำงานให้สูตรและผลลัพธ์ที่เหมือนกัน ความแตกต่างเพียงอย่างเดียวคือการตีความและข้อสมมติที่ต้องกำหนดเพื่อให้วิธีการให้ผลลัพธ์ที่มีความหมาย การเลือกกรอบการทำงานที่เหมาะสมนั้นขึ้นอยู่กับลักษณะของข้อมูลและงานการอนุมานที่ต้องดำเนินการเป็นส่วนใหญ่

หนึ่งในความแตกต่างในการตีความคือการพิจารณาตัวแปรอิสระว่าเป็นตัวแปรสุ่มหรือเป็นค่าคงที่ที่กำหนดไว้ล่วงหน้า ในกรณีแรก ( การออกแบบแบบสุ่ม ) ตัวแปรอิสระxᵢจะถูกสุ่มและได้มาพร้อมกับyᵢ จากประชากรบางกลุ่มเช่นเดียวกับการศึกษาเชิงสังเกตวิธีนี้ช่วยให้สามารถศึกษาคุณสมบัติเชิงอะซิมโทติกของตัวประมาณค่าได้อย่างเป็นธรรมชาติมากขึ้น ในการตีความอีกแบบหนึ่ง ( การออกแบบแบบคงที่ ) ตัวแปรอิสระXจะถูกมองว่าเป็นค่าคงที่ที่ทราบแล้วซึ่งกำหนดโดยการออกแบบและyจะถูกสุ่มโดยมีเงื่อนไขตามค่าของXเช่นเดียวกับการทดลองในทางปฏิบัติ ความแตกต่างนี้มักไม่สำคัญ เนื่องจาก1การประมาณค่าและการอนุมานจะดำเนินการโดยมีเงื่อนไขตามXผลลัพธ์ทั้งหมดที่กล่าวไว้ในบทความนี้อยู่ภายใต้กรอบการออกแบบแบบสุ่ม

แบบจำลองคลาสสิกมุ่งเน้นไปที่การประมาณค่าและการอนุมาน "ตัวอย่างจำกัด" ซึ่งหมายความว่าจำนวนการสังเกตnนั้นคงที่ ซึ่งแตกต่างจากแนวทางอื่นๆ ที่ศึกษาพฤติกรรมเชิงอะซิปโทติกของ OLS และศึกษาพฤติกรรมที่จำนวนตัวอย่างมาก ในการพิสูจน์ความไม่เอนเอียงของตัวประมาณค่า OLS ในตัวอย่างจำกัด เราต้องมีข้อสมมติดังต่อไปนี้

ตัวอย่างของการถดถอยพหุนามกำลังสาม ซึ่งเป็นประเภทหนึ่งของการถดถอยเชิงเส้น แม้ว่าการถดถอยพหุนามจะปรับแบบจำลองเส้นโค้งให้เข้ากับข้อมูล แต่ใน ฐานะที่เป็นปัญหา การประมาณค่าทางสถิติแล้วมันเป็นเชิงเส้น ในแง่ที่ว่าฟังก์ชันความคาดหวังแบบมีเงื่อนไขเป็นเชิงเส้นในพารามิเตอร์ ที่ไม่ทราบค่า ซึ่งประมาณได้จากข้อมูลด้วยเหตุนี้ การถดถอยพหุนามจึงถือเป็นกรณีพิเศษของการถดถอยเชิงเส้นหลายตัวแปร
  • ความเป็นอิสระจากตัวแปรอิสระ ( Exogeneity ) หมายความว่า ตัวแปรอิสระจะไม่แปรผันร่วมกับค่าความคลาดเคลื่อน: ตัวอย่างเช่น จะต้องไม่มีตัวแปรที่ถูกละเว้นซึ่งแปรผันร่วมกับตัวแปรที่สังเกตได้และส่งผลต่อตัวแปรตอบสนอง อีกทางเลือกหนึ่ง (แต่เข้มงวดกว่า) ที่มักจำเป็นเมื่ออธิบายการถดถอยเชิงเส้นในสถิติทางคณิตศาสตร์คือ ตัวแปรทำนายxสามารถถือได้ว่าเป็นค่าคงที่ แทนที่จะเป็นตัวแปรสุ่มรูปแบบที่เข้มงวดกว่านี้หมายความว่า ตัวอย่างเช่น ตัวแปรทำนายนั้นถือว่าปราศจากข้อผิดพลาด กล่าวคือ ไม่ปนเปื้อนด้วยข้อผิดพลาดในการวัด แม้ว่าสมมติฐานนี้จะไม่สมจริงในหลายกรณี แต่การละทิ้งสมมติฐานนี้จะนำไปสู่แบบจำลองที่ซับซ้อนมากขึ้น เช่นแบบจำลองข้อผิดพลาดในตัวแปรแบบจำลองตัวแปรเครื่องมือและอื่นๆ
  • ความเป็นเส้นตรงหรือการกำหนดค่าที่ถูกต้องหมายความว่า ค่าเฉลี่ยของตัวแปรตอบสนองเป็นผลรวมเชิงเส้นของพารามิเตอร์ (สัมประสิทธิ์การถดถอย) และตัวแปรทำนาย โปรดทราบว่าข้อสมมติฐานนี้มีความเข้มงวดน้อยกว่าที่อาจดูเหมือนในตอนแรก เนื่องจากตัวแปรทำนายถูกมองว่าเป็นค่าคงที่ (ดูด้านบน) ความเป็นเส้นตรงจึงเป็นเพียงข้อจำกัดของพารามิเตอร์เท่านั้น ตัวแปรทำนายเองสามารถแปลงรูปได้ตามอำเภอใจ และในความเป็นจริงสามารถเพิ่มตัวแปรทำนายพื้นฐานเดียวกันได้หลายชุด โดยแต่ละชุดถูกแปลงรูปแตกต่างกัน เทคนิคนี้ใช้ ตัวอย่างเช่น ในการถดถอยพหุนามซึ่งใช้การถดถอยเชิงเส้นเพื่อปรับตัวแปรตอบสนองให้เป็น ฟังก์ชัน พหุนาม ตามอำเภอใจ (จนถึงระดับที่กำหนด) ของตัวแปรทำนาย ด้วยความยืดหยุ่นมากเช่นนี้ โมเดลเช่นการถดถอยพหุนามมักจะมี "พลังมากเกินไป" กล่าวคือ มีแนวโน้มที่จะปรับให้เข้ากับข้อมูลมากเกินไป ส่งผลให้โดย ทั่วไปต้องใช้ การปรับค่า บางอย่าง เพื่อป้องกันไม่ให้ได้ผลลัพธ์ที่ไม่สมเหตุสมผลจากกระบวนการประมาณค่า ตัวอย่างที่พบได้ทั่วไป ได้แก่การถดถอยแบบริดจ์ (ridge regression ) และการถดถอยแบบลาโซ (lasso regression) นอกจากนี้ยังสามารถใช้การถดถอยเชิงเส้น แบบเบย์เซียน (Bayesian linear regression)ซึ่งโดยธรรมชาติแล้วค่อนข้างจะไม่มีปัญหาเรื่องการโอเวอร์ฟิตติ้ง (overfitting) (อันที่จริงการถดถอยแบบริดจ์และการถดถอยแบบลาโซ สามารถมองได้ว่าเป็นกรณีพิเศษของการถดถอยเชิงเส้นแบบเบย์เซียน โดยมีการกำหนดการ กระจายความน่าจะเป็นล่วงหน้า (prior distribution ) เฉพาะบางประเภทให้กับสัมประสิทธิ์การถดถอย)
  • การแสดงภาพความแปรปรวนที่ไม่คงที่ในแผนภาพกระจายเทียบกับค่าประมาณแบบสุ่ม 100 ค่าโดยใช้ Matlab
    ความแปรปรวนคงที่หรือ โฮโมสเคดาสติซิตี้หมายความว่า ความแปรปรวนของค่าความคลาดเคลื่อนไม่ขึ้นอยู่กับค่าของตัวแปรทำนายดังนั้น ความแปรปรวนของค่าตอบสนองสำหรับค่าคงที่ของตัวแปรทำนายจะเท่ากันไม่ว่าค่าตอบสนองจะมากหรือน้อยเพียงใดก็ตาม อย่างไรก็ตาม บ่อยครั้งที่ไม่ใช่เช่นนั้น เพราะตัวแปรที่มีค่าเฉลี่ยมากมักจะมีความแปรปรวนมากกว่าตัวแปรที่มีค่าเฉลี่ยน้อย ตัวอย่างเช่น บุคคลที่มีรายได้ตามที่คาดการณ์ไว้ 100,000 ดอลลาร์ อาจมีรายได้จริง 80,000 หรือ 120,000 ดอลลาร์ได้ง่ายๆ กล่าวคือ ค่าเบี่ยงเบนมาตรฐานประมาณ 20,000 ดอลลาร์ ในขณะที่อีกคนหนึ่งที่มีรายได้ตามที่คาดการณ์ไว้ 10,000 ดอลลาร์ มีโอกาสน้อยที่จะมีค่าเบี่ยงเบนมาตรฐาน 20,000 ดอลลาร์เท่ากัน เพราะนั่นหมายความว่ารายได้จริงของพวกเขาอาจแตกต่างกันไปตั้งแต่ -10,000 ถึง 30,000 ดอลลาร์ (อันที่จริง ดังที่แสดงให้เห็น ในหลายกรณี—ซึ่งมักจะเป็นกรณีเดียวกันกับที่สมมติฐานเรื่องความคลาดเคลื่อนมีการกระจายแบบปกติไม่เป็นจริง—ค่าความแปรปรวนหรือค่าเบี่ยงเบนมาตรฐานควรจะถูกทำนายว่าแปรผันตรงกับค่าเฉลี่ย มากกว่าที่จะเป็นค่าคงที่) การขาดความแปรปรวนคงที่เรียกว่า ความแปรปรวนไม่คงที่ในการตรวจสอบสมมติฐานนี้ สามารถตรวจสอบกราฟแสดงค่าความคลาดเคลื่อนเทียบกับค่าที่ทำนายได้ (หรือค่าของตัวทำนายแต่ละตัว) เพื่อหา "ปรากฏการณ์การกระจายแบบพัด" (เช่น การกระจายในแนวตั้งที่เพิ่มขึ้นหรือลดลงเมื่อเคลื่อนจากซ้ายไปขวาในกราฟ) นอกจากนี้ยังสามารถตรวจสอบกราฟแสดงค่าความคลาดเคลื่อนสัมบูรณ์หรือค่าความคลาดเคลื่อนยกกำลังสองเทียบกับค่าที่ทำนายได้ (หรือตัวทำนายแต่ละตัว) เพื่อหาแนวโน้มหรือความโค้งได้อีกด้วย สามารถใช้การทดสอบอย่างเป็นทางการได้เช่นกัน ดูที่ ความแปรปรวนไม่คงที่ การมีอยู่ของความแปรปรวน ไม่คงที่ จะส่งผลให้มีการใช้ค่าประมาณ "เฉลี่ย" โดยรวมของความแปรปรวนแทนที่จะเป็นค่าประมาณที่คำนึงถึงโครงสร้างความแปรปรวนที่แท้จริง สิ่งนี้ส่งผลให้ ค่าประมาณพารามิเตอร์มีความแม่นยำน้อยลง (แต่ในกรณีของวิธีกำลังสองน้อยที่สุดแบบธรรมดา จะไม่เกิดอคติ) และค่าความคลาดเคลื่อนมาตรฐานมีอคติ ทำให้การทดสอบและการประมาณช่วงความเชื่อมั่นผิดพลาด ค่าความคลาดเคลื่อนกำลังสองเฉลี่ยของแบบจำลองก็จะผิดพลาดเช่นกัน เทคนิคการประมาณค่าต่างๆ รวมถึงวิธีกำลังสองน้อยที่สุดแบบถ่วงน้ำหนักและการใช้ค่าความคลาดเคลื่อนมาตรฐานที่สอดคล้องกับความแปรปรวนที่ไม่คงที่ สามารถจัดการกับความแปรปรวนที่ไม่คงที่ได้อย่างค่อนข้างทั่วไป เทคนิค การถดถอยเชิงเส้นแบบเบย์เซียนก็สามารถใช้ได้เช่นกันเมื่อสมมติว่าความแปรปรวนเป็นฟังก์ชันของค่าเฉลี่ย นอกจากนี้ ในบางกรณีก็สามารถแก้ไขปัญหาได้โดยการแปลงตัวแปรตอบสนอง (เช่น การหาค่าลอการิทึมของตัวแปรตอบสนองโดยใช้แบบจำลองการถดถอยเชิงเส้น ซึ่งหมายความว่าตัวแปรตอบสนองเองมีการกระจายแบบลอการิทึมปกติแทนที่จะเป็นการกระจายแบบปกติ )
เพื่อตรวจสอบการละเมิดข้อสมมติฐานเรื่องความเป็นเส้นตรง ความแปรปรวนคงที่ และความเป็นอิสระของข้อผิดพลาดภายในแบบจำลองการถดถอยเชิงเส้น โดยทั่วไปแล้วจะนำค่าส่วนเหลือมาพล็อตเทียบกับค่าที่ทำนายได้ (หรือตัวแปรทำนายแต่ละตัว) การกระจายตัวของจุดที่ดูเหมือนสุ่มรอบเส้นกึ่งกลางแนวนอนที่ 0 นั้นเป็นอุดมคติ แต่ก็ไม่สามารถตัดความเป็นไปได้ของการละเมิดบางประเภทออกไปได้ เช่น ความสัมพันธ์ อัตโนมัติในข้อผิดพลาด หรือความสัมพันธ์ของข้อผิดพลาดกับตัวแปรอิสระหนึ่งตัวหรือมากกว่านั้น
  • ความคลาดเคลื่อนที่ไม่สัมพันธ์กัน สมมติฐานนี้ถือว่าความคลาดเคลื่อนของตัวแปรตอบสนองไม่สัมพันธ์กันบางวิธี เช่น วิธีการกำลังสองน้อยที่สุดแบบทั่วไปสามารถจัดการกับความคลาดเคลื่อนที่สัมพันธ์กันได้ แม้ว่าโดยทั่วไปแล้วจะต้องการข้อมูลมากกว่าอย่างมาก เว้นแต่จะ มีการใช้ การปรับค่า บางอย่าง เพื่อปรับแบบจำลองให้สันนิษฐานว่าความคลาดเคลื่อนไม่สัมพันธ์กันการถดถอยเชิงเส้นแบบเบย์เซียนเป็นวิธีการทั่วไปในการจัดการกับปัญหานี้ความเป็นอิสระทางสถิติ อย่างสมบูรณ์ เป็นเงื่อนไขที่เข้มงวดกว่าเพียงแค่การไม่มีความสัมพันธ์ และมักไม่จำเป็น แม้ว่าจะหมายถึงความเป็นอิสระของค่าเฉลี่ยก็ตาม
  • การขาดความสัมพันธ์เชิงเส้นที่สมบูรณ์แบบในตัวแปรทำนาย สำหรับวิธีการประมาณค่ากำลังสองน้อยที่สุด มาตรฐาน เมทริกซ์การออกแบบ Xต้องมีอันดับคอลัมน์ เต็ม p : [ 18 ]หากสมมติฐานนี้ถูกละเมิดความสัมพันธ์เชิงเส้น ที่สมบูรณ์แบบ จะเกิดขึ้นในตัวแปรทำนาย ซึ่งหมายความว่ามีความสัมพันธ์เชิงเส้นระหว่างตัวแปรทำนายสองตัวขึ้นไป ความสัมพันธ์เชิงเส้นอาจเกิดจากการทำซ้ำตัวแปรในข้อมูลโดยไม่ได้ตั้งใจ การใช้การแปลงเชิงเส้นของตัวแปรพร้อมกับตัวแปรดั้งเดิม (เช่น การวัดอุณหภูมิเดียวกันที่แสดงในหน่วยฟาเรนไฮต์และเซลเซียส) หรือการรวมเชิงเส้นของตัวแปรหลายตัวในแบบจำลอง เช่น ค่าเฉลี่ยของตัวแปรเหล่านั้น นอกจากนี้ยังอาจเกิดขึ้นได้หากมีข้อมูลน้อยเกินไปเมื่อเทียบกับจำนวนพารามิเตอร์ที่จะประมาณค่า (เช่น จุดข้อมูลน้อยกว่าสัมประสิทธิ์การถดถอย) การละเมิดสมมติฐานนี้อย่างใกล้เคียง ซึ่งตัวแปรทำนายมีความสัมพันธ์กันสูงแต่ไม่สมบูรณ์แบบ สามารถลดความแม่นยำของการประมาณค่าพารามิเตอร์ได้ (ดูปัจจัยการขยายตัวของความแปรปรวน ) ในกรณีที่มีความสัมพันธ์เชิงเส้นสมบูรณ์แบบ เวกเตอร์พารามิเตอร์βจะไม่สามารถระบุได้ — ไม่มีคำตอบที่ไม่ซ้ำกัน ในกรณีเช่นนี้ จะสามารถระบุพารามิเตอร์ได้เพียงบางส่วนเท่านั้น (กล่าวคือ ค่าของพารามิเตอร์เหล่านั้นสามารถประมาณได้เฉพาะภายในปริภูมิย่อยเชิงเส้นบางส่วนของปริภูมิพารามิเตอร์ทั้งหมดR pเท่านั้น) ดูการถดถอยกำลังสองน้อยที่สุดบางส่วนวิธีการสำหรับการปรับแบบจำลองเชิงเส้นที่มีความสัมพันธ์เชิงเส้นได้รับการพัฒนาแล้ว[ 19 ] [ 20 ] [ 21 ] [ 22 ]ซึ่งบางวิธีต้องใช้สมมติฐานเพิ่มเติม เช่น "ความเบาบางของผลกระทบ" — กล่าวคือ ผลกระทบส่วนใหญ่มีค่าเป็นศูนย์ โปรดทราบว่าอัลกอริธึมแบบวนซ้ำที่มีค่าใช้จ่ายในการคำนวณสูงกว่าสำหรับการประมาณค่าพารามิเตอร์ เช่น ที่ใช้ในแบบจำลองเชิงเส้นทั่วไปจะไม่ประสบปัญหาดังกล่าว

การละเมิดข้อสมมติเหล่านี้อาจส่งผลให้การประมาณค่าβผิดพลาด ค่าความคลาดเคลื่อนมาตรฐานผิดพลาด ช่วงความเชื่อมั่นไม่น่าเชื่อถือ และการทดสอบนัยสำคัญไม่น่าเชื่อถือ นอกจากข้อสมมติเหล่านี้แล้ว คุณสมบัติทางสถิติอื่นๆ ของข้อมูลยังส่งผลกระทบอย่างมากต่อประสิทธิภาพของวิธีการประมาณค่าต่างๆ ด้วย:

  • ความสัมพันธ์ทางสถิติระหว่างค่าความคลาดเคลื่อนและตัวแปรอิสระมีบทบาทสำคัญในการพิจารณาว่ากระบวนการประมาณค่ามีคุณสมบัติการสุ่มตัวอย่างที่พึงประสงค์หรือไม่ เช่น การไม่ลำเอียงและความสอดคล้อง
  • การจัดเรียงหรือการกระจายความน่าจะเป็นของตัวแปรทำนายxมีอิทธิพลอย่างมากต่อความแม่นยำของการประมาณค่าβการสุ่มตัวอย่างและการออกแบบการทดลอง เป็นสาขาย่อยที่มีการพัฒนาอย่างสูงในสถิติ ซึ่งให้แนวทางในการรวบรวม ข้อมูลในลักษณะที่จะทำให้ได้ค่าประมาณβที่ แม่นยำ

คุณสมบัติ

คุณสมบัติของตัวอย่างจำกัด

ประการแรก ภายใต้ สมมติฐาน ความเป็นอิสระที่เข้มงวดตัวประมาณ OLS และs 2จะไม่มีอคติหมายความว่าค่าที่คาดหวังจะตรงกับค่าจริงของพารามิเตอร์: [ 23 ] [พิสูจน์]

หากเงื่อนไขความเป็นตัวแปรอิสระอย่างเคร่งครัดไม่เป็นจริง (เช่นเดียวกับ แบบจำลอง อนุกรมเวลา หลายแบบ ที่ถือว่าความเป็นตัวแปรอิสระเกิดขึ้นเฉพาะกับตัวแปรในอดีตเท่านั้น แต่ไม่รวมถึงตัวแปรในอนาคต) ตัวประมาณค่าเหล่านี้จะมีความคลาดเคลื่อนในตัวอย่างที่มีขนาดจำกัด

เมทริกซ์ความแปรปรวนร่วม (หรือเรียกง่ายๆ ว่าเมทริกซ์ความแปรปรวนร่วม ) ของมีค่าเท่ากับ[ 24 ]

โดยเฉพาะอย่างยิ่ง ค่าความคลาดเคลื่อนมาตรฐานของสัมประสิทธิ์แต่ละตัวจะเท่ากับรากที่สองของ องค์ประกอบแนวทแยงมุม ที่ jของเมทริกซ์นี้ การประมาณค่าความคลาดเคลื่อนมาตรฐานนี้ได้มาจากการแทนที่ปริมาณที่ไม่ทราบค่าσ²ด้วยค่าประมาณดังนั้น

นอกจากนี้ยังสามารถแสดงได้อย่างง่ายดายว่าตัวประมาณค่าไม่มีความสัมพันธ์กับค่าตกค้างจากแบบจำลอง: [ 24 ]

ทฤษฎีบท Gauss –Markovระบุว่าภายใต้ สมมติฐาน ข้อผิดพลาดทรงกลม (นั่นคือ ข้อผิดพลาดควรจะไม่มีความสัมพันธ์กันและมีความแปรปรวนคงที่ ) ตัวประมาณค่าจะมีประสิทธิภาพในกลุ่มของตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียง ซึ่งเรียกว่าตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียงที่ดีที่สุด (BLUE) ประสิทธิภาพควรเข้าใจได้ราวกับว่าเราจะหาตัวประมาณค่าอื่น ๆที่เป็นเชิงเส้นในyและไม่เอนเอียง จากนั้น[ 24 ]

ในแง่ที่ว่านี่คือเมทริกซ์ที่ไม่เป็นลบแน่นอนทฤษฎีบทนี้พิสูจน์ความเหมาะสมที่สุดเฉพาะในกลุ่มของตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียง ซึ่งค่อนข้างจำกัด ขึ้นอยู่กับการกระจายของพจน์ความคลาดเคลื่อนεตัวประมาณค่าแบบไม่เชิงเส้นอื่นๆ อาจให้ผลลัพธ์ที่ดีกว่า OLS

สมมติว่าเป็นแบบปกติ

คุณสมบัติที่กล่าวมาทั้งหมดนั้นใช้ได้ไม่ว่าการกระจายตัวพื้นฐานของค่าความคลาดเคลื่อนจะเป็นอย่างไรก็ตาม อย่างไรก็ตาม หากคุณยินดีที่จะสมมติว่าสมมติฐานเรื่องความปกติเป็นจริง (นั่นคือε ~ N (0, σ 2 I n ) ) ก็สามารถระบุคุณสมบัติเพิ่มเติมของตัวประมาณค่า OLS ได้

ตัวประมาณค่ามีการกระจายแบบปกติ โดยมีค่าเฉลี่ยและความแปรปรวนตามที่ระบุไว้ก่อนหน้านี้: [ 25 ]

ตัวประมาณค่านี้เข้าถึงขอบเขต Cramér–Raoสำหรับแบบจำลอง และด้วยเหตุนี้จึงเหมาะสมที่สุดในกลุ่มของตัวประมาณค่าที่ไม่เอนเอียงทั้งหมด[ 17 ]โปรดทราบว่าแตกต่างจากทฤษฎีบท Gauss–Markovผลลัพธ์นี้สร้างความเหมาะสมที่สุดระหว่างตัวประมาณค่าเชิงเส้นและไม่เชิงเส้น แต่เฉพาะในกรณีของพจน์ข้อผิดพลาดที่มีการกระจายแบบปกติเท่านั้น

ตัวประมาณค่าs 2จะเป็นสัดส่วนกับการกระจายไคกำลังสอง : [ 26 ]

ความแปรปรวนของตัวประมาณนี้เท่ากับ2 σ 4 /( np )ซึ่งไม่ถึงขอบเขต Cramér–Raoที่2 σ 4 / nอย่างไรก็ตาม ได้มีการแสดงให้เห็นว่าไม่มีตัวประมาณที่ไม่เอนเอียงของσ 2ที่มีความแปรปรวนน้อยกว่าตัวประมาณs 2 [ 27 ] หากเรายินยอมให้มีตัวประมาณที่เอนเอียง และพิจารณาคลาสของตัวประมาณที่เป็นสัดส่วนกับผลรวมของกำลังสองของส่วนเหลือ (SSR) ของแบบจำลอง ตัวประมาณที่ดีที่สุด (ในแง่ของข้อผิดพลาดกำลังสองเฉลี่ย ) ในคลาสนี้จะเป็น~ σ 2 = SSR / ( np + 2)ซึ่งเอาชนะขอบเขต Cramér–Rao ได้แม้ในกรณีที่มีตัวแปรอิสระเพียงตัวเดียว ( p = 1 ) [ 28 ]

ยิ่งไปกว่านั้น ตัวประมาณค่าและs 2เป็นอิสระต่อกัน[ 29 ]ซึ่งเป็นข้อเท็จจริงที่มีประโยชน์เมื่อสร้างการทดสอบ t และ F สำหรับการถดถอย

ข้อสังเกตที่มีอิทธิพล

ดังที่กล่าวไว้ก่อนหน้านี้ ตัวประมาณค่าเป็นแบบเชิงเส้นในyซึ่งหมายความว่ามันแสดงถึงการรวมเชิงเส้นของตัวแปรตามy iน้ำหนักในการรวมเชิงเส้นนี้เป็นฟังก์ชันของตัวแปรอิสระXและโดยทั่วไปจะไม่เท่ากัน ข้อมูลที่มีน้ำหนักสูงเรียกว่าข้อมูลที่มีอิทธิพลเพราะมันมีผลกระทบต่อค่าของตัวประมาณค่ามากกว่า

เพื่อวิเคราะห์ว่าการสังเกตใดมีอิทธิพล เราจะลบ การสังเกตที่ j ที่เฉพาะเจาะจงออก และพิจารณาว่าปริมาณที่ประมาณการจะเปลี่ยนแปลงไปมากน้อยเพียงใด (คล้ายกับวิธีแจ็คไนฟ์ ) สามารถแสดงได้ว่าการเปลี่ยนแปลงในตัวประมาณ OLS สำหรับβจะเท่ากับ[ 30 ]

โดยที่h j = x j T ( X T X ) −1 x jคือ องค์ประกอบแนวทแยงมุมที่ jของเมทริกซ์หมวกPและx jคือเวกเตอร์ของตัวแปรถดถอยที่สอดคล้องกับ การสังเกตที่ jในทำนองเดียวกัน การเปลี่ยนแปลงในค่าที่ทำนายได้สำหรับ การสังเกตที่ jที่เกิดจากการละเว้นการสังเกตนั้นจากชุดข้อมูลจะเท่ากับ[ 30 ]

จากคุณสมบัติของเมทริกซ์หมวก0 ≤ h j ≤ 1และผลรวมของพวกมันเท่ากับpดังนั้นโดยเฉลี่ยแล้วh jp/nปริมาณh j เหล่านี้ เรียกว่าเลเวอเรจและการสังเกตที่มีค่าh j สูง เรียกว่าจุดเลเวอเรจ [ 31 ] โดยปกติแล้วการสังเกตที่มีค่าเลเวอเรจสูงควรได้รับการตรวจสอบอย่างละเอียดมากขึ้น ในกรณีที่อาจเป็นข้อผิดพลาด ค่าผิดปกติ หรือผิดปกติไปจากส่วนที่เหลือของชุดข้อมูล

การถดถอยแบบแบ่งส่วน

บางครั้งตัวแปรและพารามิเตอร์ที่เกี่ยวข้องในสมการถดถอยสามารถแบ่งออกเป็นสองกลุ่มได้อย่างมีเหตุผล ทำให้สมการถดถอยมีรูปแบบที่เหมาะสม

โดยที่X 1และX 2มีมิติn × p 1 , n × p 2และβ 1 , β 2เป็นเวก เตอร์ p 1 ×1 และp 2 ×1 โดยที่p 1 + p 2 = p

ทฤษฎีบทFrisch–Waugh–Lovellระบุว่าในการถดถอยนี้ ค่าตกค้างและค่าประมาณ OLS จะเหมือนกันในเชิงตัวเลขกับค่าตกค้างและค่าประมาณ OLS สำหรับβ 2ในการถดถอยต่อไปนี้: [ 32 ]

โดยที่M 1คือ เมทริก ซ์ ตัวทำลายล้างสำหรับตัวแปรถดถอยX 1

ทฤษฎีบทนี้สามารถนำไปใช้เพื่อพิสูจน์ผลลัพธ์ทางทฤษฎีได้หลายประการ ตัวอย่างเช่น การวิเคราะห์การถดถอยโดยมีค่าคงที่และตัวแปรอิสระอีกตัวหนึ่งนั้นเทียบเท่ากับการลบค่าเฉลี่ยของตัวแปรตามและตัวแปรอิสระ แล้วทำการวิเคราะห์การถดถอยอีกครั้งสำหรับตัวแปรที่ลบค่าเฉลี่ยแล้ว แต่ไม่รวมค่าคงที่

คุณสมบัติตัวอย่างขนาดใหญ่

ตัวประมาณค่ากำลังสองน้อยที่สุดเป็นค่าประมาณแบบจุดของพารามิเตอร์β ในแบบจำลองการถดถอยเชิงเส้น อย่างไรก็ตาม โดยทั่วไปแล้ว เรายังต้องการทราบว่าค่าประมาณเหล่านั้นใกล้เคียงกับค่าจริงของพารามิเตอร์มากน้อยเพียงใด กล่าวอีกนัยหนึ่ง เราต้องการสร้าง ค่าประมาณ แบบ ช่วง

เนื่องจากเราไม่ได้ตั้งสมมติฐานใดๆ เกี่ยวกับการกระจายตัวของพจน์ความคลาดเคลื่อนε iจึงเป็นไปไม่ได้ที่จะอนุมานการกระจายตัวของตัวประมาณค่าและอย่างไรก็ตาม เราสามารถใช้ทฤษฎีบทลิมิตกลางเพื่อหา คุณสมบัติ เชิงอะซิมโทติกของตัวประมาณ ค่าเหล่านี้ เมื่อขนาดตัวอย่างnเข้าสู่ค่าอนันต์ แม้ว่าขนาดตัวอย่างจะมีค่าจำกัด แต่โดยทั่วไปแล้วมักจะถือว่าnมีค่า "มากพอ" เพื่อให้การกระจายตัวที่แท้จริงของตัวประมาณค่า OLS ใกล้เคียงกับลิมิตเชิงอะซิมโทติก

เราสามารถแสดงได้ว่าภายใต้สมมติฐานของแบบจำลอง ตัวประมาณค่ากำลังสองน้อยที่สุดสำหรับβ นั้น มีความสอดคล้อง (กล่าวคือลู่เข้าสู่β ในความน่าจะเป็น ) และมีการแจกแจงปกติเชิงอะซิมโทติก: [พิสูจน์]

ที่ไหน

การอนุมาน

โดยใช้การแจกแจงเชิงอะซิมโทติกนี้ ช่วงความเชื่อมั่นสองด้านโดยประมาณสำหรับ องค์ประกอบที่ jของเวกเตอร์สามารถสร้างได้ดังนี้

  ที่ระดับความเชื่อมั่น1 −  α

โดยที่qแทนฟังก์ชันควอนไทล์ของการแจกแจงปกติมาตรฐาน และ jj คือองค์ประกอบ แนวทแยงมุมที่ jของเมทริกซ์

ในทำนองเดียวกัน ตัวประมาณค่ากำลังสองน้อยที่สุดสำหรับσ 2ก็มีความสอดคล้องและมีการแจกแจงแบบปกติเชิงอะซิมโทติก (โดยมีเงื่อนไขว่าโมเมนต์ที่สี่ของε iมีอยู่) พร้อมกับการแจกแจงแบบจำกัด

การแจกแจงเชิงอะซิมโทติกเหล่านี้สามารถใช้สำหรับการทำนาย การทดสอบสมมติฐาน การสร้างตัวประมาณค่าอื่นๆ เป็นต้น ตัวอย่างเช่น พิจารณาปัญหาการทำนาย สมมติว่าเป็นจุดใดจุดหนึ่งภายในโดเมนของการแจกแจงของตัวแปรอิสระ และเราต้องการทราบว่าตัวแปรตอบสนองจะเป็นอย่างไร ณ จุดนั้น ค่าเฉลี่ยของตัวแปรตอบสนองคือปริมาณในขณะที่ตัวแปรตอบสนองที่ทำนายได้คือเห็นได้ชัดว่าตัวแปรตอบสนองที่ทำนายได้เป็นตัวแปรสุ่ม การแจกแจงของมันสามารถหาได้จากการแจกแจงของ:

ซึ่งช่วยให้สามารถสร้างช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของการตอบสนองได้:

  ที่ระดับความเชื่อมั่น1 −  α

การทดสอบสมมติฐาน

มีการทดสอบสมมติฐานสองแบบที่ใช้กันอย่างแพร่หลาย แบบแรกคือ เราต้องการทราบว่าสมการถดถอยที่ประมาณค่าได้นั้นดีกว่าการทำนายว่าค่าทั้งหมดของตัวแปรตอบสนองเท่ากับค่าเฉลี่ยของตัวอย่างหรือไม่ (ถ้าไม่เป็นเช่นนั้น ก็กล่าวได้ว่าไม่มีอำนาจในการอธิบาย) สมมติฐานหลักที่ว่าสมการถดถอยที่ประมาณค่าได้ไม่มีอำนาจในการอธิบาย จะถูกทดสอบโดยใช้การทดสอบ Fถ้าค่า F ที่คำนวณได้มีขนาดใหญ่พอที่จะเกินค่าวิกฤตสำหรับระดับนัยสำคัญที่เลือกไว้ล่วงหน้า สมมติฐานหลักจะถูกปฏิเสธ และสมมติฐานทางเลือกที่ว่าสมการถดถอยมีอำนาจในการอธิบาย จะถูกยอมรับ มิฉะนั้น สมมติฐานหลักที่ว่าสมการถดถอยไม่มีอำนาจในการอธิบายจะถูกยอมรับ

ประการที่สอง สำหรับตัวแปรอธิบายแต่ละตัวที่เราสนใจ เราต้องการทราบว่าค่าสัมประสิทธิ์ที่ประมาณการได้นั้นแตกต่างจากศูนย์อย่างมีนัยสำคัญหรือไม่ กล่าวคือ ตัวแปรอธิบายตัวนี้มีอำนาจในการอธิบายตัวแปรตอบสนองหรือไม่ สมมติฐานว่างคือค่าสัมประสิทธิ์ที่แท้จริงเป็นศูนย์ สมมติฐานนี้ได้รับการทดสอบโดยการคำนวณค่าสถิติ t ของค่าสัมประสิทธิ์ ซึ่งเป็นอัตราส่วนของค่าประมาณสัมประสิทธิ์ต่อค่าความคลาดเคลื่อนมาตรฐานหากค่าสถิติ t มากกว่าค่าที่กำหนดไว้ล่วงหน้า สมมติฐานว่างจะถูกปฏิเสธและพบว่าตัวแปรนั้นมีอำนาจในการอธิบาย โดยที่ค่าสัมประสิทธิ์แตกต่างจากศูนย์อย่างมีนัยสำคัญ มิเช่นนั้น สมมติฐานว่างที่ว่าค่าสัมประสิทธิ์ที่แท้จริงเป็นศูนย์จะถูกยอมรับ

นอกจากนี้ ยังใช้ การทดสอบ Chowเพื่อตรวจสอบว่ากลุ่มตัวอย่างย่อยสองกลุ่มมีค่าสัมประสิทธิ์ที่แท้จริงเหมือนกันหรือไม่ โดยจะเปรียบเทียบผลรวมของกำลังสองของค่าความคลาดเคลื่อนจากการถดถอยในแต่ละกลุ่มตัวอย่างย่อยและในชุดข้อมูลรวม โดยคำนวณค่าสถิติ F หากค่านี้เกินค่าวิกฤต จะปฏิเสธสมมติฐานหลักที่ว่าไม่มีความแตกต่างระหว่างกลุ่มตัวอย่างย่อยทั้งสองกลุ่ม มิเช่นนั้นจะยอมรับสมมติฐานหลักนั้น

การละเมิดข้อสมมติฐาน

แบบจำลองอนุกรมเวลา

ใน แบบจำลอง อนุกรมเวลาเราต้องการให้กระบวนการสุ่ม { x i , y i } เป็นแบบคงที่และเออร์โกดิกหาก { x i , y i } ไม่คงที่ ผลลัพธ์ OLS มักจะเอนเอียง เว้นแต่ว่า { x i , y i } จะมีการรวมตัวกัน[ 33 ]

เรายังคงต้องกำหนดให้ตัวแปรอิสระต้องเป็นตัวแปรภายนอกอย่างเคร่งครัด : E[ x i ε i ] = 0 สำหรับทุกi = 1, ..., nหากตัวแปรอิสระถูกกำหนดไว้ล่วงหน้า เท่านั้น OLS จะมีอคติในตัวอย่างที่มีขนาดจำกัด

สุดท้ายนี้ ข้อสมมติเกี่ยวกับความแปรปรวนจะอยู่ในรูปแบบของการกำหนดให้ { x i ε i } เป็นลำดับผลต่างมาร์ติงเกลโดย มีเมทริกซ์โมเมนต์อันดับสองจำกัดQ xxε ² = E[ ε i 2 x i x i T ]

การประมาณค่าแบบมีข้อจำกัด

สมมติว่าทราบแล้วว่าสัมประสิทธิ์ในการถดถอยเป็นไปตามระบบสมการเชิงเส้น

โดยที่Qเป็น เมทริกซ์ p × qที่มีอันดับเต็ม และcเป็น เวกเตอร์ q × 1 ของค่าคงที่ที่ทราบ โดยที่q < pในกรณีนี้ การประมาณค่ากำลังสองน้อยที่สุดเทียบเท่ากับการลดผลรวมของกำลังสองของส่วนเหลือของแบบจำลองภายใต้ข้อจำกัดAตัว ประมาณ ค่ากำลังสองน้อยที่สุดแบบมีข้อจำกัด (CLS)สามารถกำหนดได้ด้วยสูตรที่ชัดเจน: [ 34 ]

นิพจน์สำหรับตัวประมาณค่าแบบมีข้อจำกัดนี้ใช้ได้ตราบใดที่เมทริกซ์X T Xสามารถผกผันได้ สมมติไว้ตั้งแต่ต้นบทความนี้ว่าเมทริกซ์นี้มีอันดับเต็ม และได้กล่าวไว้ว่าเมื่อเงื่อนไขอันดับไม่เป็นไปตามที่กำหนดβจะไม่สามารถระบุได้ อย่างไรก็ตาม อาจเกิดขึ้นได้ว่าการเพิ่มข้อจำกัดAทำให้βสามารถระบุได้ ซึ่งในกรณีนี้เราต้องการหาสูตรสำหรับตัวประมาณค่า ตัวประมาณค่าเท่ากับ[ 35 ]

โดยที่Rเป็น เมทริกซ์ p × ( p  −  q ) ซึ่งเมทริกซ์[ QR ]ไม่เป็นเอกฐาน และR T Q = 0เมทริกซ์ดังกล่าวสามารถหาได้เสมอ แม้ว่าโดยทั่วไปแล้วจะไม่เป็นเอกลักษณ์ สูตรที่สองจะตรงกับสูตรแรกในกรณีที่X T Xสามารถผกผันได้[ 35 ]

ตัวอย่างพร้อมข้อมูลจริง

ชุดข้อมูลต่อไปนี้แสดงส่วนสูงและน้ำหนักเฉลี่ยของสตรีชาวอเมริกันอายุ 30-39 ปี (ที่มา: The World Almanac and Book of Facts, 1975 )

ความสูง (เมตร) 1.471.501.521.551.57
แผนภาพกระจายของข้อมูล แสดงให้เห็นว่าความสัมพันธ์นั้นโค้งเล็กน้อย แต่ใกล้เคียงกับเส้นตรง
น้ำหนัก (กก.) 52.2153.1254.4855.8457.20
ความสูง (เมตร) 1.601.631.651.681.70
น้ำหนัก (กก.) 58.5759.9361.2963.1164.47
ความสูง (เมตร) 1.731.751.781.801.83
น้ำหนัก (กก.) 66.2868.1069.9272.1974.46

เมื่อมีการสร้างแบบจำลองตัวแปรตามเพียงตัวเดียวแผนภาพกระจายจะแสดงรูปแบบและความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ นอกจากนี้ยังอาจเปิดเผยค่าผิดปกติ ความแปรปรวนที่ไม่คงที่ และแง่มุมอื่นๆ ของข้อมูลที่อาจทำให้การตีความแบบจำลองการถดถอยมีความซับซ้อน แผนภาพกระจายแสดงให้เห็นว่าความสัมพันธ์นั้นแข็งแกร่งและสามารถประมาณได้ด้วยฟังก์ชันกำลังสอง OLS สามารถจัดการกับความสัมพันธ์ที่ไม่เป็นเชิงเส้นได้โดยการแนะนำตัวแปรอิสระHEIGHT² แบบจำลองการ ถดถอยจึงกลายเป็นแบบจำลองเชิงเส้นหลายตัวแปร:

การถดถอยที่เหมาะสม

ผลลัพธ์จากโปรแกรมวิเคราะห์สถิติ ที่นิยมใช้ส่วนใหญ่ จะมีลักษณะคล้ายกับนี้:

วิธีกำลังสองน้อยที่สุด
ตัวแปรตามน้ำหนัก
ข้อสังเกต15

พารามิเตอร์ ค่า ข้อผิดพลาดมาตรฐานค่าสถิติ tค่า p

128.812816.30837.89860.0000
−143.162019.8332−7.21830.0000
61.96036.008410.31220.0000

อาร์20.9989 ค่าความคลาดเคลื่อนมาตรฐานของการถดถอย0.2516
ค่า R ปรับปรุง20.9987 แบบจำลองผลรวมกำลังสอง692.61
ความน่าจะเป็นล็อก1.0890 ผลรวมกำลังสองของส่วนเหลือ0.7595
สถิติเดอร์บิน-วัตสัน2.1013 ผลรวมกำลังสองทั้งหมด693.37
เกณฑ์อะไคเกะ0.2548 สถิติเอฟ5471.2
เกณฑ์ชวาร์ซ0.3964 ค่า p (ค่า F)0.0000

ในตารางนี้:

  • คอลัมน์Valueแสดงค่าประมาณกำลังสองน้อยที่สุดของพารามิเตอร์β j
  • คอลัมน์Std errorแสดงค่าความคลาดเคลื่อนมาตรฐานของการประมาณค่าสัมประสิทธิ์แต่ละค่า:
  • คอลัมน์ค่าสถิติ tและค่า pใช้ทดสอบว่าค่าสัมประสิทธิ์ใดๆ อาจเท่ากับศูนย์หรือไม่ ค่าสถิติ tคำนวณได้ง่ายๆ โดยใช้สูตร t = 1/(t - t) / (t - t ) ถ้าค่าความคลาดเคลื่อน ε มีการแจกแจงแบบปกติค่า tก็จะมีการแจกแจงแบบ Student-t ภายใต้เงื่อนไขที่อ่อนกว่า ค่า t จะมีการแจกแจงแบบปกติเชิงอะซิมโทติก ค่าt ที่สูง แสดงว่าสมมติฐานว่างสามารถถูกปฏิเสธได้ และค่าสัมประสิทธิ์ที่เกี่ยวข้องไม่ใช่ศูนย์ คอลัมน์ที่สองคือค่าpซึ่งแสดงผลลัพธ์ของการทดสอบสมมติฐานในรูปของระดับนัยสำคัญโดยทั่วไปแล้ว ค่า pที่น้อยกว่า 0.05 ถือเป็นหลักฐานว่าค่าสัมประสิทธิ์ของประชากรไม่ใช่ศูนย์
  • ค่า R-squaredคือค่าสัมประสิทธิ์การกำหนดที่บ่งชี้ความเหมาะสมของแบบจำลองการถดถอย ค่าสถิตินี้จะเท่ากับหนึ่งหากแบบจำลองมีความเหมาะสมสมบูรณ์ และเท่ากับศูนย์เมื่อตัวแปรอิสระX ไม่มีอำนาจในการอธิบายใดๆ เลย นี่คือค่าประมาณที่ไม่เป็นกลางของค่า R-squaredของประชากรและจะไม่ลดลงหากเพิ่มตัวแปรอิสระเพิ่มเติมเข้าไป แม้ว่าตัวแปรเหล่านั้นจะไม่มีความเกี่ยวข้องก็ตาม
  • ค่า R-squared ที่ปรับแล้ว (Adjusted R-squared)เป็นค่าที่ดัดแปลงเล็กน้อยจากค่า R-squared ทั่วไป โดยมีจุดประสงค์เพื่อลงโทษจำนวนตัวแปรอิสระที่มากเกินไปซึ่งไม่ได้เพิ่มพลังในการอธิบายของการถดถอย ค่าสถิตินี้จะมีค่าน้อยกว่าค่า R-squared ทั่วไปเสมอ และอาจลดลงเมื่อเพิ่มตัวแปรอิสระใหม่ และอาจมีค่าเป็นลบได้สำหรับแบบจำลองที่ไม่เหมาะสม
  • ค่าลอการิทึมความน่าจะเป็นคำนวณภายใต้สมมติฐานว่าความคลาดเคลื่อนมีการกระจายแบบปกติ แม้ว่าสมมติฐานนี้จะไม่สมเหตุสมผลนัก แต่สถิตินี้ก็ยังสามารถนำไปใช้ในการทดสอบลอการิทึมความน่าจะเป็นได้
  • สถิติเดอร์บิน-วัตสัน (Durbin–Watson statistic)ใช้ทดสอบว่ามีความสัมพันธ์แบบอนุกรมระหว่างค่าความคลาดเคลื่อนหรือไม่ โดยทั่วไปแล้ว ค่าที่น้อยกว่า 2 จะแสดงว่ามีความสัมพันธ์เชิงบวก
  • เกณฑ์ข้อมูล Akaikeและเกณฑ์ Schwarzต่างก็ใช้สำหรับการเลือกแบบจำลอง โดยทั่วไป เมื่อเปรียบเทียบแบบจำลองทางเลือกสองแบบ ค่าที่น้อยกว่าของเกณฑ์ใดเกณฑ์หนึ่งจะบ่งชี้ว่าแบบจำลองนั้นดีกว่า [ 36 ]
  • ค่าความคลาดเคลื่อนมาตรฐานของการถดถอยคือค่าประมาณของσซึ่งเป็นค่าความคลาดเคลื่อนมาตรฐานของพจน์ความคลาดเคลื่อน
  • ผลรวมกำลังสองทั้งหมดผลรวมกำลังสองของแบบจำลองและผลรวมกำลังสองของส่วนเหลือ บอกเรา ว่าความแปรปรวนเริ่มต้นในตัวอย่างนั้นถูกอธิบายโดยการถดถอยได้มากน้อยเพียงใด
  • สถิติ Fพยายามทดสอบสมมติฐานที่ว่าสัมประสิทธิ์ทั้งหมด (ยกเว้นค่าคงที่) เท่ากับศูนย์ สถิตินี้มี การกระจายแบบ F ( p–1 , n–p ) ภายใต้สมมติฐานว่างและสมมติฐานความปกติ และค่า p ของมันบ่งบอกถึงความน่าจะเป็นที่สมมติฐานนั้นเป็นจริง โปรดทราบว่าเมื่อความคลาดเคลื่อนไม่เป็นไปตามการกระจายแบบปกติ สถิตินี้จะใช้ไม่ได้ และ ควรใช้การทดสอบอื่นๆ เช่นการทดสอบ Waldหรือการทดสอบ LR แทน
แผนภาพส่วนเหลือ

การวิเคราะห์ด้วยวิธีกำลังสองน้อยที่สุดแบบธรรมดา มักจะรวมถึงการใช้แผนภาพวินิจฉัยที่ออกแบบมาเพื่อตรวจจับความเบี่ยงเบนของข้อมูลจากรูปแบบที่สมมติขึ้นของแบบจำลอง แผนภาพวินิจฉัยทั่วไปบางส่วนมีดังนี้:

  • ค่าความคลาดเคลื่อนเทียบกับตัวแปรอธิบายในแบบจำลอง ความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างตัวแปรเหล่านี้บ่งชี้ว่าความเป็นเชิงเส้นของฟังก์ชันค่าเฉลี่ยแบบมีเงื่อนไขอาจไม่เป็นจริง ระดับความแปรปรวนที่แตกต่างกันในค่าความคลาดเคลื่อนสำหรับระดับที่แตกต่างกันของตัวแปรอธิบายบ่งชี้ถึงความเป็นไปได้ของความแปรปรวนที่ไม่คงที่ (heteroscedasticity)
  • ค่าความคลาดเคลื่อนเทียบกับตัวแปรอธิบายที่ไม่ได้อยู่ในแบบจำลอง ความสัมพันธ์ใดๆ ระหว่างค่าความคลาดเคลื่อนกับตัวแปรเหล่านี้ จะบ่งชี้ว่าควรพิจารณารวมตัวแปรเหล่านี้ไว้ในแบบจำลอง
  • ค่าความคลาดเคลื่อนเทียบกับค่าที่คาดการณ์ไว้
  • เปรียบเทียบค่าความคลาดเคลื่อนกับค่าความคลาดเคลื่อนก่อนหน้า แผนภาพนี้อาจช่วยระบุความสัมพันธ์แบบอนุกรมในค่าความคลาดเคลื่อนได้

สิ่งสำคัญที่ควรพิจารณาเมื่อทำการอนุมานทางสถิติโดยใช้แบบจำลองการถดถอยคือวิธีการสุ่มตัวอย่างข้อมูล ในตัวอย่างนี้ ข้อมูลเป็นค่าเฉลี่ย ไม่ใช่การวัดค่าจากผู้หญิงแต่ละคน แบบจำลองมีความเหมาะสมดีมาก แต่ไม่ได้หมายความว่าน้ำหนักของผู้หญิงแต่ละคนสามารถทำนายได้อย่างแม่นยำสูงโดยอาศัยเพียงส่วนสูงของเธอเท่านั้น

ความไวต่อการปัดเศษ

ตัวอย่างนี้ยังแสดงให้เห็นว่าค่าสัมประสิทธิ์ที่กำหนดโดยการคำนวณเหล่านี้มีความอ่อนไหวต่อวิธีการเตรียมข้อมูล ความสูงที่ให้มาเดิมนั้นปัดเศษเป็นนิ้วที่ใกล้ที่สุด และได้ถูกแปลงและปัดเศษเป็นเซนติเมตรที่ใกล้ที่สุดแล้ว เนื่องจากตัวประกอบการแปลงคือ 1 นิ้วต่อ 2.54 เซนติเมตร การแปลงนี้จึงไม่แม่นยำ สามารถกู้คืนค่าหน่วยนิ้วเดิมได้โดยใช้ Round(x/0.0254) แล้วแปลงกลับเป็นหน่วยเมตริกโดยไม่ต้องปัดเศษ หากทำเช่นนี้ ผลลัพธ์จะเป็นดังนี้:

คอนสตความสูงความสูง2
แปลงเป็นหน่วยเมตริกโดยปัดเศษแล้ว 128.8128−143.16261.96033
แปลงเป็นหน่วยเมตริกโดยไม่ปัดเศษ 119.0205−131.507658.5046
ค่าความคลาดเคลื่อนจากการปรับแบบกำลังสอง สำหรับข้อมูลที่แปลงอย่างถูกต้องและไม่ถูกต้อง

การใช้สมการใดสมการหนึ่งเพื่อทำนายน้ำหนักของผู้หญิงที่มีความสูง 5 ฟุต 6 นิ้ว (1.6764 เมตร) จะได้ค่าที่ใกล้เคียงกัน คือ 62.94 กิโลกรัมเมื่อปัดเศษ และ 62.98 กิโลกรัมเมื่อไม่ปัดเศษ ดังนั้น ความแปรผันเล็กน้อยในข้อมูลจึงมีผลกระทบต่อค่าสัมประสิทธิ์ แต่มีผลกระทบต่อผลลัพธ์ของสมการเพียงเล็กน้อย

แม้ว่าสิ่งนี้อาจดูไม่เป็นอันตรายในช่วงกลางของช่วงข้อมูล แต่ก็อาจมีความสำคัญอย่างมากที่ค่าสุดขั้ว หรือในกรณีที่ใช้แบบจำลองที่ปรับให้เหมาะสมเพื่อคาดการณ์นอกช่วงข้อมูล ( การคาดการณ์ นอกช่วง )

ตัวอย่างนี้ชี้ให้เห็นถึงข้อผิดพลาดทั่วไป: ตัวอย่างนี้เป็นการใช้ OLS อย่างไม่ถูกต้อง ซึ่งโดยพื้นฐานแล้วต้องการให้ข้อผิดพลาดในตัวแปรอิสระ (ในกรณีนี้คือความสูง) เป็นศูนย์หรืออย่างน้อยก็มีค่าเล็กน้อย การปัดเศษเริ่มต้นให้ใกล้เคียงที่สุดเป็นนิ้ว บวกกับข้อผิดพลาดในการวัดจริงใด ๆ ก็ตาม ก่อให้เกิดข้อผิดพลาดที่มีค่าและไม่สามารถละเลยได้ ส่งผลให้พารามิเตอร์ที่ได้จากการประมาณค่าไม่ใช่ค่าประมาณที่ดีที่สุดอย่างที่คาดไว้ แม้จะไม่ใช่ข้อผิดพลาดที่ผิดพลาดโดยสิ้นเชิง แต่ข้อผิดพลาดในการประมาณค่าจะขึ้นอยู่กับขนาดสัมพัทธ์ของข้อผิดพลาด ในแกน xและy

อีกตัวอย่างหนึ่งที่มีข้อมูลจริงน้อยกว่า

คำชี้แจงปัญหา

เราสามารถใช้กลไกกำลังสองน้อยที่สุดเพื่อหาสมการวงโคจรของวัตถุสองชิ้นในระบบพิกัดเชิงขั้ว สมการที่ใช้โดยทั่วไปคือโดยที่คือรัศมีที่แสดงระยะห่างของวัตถุชิ้นหนึ่งจากวัตถุอีกชิ้นหนึ่ง ในสมการนี้ พารามิเตอร์และใช้ในการกำหนดเส้นทางของวงโคจร เราได้วัดข้อมูลต่อไปนี้

(ในหน่วยองศา) 43 45 52 93 108 116
4.7126 4.5542 4.0419 2.2187 1.8910 1.7599

เราจำเป็นต้องหาค่าประมาณกำลังสองน้อยที่สุดของและสำหรับข้อมูลที่กำหนดให้

สารละลาย

ขั้นแรก เราต้องแสดง e และ p ในรูปแบบเชิงเส้น ดังนั้นเราจะเขียนสมการใหม่เป็น.

นอกจากนี้ ยังสามารถปรับให้เข้ากับจุดยอดได้โดยการขยายด้วยพารามิเตอร์เพิ่มเติมเป็นซึ่งเป็นเชิงเส้นทั้งในและในฟังก์ชันพื้นฐานเพิ่มเติม

เราใช้รูปแบบสองพารามิเตอร์ดั้งเดิมในการแสดงข้อมูลการสังเกตของเราดังนี้:

ที่ไหน:

; ; ประกอบด้วยสัมประสิทธิ์ของในคอลัมน์แรก ซึ่งทั้งหมดเป็น 1 และสัมประสิทธิ์ของในคอลัมน์ที่สอง กำหนดโดย; และเช่นนั้น:

เมื่อแก้สมการแล้วจะได้

ดังนั้นและ

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • ดอเฮอร์ตี้, คริสโตเฟอร์ (2002). บทนำสู่เศรษฐศาสตร์เชิงปริมาณ (ฉบับที่ 2). นิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด. หน้า  48–113 . ISBN 0-19-877643-8.
  • Gujarati, Damodar N. ; Porter, Dawn C. (2009). เศรษฐศาสตร์เชิงปริมาณพื้นฐาน (ฉบับที่ห้า). บอสตัน: McGraw-Hill Irwin. หน้า  55–96 . ISBN 978-0-07-337577-9.
  • เฮจ, คริสเตียน ; โบเออร์, พอล; ฟรานเซส, ฟิลิป เอช. ; คลิก, ทึน ; ฟาน ไดจ์ค, เฮอร์มาน เค. (2004) วิธีเศรษฐมิติกับการประยุกต์ในธุรกิจและเศรษฐศาสตร์ (ฉบับที่ 1) ออกซ์ฟอร์ด: สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด. หน้า  76– 115. ISBN 978-0-19-926801-6.
  • Hill, R. Carter; Griffiths, William E.; Lim, Guay C. (2008). หลักการทางเศรษฐมิติ (ฉบับที่ 3). โฮโบเคน, นิวเจอร์ซีย์: John Wiley & Sons. หน้า  8–47 . ISBN 978-0-471-72360-8.
  • วูลดริดจ์, เจฟฟรีย์ (2008). "แบบจำลองการถดถอยอย่างง่าย"เศรษฐศาสตร์เบื้องต้น: แนวทางสมัยใหม่ (ฉบับที่ 4). เมสัน, โอไฮโอ: Cengage Learning. หน้า  22–67 . ISBN 978-0-324-58162-1.
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Ordinary_least_squares&oldid=1358001015#Normal_equations "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ กำลังสองน้อยที่สุดแบบธรรมดา

ในทางสถิติวิธีการกำลังสองน้อยที่สุดแบบธรรมดา ( OLS ) เป็น วิธีการกำลังสองน้อยที่สุดเชิงเส้นประเภทหนึ่ง สำหรับการเลือก พารามิเตอร์ ที่ไม่ทราบค่า ใน แบบจำลอง...

แบบจำลองเชิงเส้น

สมมติว่าข้อมูลประกอบด้วย ค่าสังเกต แต่ละค่าสังเกตประกอบด้วยตัวแปรตอบสนองแบบสเกลาร์และเวกเตอร์คอลัมน์ของพารามิเตอร์ (ตัวแปรอิสระ) เช่นใน แบบจำลองการถดถอยเชิงเส้น ตัวแปรตอบสนองคือฟังก์ชันเชิงเส้นของตัวแปรอิสระ: n {\displaystyle n} { x ฉัน , y ฉัน } ฉัน = 1 n...

การประมาณการ

สมมติว่า b เป็นค่า "ผู้สมัคร" สำหรับเวกเตอร์พารามิเตอร์ β ปริมาณ y i − x i T b ซึ่งเรียกว่าค่า ตกค้าง สำหรับ การสังเกตครั้งที่ i จะวัดระยะทางแนวตั้งระหว่างจุดข้อมูล ( x i , y i ) และระนาบไฮเปอร์ y = x T b...

การทำนาย

หลังจากที่เราได้ประมาณ ค่า β แล้ว ค่าที่ได้จากการปรับให้เหมาะสม (หรือ ค่าที่ทำนายได้ ) จากการถดถอยจะเป็นดังนี้