อ่าน 6 นาที
การถดถอยของเดมิง
ในทางสถิติการถดถอยแบบเดมิง (Deming regression ) ซึ่งตั้งชื่อตามดับเบิลยู. เอ็ดเวิร์ด เดมิงเป็นแบบจำลองความคลาดเคลื่อนในตัวแปรที่พยายามหาเส้นตรงที่เหมาะสมที่สุด สำหรับ
การถดถอยของเดมิง

ในทางสถิติการถดถอยแบบเดมิง (Deming regression ) ซึ่งตั้งชื่อตามดับเบิลยู. เอ็ดเวิร์ด เดมิงเป็นแบบจำลองความคลาดเคลื่อนในตัวแปรที่พยายามหาเส้นตรงที่เหมาะสมที่สุด สำหรับ ชุดข้อมูลสองมิติมันแตกต่างจากการถดถอยเชิงเส้นแบบง่ายตรงที่มันคำนึงถึงความคลาดเคลื่อนในการสังเกตทั้งบนแกนxและ แกน yมันเป็นกรณีพิเศษของกำลังสองน้อยที่สุดโดยรวม (Total Least Squares ) ซึ่งอนุญาตให้มีตัวแปรทำนายได้หลายตัวและโครงสร้างความคลาดเคลื่อนที่ซับซ้อนกว่า
การถดถอยแบบเดมิงเทียบเท่ากับ การประมาณ ค่าความน่าจะเป็นสูงสุดของแบบจำลองข้อผิดพลาดในตัวแปรโดยที่ข้อผิดพลาดสำหรับตัวแปรทั้งสองถือว่าเป็นอิสระและมีการกระจายแบบปกติและอัตราส่วนของความแปรปรวนของตัวแปรทั้งสอง ซึ่งแสดงด้วยδ นั้น เป็นที่ทราบ[ 1 ]ในทางปฏิบัติ อัตราส่วนนี้อาจได้รับการประมาณจากแหล่งข้อมูลที่เกี่ยวข้อง อย่างไรก็ตาม ขั้นตอนการถดถอยไม่ได้คำนึงถึงข้อผิดพลาดที่อาจเกิดขึ้นในการประมาณอัตราส่วนนี้
การคำนวณการถดถอยแบบเดมิงนั้นยากกว่าการคำนวณการถดถอยเชิงเส้นแบบง่าย เพียงเล็กน้อย โปรแกรมซอฟต์แวร์ทางสถิติส่วนใหญ่ที่ใช้ในเคมีคลินิกมีฟังก์ชันการคำนวณการถดถอยแบบเดมิงให้ใช้งาน
แบบจำลองนี้ได้รับการแนะนำครั้งแรกโดยAdcock (1878)ซึ่งพิจารณากรณีδ = 1 และต่อมาโดยKummell (1879) โดยทั่วไป ด้วยδ ใดๆ อย่างไรก็ตาม แนวคิดของพวกเขายังคงไม่ได้รับความสนใจมากนักเป็นเวลากว่า 50 ปี จนกระทั่งได้รับการฟื้นฟูโดยKoopmans (1936)และต่อมาได้รับการเผยแพร่มากขึ้นโดยDeming (1943)หนังสือเล่มหลังนี้ได้รับความนิยมอย่างมากใน สาขา เคมีคลินิกและสาขาที่เกี่ยวข้อง จนกระทั่งวิธีการนี้ถูกเรียกว่าการถดถอยของ Demingในสาขาเหล่านั้น[ 2 ]
ข้อกำหนด
สมมติว่าข้อมูลที่มีอยู่ ( y i , x i ) เป็นค่าสังเกตที่วัดได้ของค่า "จริง" ( y i * , x i * ) ซึ่งอยู่บนเส้นถดถอย:
โดยที่ค่าความคลาดเคลื่อนεและηเป็นอิสระต่อกัน และถือว่าทราบอัตราส่วนของความแปรปรวนของค่าความคลาดเคลื่อนทั้งสองแล้ว:
ในทางปฏิบัติ ค่าความแปรปรวนของ พารามิเตอร์ และมักจะไม่ทราบค่า ซึ่งทำให้การประมาณค่า มีความซับซ้อนมากขึ้นโปรดทราบว่าเมื่อวิธีการวัดสำหรับและเหมือนกัน ค่าความแปรปรวนเหล่านี้มักจะเท่ากัน ดังนั้นในกรณีนี้
เราพยายามค้นหาเส้นแบ่งที่ "เหมาะสมที่สุด"
เพื่อให้ผลรวมถ่วงน้ำหนักของค่าตกค้างกำลังสองของแบบจำลองมีค่าน้อยที่สุด: [ 3 ]
ดูJensen (2007)สำหรับที่มาของสูตรทั้งหมด
สารละลาย
คำตอบสามารถแสดงได้ในรูปของโมเมนต์ตัวอย่างระดับที่สอง กล่าวคือ เราจะคำนวณปริมาณต่อไปนี้ก่อน (ผลรวมทั้งหมดมีค่าตั้งแต่i = 1 ถึงn ):
สุดท้าย ค่าประมาณกำลังสองน้อยที่สุดของพารามิเตอร์ของแบบจำลองจะเป็น[ 4 ]
การถดถอยเชิงตั้งฉาก
สำหรับกรณีที่ความแปรปรวนของข้อผิดพลาดเท่ากัน กล่าวคือ เมื่อการถดถอยของ Deming จะกลายเป็นการถดถอยเชิงตั้งฉาก : มันจะลดผลรวมของระยะทางตั้งฉากกำลังสองจากจุดข้อมูลไปยังเส้นถดถอย ให้เหลือน้อยที่สุด ในกรณีนี้ ให้แต่ละการสังเกตเป็นจุดในระนาบเชิงซ้อน (กล่าวคือ จุดที่เป็นหน่วยจินตนาการ ) ให้ เป็นผลรวมของความแตกต่างกำลังสองของจุดข้อมูลจากจุดศูนย์กลาง (ซึ่งแสดงในพิกัดเชิงซ้อนเช่นกัน) ซึ่งเป็นจุดที่มีตำแหน่งแนวนอนและแนวตั้งเป็นค่าเฉลี่ยของจุดข้อมูล จากนั้น: [ 5 ]
- ถ้าเงื่อนไขเป็นจริง เส้นตรงทุกเส้นที่ลากผ่านจุดศูนย์กลางจะเป็นเส้นตรงที่เหมาะสมที่สุดในเชิงตั้งฉาก
- ถ้าเส้นถดถอยเชิงตั้งฉากจะผ่านจุดศูนย์กลางและขนานกับเวกเตอร์จากจุดกำเนิดไปยัง
การ แสดง ตรีโกณมิติของเส้นถดถอยเชิงตั้งฉากได้รับการนำเสนอโดยคูลิดจ์ในปี พ.ศ. 2456 [ 6 ]ระยะทางยังสามารถคำนวณได้โดยใช้สมการเส้นตรงทั่วไป ซึ่งกำหนดเป็น
แอปพลิเคชัน
ในกรณีที่จุดสาม จุด ไม่เรียงตัวกันบนระนาบสามเหลี่ยมที่มีจุดเหล่านี้เป็นจุดยอดจะมีวงรีสไตเนอร์ที่ ไม่ซ้ำกัน ซึ่งสัมผัสกับด้านของสามเหลี่ยมที่จุดกึ่งกลางแกนหลักของวงรีนี้จะตกอยู่บนเส้นถดถอยตั้งฉากสำหรับจุดยอดทั้งสาม[ 7 ] การหาปริมาณของ สัญญาณรบกวนภายในเซลล์ชีวภาพสามารถหาปริมาณได้โดยการใช้การถดถอยเดมิงกับพฤติกรรมที่สังเกตได้ของวงจรชีวภาพสังเคราะห์ที่มีผู้ รายงานสองคน [ 8 ]
เมื่อมนุษย์ถูกขอให้วาดการถดถอยเชิงเส้นบนแผนภาพกระจายโดยการเดา คำตอบของพวกเขาจะใกล้เคียงกับการถดถอยเชิงตั้งฉากมากกว่าการถดถอยกำลังสองน้อยที่สุดแบบธรรมดา[ 9 ]
เวอร์ชันที่ไม่ขึ้นกับมาตราส่วน
ความสัมพันธ์เชิงฟังก์ชันค่าเฉลี่ยเรขาคณิตเป็นกรณีหนึ่งของการถดถอยแบบเดมิง โดยที่δ = σ² x / σ² yโดยถือว่าตัวแปรทั้งสองมีความน่าเชื่อถือ เท่ากัน กล่าวคือσ y / σ ε = σ x / σ ηความชันที่ได้จะเป็นค่าเฉลี่ยเรขาคณิตของความชันกำลังสองน้อยที่สุดแบบธรรมดาและความชันกำลังสองน้อยที่สุดแบบผกผัน ซึ่งทำให้คำนวณได้ง่ายโดยใช้เครื่องมือที่มีอยู่ มีการแนะนำให้ใช้ในทางชีววิทยา[ 10 ]วิธีนี้ไม่เปลี่ยนแปลงภายใต้การปรับขนาด การแปล และการสลับตัวแปร เป็นวิธีเดียวที่ขึ้นอยู่กับโมเมนต์แรกและโมเมนต์ที่สองเท่านั้นที่มีคุณสมบัตินี้[ 11 ]
การถดถอยของยอร์ก
การถดถอยของ York ขยายการถดถอยของ Deming โดยอนุญาตให้มีข้อผิดพลาดที่สัมพันธ์กันใน x และ y [ 12 ]
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การถดถอยของเดมิง
ในทางสถิติการถดถอยแบบเดมิง (Deming regression ) ซึ่งตั้งชื่อตามดับเบิลยู. เอ็ดเวิร์ด เดมิงเป็นแบบจำลองความคลาดเคลื่อนในตัวแปรที่พยายามหาเส้นตรงที่เหมาะสมที่สุด สำหรับ
ข้อกำหนด
สมมติว่าข้อมูลที่มีอยู่ ( y i , x i ) เป็นค่าสังเกตที่วัดได้ของค่า "จริง" ( y i * , x i * ) ซึ่งอยู่บนเส้นถดถอย:
สารละลาย
คำตอบสามารถแสดงได้ในรูปของโมเมนต์ตัวอย่างระดับที่สอง กล่าวคือ เราจะคำนวณปริมาณต่อไปนี้ก่อน (ผลรวมทั้งหมดมีค่าตั้งแต่ i = 1 ถึง n ):
การถดถอยเชิงตั้งฉาก
สำหรับกรณีที่ความแปรปรวนของข้อผิดพลาดเท่ากัน กล่าวคือ เมื่อการถดถอยของ Deming จะกลายเป็นการ ถดถอยเชิงตั้งฉาก : มันจะลดผลรวมของ ระยะทางตั้งฉากกำลังสองจากจุดข้อมูลไปยังเส้นถดถอย ให้เหลือน้อยที่สุด ในกรณีนี้ ให้แต่ละการสังเกตเป็นจุดใน ระนาบเชิงซ้อน (กล่าวคือ...