กลับไปหน้าบทความ

อ่าน 5 นาที

ค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด

ค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด ( LAD ) หรือที่รู้จักกันในชื่อค่าคลาดเคลื่อน สัมบูรณ์น้อยที่สุด ( LAE ) ค่า ตกค้าง สัมบูรณ์น้อยที่สุด ( LAR ) หรือค่าสัมบูรณ์น้อยที่สุด ( LAV )...

ค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด

ค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด ( LAD ) หรือที่รู้จักกันในชื่อค่าคลาดเคลื่อน สัมบูรณ์น้อยที่สุด ( LAE ) ค่า ตกค้าง สัมบูรณ์น้อยที่สุด ( LAR ) หรือค่าสัมบูรณ์น้อยที่สุด ( LAV ) เป็นเกณฑ์ความเหมาะสม ทางสถิติ และ เทคนิค การเพิ่มประสิทธิภาพ ทางสถิติ โดยอาศัยการลดผลรวมของค่าเบี่ยงเบนสัมบูรณ์ (หรือผลรวมของค่าตกค้างสัมบูรณ์หรือ ผล รวม ของค่า คลาดเคลื่อนสัมบูรณ์ ) หรือ ค่า L1นอร์มของค่าดังกล่าวให้เหลือน้อยที่สุด มันคล้ายคลึงกับ เทคนิค กำลังสองน้อยที่สุดยกเว้นว่ามันอาศัยค่าสัมบูรณ์แทนที่จะเป็นค่ากำลังสองมันพยายามหาฟังก์ชันที่ประมาณชุดข้อมูลได้อย่างใกล้เคียงโดยการลดค่าตกค้างระหว่างจุดที่สร้างขึ้นโดยฟังก์ชันและจุดข้อมูลที่สอดคล้องกันให้เหลือน้อยที่สุด ค่าประมาณ LAD ยังเกิดขึ้นเป็น ค่าประมาณ ความน่าจะเป็นสูงสุดหากค่าคลาดเคลื่อนมีการกระจายแบบลาปลาสมันถูกนำเสนอในปี 1757 โดยRoger Joseph Boscovich [ 1 ]

สูตร

สมมติว่าชุดข้อมูลประกอบด้วยจุด ( x i , y i ) โดยที่i = 1, 2, ..., nเราต้องการหาฟังก์ชันfที่ทำให้

เพื่อให้บรรลุเป้าหมายนี้ เราสมมติว่าฟังก์ชันfมีรูปแบบเฉพาะที่มีพารามิเตอร์บางตัวที่ต้องกำหนด ตัวอย่างเช่น รูปแบบที่ง่ายที่สุดคือเชิงเส้น: f ( x ) = bx + cโดยที่bและcเป็นพารามิเตอร์ที่ไม่ทราบค่า แต่เราต้องการประมาณค่า หรือในรูปแบบที่ซับซ้อนกว่านั้น สมมติว่าf ( x ) เป็นฟังก์ชันกำลังสองหมายความว่าf ( x ) = ax² + bx + cโดยที่a , bและcยังไม่ทราบค่า (โดยทั่วไปแล้ว อาจมีตัวแปรอธิบายx ไม่ใช่แค่ตัวเดียว แต่ มีตัวแปรอธิบายหลายตัว ซึ่งทั้งหมดปรากฏเป็นอาร์กิวเมนต์ของฟังก์ชันf )

ต่อไปเราจะหาค่าประมาณของพารามิเตอร์ที่ไม่ทราบค่าซึ่งทำให้ผลรวมของค่าสัมบูรณ์ของค่าความคลาดเคลื่อนมีค่าน้อยที่สุด:

สารละลาย

แม้ว่าแนวคิดของการถดถอยแบบค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดจะตรงไปตรงมาเหมือนกับการถดถอยแบบกำลังสองน้อยที่สุด แต่การคำนวณเส้นค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดนั้นไม่ง่ายและมีประสิทธิภาพเท่ากับการถดถอยแบบกำลังสองน้อยที่สุด ต่างจากการถดถอยแบบกำลังสองน้อยที่สุด การถดถอยแบบค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดไม่มีวิธีการแก้ปัญหาเชิงวิเคราะห์ ดังนั้นจึงต้องใช้วิธีการแบบวนซ้ำ ต่อไปนี้เป็นรายการวิธีการแก้ปัญหาค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดบางวิธี

วิธีการแบบซิมเพล็กซ์เป็นวิธีที่ “นิยม” ในการแก้ปัญหาค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด[ 7 ]วิธีซิมเพล็กซ์เป็นวิธีการแก้ปัญหาในการเขียนโปรแกรมเชิงเส้น อัลกอริทึมที่ได้รับความนิยมมากที่สุดคืออัลกอริทึมซิมเพล็กซ์ที่ปรับปรุงโดย Barrodale-Roberts อัลกอริทึมสำหรับ IRLS วิธีของ Wesolowsky และวิธีของ Li สามารถพบได้ในภาคผนวก A ของ[ 7 ] รวมถึงวิธีการอื่นๆ การตรวจสอบการรวมกันทั้งหมดของเส้นที่ผ่านจุดข้อมูล (x,y) สองจุดใดๆ เป็นอีกวิธีหนึ่งในการหาเส้นที่มีค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด เนื่องจากเป็นที่ทราบกันว่าอย่างน้อยหนึ่งเส้นที่มีค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดจะผ่านจุดข้อมูลอย่างน้อยสองจุด วิธีนี้จะหาเส้นโดยการเปรียบเทียบ SAE (ค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดเหนือจุดข้อมูล) ของแต่ละเส้น และเลือกเส้นที่มี SAE น้อยที่สุด นอกจากนี้ หากมีหลายเส้นที่มี SAE น้อยที่สุดเท่ากัน เส้นเหล่านั้นจะกำหนดขอบเขตของพื้นที่ของหลายคำตอบ แม้จะเรียบง่าย แต่วิธีสุดท้ายนี้ไม่มีประสิทธิภาพสำหรับชุดข้อมูลขนาดใหญ่

วิธีแก้ปัญหาโดยใช้การเขียนโปรแกรมเชิงเส้น

ปัญหาดังกล่าวสามารถแก้ไขได้โดยใช้เทคนิคการเขียนโปรแกรมเชิงเส้นใดๆ ก็ได้กับข้อกำหนดของปัญหาต่อไปนี้ เราต้องการ

โดยคำนึงถึงการเลือกค่าของพารามิเตอร์โดยที่y iคือค่าของ การสังเกต ครั้งที่iของตัวแปรตาม และx ijคือค่าของ การสังเกต ครั้งที่iของตัวแปรอิสระครั้งที่j ( j = 1,..., k ) เราเขียนปัญหานี้ใหม่ในรูปของตัวแปรเทียมu iดังนี้

โดยคำนึงถึงและ
ขึ้นอยู่กับ

ข้อจำกัดเหล่านี้มีผลทำให้แต่ละค่าเท่ากันเมื่อถูกทำให้มีค่าน้อยที่สุด ดังนั้นฟังก์ชันเป้าหมายจึงเทียบเท่ากับฟังก์ชันเป้าหมายเดิม เนื่องจากโจทย์ปัญหานี้ไม่มีตัวดำเนินการค่าสัมบูรณ์ จึงอยู่ในรูปแบบที่สามารถแก้ไขได้ด้วยโปรแกรมการเขียนโปรแกรมเชิงเส้นใดๆ ก็ได้

คุณสมบัติ

เส้นเบี่ยงเบนสัมบูรณ์น้อยที่สุดยังมีคุณสมบัติเฉพาะอื่นๆ อีก ในกรณีของชุดข้อมูล ( x , y ) เส้นเบี่ยงเบนสัมบูรณ์น้อยที่สุดจะผ่านจุดข้อมูลอย่างน้อยสองจุดเสมอ เว้นแต่จะมีคำตอบหลายคำตอบ หากมีคำตอบหลายคำตอบ พื้นที่ของคำตอบเบี่ยงเบนสัมบูรณ์น้อยที่สุดที่ถูกต้องจะถูกจำกัดด้วยเส้นอย่างน้อยสองเส้น ซึ่งแต่ละเส้นจะผ่านจุดข้อมูลอย่างน้อยสองจุด โดยทั่วไป หากมีตัวแปรอิสระk ตัว (รวมถึงค่าคงที่) พื้นผิวการถดถอยที่เหมาะสมที่สุดอย่างน้อยหนึ่งพื้นผิวจะผ่านจุดข้อมูลk จุด [ 8 ] : หน้า 936

การ "ยึดติด" ของเส้นกับจุดข้อมูลนี้ช่วยให้เข้าใจคุณสมบัติ "ความไม่เสถียร" ได้ดีขึ้น: หากเส้นยึดติดกับจุดอย่างน้อยสองจุดเสมอ เส้นก็จะกระโดดไปมาระหว่างชุดจุดต่างๆ เมื่อจุดข้อมูลเปลี่ยนแปลงไป การ "ยึดติด" นี้ยังช่วยให้เข้าใจคุณสมบัติ "ความทนทาน" ได้ดีขึ้น: หากมีค่าผิดปกติอยู่ และเส้นเบี่ยงเบนสัมบูรณ์น้อยที่สุดต้องยึดติดกับจุดข้อมูลสองจุด ค่าผิดปกตินั้นมักจะไม่ใช่หนึ่งในสองจุดนั้น เพราะในกรณีส่วนใหญ่จะไม่ทำให้ผลรวมของค่าเบี่ยงเบนสัมบูรณ์มีค่าน้อยที่สุด

กรณีหนึ่งที่ทราบกันดีว่ามีคำตอบหลายคำตอบคือ เซตของจุดที่สมมาตรเกี่ยวกับเส้นแนวนอน ดังแสดงในรูป A ด้านล่าง

รูป A: ชุดข้อมูลที่มีสมมาตรแบบสะท้อนและคำตอบความคลาดเคลื่อนสัมบูรณ์น้อยที่สุดหลายคำตอบ “พื้นที่คำตอบ” แสดงด้วยสีเขียว เส้นสีน้ำเงินแนวตั้งแสดงถึงข้อผิดพลาดสัมบูรณ์จากเส้นสีชมพูไปยังแต่ละจุดข้อมูล เส้นสีชมพูเป็นหนึ่งในคำตอบจำนวนอนันต์ภายในพื้นที่สีเขียว

เพื่อให้เข้าใจว่าทำไมจึงมีคำตอบหลายคำตอบในกรณีที่แสดงในรูป A ให้พิจารณาเส้นสีชมพูในบริเวณสีเขียว ผลรวมของค่าความคลาดเคลื่อนสัมบูรณ์ของเส้นนี้คือค่า S หากเราเอียงเส้นขึ้นเล็กน้อย โดยยังคงอยู่ในบริเวณสีเขียว ผลรวมของค่าความคลาดเคลื่อนก็จะยังคงเป็น S ค่านี้จะไม่เปลี่ยนแปลง เพราะระยะห่างจากแต่ละจุดไปยังเส้นจะเพิ่มขึ้นทางด้านหนึ่งของเส้น ในขณะที่ระยะห่างไปยังแต่ละจุดทางด้านตรงข้ามของเส้นจะลดลงในปริมาณที่เท่ากัน ดังนั้นผลรวมของค่าความคลาดเคลื่อนสัมบูรณ์จึงยังคงเท่าเดิม นอกจากนี้ เนื่องจากเราสามารถเอียงเส้นได้ทีละน้อยมากจนแทบไม่มีขีดจำกัด นี่จึงแสดงให้เห็นว่าหากมีคำตอบมากกว่าหนึ่งคำตอบ ก็จะมีคำตอบมากมายนับไม่ถ้วน

ข้อดีและข้อเสีย

ต่อไปนี้เป็นตารางเปรียบเทียบคุณสมบัติบางประการของวิธีการเบี่ยงเบนสัมบูรณ์น้อยที่สุดกับวิธีการกำลังสองน้อยที่สุด (สำหรับปัญหาที่ไม่เอกฐาน) [ 9 ] [ 10 ]

การถดถอยกำลังสองน้อยที่สุดแบบธรรมดาการถดถอยค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด
ไม่ค่อยแข็งแรงเท่าไหร่ แข็งแกร่ง
โซลูชันที่เสถียร วิธีแก้ปัญหาที่ไม่เสถียร
วิธีแก้ปัญหาหนึ่งวิธี* อาจมีวิธีแก้ปัญหาได้หลายวิธี

*โดยมีเงื่อนไขว่าจำนวนจุดข้อมูลต้องมากกว่าหรือเท่ากับจำนวนคุณลักษณะ

วิธีการหาค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด (Least Absolute Deviation: LAD) มีการประยุกต์ใช้ในหลายสาขา เนื่องจากมีความแข็งแกร่งกว่าวิธีการกำลังสองน้อยที่สุด (Least Squares: OLS) LAD มีความแข็งแกร่งในแง่ที่ว่าสามารถต้านทานค่าผิดปกติในข้อมูลได้ LAD ให้ความสำคัญเท่ากันกับทุกข้อมูล ในขณะที่ OLS นั้นจะให้น้ำหนักกับค่าเบี่ยงเบนมาก ๆ มากกว่า นั่นคือค่าผิดปกติที่ค่าที่คาดการณ์ไว้ห่างไกลจากค่าที่สังเกตได้จริง โดยการยกกำลังสองค่าเบี่ยงเบน วิธีนี้อาจมีประโยชน์ในงานวิจัยที่ค่าผิดปกติไม่จำเป็นต้องได้รับน้ำหนักมากกว่าข้อมูลอื่น ๆ แต่ถ้าจำเป็นต้องให้น้ำหนักกับค่าผิดปกติมากกว่า วิธีการกำลังสองน้อยที่สุดจะเป็นตัวเลือกที่ดีกว่า

รูปแบบต่างๆ, ส่วนขยาย, ความเชี่ยวชาญเฉพาะด้าน

หากเราขยายฟังก์ชันค่าสัมบูรณ์ของผลรวมของค่าสัมบูรณ์ของส่วนเหลือไปเป็นฟังก์ชันค่าสัมบูรณ์แบบเอียง ซึ่งบนครึ่งเส้นด้านซ้ายมีค่าความชันและบนครึ่งเส้นด้านขวามีค่าความชันโดยที่จะได้การถดถอยควอนไทล์กรณีที่ จะ ได้ การถดถอยมาตรฐานโดยใช้ค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด และเรียกอีกอย่างว่าการ ถดถอยมัธยฐาน

ปัญหาการเบี่ยงเบนสัมบูรณ์น้อยที่สุดอาจขยายให้ครอบคลุมตัวอธิบายหลายตัว ข้อจำกัด และการทำให้เป็นระเบียบเช่น แบบจำลองเชิงเส้นที่มีข้อจำกัดเชิงเส้น: [ 11 ]

ลดให้น้อยที่สุด
ขึ้นอยู่กับเงื่อนไข เช่น

โดยที่เป็นเวกเตอร์คอลัมน์ของสัมประสิทธิ์ที่จะประมาณค่า, bเป็นค่าคงที่ที่จะประมาณค่า, x iเป็นเวกเตอร์คอลัมน์ของ การสังเกต ครั้งที่iของตัวแปรอธิบายต่างๆ, y iเป็นการ สังเกต ครั้งที่iของตัวแปรตาม และkเป็นค่าคงที่ที่ทราบแล้ว

การปรับค่าด้วยLASSO (ตัวดำเนินการลดขนาดและเลือกค่าสัมบูรณ์น้อยที่สุด) อาจใช้ร่วมกับ LAD ได้เช่นกัน[ 12 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Peter Bloomfield ; William Steiger (1980). "การปรับเส้นโค้งด้วยค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด" . SIAM Journal on Scientific Computing . 1 (2): 290– 301. doi : 10.1137/0901019 .
  • Subhash C. Narula และ John F. Wellington (1982). "การถดถอยผลรวมขั้นต่ำของข้อผิดพลาดสัมบูรณ์: การสำรวจสถานะปัจจุบัน". International Statistical Review . 50 (3): 317– 326. doi : 10.2307/1402501 . JSTOR  1402501 .
  • Robert F. Phillips (กรกฎาคม 2545). "การประมาณค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดโดยใช้อัลกอริทึม EM" สถิติและการคำนวณ 12 ( 3): 281– 285. doi : 10.1023/A:1020759012226 .
  • Enno Siemsen & Kenneth A. Bollen (2007). " การประมาณค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดในการสร้างแบบจำลองสมการโครงสร้าง" วิธีการทางสังคมวิทยาและการวิจัย 36 ( 2): 227– 265. doi : 10.1177/0049124107301946
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Least_absolute_deviations&oldid=1258886998 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด

ค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุด ( LAD ) หรือที่รู้จักกันในชื่อค่าคลาดเคลื่อน สัมบูรณ์น้อยที่สุด ( LAE ) ค่า ตกค้าง สัมบูรณ์น้อยที่สุด ( LAR ) หรือค่าสัมบูรณ์น้อยที่สุด ( LAV )...

สูตร

สมมติว่า ชุดข้อมูล ประกอบด้วยจุด ( x i , y i ) โดยที่ i = 1, 2, ..., n เราต้องการหาฟังก์ชัน f ที่ทำให้ เอฟ ( x ฉัน ) ≈ y ฉัน . {\displaystyle f(x_{i})\approx y_{i}.}

สารละลาย

แม้ว่าแนวคิดของการถดถอยแบบค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดจะตรงไปตรงมาเหมือนกับการถดถอยแบบกำลังสองน้อยที่สุด แต่การคำนวณเส้นค่าเบี่ยงเบนสัมบูรณ์น้อยที่สุดนั้นไม่ง่ายและมีประสิทธิภาพเท่ากับการถดถอยแบบกำลังสองน้อยที่สุด ต่างจากการถดถอยแบบกำลังสองน้อยที่สุด...

วิธีแก้ปัญหาโดยใช้การเขียนโปรแกรมเชิงเส้น

ปัญหาดังกล่าวสามารถแก้ไขได้โดยใช้เทคนิคการเขียนโปรแกรมเชิงเส้นใดๆ ก็ได้กับข้อกำหนดของปัญหาต่อไปนี้ เราต้องการ