กลับไปหน้าบทความ

อ่าน 8 นาที

สปลายเรียบ

สปลายปรับเรียบ (Smoothing spline) คือค่าประมาณฟังก์ชันที่ได้จากชุดข้อมูลที่มีสัญญาณรบกวนของตัวแปรเป้าหมายเพื่อปรับสมดุลระหว่างการวัด ความเหมาะสม ของ กับการวัดความเรียบ...

สปลายเรียบ

สปลายปรับเรียบ (Smoothing spline)คือค่าประมาณฟังก์ชันที่ได้จากชุดข้อมูลที่มีสัญญาณรบกวนของตัวแปรเป้าหมายเพื่อปรับสมดุลระหว่างการวัดความเหมาะสมของ กับการวัดความเรียบ ของโดยใช้ค่าอนุพันธ์เป็นเกณฑ์ สปลายปรับเรียบเป็นวิธีการหนึ่งในการปรับเรียบข้อมูลที่มีสัญญาณรบกวน ตัวอย่างที่คุ้นเคยที่สุดคือสปลายปรับเรียบแบบลูกบาศก์ (cubic smoothing spline) แต่ก็ยังมีอีกหลายความเป็นไปได้ รวมถึงกรณีที่เป็นปริมาณเวกเตอร์ด้วย

คำจำกัดความของเส้นโค้งลูกบาศก์

ให้เป็นเซตของการสังเกต ซึ่งจำลองโดยความสัมพันธ์โดยที่ เป็นตัวแปรสุ่มอิสระที่มีค่าเฉลี่ยเป็นศูนย์ การประมาณค่าสปลายเรียบลูกบาศก์ของฟังก์ชันถูกกำหนดให้เป็นค่าต่ำสุดที่ไม่ซ้ำกันในปริภูมิโซโบเลฟบนช่วงกระชับของ[ 1 ] [ 2 ]

หมายเหตุ:

  • เป็นพารามิเตอร์การปรับเรียบที่ควบคุมความสมดุลระหว่างความแม่นยำต่อข้อมูลและความหยาบของการประมาณค่าฟังก์ชัน มักจะประมาณค่าโดยการตรวจสอบแบบไขว้ทั่วไป[ 3 ]หรือโดยความน่าจะเป็นแบบ จำกัด (REML) [ 4 ]ซึ่งใช้ประโยชน์จากการเชื่อมโยงระหว่างการปรับเรียบแบบสปลายน์และการประมาณค่าแบบเบย์เซียน (ค่าปรับเรียบสามารถมองได้ว่าเกิดจากความน่าจะเป็นก่อนหน้าของ) [ 5 ]
  • โดยทั่วไปแล้ว การคำนวณอินทิกรัลจะทำบนเส้นจำนวนจริงทั้งหมด แม้ว่าจะสามารถจำกัดช่วงให้อยู่เฉพาะบนเส้นจำนวนจริงได้เช่นกัน
  • เนื่องจาก(ไม่มีการปรับให้เรียบ) สปลายน์ปรับให้เรียบจะลู่เข้าสู่สปลายน์การประมาณค่า
  • เมื่อทำการปรับให้เรียบอย่างไม่มีที่สิ้นสุด ค่าปรับสำหรับความหยาบจะมีความสำคัญสูงสุด และค่าประมาณจะลู่เข้าสู่ค่าประมาณกำลังสองน้อยที่สุดเชิงเส้น
  • การลงโทษความหยาบโดยอิงจากอนุพันธ์อันดับสองเป็นวิธีที่พบได้บ่อยที่สุดในเอกสารทางสถิติสมัยใหม่ แม้ว่าวิธีการนี้สามารถปรับใช้กับการลงโทษโดยอิงจากอนุพันธ์อื่นๆ ได้อย่างง่ายดายก็ตาม
  • ในวรรณกรรมยุคแรก มีการใช้ผลต่างลำดับที่สองหรือสามที่มีระยะห่างเท่ากันในการลงโทษ แทนที่จะใช้ผลต่างอนุพันธ์[ 6 ]ดูเพิ่มเติมที่ การ ปรับเรียบ Whittaker–Henderson
  • วัตถุประสงค์การปรับเรียบผลรวมกำลังสองแบบมีค่าปรับสามารถแทนที่ด้วย วัตถุประสงค์ ความน่าจะเป็นแบบมีค่าปรับโดยที่พจน์ผลรวมกำลังสองจะถูกแทนที่ด้วยการวัดความเที่ยงตรงต่อข้อมูลตามลอการิทึมความน่าจะเป็นอีกแบบหนึ่ง[ 1 ] พจน์ผลรวมกำลังสองสอดคล้องกับความน่าจะเป็นแบบมีค่าปรับโดยมีข้อสมมติฐานแบบเกา ส์เซียนบน

การหาอนุพันธ์ของเส้นโค้งเรียบลูกบาศก์

การคิดถึงการปรับเส้นโค้งให้เรียบโดยแบ่งเป็นสองขั้นตอนจะเป็นประโยชน์:

  1. ขั้นแรก ให้หาค่าต่างๆก่อน
  2. จากค่าเหล่านี้ จงหาค่าxทั้งหมด

ตอนนี้ ให้เริ่มขั้นตอนที่สองก่อน

เมื่อกำหนดเวกเตอร์ของค่าที่เหมาะสมแล้ว ส่วนผลรวมกำลังสองของเกณฑ์สปลายน์จะคงที่ เหลือเพียงแค่การหาค่าต่ำสุดของและตัวหาค่าต่ำสุดคือสปลายน์ ลูกบาศก์ธรรมชาติ ที่ประมาณค่าจุดต่างๆสปลายน์ที่ประมาณค่านี้เป็นตัวดำเนินการเชิงเส้น และสามารถเขียนได้ในรูปแบบ

โดยที่เป็นเซตของฟังก์ชันฐานสปลายน์ ดังนั้น ค่าปรับความหยาบจึงมีรูปแบบดังนี้

โดยที่องค์ประกอบของคือฟังก์ชันพื้นฐาน และด้วยเหตุนี้ เมทริกซ์ จึงขึ้นอยู่กับการกำหนด ค่า ของตัวแปรทำนายแต่ไม่ขึ้นอยู่กับการตอบสนองหรือ

เป็น เมทริก ซ์ ที่กำหนดโดย

เป็นเมทริกซ์ของผลต่างอันดับสองที่มีองค์ประกอบดังนี้:

, ,

เป็นเมทริกซ์สมมาตรสามแนวทแยงมุมที่มีองค์ประกอบดังนี้:

และคือระยะห่างระหว่างปมที่ต่อเนื่องกัน (หรือค่า x)

กลับไปที่ขั้นตอนแรกกันอีกครั้ง ผลรวมกำลังสองที่ถูกปรับโทษสามารถเขียนได้ดังนี้

ที่ไหน.

ลดค่าให้น้อยที่สุดโดยการหาอนุพันธ์เทียบกับ ซึ่งส่งผลให้: [ 7 ]และ

แนวทางของเดอ บูร์

แนวทางของ De Boor ใช้ประโยชน์จากแนวคิดเดียวกัน คือการหาจุดสมดุลระหว่างการมีเส้นโค้งที่เรียบเนียนและการอยู่ใกล้กับข้อมูลที่กำหนด[ 8 ]

โดยที่เป็นพารามิเตอร์ที่เรียกว่าปัจจัยความเรียบและอยู่ในช่วงและเป็นปริมาณที่ควบคุมขอบเขตของการทำให้เรียบ (ซึ่งแสดงถึงน้ำหนักของแต่ละจุด) ในทางปฏิบัติ เนื่องจากส่วนใหญ่ใช้สปลายลูกบาศก์จึงมักจะเป็นวิธีแก้ปัญหาสำหรับได้รับการเสนอโดยChristian Reinschในปี 1967 [ 9 ]สำหรับเมื่อเข้าใกล้จะลู่เข้าสู่สปลาย "ธรรมชาติ" ที่ประมาณค่าข้อมูลที่กำหนด[ 8 ]เมื่อเข้าใกล้จะลู่เข้าสู่เส้นตรง (เส้นโค้งที่เรียบที่สุด) เนื่องจากการหาค่าที่เหมาะสมของเป็นงานของการลองผิดลองถูกจึงมีการแนะนำค่าคงที่ที่เกินมาเพื่อความสะดวก[ 9 ]ใช้เพื่อกำหนดค่าของ ในเชิงตัวเลขเพื่อให้ฟังก์ชันตรงตามเงื่อนไขต่อไปนี้:

อัลกอริทึมที่อธิบายโดย de Boor เริ่มต้นด้วยและเพิ่มขึ้นเรื่อยๆจนกว่าจะตรงตามเงื่อนไข[ 8 ]ถ้าเป็นการประมาณค่าเบี่ยงเบนมาตรฐานสำหรับขอแนะนำให้เลือกค่าคงที่ ในช่วง การ มีหมายความว่าคำตอบคือตัวประมาณค่าสปลายน์ "ธรรมชาติ" [ 9 ]การเพิ่มหมายความว่าเราจะได้เส้นโค้งที่เรียบเนียนขึ้นเมื่ออยู่ห่างจากข้อมูลที่กำหนดมากขึ้น

สปลายหลายมิติ

มีวิธีการหลักสองประเภทสำหรับการขยายผลจากการปรับเรียบโดยพิจารณาจากค่าสเกลาร์ไปสู่การปรับเรียบโดยพิจารณาจากค่าเวกเตอร์ วิธีแรกเป็นการขยายผลของค่าปรับเรียบแบบสปลายน์ไปสู่การตั้งค่าแบบหลายมิติ ตัวอย่างเช่น หากเราพยายามประมาณค่าเราอาจใช้ ค่าปรับ เรียบแบบสปลายน์แผ่นบางและหาค่าที่ทำให้น้อยที่สุด

วิธีการสปลายแผ่นบางสามารถขยายไปสู่การปรับเรียบโดยสัมพันธ์กับมิติมากกว่าสองมิติและลำดับการอนุพันธ์อื่น ๆ ในการลงโทษได้[ 1 ]เมื่อมิติเพิ่มขึ้นจะมีข้อจำกัดบางประการเกี่ยวกับลำดับการอนุพันธ์ที่เล็กที่สุดที่สามารถใช้ได้[ 1 ]แต่ในความเป็นจริง บทความต้นฉบับของ Duchon [ 10 ]ให้การลงโทษที่ซับซ้อนกว่าเล็กน้อยซึ่งสามารถหลีกเลี่ยงข้อจำกัดนี้ได้

สปลายแผ่นบางนั้นเป็นแบบไอโซโทรปิก หมายความว่าหากเราหมุน ระบบพิกัด ค่าประมาณจะไม่เปลี่ยนแปลง แต่ก็หมายความว่าเรากำลังสมมติว่าระดับการปรับให้เรียบนั้นเหมาะสมในทุกทิศทาง โดยทั่วไปแล้วถือว่าสมเหตุสมผลเมื่อทำการปรับให้เรียบโดยสัมพันธ์กับตำแหน่งเชิงพื้นที่ แต่ในหลายกรณีไอโซโทรปิกไม่ใช่สมมติฐานที่เหมาะสม และอาจนำไปสู่ความไวต่อการเลือกหน่วยวัดที่ดูเหมือนจะไม่มีเหตุผล ตัวอย่างเช่น หากทำการปรับให้เรียบโดยสัมพันธ์กับระยะทางและเวลา ตัวปรับให้เรียบแบบไอโซโทรปิกจะให้ผลลัพธ์ที่แตกต่างกันหากวัดระยะทางเป็นเมตรและเวลาเป็นวินาที เมื่อเทียบกับกรณีที่เปลี่ยนหน่วยเป็นเซนติเมตรและชั่วโมง

การวางนัยทั่วไปประเภทที่สองสำหรับการปรับเรียบแบบหลายมิติจะจัดการกับ ปัญหา ความไม่แปรผันตามมาตราส่วน นี้โดยตรง โดยใช้การสร้างสปลายผลคูณเทนเซอร์[ 11 ] [ 12 ] [ 13 ]สปลายดังกล่าวมีค่าปรับเรียบที่มีพารามิเตอร์ปรับเรียบหลายตัว ซึ่งเป็นราคาที่ต้องจ่ายสำหรับการไม่ถือว่าระดับความเรียบเดียวกันนั้นเหมาะสมในทุกทิศทาง

เส้นโค้งเรียบ (Smoothing splines) มีความเกี่ยวข้อง แต่แตกต่างจาก:

ซอร์สโค้ด

ซอร์สโค้ดสำหรับ การปรับเรียบ สปลายน์สามารถพบได้ในตัวอย่างจากหนังสือA Practical Guide to Splines ของ Carl de Boorตัวอย่างเหล่านี้เขียนด้วยภาษาโปรแกรมFortranซอร์สโค้ดที่อัปเดตแล้วยังมีอยู่ในเว็บไซต์อย่างเป็นทางการของ Carl de Boor อีกด้วย[1 ]

อ่านเพิ่มเติม

  • Wahba, G. (1990). แบบจำลองสปลายน์สำหรับข้อมูลเชิงสังเกต SIAM, ฟิลาเดลเฟีย
  • Green, PJ และ Silverman, BW (1994). การถดถอยแบบไม่ใช้พารามิเตอร์และแบบจำลองเชิงเส้นทั่วไป CRC Press.
  • เดอ บูร์, ซี. (2001). คู่มือปฏิบัติเกี่ยวกับสปลายน์ (ฉบับปรับปรุง) . สปริงเกอร์.
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Smoothing_spline&oldid=1342728807 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ สปลายเรียบ

สปลายปรับเรียบ (Smoothing spline) คือค่าประมาณฟังก์ชันที่ได้จากชุดข้อมูลที่มีสัญญาณรบกวนของตัวแปรเป้าหมายเพื่อปรับสมดุลระหว่างการวัด ความเหมาะสม ของ กับการวัดความเรียบ...

คำจำกัดความของเส้นโค้งลูกบาศก์

ให้เป็นเซตของการสังเกต ซึ่งจำลองโดยความสัมพันธ์โดยที่ เป็นตัวแปรสุ่มอิสระที่มีค่าเฉลี่ยเป็นศูนย์ การประมาณค่าสปลายเรียบลูกบาศก์ของฟังก์ชันถูกกำหนดให้เป็นค่าต่ำสุดที่ไม่ซ้ำกันใน ปริภูมิโซโบเลฟ บนช่วงกระชับของ [ 1 ] [ 2 ] { x ฉัน , วาย ฉัน : ฉัน = 1 , … , n }...

การหาอนุพันธ์ของเส้นโค้งเรียบลูกบาศก์

การคิดถึงการปรับเส้นโค้งให้เรียบโดยแบ่งเป็นสองขั้นตอนจะเป็นประโยชน์:

แนวทางของเดอ บูร์

แนวทางของ De Boor ใช้ประโยชน์จากแนวคิดเดียวกัน คือการหาจุดสมดุลระหว่างการมีเส้นโค้งที่เรียบเนียนและการอยู่ใกล้กับข้อมูลที่กำหนด [ 8 ]