อ่าน 6 นาที
การปรับเส้นโค้งให้เหมาะสม
การปรับ เส้น โค้ง [ 1 ] [ 2 ] คือกระบวนการสร้าง เส้นโค้ง หรือ ฟังก์ชันทางคณิตศาสตร์ ที่เหมาะสมที่สุดกับชุด จุดข้อมูล [ 3 ] ซึ่งอาจอยู่ภายใต้ข้อจำกัด [ 4 ] [ 5 ]...
การปรับเส้นโค้งให้เหมาะสม

การปรับ เส้นโค้ง[ 1 ] [ 2 ]คือกระบวนการสร้างเส้นโค้งหรือฟังก์ชันทางคณิตศาสตร์ที่เหมาะสมที่สุดกับชุดจุดข้อมูล [ 3 ]ซึ่งอาจอยู่ภายใต้ข้อจำกัด[ 4 ] [ 5 ]การปรับเส้นโค้งอาจเกี่ยวข้องกับการแทรกสอด [ 6 ] [ 7 ] ซึ่งต้องการความพอดีที่แน่นอนกับข้อมูล หรือ การปรับ ให้เรียบ[ 8 ] [ 9 ]ซึ่งเป็นการสร้างฟังก์ชัน "เรียบ" ที่พอดีกับข้อมูลโดยประมาณ หัวข้อที่เกี่ยวข้องคือการวิเคราะห์การถดถอย [ 10 ] [ 11 ]ซึ่งมุ่งเน้นไปที่คำถามเกี่ยวกับการอนุมานทางสถิติ เช่น ความไม่แน่นอนที่มีอยู่ในเส้นโค้งที่ปรับให้เข้ากับข้อมูลที่ สังเกตได้โดยมีข้อผิดพลาดแบบสุ่ม เส้นโค้งที่ปรับแล้วสามารถใช้เป็นเครื่องมือช่วยในการแสดงภาพข้อมูล[ 12 ] [ 13 ]เพื่ออนุมานค่าของฟังก์ชันในกรณีที่ไม่มีข้อมูล[ 14 ]และเพื่อสรุปความสัมพันธ์ระหว่างตัวแปรสองตัวขึ้นไป[ 15 ]การขยายขอบเขตหมายถึงการใช้เส้นโค้งที่เหมาะสมเกินขอบเขตของข้อมูลที่สังเกตได้[ 16 ]และขึ้นอยู่กับระดับความไม่แน่นอน[ 17 ]เนื่องจากอาจสะท้อนถึงวิธีการที่ใช้ในการสร้างเส้นโค้งมากพอๆ กับที่สะท้อนถึงข้อมูลที่สังเกตได้
สำหรับการวิเคราะห์ข้อมูลเชิงเส้นพีชคณิต "การปรับให้เหมาะสม" โดยทั่วไปหมายถึงการพยายามหาเส้นโค้งที่ลดการเคลื่อนที่ในแนวตั้ง ( แกน y ) ของจุดจากเส้นโค้งให้น้อยที่สุด (เช่นกำลังสองน้อยที่สุดแบบธรรมดา ) อย่างไรก็ตาม สำหรับแอปพลิเคชันกราฟิกและรูปภาพ การปรับให้เหมาะสมทางเรขาคณิตมุ่งที่จะให้ความเหมาะสมทางสายตาที่ดีที่สุด ซึ่งโดยทั่วไปหมายถึงการพยายามลดระยะห่างตั้งฉากกับเส้นโค้งให้น้อยที่สุด (เช่นกำลังสองน้อยที่สุดทั้งหมด ) หรือรวมแกนการเคลื่อนที่ทั้งสองของจุดจากเส้นโค้ง การปรับให้เหมาะสมทางเรขาคณิตไม่เป็นที่นิยมเนื่องจากโดยทั่วไปต้องใช้การคำนวณแบบไม่เชิงเส้นและ/หรือแบบวนซ้ำ แม้ว่าจะมีข้อดีคือผลลัพธ์ที่สวยงามและแม่นยำทางเรขาคณิตมากกว่าก็ตาม[ 18 ] [ 19 ] [ 20 ]
การปรับฟังก์ชันให้เข้ากับจุดข้อมูลด้วยวิธีพีชคณิต
โดยทั่วไปแล้ว เราจะใช้ฟังก์ชันที่มีรูปแบบy = f ( x ) ในการหาค่าที่ เหมาะสม
การปรับเส้นตรงและฟังก์ชันพหุนามให้เข้ากับจุดข้อมูล

สมการพหุนามดีกรีหนึ่ง
เส้นตรงคือเส้นตรงที่มีความชัน เท่ากับ aเส้นตรงจะเชื่อมต่อจุดสองจุดใดๆ ดังนั้นสมการพหุนามดีกรีหนึ่งจึงเป็นสมการที่ลากผ่านจุดสองจุดใดๆ ที่มีพิกัด x ต่างกันได้อย่างพอดี
หากเพิ่มอันดับของสมการเป็นพหุนามดีกรีสอง จะได้ผลลัพธ์ดังต่อไปนี้:
เส้นนี้จะพอดีกับเส้นโค้งอย่างง่ายที่จุดสามจุดอย่างแม่นยำ
หากเพิ่มอันดับของสมการเป็นพหุนามดีกรีสาม จะได้ผลลัพธ์ดังต่อไปนี้:
นี่จะพอดีกับจุดสี่จุดพอดี
กล่าวโดยทั่วไปแล้ว เส้นโค้งนั้นจะตรงตามข้อจำกัด สี่ข้ออย่างแม่นยำ แต่ละข้อจำกัดอาจเป็นจุดมุมหรือความโค้ง (ซึ่งเป็นส่วนกลับของรัศมีของวงกลมสัมผัส ) ข้อจำกัดเกี่ยวกับมุมและความโค้งมักจะถูกเพิ่มเข้าไปที่ปลายของเส้นโค้ง และในกรณีเช่นนี้เรียกว่าเงื่อนไขปลายเงื่อนไขปลายที่เหมือนกันมักใช้เพื่อให้แน่ใจว่าการเปลี่ยนผ่านระหว่างเส้นโค้งพหุนามภายในสปลาย เดียวเป็นไป อย่างราบรื่น ข้อจำกัดลำดับสูงกว่า เช่น "การเปลี่ยนแปลงอัตราความโค้ง" ก็สามารถเพิ่มเข้าไปได้เช่นกัน ตัวอย่างเช่น สิ่งนี้จะมีประโยชน์ใน การออกแบบทาง แยกต่าง ระดับบนทางหลวง เพื่อทำความเข้าใจอัตราการเปลี่ยนแปลงของแรงที่กระทำต่อรถยนต์ (ดูการกระชาก ) ขณะที่รถวิ่งผ่านทางแยกต่างระดับ และเพื่อกำหนดขีดจำกัดความเร็วที่เหมาะสมตามนั้น
สมการพหุนามดีกรีหนึ่งอาจเหมาะสมอย่างแม่นยำสำหรับจุดเดียวและมุมหนึ่ง ในขณะที่สมการพหุนามดีกรีสามอาจเหมาะสมอย่างแม่นยำสำหรับสองจุด ข้อจำกัดของมุม และข้อจำกัดของความโค้ง นอกจากนี้ยังสามารถใช้ข้อจำกัดอื่นๆ ได้อีกหลายแบบสำหรับสมการเหล่านี้และสมการพหุนามดีกรีสูงกว่า
หากมีข้อจำกัดมากกว่าn + 1 ข้อ ( โดยที่ nคือดีกรีของพหุนาม) เส้นโค้งพหุนามก็ยังสามารถผ่านข้อจำกัดเหล่านั้นได้ การที่เส้นโค้งพอดีกับข้อจำกัดทั้งหมดอย่างแม่นยำนั้นไม่แน่นอน (แต่ก็อาจเกิดขึ้นได้ เช่น ในกรณีที่พหุนามดีกรีหนึ่งพอดีกับจุดสามจุดที่เรียงตัวกัน อย่างแม่นยำ ) อย่างไรก็ตาม โดยทั่วไปแล้ว จำเป็นต้องมีวิธีการบางอย่างในการประเมินค่าประมาณแต่ละค่า วิธี การกำลังสองน้อยที่สุดเป็นวิธีหนึ่งในการเปรียบเทียบความคลาดเคลื่อน
มีเหตุผลหลายประการที่ทำให้ต้องใช้ค่าประมาณในการปรับสมการพหุนาม ทั้งๆ ที่สามารถเพิ่มดีกรีของสมการพหุนามเพื่อให้ได้ค่าที่ตรงกันอย่างแม่นยำได้:
- ถึงแม้ว่าจะมีการจับคู่ที่ตรงกันอย่างสมบูรณ์ แต่ก็ไม่ได้หมายความว่าจะสามารถค้นหาได้โดยง่ายเสมอไป ขึ้นอยู่กับอัลกอริทึมที่ใช้ อาจมีกรณีที่แตกต่างกันออกไป ซึ่งไม่สามารถคำนวณการจับคู่ที่ตรงกันอย่างสมบูรณ์ได้ หรืออาจต้องใช้เวลาในการคำนวณมากเกินไปในการหาคำตอบ สถานการณ์เช่นนี้อาจต้องใช้คำตอบโดยประมาณ
- การหาค่าเฉลี่ยของจุดข้อมูลที่น่าสงสัยในตัวอย่าง แทนที่จะบิดเบือนเส้นโค้งเพื่อให้ตรงกับจุดข้อมูลเหล่านั้นอย่างแม่นยำ อาจเป็นผลที่พึงประสงค์
- ปรากฏการณ์ของรันเก : พหุนามอันดับสูงมักมีการแกว่งสูงมาก หากเส้นโค้งลากผ่านจุดสองจุดAและBก็คาดได้ว่าเส้นโค้งนั้นจะอยู่ใกล้จุดกึ่งกลางของAและBด้วยเช่นกัน แต่สิ่งนี้อาจไม่เกิดขึ้นกับเส้นโค้งพหุนามอันดับสูง ค่าของเส้นโค้งอาจมีขนาดใหญ่มากทั้งในค่าบวกหรือค่าลบในขณะที่พหุนามอันดับต่ำ เส้นโค้งมักจะอยู่ใกล้จุดกึ่งกลางมากกว่า (และรับประกันได้ว่าจะผ่านจุดกึ่งกลางอย่างแม่นยำสำหรับพหุนามดีกรี 1)
- เส้นโค้งพหุนามอันดับต่ำมักจะเรียบ ในขณะที่เส้นโค้งพหุนามอันดับสูงมักจะ "เป็นลอน" เพื่ออธิบายให้ชัดเจนยิ่งขึ้น จำนวนจุดเปลี่ยนเว้า สูงสุด ที่เป็นไปได้ในเส้นโค้งพหุนามคือn-2โดยที่nคืออันดับของสมการพหุนาม จุดเปลี่ยนเว้าคือตำแหน่งบนเส้นโค้งที่รัศมีเปลี่ยนจากบวกเป็นลบ เราอาจกล่าวได้ว่านี่คือจุดที่เส้นโค้งเปลี่ยนจาก "กักเก็บน้ำ" เป็น "ระบายน้ำ" โปรดทราบว่าพหุนามอันดับสูงนั้น "เป็นไปได้" ที่จะมีลักษณะเป็นลอน มันอาจจะเรียบก็ได้ แต่ไม่มีการรับประกัน ต่างจากเส้นโค้งพหุนามอันดับต่ำ พหุนามดีกรีสิบห้าอาจมีจุดเปลี่ยนเว้าได้มากที่สุดสิบสามจุด แต่ก็อาจมีสิบเอ็ดจุด เก้าจุด หรือจำนวนคี่ใดๆ ก็ได้ลงไปจนถึงหนึ่งจุด (พหุนามที่มีดีกรีเป็นเลขคู่สามารถมีจุดเปลี่ยนเว้าได้จำนวนคู่ใดๆ ก็ได้ตั้งแต่n - 2 ลงไปจนถึงศูนย์)
ระดับของเส้นโค้งพหุนามที่สูงกว่าที่จำเป็นสำหรับการจับคู่ที่แม่นยำนั้นไม่เป็นที่พึงประสงค์ด้วยเหตุผลทั้งหมดที่ได้กล่าวไว้ก่อนหน้านี้สำหรับพหุนามอันดับสูง แต่ยังนำไปสู่กรณีที่มีคำตอบเป็นอนันต์อีกด้วย ตัวอย่างเช่น พหุนามดีกรีหนึ่ง (เส้นตรง) ที่ถูกจำกัดด้วยจุดเพียงจุดเดียว แทนที่จะเป็นสองจุดตามปกติ จะให้คำตอบเป็นอนันต์ ซึ่งนำมาซึ่งปัญหาว่าจะเปรียบเทียบและเลือกคำตอบเพียงหนึ่งเดียวได้อย่างไร ซึ่งอาจเป็นปัญหาสำหรับทั้งซอฟต์แวร์และมนุษย์ ด้วยเหตุนี้ โดยทั่วไปแล้วจึงควรเลือกดีกรีที่ต่ำที่สุดเท่าที่จะเป็นไปได้สำหรับการจับคู่ที่แม่นยำกับข้อจำกัดทั้งหมด และอาจเลือกดีกรีที่ต่ำกว่านั้นอีกหากการจับคู่โดยประมาณเป็นที่ยอมรับได้

การนำฟังก์ชันอื่นๆ มาใช้กับจุดข้อมูล
ในบางกรณี อาจใช้เส้นโค้งประเภทอื่น เช่นฟังก์ชันตรีโกณมิติ (เช่น ไซน์และโคไซน์) ได้เช่นกัน
ในวิชาสเปกโทรสโกปี ข้อมูลอาจถูกปรับให้เข้ากับฟังก์ชันเกาส์เซียนลอเรนซ์โวอิกต์และฟังก์ชันที่เกี่ยวข้อง
ในชีววิทยา นิเวศวิทยา ประชากรศาสตร์ ระบาดวิทยา และสาขาวิชาอื่นๆ อีกมากมาย การเติบโตของประชากรการแพร่กระจายของโรคติดต่อ ฯลฯ สามารถอธิบายได้ด้วยฟังก์ชันโลจิสติก
ในด้านการเกษตรฟังก์ชันซิกมอยด์แบบโลจิสติกผกผัน(เส้นโค้งรูปตัว S) ถูกนำมาใช้เพื่ออธิบายความสัมพันธ์ระหว่างผลผลิตพืชและปัจจัยการเจริญเติบโต รูปสีน้ำเงินสร้างขึ้นจากสมการถดถอยซิกมอยด์ของข้อมูลที่วัดได้ในพื้นที่เพาะปลูก จะเห็นได้ว่า ในช่วงเริ่มต้น กล่าวคือ ในดินที่มีความเค็มต่ำ ผลผลิตพืชจะลดลงอย่างช้าๆ เมื่อความเค็มของดินเพิ่มขึ้น ในขณะที่หลังจากนั้น การลดลงจะเกิดขึ้นเร็วขึ้น
การปรับเส้นโค้งระนาบให้เข้ากับจุดข้อมูลด้วยรูปทรงเรขาคณิต
หาก ไม่สามารถกำหนดฟังก์ชันในรูปแบบดังกล่าว ได้ ก็ยังสามารถลองปรับให้เข้ากับ เส้นโค้งระนาบได้
เส้นโค้งประเภทอื่น ๆ เช่นภาคตัดกรวย (ส่วนโค้งวงกลม วงรี พาราโบลา และไฮเปอร์โบลา) หรือฟังก์ชันตรีโกณมิติ (เช่น ไซน์และโคไซน์) ก็สามารถนำมาใช้ได้ในบางกรณี ตัวอย่างเช่น วิถีการเคลื่อนที่ของวัตถุภายใต้แรงโน้มถ่วงจะตามเส้นทางพาราโบลา เมื่อไม่พิจารณาแรงต้านอากาศ ดังนั้น การจับคู่จุดข้อมูลวิถีการเคลื่อนที่กับเส้นโค้งพาราโบลาจึงสมเหตุสมผล ส่วนน้ำขึ้นน้ำลงมีรูปแบบเป็นคลื่นไซน์ ดังนั้น จุดข้อมูลน้ำขึ้นน้ำลงควรจับคู่กับคลื่นไซน์ หรือผลรวมของคลื่นไซน์สองลูกที่มีคาบเวลาต่างกัน หากพิจารณาผลกระทบจากทั้งดวงจันทร์และดวงอาทิตย์
สำหรับเส้นโค้งพาราเมตริก การปรับพิกัดแต่ละจุดให้เป็นฟังก์ชันแยกกันของ ความยาวส่วนโค้งนั้นมีประสิทธิภาพโดยสมมติว่าจุดข้อมูลสามารถเรียงลำดับได้ระยะทางคอร์ดอาจถูกนำมาใช้[ 22 ]
การพอดีของวงกลมโดยใช้หลักเรขาคณิต



Coope [ 23 ]เข้าถึงปัญหาการพยายามหาความพอดีทางสายตาที่ดีที่สุดของวงกลมกับชุดจุดข้อมูล 2 มิติ วิธีการนี้แปลงปัญหาที่ไม่เป็นเชิงเส้นตามปกติให้กลายเป็นปัญหาเชิงเส้นที่สามารถแก้ไขได้โดยไม่ต้องใช้วิธีการเชิงตัวเลขแบบวนซ้ำ จึงเร็วกว่าเทคนิคก่อนหน้านี้มาก
การหาค่าที่พอดีกับวงรีโดยใช้วิธีทางคณิตศาสตร์
สมการของภาคตัดกรวย (รวมถึงวงรี) มีรูปแบบดังนี้ [ 24 ]
สำหรับจุดที่มีพิกัดคาร์ทีเซียน(x,y)บนขอบ สำหรับชุดข้อมูลของจุดที่กระจัดกระจาย(x ,y )และวงรีคงที่ ด้านขวาของสมการนี้จะไม่เป็นศูนย์อีกต่อไป แนวทางหนึ่งในการปรับจุดให้เข้ากับวงรีคือการหาพารามิเตอร์หกตัวAถึงFที่ทำให้ผลรวมของ (กำลังสองของ) ด้านขวาที่เหลืออยู่มีค่าน้อยที่สุด ซึ่งนำไปสู่ปัญหาการปรับแบบกำลังสองน้อยที่สุดเชิงเส้น ซึ่งโดยพื้นฐานแล้วจะแก้ได้โดยการหาเวกเตอร์ลักษณะเฉพาะของ เมทริกซ์ 6 x 6 ที่เกี่ยวข้อง ซึ่งประกอบด้วยผลรวมของกำลังผสมของ( x ,y ) [ 25 ] [ 26 ] [ 27 ] [ 28 ]
การปรับวงรีให้พอดีด้วยรูปทรงเรขาคณิต
เทคนิคข้างต้นขยายไปสู่วงรีทั่วไป[ 29 ]โดยการเพิ่มขั้นตอนที่ไม่เป็นเชิงเส้น ส่งผลให้ได้วิธีการที่รวดเร็ว แต่ยังคงค้นหาวงรีที่สวยงามตามการวางแนวและการกระจัดแบบใดก็ได้ การปรับให้เข้ากับรูปทรงเรขาคณิตจะลดผลรวมของระยะทางตั้งฉากกำลังสองของจุดข้อมูลไปยังขอบของวงรีให้เหลือน้อยที่สุด [ 30 ] [ 31 ] วิธีการที่คล้ายกันซึ่งประมาณระยะทางตั้งฉากเหล่านี้ขึ้นอยู่กับเมตริกแซมป์สัน [ 32 ] [ 33 ]
พื้นผิวที่พอดี
โปรดทราบว่าแม้การอภิปรายนี้จะกล่าวถึงเส้นโค้ง 2 มิติ แต่ตรรกะส่วนใหญ่ยังสามารถขยายไปถึงพื้นผิว 3 มิติได้ด้วย โดยแต่ละส่วนของพื้นผิวจะถูกกำหนดโดยโครงข่ายของเส้นโค้งในสองทิศทางพาราเมตริก ซึ่งโดยทั่วไปเรียกว่าuและvพื้นผิวอาจประกอบด้วยส่วนของพื้นผิวหนึ่งส่วนหรือมากกว่าในแต่ละทิศทาง
ซอฟต์แวร์
โปรแกรมทางสถิติหลาย โปรแกรม เช่นRและซอฟต์แวร์เชิงตัวเลขเช่นgnuplot , GNU Scientific Library , Igor Pro , MLAB , Maple , MATLAB , TK Solver 6.0, Scilab , Mathematica , GNU OctaveและSciPyมีคำสั่งสำหรับทำการปรับเส้นโค้งให้เข้ากับข้อมูลในสถานการณ์ต่างๆ นอกจากนี้ยังมีโปรแกรมที่เขียนขึ้นโดยเฉพาะสำหรับการปรับเส้นโค้งให้เข้ากับข้อมูล ซึ่งสามารถพบได้ในรายการโปรแกรมทางสถิติและการวิเคราะห์เชิงตัวเลขรวมถึงในหมวดหมู่: ซอฟต์แวร์การถดถอยและการปรับเส้นโค้งให้เข้ากับข้อมูล
ดูเพิ่มเติม
- เส้นโค้งสอบเทียบ
- การอัดแน่นแบบปรับเส้นโค้งให้พอดี
- การแบ่งส่วนย่อย
- ทฤษฎีการประมาณค่า
- การประมาณฟังก์ชัน
- การโปรแกรมทางพันธุกรรม
- ความพอดีที่ดี
- การปรับค่ากำลังสองน้อยที่สุด
- อัลกอริทึมเลเวนเบิร์ก-มาร์ควาร์ด
- การติดตั้งท่อ
- การประมาณค่าเชิงเส้น
- การประมาณแนวโน้มเชิงเส้น
- แบบจำลองทางคณิตศาสตร์
- การเขียนโปรแกรมแบบหลายนิพจน์
- กรอบแนวคิดหลายเส้นโค้งและการเริ่มต้นธุรกิจแบบบูตสแตรป (ด้านการเงิน)
- การถดถอยแบบไม่เชิงเส้น
- โอเวอร์ฟิตติ้ง
- เส้นโค้งระนาบ
- การปรับการกระจายความน่าจะเป็น
- วิธีการประมาณค่าแบบวนซ้ำก้าวหน้า
- แบบจำลองไซนูซอยด์
- การปรับให้เรียบ
- สปลายน์ ( การประมาณ ค่าในช่วง , การปรับให้ เรียบ )
- อนุกรมเวลา
- ผลรวมกำลังสองน้อยที่สุด
อ่านเพิ่มเติม
- N. Chernov (2010), การถดถอยแบบวงกลมและเชิงเส้น: การหาค่าที่เหมาะสมของวงกลมและเส้นตรงโดยใช้วิธีกำลังสองน้อยที่สุด , Chapman & Hall/CRC, เอกสารทางวิชาการด้านสถิติและความน่าจะเป็นประยุกต์, เล่มที่ 117 (256 หน้า)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การปรับเส้นโค้งให้เหมาะสม
การปรับ เส้น โค้ง [ 1 ] [ 2 ] คือกระบวนการสร้าง เส้นโค้ง หรือ ฟังก์ชันทางคณิตศาสตร์ ที่เหมาะสมที่สุดกับชุด จุดข้อมูล [ 3 ] ซึ่งอาจอยู่ภายใต้ข้อจำกัด [ 4 ] [ 5 ]...
การปรับฟังก์ชันให้เข้ากับจุดข้อมูลด้วยวิธีพีชคณิต
โดยทั่วไปแล้ว เราจะใช้ฟังก์ชันที่มีรูปแบบ y = f ( x ) ในการหาค่าที่ เหมาะสม
การนำฟังก์ชันอื่นๆ มาใช้กับจุดข้อมูล
ในบางกรณี อาจใช้เส้นโค้งประเภทอื่น เช่น ฟังก์ชันตรีโกณมิติ (เช่น ไซน์และโคไซน์) ได้เช่นกัน
การปรับเส้นโค้งระนาบให้เข้ากับจุดข้อมูลด้วยรูปทรงเรขาคณิต
หาก ไม่สามารถกำหนดฟังก์ชันในรูปแบบดังกล่าว ได้ ก็ยังสามารถลองปรับให้เข้ากับ เส้นโค้งระนาบ ได้ y = เอฟ ( x ) {\displaystyle y=f(x)}