กลับไปหน้าบทความ

อ่าน 6 นาที

การปรับเส้นโค้งให้เหมาะสม

การปรับ เส้น โค้ง [ 1 ] [ 2 ] คือกระบวนการสร้าง เส้นโค้ง หรือ ฟังก์ชันทางคณิตศาสตร์ ที่เหมาะสมที่สุดกับชุด จุดข้อมูล [ 3 ] ซึ่งอาจอยู่ภายใต้ข้อจำกัด [ 4 ] [ 5 ]...

การปรับเส้นโค้งให้เหมาะสม

การปรับเส้นโค้งที่มีสัญญาณรบกวนด้วยแบบจำลองยอดไม่สมมาตร โดยใช้กระบวนการวนซ้ำ ( อัลกอริธึมเกาส์-นิวตันพร้อมตัวประกอบการหน่วง α ที่เปลี่ยนแปลงได้)

การปรับ เส้นโค้ง[ 1 ] [ 2 ]คือกระบวนการสร้างเส้นโค้งหรือฟังก์ชันทางคณิตศาสตร์ที่เหมาะสมที่สุดกับชุดจุดข้อมูล [ 3 ]ซึ่งอาจอยู่ภายใต้ข้อจำกัด[ 4 ] [ 5 ]การปรับเส้นโค้งอาจเกี่ยวข้องกับการแทรกสอด [ 6 ] [ 7 ] ซึ่งต้องการความพอดีที่แน่นอนกับข้อมูล หรือ การปรับ ให้เรียบ[ 8 ] [ 9 ]ซึ่งเป็นการสร้างฟังก์ชัน "เรียบ" ที่พอดีกับข้อมูลโดยประมาณ หัวข้อที่เกี่ยวข้องคือการวิเคราะห์การถดถอย [ 10 ] [ 11 ]ซึ่งมุ่งเน้นไปที่คำถามเกี่ยวกับการอนุมานทางสถิติ เช่น ความไม่แน่นอนที่มีอยู่ในเส้นโค้งที่ปรับให้เข้ากับข้อมูลที่ สังเกตได้โดยมีข้อผิดพลาดแบบสุ่ม เส้นโค้งที่ปรับแล้วสามารถใช้เป็นเครื่องมือช่วยในการแสดงภาพข้อมูล[ 12 ] [ 13 ]เพื่ออนุมานค่าของฟังก์ชันในกรณีที่ไม่มีข้อมูล[ 14 ]และเพื่อสรุปความสัมพันธ์ระหว่างตัวแปรสองตัวขึ้นไป[ 15 ]การขยายขอบเขตหมายถึงการใช้เส้นโค้งที่เหมาะสมเกินขอบเขตของข้อมูลที่สังเกตได้[ 16 ]และขึ้นอยู่กับระดับความไม่แน่นอน[ 17 ]เนื่องจากอาจสะท้อนถึงวิธีการที่ใช้ในการสร้างเส้นโค้งมากพอๆ กับที่สะท้อนถึงข้อมูลที่สังเกตได้

สำหรับการวิเคราะห์ข้อมูลเชิงเส้นพีชคณิต "การปรับให้เหมาะสม" โดยทั่วไปหมายถึงการพยายามหาเส้นโค้งที่ลดการเคลื่อนที่ในแนวตั้ง ( แกน y ) ของจุดจากเส้นโค้งให้น้อยที่สุด (เช่นกำลังสองน้อยที่สุดแบบธรรมดา ) อย่างไรก็ตาม สำหรับแอปพลิเคชันกราฟิกและรูปภาพ การปรับให้เหมาะสมทางเรขาคณิตมุ่งที่จะให้ความเหมาะสมทางสายตาที่ดีที่สุด ซึ่งโดยทั่วไปหมายถึงการพยายามลดระยะห่างตั้งฉากกับเส้นโค้งให้น้อยที่สุด (เช่นกำลังสองน้อยที่สุดทั้งหมด ) หรือรวมแกนการเคลื่อนที่ทั้งสองของจุดจากเส้นโค้ง การปรับให้เหมาะสมทางเรขาคณิตไม่เป็นที่นิยมเนื่องจากโดยทั่วไปต้องใช้การคำนวณแบบไม่เชิงเส้นและ/หรือแบบวนซ้ำ แม้ว่าจะมีข้อดีคือผลลัพธ์ที่สวยงามและแม่นยำทางเรขาคณิตมากกว่าก็ตาม[ 18 ] [ 19 ] [ 20 ]

การปรับฟังก์ชันให้เข้ากับจุดข้อมูลด้วยวิธีพีชคณิต

โดยทั่วไปแล้ว เราจะใช้ฟังก์ชันที่มีรูปแบบy = f ( x ) ในการหาค่าที่ เหมาะสม

การปรับเส้นตรงและฟังก์ชันพหุนามให้เข้ากับจุดข้อมูล

เส้นโค้งพหุนามที่เหมาะสมกับฟังก์ชันไซน์
เส้นโค้งพหุนามที่เหมาะสมกับจุดที่สร้างขึ้นด้วยฟังก์ชันไซน์ เส้นประสีดำคือข้อมูล "จริง" เส้นสีแดงคือพหุนามดีกรีหนึ่งเส้นสีเขียวคือ พหุนาม ดีกรีสองเส้นสีส้มคือพหุนามดีกรีสามและเส้นสีน้ำเงินคือพหุนามดีกรีสี่

สมการพหุนามดีกรีหนึ่ง

เส้นตรงคือเส้นตรงที่มีความชัน เท่ากับ aเส้นตรงจะเชื่อมต่อจุดสองจุดใดๆ ดังนั้นสมการพหุนามดีกรีหนึ่งจึงเป็นสมการที่ลากผ่านจุดสองจุดใดๆ ที่มีพิกัด x ต่างกันได้อย่างพอดี

หากเพิ่มอันดับของสมการเป็นพหุนามดีกรีสอง จะได้ผลลัพธ์ดังต่อไปนี้:

เส้นนี้จะพอดีกับเส้นโค้งอย่างง่ายที่จุดสามจุดอย่างแม่นยำ

หากเพิ่มอันดับของสมการเป็นพหุนามดีกรีสาม จะได้ผลลัพธ์ดังต่อไปนี้:

นี่จะพอดีกับจุดสี่จุดพอดี

กล่าวโดยทั่วไปแล้ว เส้นโค้งนั้นจะตรงตามข้อจำกัด สี่ข้ออย่างแม่นยำ แต่ละข้อจำกัดอาจเป็นจุดมุมหรือความโค้ง (ซึ่งเป็นส่วนกลับของรัศมีของวงกลมสัมผัส ) ข้อจำกัดเกี่ยวกับมุมและความโค้งมักจะถูกเพิ่มเข้าไปที่ปลายของเส้นโค้ง และในกรณีเช่นนี้เรียกว่าเงื่อนไขปลายเงื่อนไขปลายที่เหมือนกันมักใช้เพื่อให้แน่ใจว่าการเปลี่ยนผ่านระหว่างเส้นโค้งพหุนามภายในสปลาย เดียวเป็นไป อย่างราบรื่น ข้อจำกัดลำดับสูงกว่า เช่น "การเปลี่ยนแปลงอัตราความโค้ง" ก็สามารถเพิ่มเข้าไปได้เช่นกัน ตัวอย่างเช่น สิ่งนี้จะมีประโยชน์ใน การออกแบบทาง แยกต่าง ระดับบนทางหลวง เพื่อทำความเข้าใจอัตราการเปลี่ยนแปลงของแรงที่กระทำต่อรถยนต์ (ดูการกระชาก ) ขณะที่รถวิ่งผ่านทางแยกต่างระดับ และเพื่อกำหนดขีดจำกัดความเร็วที่เหมาะสมตามนั้น

สมการพหุนามดีกรีหนึ่งอาจเหมาะสมอย่างแม่นยำสำหรับจุดเดียวและมุมหนึ่ง ในขณะที่สมการพหุนามดีกรีสามอาจเหมาะสมอย่างแม่นยำสำหรับสองจุด ข้อจำกัดของมุม และข้อจำกัดของความโค้ง นอกจากนี้ยังสามารถใช้ข้อจำกัดอื่นๆ ได้อีกหลายแบบสำหรับสมการเหล่านี้และสมการพหุนามดีกรีสูงกว่า

หากมีข้อจำกัดมากกว่าn  +  1 ข้อ ( โดยที่ nคือดีกรีของพหุนาม) เส้นโค้งพหุนามก็ยังสามารถผ่านข้อจำกัดเหล่านั้นได้ การที่เส้นโค้งพอดีกับข้อจำกัดทั้งหมดอย่างแม่นยำนั้นไม่แน่นอน (แต่ก็อาจเกิดขึ้นได้ เช่น ในกรณีที่พหุนามดีกรีหนึ่งพอดีกับจุดสามจุดที่เรียงตัวกัน อย่างแม่นยำ ) อย่างไรก็ตาม โดยทั่วไปแล้ว จำเป็นต้องมีวิธีการบางอย่างในการประเมินค่าประมาณแต่ละค่า วิธี การกำลังสองน้อยที่สุดเป็นวิธีหนึ่งในการเปรียบเทียบความคลาดเคลื่อน

มีเหตุผลหลายประการที่ทำให้ต้องใช้ค่าประมาณในการปรับสมการพหุนาม ทั้งๆ ที่สามารถเพิ่มดีกรีของสมการพหุนามเพื่อให้ได้ค่าที่ตรงกันอย่างแม่นยำได้:

  • ถึงแม้ว่าจะมีการจับคู่ที่ตรงกันอย่างสมบูรณ์ แต่ก็ไม่ได้หมายความว่าจะสามารถค้นหาได้โดยง่ายเสมอไป ขึ้นอยู่กับอัลกอริทึมที่ใช้ อาจมีกรณีที่แตกต่างกันออกไป ซึ่งไม่สามารถคำนวณการจับคู่ที่ตรงกันอย่างสมบูรณ์ได้ หรืออาจต้องใช้เวลาในการคำนวณมากเกินไปในการหาคำตอบ สถานการณ์เช่นนี้อาจต้องใช้คำตอบโดยประมาณ
  • การหาค่าเฉลี่ยของจุดข้อมูลที่น่าสงสัยในตัวอย่าง แทนที่จะบิดเบือนเส้นโค้งเพื่อให้ตรงกับจุดข้อมูลเหล่านั้นอย่างแม่นยำ อาจเป็นผลที่พึงประสงค์
  • ปรากฏการณ์ของรันเก : พหุนามอันดับสูงมักมีการแกว่งสูงมาก หากเส้นโค้งลากผ่านจุดสองจุดAและBก็คาดได้ว่าเส้นโค้งนั้นจะอยู่ใกล้จุดกึ่งกลางของAและBด้วยเช่นกัน แต่สิ่งนี้อาจไม่เกิดขึ้นกับเส้นโค้งพหุนามอันดับสูง ค่าของเส้นโค้งอาจมีขนาดใหญ่มากทั้งในค่าบวกหรือค่าลบในขณะที่พหุนามอันดับต่ำ เส้นโค้งมักจะอยู่ใกล้จุดกึ่งกลางมากกว่า (และรับประกันได้ว่าจะผ่านจุดกึ่งกลางอย่างแม่นยำสำหรับพหุนามดีกรี 1)
  • เส้นโค้งพหุนามอันดับต่ำมักจะเรียบ ในขณะที่เส้นโค้งพหุนามอันดับสูงมักจะ "เป็นลอน" เพื่ออธิบายให้ชัดเจนยิ่งขึ้น จำนวนจุดเปลี่ยนเว้า สูงสุด ที่เป็นไปได้ในเส้นโค้งพหุนามคือn-2โดยที่nคืออันดับของสมการพหุนาม จุดเปลี่ยนเว้าคือตำแหน่งบนเส้นโค้งที่รัศมีเปลี่ยนจากบวกเป็นลบ เราอาจกล่าวได้ว่านี่คือจุดที่เส้นโค้งเปลี่ยนจาก "กักเก็บน้ำ" เป็น "ระบายน้ำ" โปรดทราบว่าพหุนามอันดับสูงนั้น "เป็นไปได้" ที่จะมีลักษณะเป็นลอน มันอาจจะเรียบก็ได้ แต่ไม่มีการรับประกัน ต่างจากเส้นโค้งพหุนามอันดับต่ำ พหุนามดีกรีสิบห้าอาจมีจุดเปลี่ยนเว้าได้มากที่สุดสิบสามจุด แต่ก็อาจมีสิบเอ็ดจุด เก้าจุด หรือจำนวนคี่ใดๆ ก็ได้ลงไปจนถึงหนึ่งจุด (พหุนามที่มีดีกรีเป็นเลขคู่สามารถมีจุดเปลี่ยนเว้าได้จำนวนคู่ใดๆ ก็ได้ตั้งแต่n  -  2 ลงไปจนถึงศูนย์)

ระดับของเส้นโค้งพหุนามที่สูงกว่าที่จำเป็นสำหรับการจับคู่ที่แม่นยำนั้นไม่เป็นที่พึงประสงค์ด้วยเหตุผลทั้งหมดที่ได้กล่าวไว้ก่อนหน้านี้สำหรับพหุนามอันดับสูง แต่ยังนำไปสู่กรณีที่มีคำตอบเป็นอนันต์อีกด้วย ตัวอย่างเช่น พหุนามดีกรีหนึ่ง (เส้นตรง) ที่ถูกจำกัดด้วยจุดเพียงจุดเดียว แทนที่จะเป็นสองจุดตามปกติ จะให้คำตอบเป็นอนันต์ ซึ่งนำมาซึ่งปัญหาว่าจะเปรียบเทียบและเลือกคำตอบเพียงหนึ่งเดียวได้อย่างไร ซึ่งอาจเป็นปัญหาสำหรับทั้งซอฟต์แวร์และมนุษย์ ด้วยเหตุนี้ โดยทั่วไปแล้วจึงควรเลือกดีกรีที่ต่ำที่สุดเท่าที่จะเป็นไปได้สำหรับการจับคู่ที่แม่นยำกับข้อจำกัดทั้งหมด และอาจเลือกดีกรีที่ต่ำกว่านั้นอีกหากการจับคู่โดยประมาณเป็นที่ยอมรับได้

ความสัมพันธ์ระหว่างผลผลิตข้าวสาลีและความเค็มของดิน[ 21 ]

การนำฟังก์ชันอื่นๆ มาใช้กับจุดข้อมูล

ในบางกรณี อาจใช้เส้นโค้งประเภทอื่น เช่นฟังก์ชันตรีโกณมิติ (เช่น ไซน์และโคไซน์) ได้เช่นกัน

ในวิชาสเปกโทรสโกปี ข้อมูลอาจถูกปรับให้เข้ากับฟังก์ชันเกาส์เซียนลอเรนซ์โวอิกต์และฟังก์ชันที่เกี่ยวข้อง

ในชีววิทยา นิเวศวิทยา ประชากรศาสตร์ ระบาดวิทยา และสาขาวิชาอื่นๆ อีกมากมาย การเติบโตของประชากรการแพร่กระจายของโรคติดต่อ ฯลฯ สามารถอธิบายได้ด้วยฟังก์ชันโลจิสติ

ในด้านการเกษตรฟังก์ชันซิกมอยด์แบบโลจิสติกผกผัน(เส้นโค้งรูปตัว S) ถูกนำมาใช้เพื่ออธิบายความสัมพันธ์ระหว่างผลผลิตพืชและปัจจัยการเจริญเติบโต รูปสีน้ำเงินสร้างขึ้นจากสมการถดถอยซิกมอยด์ของข้อมูลที่วัดได้ในพื้นที่เพาะปลูก จะเห็นได้ว่า ในช่วงเริ่มต้น กล่าวคือ ในดินที่มีความเค็มต่ำ ผลผลิตพืชจะลดลงอย่างช้าๆ เมื่อความเค็มของดินเพิ่มขึ้น ในขณะที่หลังจากนั้น การลดลงจะเกิดขึ้นเร็วขึ้น

การปรับเส้นโค้งระนาบให้เข้ากับจุดข้อมูลด้วยรูปทรงเรขาคณิต

หาก ไม่สามารถกำหนดฟังก์ชันในรูปแบบดังกล่าว ได้ ก็ยังสามารถลองปรับให้เข้ากับ เส้นโค้งระนาบได้

เส้นโค้งประเภทอื่น ๆ เช่นภาคตัดกรวย (ส่วนโค้งวงกลม วงรี พาราโบลา และไฮเปอร์โบลา) หรือฟังก์ชันตรีโกณมิติ (เช่น ไซน์และโคไซน์) ก็สามารถนำมาใช้ได้ในบางกรณี ตัวอย่างเช่น วิถีการเคลื่อนที่ของวัตถุภายใต้แรงโน้มถ่วงจะตามเส้นทางพาราโบลา เมื่อไม่พิจารณาแรงต้านอากาศ ดังนั้น การจับคู่จุดข้อมูลวิถีการเคลื่อนที่กับเส้นโค้งพาราโบลาจึงสมเหตุสมผล ส่วนน้ำขึ้นน้ำลงมีรูปแบบเป็นคลื่นไซน์ ดังนั้น จุดข้อมูลน้ำขึ้นน้ำลงควรจับคู่กับคลื่นไซน์ หรือผลรวมของคลื่นไซน์สองลูกที่มีคาบเวลาต่างกัน หากพิจารณาผลกระทบจากทั้งดวงจันทร์และดวงอาทิตย์

สำหรับเส้นโค้งพาราเมตริก การปรับพิกัดแต่ละจุดให้เป็นฟังก์ชันแยกกันของ ความยาวส่วนโค้งนั้นมีประสิทธิภาพโดยสมมติว่าจุดข้อมูลสามารถเรียงลำดับได้ระยะทางคอร์ดอาจถูกนำมาใช้[ 22 ]

การพอดีของวงกลมโดยใช้หลักเรขาคณิต

การหาค่าที่เหมาะสมของวงกลมด้วยวิธี Coope โดยจุดต่างๆ อธิบายส่วนโค้งของวงกลม จุดศูนย์กลางอยู่ที่ (1  ; 1) รัศมี 4
รูปแบบต่างๆ ของการปรับวงรีให้พอดี
การหาค่าที่เหมาะสมที่สุดของวงรีโดยลดระยะทางเชิงพีชคณิตให้เหลือน้อยที่สุด (วิธีของฟิตซ์กิบบอน)

Coope [ 23 ]เข้าถึงปัญหาการพยายามหาความพอดีทางสายตาที่ดีที่สุดของวงกลมกับชุดจุดข้อมูล 2 มิติ วิธีการนี้แปลงปัญหาที่ไม่เป็นเชิงเส้นตามปกติให้กลายเป็นปัญหาเชิงเส้นที่สามารถแก้ไขได้โดยไม่ต้องใช้วิธีการเชิงตัวเลขแบบวนซ้ำ จึงเร็วกว่าเทคนิคก่อนหน้านี้มาก

การหาค่าที่พอดีกับวงรีโดยใช้วิธีทางคณิตศาสตร์

สมการของภาคตัดกรวย (รวมถึงวงรี) มีรูปแบบดังนี้ [ 24 ]

สำหรับจุดที่มีพิกัดคาร์ทีเซียน(x,y)บนขอบ สำหรับชุดข้อมูลของจุดที่กระจัดกระจาย(x ,y )และวงรีคงที่ ด้านขวาของสมการนี้จะไม่เป็นศูนย์อีกต่อไป แนวทางหนึ่งในการปรับจุดให้เข้ากับวงรีคือการหาพารามิเตอร์หกตัวAถึงFที่ทำให้ผลรวมของ (กำลังสองของ) ด้านขวาที่เหลืออยู่มีค่าน้อยที่สุด ซึ่งนำไปสู่ปัญหาการปรับแบบกำลังสองน้อยที่สุดเชิงเส้น ซึ่งโดยพื้นฐานแล้วจะแก้ได้โดยการหาเวกเตอร์ลักษณะเฉพาะของ เมทริกซ์ 6 x 6 ที่เกี่ยวข้อง ซึ่งประกอบด้วยผลรวมของกำลังผสมของ( x ,y ) [ 25 ] [ 26 ] [ 27 ] [ 28 ]

การปรับวงรีให้พอดีด้วยรูปทรงเรขาคณิต

เทคนิคข้างต้นขยายไปสู่วงรีทั่วไป[ 29 ]โดยการเพิ่มขั้นตอนที่ไม่เป็นเชิงเส้น ส่งผลให้ได้วิธีการที่รวดเร็ว แต่ยังคงค้นหาวงรีที่สวยงามตามการวางแนวและการกระจัดแบบใดก็ได้ การปรับให้เข้ากับรูปทรงเรขาคณิตจะลดผลรวมของระยะทางตั้งฉากกำลังสองของจุดข้อมูลไปยังขอบของวงรีให้เหลือน้อยที่สุด [ 30 ] [ 31 ] วิธีการที่คล้ายกันซึ่งประมาณระยะทางตั้งฉากเหล่านี้ขึ้นอยู่กับเมตริกแซมป์สัน [ 32 ] [ 33 ]

พื้นผิวที่พอดี

โปรดทราบว่าแม้การอภิปรายนี้จะกล่าวถึงเส้นโค้ง 2 มิติ แต่ตรรกะส่วนใหญ่ยังสามารถขยายไปถึงพื้นผิว 3 มิติได้ด้วย โดยแต่ละส่วนของพื้นผิวจะถูกกำหนดโดยโครงข่ายของเส้นโค้งในสองทิศทางพาราเมตริก ซึ่งโดยทั่วไปเรียกว่าuและvพื้นผิวอาจประกอบด้วยส่วนของพื้นผิวหนึ่งส่วนหรือมากกว่าในแต่ละทิศทาง

ซอฟต์แวร์

โปรแกรมทางสถิติหลาย โปรแกรม เช่นRและซอฟต์แวร์เชิงตัวเลขเช่นgnuplot , GNU Scientific Library , Igor Pro , MLAB , Maple , MATLAB , TK Solver 6.0, Scilab , Mathematica , GNU OctaveและSciPyมีคำสั่งสำหรับทำการปรับเส้นโค้งให้เข้ากับข้อมูลในสถานการณ์ต่างๆ นอกจากนี้ยังมีโปรแกรมที่เขียนขึ้นโดยเฉพาะสำหรับการปรับเส้นโค้งให้เข้ากับข้อมูล ซึ่งสามารถพบได้ในรายการโปรแกรมทางสถิติและการวิเคราะห์เชิงตัวเลขรวมถึงในหมวดหมู่: ซอฟต์แวร์การถดถอยและการปรับเส้นโค้งให้เข้ากับข้อมูล

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • N. Chernov (2010), การถดถอยแบบวงกลมและเชิงเส้น: การหาค่าที่เหมาะสมของวงกลมและเส้นตรงโดยใช้วิธีกำลังสองน้อยที่สุด , Chapman & Hall/CRC, เอกสารทางวิชาการด้านสถิติและความน่าจะเป็นประยุกต์, เล่มที่ 117 (256 หน้า)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Curve_fitting&oldid=1343749234 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การปรับเส้นโค้งให้เหมาะสม

การปรับ เส้น โค้ง [ 1 ] [ 2 ] คือกระบวนการสร้าง เส้นโค้ง หรือ ฟังก์ชันทางคณิตศาสตร์ ที่เหมาะสมที่สุดกับชุด จุดข้อมูล [ 3 ] ซึ่งอาจอยู่ภายใต้ข้อจำกัด [ 4 ] [ 5 ]...

การปรับฟังก์ชันให้เข้ากับจุดข้อมูลด้วยวิธีพีชคณิต

โดยทั่วไปแล้ว เราจะใช้ฟังก์ชันที่มีรูปแบบ y = f ( x ) ในการหาค่าที่ เหมาะสม

การนำฟังก์ชันอื่นๆ มาใช้กับจุดข้อมูล

ในบางกรณี อาจใช้เส้นโค้งประเภทอื่น เช่น ฟังก์ชันตรีโกณมิติ (เช่น ไซน์และโคไซน์) ได้เช่นกัน

การปรับเส้นโค้งระนาบให้เข้ากับจุดข้อมูลด้วยรูปทรงเรขาคณิต

หาก ไม่สามารถกำหนดฟังก์ชันในรูปแบบดังกล่าว ได้ ก็ยังสามารถลองปรับให้เข้ากับ เส้นโค้งระนาบ ได้ y = เอฟ ( x ) {\displaystyle y=f(x)}