ทฤษฎีการประมาณค่า

Q: ข้อมูลสำคัญเกี่ยวกับ ทฤษฎีการประมาณค่า

ในทางคณิตศาสตร์ทฤษฎีการประมาณค่าเกี่ยวข้องกับวิธีการประมาณค่าฟังก์ชัน ด้วยฟังก์ชันที่เรียบง่ายกว่า ได้ดีที่สุดและการกำหนดลักษณะเชิงปริมาณของข้อผิดพลาดที่เกิดขึ้นจากวิธีการดังกล่าว.

ในทางคณิตศาสตร์ทฤษฎีการประมาณค่าเกี่ยวข้องกับวิธีการประมาณ ค่าฟังก์ชัน ด้วยฟังก์ชันที่เรียบง่ายกว่า ได้ดีที่สุดและการกำหนดลักษณะ เชิงปริมาณของข้อผิดพลาดที่เกิดขึ้นจากวิธีการดังกล่าว ความหมายของคำว่า " ดีที่สุด"และ " เรียบง่ายกว่า"จะขึ้นอยู่กับการประยุกต์ใช้

หัวข้อที่เกี่ยวข้องอย่างใกล้ชิดคือ การประมาณค่าฟังก์ชันโดยใช้ชุดอนุกรมฟูริเยร์แบบทั่วไปซึ่งก็คือการประมาณค่าโดยอาศัยการรวมผลของชุดพจน์ที่อิงตามพหุนามเชิงตั้งฉาก

ปัญหาหนึ่งที่น่าสนใจเป็นพิเศษคือ การประมาณค่าฟังก์ชันใน ไลบรารีทางคณิตศาสตร์ ของคอมพิวเตอร์โดยใช้การดำเนินการที่สามารถทำได้บนคอมพิวเตอร์หรือเครื่องคิดเลข (เช่น การบวกและการคูณ) เพื่อให้ผลลัพธ์ใกล้เคียงกับฟังก์ชันจริงมากที่สุดเท่าที่จะเป็นไปได้ โดยทั่วไปแล้วจะใช้วิธีการประมาณค่าด้วยพหุนามหรือจำนวนตรรกยะ (อัตราส่วนของพหุนาม)

จุดประสงค์คือการทำให้ค่าประมาณใกล้เคียงกับฟังก์ชันจริงมากที่สุด โดยทั่วไปแล้วจะมีความแม่นยำใกล้เคียงกับความแม่นยำของ การคำนวณ เลข ทศนิยมของคอมพิวเตอร์ ซึ่งทำได้โดยการใช้พหุนามดีกรี สูง และ/หรือจำกัดขอบเขตของโดเมนที่พหุนามต้องใช้ในการประมาณฟังก์ชัน การจำกัดขอบเขตมักทำได้โดยการใช้สูตรการบวกหรือการปรับขนาดต่างๆ สำหรับฟังก์ชันที่กำลังประมาณ ไลบรารีทางคณิตศาสตร์สมัยใหม่มักลดขอบเขตลงเป็นส่วนเล็กๆ จำนวนมาก และใช้พหุนามดีกรีต่ำสำหรับแต่ละส่วน

พหุนามที่เหมาะสมที่สุด

เมื่อเลือกโดเมน (โดยทั่วไปคือช่วง) และดีกรีของพหุนามแล้ว พหุนามนั้นจะถูกเลือกในลักษณะที่ทำให้ค่าความคลาดเคลื่อนกรณีที่เลวร้ายที่สุดมีค่าน้อยที่สุด กล่าวคือ เป้าหมายคือการลดค่าสูงสุดของโดยที่P ( x ) คือพหุนามประมาณค่าf ( x ) คือฟังก์ชันจริง และxเปลี่ยนแปลงไปตามช่วงที่เลือก สำหรับฟังก์ชันที่มีพฤติกรรมที่ดี จะมี พหุนาม ดีกรีN อยู่ ตัวหนึ่งที่จะทำให้เส้นโค้งความคลาดเคลื่อนแกว่งไปมาระหว่างและรวมทั้งหมดN + 2 ครั้ง ทำให้เกิดความคลาดเคลื่อนกรณีที่เลวร้ายที่สุด เท่ากับ จะเห็นได้ว่ามี พหุนามดีกรี N อยู่ ตัว หนึ่ง ที่สามารถประมาณค่า จุด N + 1 จุดบนเส้นโค้งได้ ทฤษฎีบท การแกว่งเท่า กันยืนยัน ว่าพหุนามดังกล่าวเป็นตัวเลือกที่ดีที่สุดเสมอเป็นไปได้ที่จะสร้างฟังก์ชันf ( x ) ที่ไม่มีพหุนามดังกล่าวอยู่ แต่ในทางปฏิบัติแล้วเกิดขึ้นได้ยาก $\mid P(x)-f(x)\mid$ $+\varepsilon$ $-\varepsilon$ $\varepsilon$

ตัวอย่างเช่น กราฟที่แสดงทางด้านขวาแสดงข้อผิดพลาดในการประมาณค่า log(x) และ exp(x) สำหรับN = 4 เส้นโค้งสีแดงสำหรับพหุนามที่เหมาะสมที่สุดนั้นเป็นเส้นตรงกล่าวคือ เส้นโค้งจะแกว่งไปมาระหว่างและอย่างแม่นยำ ในแต่ละกรณี จำนวนจุดสูงสุดและต่ำสุดคือN + 2 นั่นคือ 6 จุดสูงสุดและต่ำสุดสองจุดอยู่ที่จุดปลายของช่วง ที่ขอบด้านซ้ายและด้านขวาของกราฟ $+\varepsilon$ $-\varepsilon$

ข้อผิดพลาดP ( x ) − f ( x ) สำหรับพหุนามระดับ (สีแดง) และสำหรับพหุนามที่คาดว่าจะดีกว่า (สีน้ำเงิน)

เพื่อพิสูจน์ว่าสิ่งนี้เป็นจริงโดยทั่วไป สมมติว่าPเป็นพหุนามดีกรีNที่มีคุณสมบัติตามที่อธิบายไว้ นั่นคือ มันทำให้เกิดฟังก์ชันความคลาดเคลื่อนที่มี ค่าสุดขั้ว N + 2 ค่า โดยมีเครื่องหมายสลับกันและขนาดเท่ากัน กราฟสีแดงทางด้านขวาแสดงให้เห็นว่าฟังก์ชันความคลาดเคลื่อนนี้อาจมีลักษณะอย่างไรสำหรับN = 4 สมมติว่าQ ( x ) (ซึ่งฟังก์ชันความคลาดเคลื่อนแสดงด้วยสีน้ำเงินทางด้านขวา) เป็นพหุนามดีกรีN อีกตัวหนึ่งที่ประมาณค่า f ได้ดี กว่าPโดยเฉพาะอย่างยิ่งQอยู่ใกล้fมากกว่าPสำหรับแต่ละค่าxᵢที่เกิดค่าสุดขั้ว_ของ P − fดังนั้น

|Q(x_{i})-f(x_{i})|<|P(x_{i})-f(x_{i})|.

เมื่อค่าสูงสุดของP − fเกิดขึ้นที่x _iแล้ว

Q(x_{i})-f(x_{i})\leq |Q(x_{i})-f(x_{i})|<|P(x_{i})-f(x_{i})|=P(x_{i})-f(x_{i}),

และเมื่อค่าต่ำสุดของP − fเกิดขึ้นที่x _iแล้ว

f(x_{i})-Q(x_{i})\leq |Q(x_{i})-f(x_{i})|<|P(x_{i})-f(x_{i})|=f(x_{i})-P(x_{i}).

ดังนั้น ดังที่เห็นได้ในกราฟ [ P ( x ) − f ( x )] − [ Q ( x ) − f ( x )] จะต้องสลับเครื่องหมายสำหรับ ค่า x _i จำนวน N + 2 ค่าแต่ [ P ( x ) − f ( x )] − [ Q ( x ) − f ( x )] ลดรูปเป็นP ( x ) − Q ( x ) ซึ่งเป็นพหุนามดีกรีNฟังก์ชันนี้เปลี่ยนเครื่องหมายอย่างน้อยN + 1 ครั้ง ดังนั้น ตามทฤษฎีบทค่ากลาง ฟังก์ชันนี้ จึงมี ราก N + 1 ตัว ซึ่งเป็นไปไม่ได้สำหรับพหุนามดีกรีN

การประมาณค่าเชบิเชฟ

เราสามารถหาพหุนามที่ใกล้เคียงกับค่าที่เหมาะสมที่สุดได้โดยการขยายฟังก์ชันที่กำหนดให้ในรูปของพหุนามเชบิเชฟแล้วตัดการขยายนั้นที่ระดับที่ต้องการ วิธีนี้คล้ายกับการวิเคราะห์ฟูริเยร์ของฟังก์ชัน โดยใช้พหุนามเชบิเชฟแทนฟังก์ชันตรีโกณมิติแบบปกติ

หากเราคำนวณสัมประสิทธิ์ในการกระจายเชบิเชฟสำหรับฟังก์ชันหนึ่ง:

f(x)\sim \sum _{i=0}^{\infty }c_{i}T_{i}(x)

จากนั้นจึงตัดอนุกรมออกหลังจากพจน์นั้น จะได้พหุนามดีกรีN ที่ ประมาณค่า f ( x ) $T_{N}$

เหตุผลที่พหุนามนี้เกือบจะเหมาะสมที่สุดก็คือ สำหรับฟังก์ชันที่มีอนุกรมกำลังลู่เข้าอย่างรวดเร็ว หากอนุกรมถูกตัดออกหลังจากพจน์ใดพจน์หนึ่ง ข้อผิดพลาดทั้งหมดที่เกิดจากการตัดออกจะใกล้เคียงกับพจน์แรกหลังจากการตัดออก กล่าวคือ พจน์แรกหลังจากการตัดออกจะครอบงำพจน์ต่อๆ ไปทั้งหมด เช่นเดียวกันหากการกระจายอยู่ในรูปของพหุนามบัคกิ้ง หากการกระจายเชบิเชฟถูกตัดออกหลังจากข้อผิดพลาดจะมีรูปแบบที่ใกล้เคียงกับผลคูณของพหุนามเชบิเชฟมีคุณสมบัติว่าเป็นพหุนามระดับ – มันจะแกว่งไปมาระหว่าง +1 และ −1 ในช่วง [−1, 1] มี ค่าสุดขั้วระดับ N + 2 ค่า ซึ่งหมายความว่าข้อผิดพลาดระหว่างf ( x ) และการกระจายเชบิเชฟจนถึง นั้นใกล้เคียงกับฟังก์ชันระดับที่มีค่า สุดขั้ว N + 2 ค่า ดังนั้นจึงใกล้เคียงกับพหุนามดีกรี N ที่ เหมาะสมที่สุด $T_{N}$ $T_{N+1}$ $T_{N+1}$ $T_{N}$

ในกราฟด้านบน ฟังก์ชันความคลาดเคลื่อนสีน้ำเงินบางครั้งดีกว่า (ภายใน) ฟังก์ชันสีแดง แต่บางครั้งก็แย่กว่า ซึ่งหมายความว่ามันไม่ใช่พหุนามที่เหมาะสมที่สุด ความคลาดเคลื่อนนี้รุนแรงน้อยกว่าสำหรับฟังก์ชัน exp ซึ่งมีอนุกรมกำลังที่ลู่เข้าอย่างรวดเร็วมาก เมื่อเทียบกับฟังก์ชัน log

การประมาณค่าแบบเชบิเชฟเป็นพื้นฐานสำหรับการหา ปริพันธ์เชิงตัวเลข แบบคลีนชอว์-เคอร์ติสซึ่งเป็นเทคนิค การหาปริพันธ์เชิงตัวเลข

อัลกอริทึมของเรเมซ

อัลกอริทึม Remez (บางครั้งสะกดว่า Remes) ใช้ในการสร้างพหุนามP ( x ) ที่เหมาะสมที่สุดเพื่อประมาณค่าฟังก์ชันf ( x ) ที่กำหนดในช่วงเวลาที่กำหนด เป็นอัลกอริทึมแบบวนซ้ำที่ลู่เข้าสู่พหุนามที่มีฟังก์ชันความคลาดเคลื่อนที่มี ค่าสุดขีด N +2 ระดับ ตามทฤษฎีบทข้างต้น พหุนามนั้นจึงเหมาะสมที่สุด

อัลกอริทึมของ Remez ใช้ประโยชน์จากข้อเท็จจริงที่ว่าเราสามารถสร้าง พหุนาม ดีกรีNที่นำไปสู่ค่าความคลาดเคลื่อนที่คงที่และสลับกันได้ โดยกำหนดจุดทดสอบ N + 2 จุด

เมื่อมีจุดทดสอบN + 2 จุด , , ... (โดยที่และน่าจะเป็นจุดปลายของช่วงการประมาณค่า) จะต้องแก้สมการเหล่านี้: $x_{1}$ $x_{2}$ $x_{N+2}$ $x_{1}$ $x_{N+2}$

{\begin{aligned}P(x_{1})-f(x_{1})&=+\varepsilon \\P(x_{2})-f(x_{2})&=-\varepsilon \\P(x_{3})-f(x_{3})&=+\varepsilon \\&\ \ \vdots \\P(x_{N+2})-f(x_{N+2})&=\pm \varepsilon .\end{aligned}}

ด้านขวาสลับเครื่องหมายกัน

นั่นคือ

{\begin{aligned}P_{0}+P_{1}x_{1}+P_{2}x_{1}^{2}+P_{3}x_{1}^{3}+\dots +P_{N}x_{1}^{N}-f(x_{1})&=+\varepsilon \\P_{0}+P_{1}x_{2}+P_{2}x_{2}^{2}+P_{3}x_{2}^{3}+\dots +P_{N}x_{2}^{N}-f(x_{2})&=-\varepsilon \\&\ \ \vdots \end{aligned}}

เนื่องจาก, ..., ถูกกำหนดมาแล้ว จึงทราบกำลังของตัวแปรทั้งหมด และ, ..., ก็ทราบเช่นกัน นั่นหมายความว่าสมการข้างต้นเป็นเพียง สมการเชิงเส้น N + 2 สมการใน ตัวแปร N + 2 ตัวคือ, , ..., , และเมื่อกำหนดจุดทดสอบ, ..., แล้ว เราสามารถแก้ระบบสมการนี้เพื่อหาพหุนามPและจำนวนได้ $x_{1}$ $x_{N+2}$ $f(x_{1})$ $f(x_{N+2})$ $P_{0}$ $P_{1}$ $P_{N}$ $\varepsilon$ $x_{1}$ $x_{N+2}$ $\varepsilon$

กราฟด้านล่างแสดงตัวอย่างนี้ โดยสร้างพหุนามดีกรีสี่ที่ประมาณค่าในช่วง [−1, 1] จุดทดสอบถูกกำหนดไว้ที่ −1, −0.7, −0.1, +0.4, +0.9 และ 1 ค่าเหล่านี้แสดงด้วยสีเขียว ค่าที่ได้คือ 4.43 × 10 ⁻⁴ $e^{x}$ $\varepsilon$

ข้อผิดพลาดของพหุนามที่สร้างขึ้นโดยขั้นตอนแรกของอัลกอริทึมของ Remez ซึ่งประมาณค่า e ^xในช่วง [−1, 1] การแบ่งตามแนวตั้งคือ10 ⁻⁴

กราฟแสดงข้อผิดพลาดนั้นแสดงค่าที่จุดทดสอบทั้งหกจุด รวมถึงจุดปลายด้วย แต่จุดเหล่านั้นไม่ใช่จุดสุดขั้ว หากจุดทดสอบภายในทั้งสี่จุดเป็นจุดสุดขั้ว (กล่าวคือ ฟังก์ชันP ( x ) f ( x ) มีค่าสูงสุดหรือต่ำสุดที่จุดเหล่านั้น) พหุนามนั้นก็จะเหมาะสมที่สุด $\pm \varepsilon$

ขั้นตอนที่สองของอัลกอริทึมของ Remez ประกอบด้วยการย้ายจุดทดสอบไปยังตำแหน่งโดยประมาณที่ฟังก์ชันข้อผิดพลาดมีค่าสูงสุดหรือต่ำสุดเฉพาะที่ ตัวอย่างเช่น จากกราฟ เราสามารถบอกได้ว่าจุดที่ −0.1 ควรอยู่ที่ประมาณ −0.28 วิธีการทำเช่นนี้ในอัลกอริทึมคือการใช้รอบเดียวของวิธีของนิวตันเนื่องจากเรารู้ค่าอนุพันธ์อันดับที่หนึ่งและอันดับที่สองของP ( x ) − f ( x )เราจึงสามารถคำนวณได้โดยประมาณว่าต้องย้ายจุดทดสอบไปไกลแค่ไหนเพื่อให้ได้ค่าอนุพันธ์เป็นศูนย์

การคำนวณอนุพันธ์ของพหุนามนั้นทำได้ง่าย นอกจากนี้ยังต้องสามารถคำนวณอนุพันธ์อันดับที่หนึ่งและอันดับที่สองของf ( x ) ได้ด้วย อัลกอริทึมของ Remez ต้องการความสามารถในการคำนวณ, , และด้วยความแม่นยำสูงมาก อัลกอริทึมทั้งหมดต้องดำเนินการด้วยความแม่นยำสูงกว่าความแม่นยำของผลลัพธ์ที่ต้องการ $f(x)\,$ $f'(x)\,$ $f''(x)\,$

หลังจากย้ายจุดทดสอบแล้ว จะทำซ้ำส่วนของสมการเชิงเส้นเพื่อสร้างพหุนามใหม่ จากนั้นจึงใช้วิธีของนิวตันในการย้ายจุดทดสอบอีกครั้ง ลำดับนี้จะดำเนินต่อไปจนกว่าผลลัพธ์จะลู่เข้าสู่ความแม่นยำที่ต้องการ อัลกอริทึมนี้ลู่เข้าอย่างรวดเร็วมาก การลู่เข้าเป็นแบบกำลังสองสำหรับฟังก์ชันที่มีคุณสมบัติที่ดี กล่าวคือ ถ้าจุดทดสอบอยู่ภายในค่าที่ถูกต้อง ผลลัพธ์ที่ได้ก็จะอยู่ภายในค่าที่ถูกต้องโดยประมาณหลังจากรอบถัดไป $10^{-15}$ $10^{-30}$

โดยทั่วไปแล้ว อัลกอริทึมของ Remez จะเริ่มต้นด้วยการเลือกค่าสุดขั้วของพหุนาม Chebyshev เป็นจุดเริ่มต้น เนื่องจากฟังก์ชันข้อผิดพลาดสุดท้ายจะมีลักษณะคล้ายกับพหุนามนั้น $T_{N+1}$

วารสารหลัก

ดูเพิ่มเติม

ลิงก์ภายนอก

ประวัติความเป็นมาของทฤษฎีการประมาณค่า (HAT)
การสำรวจในทฤษฎีการประมาณค่า (SAT)