ตัวเลขเชิงความน่าจะเป็น

Q: การบูรณาการ

ได้มีการพัฒนาวิธีการเชิงตัวเลขแบบความน่าจะเป็นสำหรับปัญหา การอินทิเกรตเชิงตัวเลข โดยวิธีที่ได้รับความนิยมมากที่สุดเรียกว่า Bayesian quadrature [ 15 ] [ 16 ] [ 17 ] [ 18 ]

คณิตศาสตร์เชิงความน่าจะเป็นเป็น สาขาการศึกษา ที่กำลังดำเนินอยู่ณ จุดตัดของคณิตศาสตร์ประยุกต์สถิติและการเรียนรู้ของเครื่องจักรโดยมุ่งเน้นที่แนวคิดเรื่องความไม่แน่นอนในการคำนวณในคณิตศาสตร์เชิงความน่าจะเป็น งานในการวิเคราะห์เชิงตัวเลขเช่น การหาคำตอบเชิงตัวเลขสำหรับการอินทิ เกรต พีชคณิตเชิง เส้น การหาค่า เหมาะสมที่สุด การจำลองและสมการเชิงอนุพันธ์ จะถูกมองว่าเป็นปัญหาของ การอนุมานทางสถิติ ความน่าจะเป็น หรือ แบบเบ ย์ เซียน ^{[ 1 ]}^{[ 2 ]}^{[ 3 ]}^{[ 4 ]}^{[ 5 ]}

การแนะนำ

วิธีการเชิงตัวเลขคืออัลกอริทึมที่ประมาณค่าคำตอบของปัญหาทางคณิตศาสตร์ (ตัวอย่างต่อไปนี้ได้แก่ คำตอบของระบบสมการเชิงเส้นค่าของอินทิกรัลคำตอบของสมการเชิงอนุพันธ์ค่าต่ำสุดของฟังก์ชันหลายตัวแปร) ใน อัลกอริทึมเชิงตัวเลข แบบความน่าจะเป็น กระบวนการประมาณค่านี้ถือเป็นปัญหาของการประมาณค่าการอนุมานหรือการเรียนรู้และเกิดขึ้นในกรอบของการอนุมานแบบความน่าจะเป็น (บ่อยครั้ง แต่ไม่เสมอไป คือการอนุมานแบบเบย์เซียน ) ^{[ 6 ]}

ในทางทฤษฎีแล้ว หมายความว่าเราต้องกำหนดรูปแบบของปัญหาการคำนวณให้อยู่ในรูปของการแจกแจงความน่าจะเป็นก่อนหน้า (prior distribution ) โดยกำหนดความสัมพันธ์ระหว่างตัวเลขที่คำนวณโดยคอมพิวเตอร์ (เช่น การคูณเมทริกซ์กับเวกเตอร์ในพีชคณิตเชิงเส้น เกรเดียนต์ในการหาค่าเหมาะสมที่สุด ค่าของตัวอินทิกรัลหรือสนามเวกเตอร์ที่กำหนดสมการเชิงอนุพันธ์) กับปริมาณที่ต้องการหา (คำตอบของปัญหาเชิงเส้น ค่าต่ำสุด อินทิกรัล เส้นโค้งคำตอบ) ในฟังก์ชันความน่าจะเป็น (likelihood function ) และส่งคืนการแจกแจงความน่าจะเป็นภายหลัง (posterior distribution ) เป็นผลลัพธ์ ในกรณีส่วนใหญ่ อัลกอริทึมเชิงตัวเลขยังมีการตัดสินใจปรับตัวภายในเกี่ยวกับการเลือกตัวเลขที่จะคำนวณ ซึ่งก่อให้เกิด ปัญหา การเรียนรู้เชิงรุก (active learning problem)

อั ลกอริทึมเชิงตัวเลขคลาสสิกที่เป็นที่นิยมจำนวนมากสามารถตีความใหม่ได้ในกรอบงานความน่าจะเป็น ซึ่งรวมถึงวิธีการไล่ระดับแบบคอนจูเกต [ ^{7 ] [}^{8 ] [}^{9 ] วิธี} การของนอร์ดซี คกฎการหาปริพันธ์แบบเกาส์เซียน^[¹⁰^]และวิธีการควาซี-นิวตัน [ ¹¹^]^ในทุกกรณีเหล่านี้ วิธีการแบบคลาสสิกจะขึ้นอยู่กับการประมาณค่ากำลังสองน้อยที่สุดแบบ ปรับปรุง ซึ่งสามารถเชื่อมโยงกับค่าเฉลี่ยภายหลังที่เกิดขึ้นจากความ น่าจะเป็นก่อนหน้าและความน่าจะเป็นแบบ เกาส์เซียนในกรณีเช่นนี้ ความแปรปรวนของความน่าจะเป็นภายหลังแบบเกาส์เซียนจะเชื่อมโยงกับการประมาณค่ากรณีที่เลวร้ายที่สุดสำหรับข้อผิดพลาดกำลังสอง

วิธีการเชิงตัวเลขแบบความน่าจะเป็นให้ข้อได้เปรียบเชิงแนวคิดหลายประการเหนือกว่าเทคนิคการประมาณค่าแบบคลาสสิกที่อิงตามค่าประมาณจุด:

ฟังก์ชัน เหล่านี้จะส่งคืน ค่าประมาณความคลาดเคลื่อน ที่มีโครงสร้าง (โดยเฉพาะอย่างยิ่ง ความสามารถในการส่งคืนตัวอย่างความน่าจะเป็นภายหลังร่วมกัน กล่าวคือ สมมติฐานที่สมจริงหลายประการสำหรับคำตอบที่แท้จริงที่ไม่ทราบของปัญหา)
การอนุมานแบบเบย์เซียนเชิงลำดับชั้นสามารถนำมาใช้ในการกำหนดและควบคุมพารามิเตอร์ภายในของวิธีการดังกล่าวได้อย่างเป็นระบบ แทนที่จะต้องคิดค้นวิธีการใหม่สำหรับแต่ละพารามิเตอร์
เนื่องจากวิธีการเชิงตัวเลขแบบความน่าจะเป็นใช้และอนุญาตให้มีความน่าจะเป็นที่ชัดเจนซึ่งอธิบายความสัมพันธ์ระหว่างตัวเลขที่คำนวณได้กับปริมาณเป้าหมาย วิธีการเชิงตัวเลขแบบความน่าจะเป็นจึงสามารถใช้ผลลัพธ์ของการคำนวณที่ไม่แม่นยำ มีอคติ และสุ่มได้^{[ 12 ]}ในทางกลับกัน วิธีการเชิงตัวเลขแบบความน่าจะเป็นยังสามารถให้ความน่าจะเป็นในการคำนวณที่มักถือว่า " ปราศจากความน่าจะเป็น " ในที่อื่นได้อีก ด้วย ^{[ 13 ]}
เนื่องจากวิธีการเชิงตัวเลขแบบความน่าจะเป็นทั้งหมดใช้ข้อมูลประเภทเดียวกันโดยพื้นฐาน นั่นคือ การวัดความน่าจะเป็น เพื่อวัดปริมาณความไม่แน่นอนทั้งในข้อมูลนำเข้าและข้อมูลส่งออกจึงสามารถนำวิธีการเหล่านี้มาเชื่อมโยงกันเพื่อกระจายความไม่แน่นอนไปทั่วการคำนวณขนาดใหญ่และซับซ้อนได้
แหล่งข้อมูลจากแหล่งข้อมูลหลายแหล่ง (เช่น ความรู้เชิงพีชคณิต กลไกเกี่ยวกับรูปแบบของสมการเชิงอนุพันธ์ และการสังเกตวิถีการเคลื่อนที่ของระบบที่รวบรวมได้ในโลกทางกายภาพ) สามารถนำมารวมกันได้อย่างเป็นธรรมชาติและภายในลูปภายในของอัลกอริทึม โดยขจัดลูปซ้อนกันที่จำเป็นในการคำนวณ เช่น ใน^{ปัญหา}ผกผัน [ ^{14 ]}

ข้อดีเหล่านี้โดยพื้นฐานแล้วเทียบเท่ากับข้อดีเชิงฟังก์ชันที่คล้ายคลึงกันซึ่งวิธีการแบบเบย์เซียนมีเหนือกว่าการประมาณค่าแบบจุดในแมชชีนเลิร์นนิง ซึ่งนำมาประยุกต์ใช้หรือถ่ายทอดไปยังโดเมนการคำนวณ

งานเชิงตัวเลข

การบูรณาการ

ได้มีการพัฒนาวิธีการเชิงตัวเลขแบบความน่าจะเป็นสำหรับปัญหาการอินทิเกรตเชิงตัวเลขโดยวิธีที่ได้รับความนิยมมากที่สุดเรียกว่าBayesian quadrature ^{[ 15 ]}^{[ 16 ]}^{[ 17 ]}^{[ 18 ]}

ในการหาปริพันธ์เชิงตัวเลข การประเมินค่าฟังก์ชันณ จุดต่างๆจะถูกนำมาใช้เพื่อประมาณค่าปริพันธ์ของฟังก์ชันเทียบกับตัววัดบางอย่างการหาปริพันธ์แบบเบย์เซียนประกอบด้วยการกำหนดการแจกแจงแบบก่อนหน้า (prior distribution) บนและกำหนดเงื่อนไขการแจกแจงแบบก่อนหน้านี้บน เพื่อให้ได้การแจกแจงแบบภายหลัง (posterior distribution) บน จากนั้นจึงคำนวณ การแจกแจงแบบภายหลังโดยนัยบน ตัวเลือกการแจกแจงแบบก่อนหน้าที่นิยมใช้มากที่สุดคือกระบวนการเกาส์เซียนเนื่องจากทำให้เราได้การแจกแจงแบบภายหลังในรูปแบบปิดบนปริพันธ์ ซึ่งเป็นการแจกแจงเกาส์เซียนแบบตัวแปรเดียว การหาปริพันธ์แบบเบย์เซียนมีประโยชน์อย่างยิ่งเมื่อฟังก์ชันมีค่าใช้จ่ายในการประเมินสูง และมิติของข้อมูลมีขนาดเล็กถึงปานกลาง $f(x_{1}),\ldots ,f(x_{n})$ $x_{1},\ldots ,x_{n}$ $\textstyle \int f(x)\nu (dx)$ $f$ $\nu$ $f$ $f(x_{1}),\ldots ,f(x_{n})$ $f$ $\textstyle \int f(x)\nu (dx)$ $f$

การเพิ่มประสิทธิภาพ

นอกจากนี้ ยังมีการศึกษาการคำนวณเชิงความน่าจะเป็นเพื่อใช้ในการหาค่าเหมาะสมที่สุดทางคณิตศาสตร์ซึ่งประกอบด้วยการหาค่าต่ำสุดหรือสูงสุดของฟังก์ชันเป้าหมายโดยพิจารณาจากค่าประเมินของฟังก์ชันนั้น (ซึ่งอาจมีสัญญาณรบกวนหรือได้มาโดยอ้อม) ณ จุดต่างๆ $f$

บางทีความพยายามที่โดดเด่นที่สุดในทิศทางนี้คือการเพิ่มประสิทธิภาพแบบเบย์เซียน [ ²⁰^{] ซึ่ง}^เป็นแนวทางทั่วไปในการเพิ่มประสิทธิภาพโดยอาศัยการอนุมานแบบเบย์เซียน อัลกอริทึมการเพิ่มประสิทธิภาพแบบเบย์เซียนทำงานโดยการรักษาความเชื่อเชิงความน่าจะเป็นตลอดกระบวนการเพิ่มประสิทธิภาพ ซึ่งมักจะอยู่ในรูปแบบของกระบวนการเกาส์เซียนก่อนหน้าโดยมีเงื่อนไขตามการสังเกต ความเชื่อนี้จะนำทางอัลกอริทึมในการได้มาซึ่งการสังเกตที่น่าจะทำให้กระบวนการเพิ่มประสิทธิภาพก้าวหน้า นโยบายการเพิ่มประสิทธิภาพแบบเบย์เซียนมักจะเกิดขึ้นโดยการแปลงฟังก์ชันวัตถุประสงค์ภายหลังให้เป็นฟังก์ชันการได้มาซึ่งอนุพันธ์ ราคาไม่แพง ซึ่งมีค่าสูงสุดเพื่อเลือกตำแหน่งการสังเกตที่ต่อเนื่องกันแต่ละตำแหน่ง แนวทางที่โดดเด่นอย่างหนึ่งคือการจำลองการเพิ่มประสิทธิภาพผ่านการออกแบบการทดลองแบบลำดับเบย์เซียนโดยมุ่งหวังที่จะได้มาซึ่งลำดับของการสังเกตที่ให้ความก้าวหน้าในการเพิ่มประสิทธิภาพมากที่สุดตามที่ประเมินโดยฟังก์ชันอรรถประโยชน์ ที่เหมาะสม ผลข้างเคียงที่น่ายินดีจากแนวทางนี้คือความไม่แน่นอนในฟังก์ชันวัตถุประสงค์ ตามที่วัดโดยความเชื่อเชิงความน่าจะเป็นพื้นฐาน สามารถนำทางนโยบายการเพิ่มประสิทธิภาพในการจัดการกับการแลกเปลี่ยนระหว่างการสำรวจและการใช้ประโยชน์ แบบคลาสสิก ได้ $f$

การเพิ่มประสิทธิภาพในระดับท้องถิ่น

วิธีการเชิงตัวเลขแบบความน่าจะเป็นได้รับการพัฒนาขึ้นในบริบทของการเพิ่มประสิทธิภาพแบบสุ่มสำหรับการเรียนรู้เชิงลึกโดยเฉพาะอย่างยิ่งเพื่อแก้ไขปัญหาหลัก เช่น การปรับ อัตราการเรียนรู้และการค้นหาเส้น^{[ 21 ]} การเลือกขนาดแบทช์^{[ 22 ]} การหยุดก่อนกำหนด [ ^{23 ] การ} ตัดแต่ง^{[ 24 ]}และทิศทางการค้นหาลำดับที่หนึ่งและลำดับที่สอง^{[ 25 ]}^{[ 26 ]}

ในบริบทนี้ วัตถุประสงค์ของการปรับให้เหมาะสมมักจะเป็นความเสี่ยงเชิงประจักษ์ในรูปแบบ ที่กำหนดโดยชุดข้อมูลและความสูญเสียที่วัดปริมาณว่าแบบจำลองการทำนายที่กำหนดพารามิเตอร์โดยนั้น ทำงานได้ดีเพียงใดในการทำนายเป้าหมายจากอินพุตที่สอดคล้องกันความไม่แน่นอนทางความรู้เกิดขึ้นเมื่อขนาดของชุดข้อมูลมีขนาดใหญ่และไม่สามารถประมวลผลได้ในคราวเดียว ซึ่งหมายความว่าปริมาณเฉพาะที่ (เมื่อกำหนดค่าบางอย่าง) เช่น ฟังก์ชันความสูญเสีย เองหรืออนุพันธ์ของฟังก์ชันนั้นไม่สามารถคำนวณได้ในเวลาที่เหมาะสม ดังนั้น โดยทั่วไปจึงใช้การแบ่งกลุ่มย่อยเพื่อสร้างตัวประมาณค่าของปริมาณเหล่านี้บนชุดย่อยแบบสุ่มของข้อมูล วิธีการเชิงตัวเลขแบบความน่าจะเป็นจำลองความไม่แน่นอนนี้อย่างชัดเจนและอนุญาตให้มีการตัดสินใจและการปรับแต่งพารามิเตอร์โดยอัตโนมัติ $\textstyle L(\theta )={\frac {1}{N}}\sum _{n=1}^{N}\ell (y_{n},f_{\theta }(x_{n}))$ $\textstyle {\mathcal {D}}=\{(x_{n},y_{n})\__{n=1}^{N}$ $\ell (y,f_{\theta }(x))$ $f_{\theta }(x)$ $\theta$ $y$ $x$ $N$ $\theta$ $L(\theta )$ $\nabla L(\theta )$

พีชคณิตเชิงเส้น

วิธีการเชิงตัวเลขแบบความน่าจะเป็นสำหรับพีชคณิตเชิงเส้น^{[ 7 ]}^{[ 8 ]}^{[ 27 ]}^{[ 9 ]}^{[ 28 ]}^{[ 29 ]} มุ่งเน้นไปที่การแก้ระบบสมการเชิงเส้นในรูปแบบและการคำนวณดีเทอร์มิแนนต์เป็น หลัก ^[³⁰^]^[³¹^] $Ax=b$ $|A|$

ภาพประกอบของตัวแก้เชิงเส้นความน่าจะเป็นแบบเมทริกซ์^{[ 9 ]}

วิธีการจำนวนมากมีลักษณะเป็นแบบวนซ้ำและรวบรวมข้อมูลเกี่ยวกับระบบเชิงเส้นที่จะแก้ไขผ่านการคูณเมทริกซ์-เวกเตอร์ซ้ำๆกับเมทริกซ์ระบบที่มีเวกเตอร์ต่างกันวิธีการดังกล่าวสามารถแบ่งออกได้คร่าวๆ เป็นมุมมองแบบอิงตามวิธีแก้ปัญหา^[⁸^]^[²⁸^]และแบบอิงตามเมทริกซ์^[⁷^]^[⁹^]ขึ้นอยู่กับว่าความเชื่อนั้นแสดงออกเหนือวิธีแก้ปัญหาของระบบเชิงเส้นหรือ (ผกผันเทียม) ของเมทริกซ์ การอัปเดตความเชื่อใช้ว่าวัตถุที่อนุมานนั้นเชื่อมโยงกับการคูณเมทริกซ์หรือผ่านและวิธีการโดยทั่วไปจะถือว่ามีการกระจายแบบเกาส์เซียน เนื่องจากความปิดภายใต้การสังเกตเชิงเส้นของปัญหา แม้ว่าจะแตกต่างกันในเชิงแนวคิด แต่มุมมองทั้งสองนี้เทียบเท่ากันในเชิงการคำนวณและเชื่อมต่อกันโดยเนื้อแท้ผ่านด้านขวามือผ่าน^[²⁷^] $v\mapsto Av$ $A$ $v$ $x$ $H=A^{\dagger }$ $y=Av$ $z=A^{\intercal }v$ $b^{\intercal }z=x^{\intercal }v$ $v=A^{-1}y$ $x=A^{-1}b$

รูทีนพีชคณิตเชิงเส้นเชิงตัวเลขแบบความน่าจะเป็นได้รับการประยุกต์ใช้สำเร็จในการปรับขนาดกระบวนการเกาส์เซียนให้เข้ากับชุดข้อมูลขนาดใหญ่^{[ 31 ]}^{[ 32 ]}โดยเฉพาะอย่างยิ่ง รูทีนเหล่านี้ช่วยให้สามารถ แพร่กระจายข้อผิดพลาดในการประมาณค่าไปยังกระบวนการเกาส์เซียนแบบผสมได้ อย่างแม่นยำซึ่งจะวัดปริมาณความไม่แน่นอนที่เกิดขึ้นจากทั้งจำนวนข้อมูลที่สังเกตได้จำกัดและปริมาณการคำนวณที่ใช้ไป จำกัด ^{[ 32 ]}

สมการเชิงอนุพันธ์สามัญ

วิธีการเชิงตัวเลขแบบความน่าจะเป็นสำหรับสมการเชิงอนุพันธ์สามัญ ได้รับการพัฒนาขึ้นสำหรับปัญหาค่าเริ่มต้นและค่าขอบเขต วิธีการเชิงตัวเลขแบบความน่าจะเป็นที่แตกต่างกันมากมายที่ออกแบบมาสำหรับสมการเชิงอนุพันธ์สามัญได้รับการเสนอแนะ และสามารถจัดกลุ่มได้เป็นสองประเภทหลักดังต่อไปนี้: ${\dot {y}}(t)=f(t,y(t))$

วิธีการที่ใช้การสุ่มจะถูกกำหนดผ่านการรบกวนแบบสุ่มของวิธีการเชิงตัวเลขแบบกำหนดมาตรฐานสำหรับสมการเชิงอนุพันธ์สามัญ ตัวอย่างเช่น สิ่งนี้ทำได้โดยการเพิ่มการรบกวนแบบเกาส์เซียนในการแก้ปัญหาของตัวรวมแบบขั้นตอนเดียว^{[ 33 ]}หรือโดยการรบกวนขั้นตอนเวลาแบบสุ่ม^{[ 34 ]}ซึ่งกำหนดมาตรวัดความน่าจะเป็นในการแก้ปัญหาของสมการเชิงอนุพันธ์ที่สามารถสุ่มตัวอย่างได้
วิธีการถดถอยกระบวนการเกาส์เซียนนั้นตั้งอยู่บนสมมติฐานของการกำหนดปัญหาการแก้สมการเชิงอนุพันธ์ที่อยู่ในมือให้เป็นปัญหาการถดถอยกระบวนการเกาส์เซียน โดยตีความการประเมินค่าด้านขวามือเป็นข้อมูลเกี่ยวกับอนุพันธ์^{[ 35 ]}เทคนิคเหล่านี้คล้ายกับการคำนวณแบบเบย์เซียน แต่ใช้แบบจำลองการสังเกตที่แตกต่างกันและมักจะไม่เป็นเชิงเส้น^{[ 36 ]}^{[ 37 ]}ในช่วงเริ่มต้น วิธีการประเภทนี้ตั้งอยู่บน การถดถอย กระบวนการเกาส์เซียน แบบง่ายๆ ต่อมาได้มีการปรับปรุง (ในแง่ของการคำนวณที่มีประสิทธิภาพ) โดยใช้ไพรเออร์แบบเกาส์-มาร์คอฟ^{[ 38 ]}^{[ 39 ]}ซึ่งจำลองโดยสม การเชิง อนุพันธ์เชิงสุ่ม โดยที่ เป็นเวกเตอร์มิติ ที่จำลองอนุพันธ์อันดับแรกของและ โดยที่เป็นการเคลื่อนที่แบบบราวน์มิติการอนุมานจึงสามารถดำเนินการได้อย่างมีประสิทธิภาพด้วยวิธีการที่ใช้การกรองแบบคาลมาน $\mathrm {d} x(t)=Ax(t)\,\mathrm {d} t+B\,\mathrm {d} v(t)$ $x(t)$ $\nu$ $\nu$ $y(t)$ $v(t)$ $\nu$

ขอบเขตระหว่างสองหมวดหมู่นี้ไม่ชัดเจน อันที่จริงแล้ววิธีการถดถอยกระบวนการเกาส์เซียนที่อิงตามข้อมูลแบบสุ่มก็ได้รับการพัฒนาเช่นกัน^{[ 40 ]}วิธีการเหล่านี้ถูกนำไปใช้กับปัญหาในเรขาคณิตแบบรีมันน์เชิงคำนวณ^{[ 41 ]}ปัญหาผกผัน แบบจำลองแรงแฝง และสมการเชิงอนุพันธ์ที่มีโครงสร้างทางเรขาคณิต เช่น ซิมเพล็กติก

สมการเชิงอนุพันธ์ย่อย

มีการเสนอวิธีการเชิงตัวเลขแบบความน่าจะเป็นจำนวนหนึ่งสำหรับสมการเชิงอนุพันธ์ย่อยเช่นเดียวกับสมการเชิงอนุพันธ์สามัญ แนวทางเหล่านี้สามารถแบ่งออกได้กว้างๆ เป็นแนวทางที่อิงกับการสุ่ม โดยทั่วไปแล้วจะเป็นตาข่ายองค์ประกอบจำกัดพื้นฐาน^{[ 33 ]}^{[ 42 ]}และแนวทางที่อิงกับการถดถอยกระบวนการเกาส์เซียน^{[ 4 ]}^{[ 3 ]}^{[ 43 ]}^{[ 44 ]}

ตัวแก้ PDE เชิงตัวเลขแบบความน่าจะเป็นที่ใช้การถดถอยกระบวนการเกาส์เซียนจะกู้คืนวิธีการแบบคลาสสิกบน PDE เชิงเส้นสำหรับไพรเออร์บางอย่าง โดยเฉพาะอย่างยิ่งวิธีการของค่าตกค้างถ่วงน้ำหนักเฉลี่ยซึ่งรวมถึงวิธีการ Galerkinวิธีการองค์ประกอบจำกัดและวิธีการสเปกตรัม^{[ 44 ]}

ประวัติศาสตร์และสาขาที่เกี่ยวข้อง

ความสัมพันธ์ระหว่างการวิเคราะห์เชิงตัวเลขและความน่าจะเป็นนั้นเกี่ยวข้องกับสาขาอื่นๆ ของคณิตศาสตร์หลายสาขา รวมถึงการวิเคราะห์กรณีเฉลี่ยของวิธีการเชิงตัวเลขความซับซ้อนตามข้อมูล ทฤษฎีเกมและทฤษฎีการตัดสินใจ ทางสถิติ ต้นกำเนิดของสิ่งที่เรียกว่า "การคำนวณเชิงความน่าจะเป็น" ในปัจจุบัน สามารถพบได้ตั้งแต่ปลายศตวรรษที่ 19 และต้นศตวรรษที่ 20

ที่มาของตัวเลขเชิงความน่าจะเป็นสามารถสืบย้อนไปถึงการอภิปรายเกี่ยวกับแนวทางเชิงความน่าจะเป็นในการแทรกสอดพหุนามโดยHenri PoincaréในCalcul des Probabilités ของเขา ^{[ 45 ]} ในศัพท์สมัยใหม่ Poincaré พิจารณาการแจกแจงแบบเกาส์เซียนก่อนหน้าบนฟังก์ชันซึ่งแสดงเป็นอนุกรมกำลัง อย่างเป็นทางการ ที่มีสัมประสิทธิ์แบบสุ่ม และถามถึง "ค่าที่เป็นไปได้" ของ โดยพิจารณาจากก่อน หน้านี้และการสังเกตสำหรับ $f\colon \mathbb {R} \to \mathbb {R}$ $f(x)$ $n\in \mathbb {N}$ $f(a_{i})=B_{i}$ $i=1,\dots ,n$

ผลงานชิ้นสำคัญชิ้นต่อมาเกี่ยวกับปฏิสัมพันธ์ระหว่างการวิเคราะห์เชิงตัวเลขและความน่าจะเป็นนั้นมาจาก Albert Suldin ในบริบทของการหาปริพันธ์เชิงตัวเลขแบบ ตัวแปรเดียว ^{[ 46 ]} ปัญหาทางสถิติที่ Suldin พิจารณาคือการประมาณค่าปริพันธ์จำกัดของฟังก์ชันภายใต้การเคลื่อนที่แบบบราวน์ก่อนหน้าบนโดยให้เข้าถึงการประเมินค่าแบบจุดต่อจุดของที่โหนดSuldin แสดงให้เห็นว่า สำหรับโหนดการหาปริพันธ์เชิงตัวเลขที่กำหนด กฎการหาปริพันธ์เชิงตัวเลขที่มีข้อผิดพลาดกำลังสองเฉลี่ย น้อยที่สุด คือกฎรูปสี่เหลี่ยมคางหมูยิ่งไปกว่านั้น ข้อผิดพลาดน้อยที่สุดนี้เป็นสัดส่วนกับผลรวมของกำลังสามของระยะห่างระหว่างโหนด ส่งผลให้เราสามารถมองกฎรูปสี่เหลี่ยมคางหมูที่มีโหนดเว้นระยะเท่ากันว่าเป็นกฎที่เหมาะสมที่สุดทางสถิติในบางแง่ ซึ่งเป็นตัวอย่างแรกๆ ของการวิเคราะห์กรณีเฉลี่ยของวิธีการเชิงตัวเลข มุมมองของ Suldin ได้รับการขยายเพิ่มเติมในภายหลังโดย Mike Larkin ^[⁴⁷^] โปรดทราบว่าการเคลื่อนที่แบบบราวน์ของซัลดินก่อนหน้าบนอินทิกรัลเป็นการวัดแบบเกาส์เซียน และการดำเนินการของการอินทิเกรตและการประเมินค่าแบบจุดต่อจุดของต่างก็เป็นแผนที่เชิงเส้นดังนั้น อินทิกรัลจำกัดจึงเป็นตัวแปรสุ่มเกาส์เซียนค่าจริง โดยเฉพาะอย่างยิ่ง หลังจากปรับเงื่อนไขตามค่าแบบจุดที่สังเกตได้ของ แล้วจะมีการกระจายแบบปกติโดยมีค่าเฉลี่ยเท่ากับกฎสี่เหลี่ยมคางหมูและความแปรปรวนเท่ากับมุมมองนี้ใกล้เคียงกับมุมมองของการหาปริพันธ์แบบเบย์เซียน มาก โดยมองผลลัพธ์ของวิธีการหาปริพันธ์ไม่ใช่แค่การประมาณค่าแบบจุด แต่เป็นการกระจายความน่าจะเป็นในตัวมันเอง $\textstyle \int u(t)\,\mathrm {d} t$ $u\colon [a,b]\to \mathbb {R}$ $u$ $u$ $t_{1},\dots ,t_{n}\in [a,b]$ $u$ $u$ $\textstyle \int u(t)\,\mathrm {d} t$ $u$ $\textstyle {\frac {1}{12}}\sum _{i=2}^{n}(t_{i}-t_{i-1})^{3}$

ตามที่Houman Owhadiและผู้ร่วมงาน ได้กล่าวไว้ ^{[ 3 ]}^{[ 48 ]}ปฏิสัมพันธ์ระหว่างการประมาณเชิงตัวเลขและการอนุมานทางสถิติยังสามารถสืบย้อนไปถึง Palasti และ Renyi ^{[ 49 ]} Sard ^{[ 50 ]} Kimeldorf และ Wahba ^{[ 51 ]} (เกี่ยวกับความสอดคล้องระหว่างการประมาณแบบเบย์เซียนและการปรับเรียบ/การแทรกสอดแบบสปลายน์) และ Larkin ^{[ 47 ]} (เกี่ยวกับความสอดคล้องระหว่าง การถดถอย กระบวนการเกาส์เซียนและการประมาณเชิงตัวเลข) แม้ว่าแนวทางการสร้างแบบจำลองฟังก์ชันที่ทราบอย่างสมบูรณ์เป็นตัวอย่างจากกระบวนการสุ่มอาจดูขัดกับสัญชาตญาณ แต่กรอบการทำงานที่เป็นธรรมชาติสำหรับการทำความเข้าใจสามารถพบได้ในความซับซ้อนตามข้อมูล (IBC) ^{[ 52 ]}ซึ่งเป็นสาขาของความซับซ้อนในการคำนวณที่ตั้งอยู่บนข้อสังเกตว่าการนำไปใช้เชิงตัวเลขต้องใช้การคำนวณด้วยข้อมูลบางส่วนและทรัพยากรที่จำกัด ใน IBC ประสิทธิภาพของอัลกอริทึมที่ทำงานบนข้อมูลที่ไม่สมบูรณ์สามารถวิเคราะห์ได้ในกรณีที่เลวร้ายที่สุดหรือกรณีเฉลี่ย (แบบสุ่ม) โดยสัมพันธ์กับข้อมูลที่ขาดหายไป ยิ่งไปกว่านั้น ดังที่ Packel ^{[ 53 ]}สังเกต กรณีเฉลี่ยสามารถตีความได้ว่าเป็นกลยุทธ์แบบผสมในเกมแบบต่อต้านซึ่งได้มาจากการยกปัญหา minmax (กรณีที่เลวร้ายที่สุด) ไปสู่ปัญหา minmax บนกลยุทธ์แบบผสม (แบบสุ่ม) การสังเกตนี้ทำให้เกิดความเชื่อมโยงตามธรรมชาติ^{[ 54 ]}^{[ 3 ]}ระหว่างการประมาณค่าเชิงตัวเลขและทฤษฎีการตัดสินใจ ของ Wald ซึ่งเห็นได้ชัดว่าได้รับอิทธิพลจากทฤษฎีเกม ของ von Neumannเพื่ออธิบายความเชื่อมโยงนี้ ให้พิจารณาการตั้งค่าการกู้คืนที่เหมาะสมที่สุดของ Micchelli และ Rivlin ^[⁵⁵^]ซึ่งพยายามประมาณค่าฟังก์ชันที่ไม่ทราบค่าจากการวัดเชิงเส้นจำนวนจำกัดบนฟังก์ชันนั้น การตีความปัญหาการกู้คืนที่เหมาะสมที่สุดนี้ว่าเป็นเกมผลรวมเป็นศูนย์โดยที่ผู้เล่น I เลือกฟังก์ชันที่ไม่ทราบ และผู้เล่น II เลือกการประมาณค่าของฟังก์ชันนั้น และใช้ข้อผิดพลาดสัมพัทธ์ในบรรทัดฐานกำลังสองเพื่อกำหนดการสูญเสีย ไพรเออร์แบบเกาส์เซียนจึงปรากฏขึ้น^[³^] เป็นกลยุทธ์ผสมที่เหมาะสมที่สุดสำหรับเกมดังกล่าว และตัวดำเนินการความแปรปรวนร่วมของไพรเออร์แบบเกาส์เซียนที่เหมาะสมที่สุดจะถูกกำหนดโดยบรรทัดฐานกำลังสองที่ใช้ในการกำหนดข้อผิดพลาดสัมพัทธ์ของการกู้คืน

ซอฟต์แวร์

ProbNum : การคำนวณเชิงความน่าจะเป็นในภาษา Python
ProbNumDiffEq.jl : ตัวแก้สมการเชิงอนุพันธ์สามัญเชิงตัวเลขแบบความน่าจะเป็นโดยใช้การกรอง ซึ่งเขียนด้วยภาษา Julia
Emukit : ชุดเครื่องมือ Python ที่ปรับเปลี่ยนได้สำหรับการตัดสินใจภายใต้ความไม่แน่นอน
BackPACK : สร้างขึ้นบนพื้นฐานของ PyTorch สามารถคำนวณปริมาณอื่นๆ นอกเหนือจากค่าความชันได้อย่างมีประสิทธิภาพ

ดูเพิ่มเติม

[ 1 ]

[ 2 ]

[ 4 ]

[ 5 ]

[ 6 ]

7 ] [

8 ] [

9 ] วิธี

[

11

[ 12 ]

[ 13 ]

ปัญหา

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

20

[ 21 ]

[ 22 ]

23 ] การ

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[

[

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

[ 44 ]

[ 45 ]

[ 46 ]

[

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

[ 52 ]

[ 53 ]

[