อ่าน 61 นาที
ตัวกรองอนุภาค
ตัวกรองอนุภาคหรือที่รู้จักกันในชื่อ วิธีการ มอนเตคาร์โลแบบลำดับคือชุดของ อัลกอริธึ...
ตัวกรองอนุภาค
ตัวกรองอนุภาคหรือที่รู้จักกันในชื่อ วิธีการ มอนเตคาร์โลแบบลำดับคือชุดของ อัลกอริธึ มมอนเตคาร์โลที่ใช้ในการค้นหาคำตอบโดยประมาณสำหรับปัญหาการกรองสำหรับระบบปริภูมิสถานะที่ไม่เป็นเชิงเส้น เช่นการประมวลผลสัญญาณและ การอนุมานทางสถิติแบบเบ ย์เซียน[ 1 ]ปัญหาการกรองประกอบด้วยการประมาณสถานะภายในในระบบไดนามิกเมื่อมีการสังเกตบางส่วนและมีการรบกวนแบบสุ่มในเซ็นเซอร์และในระบบไดนามิก วัตถุประสงค์คือการคำนวณการแจกแจงความน่าจะเป็นภายหลังของสถานะของกระบวนการมาร์คอฟโดยพิจารณาจากการสังเกตที่มีเสียงรบกวนและบางส่วน คำว่า "ตัวกรองอนุภาค" ถูกบัญญัติขึ้นครั้งแรกในปี 1996 โดย Pierre Del Moral เกี่ยวกับวิธีการอนุภาคที่มีปฏิสัมพันธ์แบบสนามเฉลี่ยที่ใช้ในกลศาสตร์ของไหลตั้งแต่ต้นทศวรรษ 1960 [ 2 ]คำว่า "มอนเตคาร์โลแบบลำดับ" ถูกบัญญัติขึ้นโดยJun S. Liuและ Rong Chen ในปี 1998 [ 3 ]
การกรองอนุภาคใช้ชุดอนุภาค (เรียกอีกอย่างว่าตัวอย่าง) เพื่อแสดงการแจกแจงความน่าจะเป็นภายหลังของกระบวนการสุ่มโดยพิจารณาจากการสังเกตที่มีเสียงรบกวนและ/หรือบางส่วน แบบจำลองปริภูมิสถานะสามารถเป็นแบบไม่เชิงเส้นได้ และการแจกแจงสถานะเริ่มต้นและเสียงรบกวนสามารถมีรูปแบบใดก็ได้ตามต้องการ เทคนิคการกรองอนุภาคเป็นวิธีการที่ได้รับการยอมรับอย่างดี[ 2 ] [ 4 ] [ 5 ]สำหรับการสร้างตัวอย่างจากการแจกแจงที่ต้องการโดยไม่ต้องมีข้อสมมติเกี่ยวกับแบบจำลองปริภูมิสถานะหรือการแจกแจงสถานะ อย่างไรก็ตาม วิธีการเหล่านี้ทำงานได้ไม่ดีเมื่อนำไปใช้กับระบบที่มีมิติสูงมาก
ตัวกรองอนุภาคจะอัปเดตการทำนายในลักษณะโดยประมาณ (ทางสถิติ) ตัวอย่างจากการกระจายจะถูกแทนด้วยชุดของอนุภาค แต่ละอนุภาคจะมีน้ำหนักความน่าจะเป็นที่กำหนดให้กับมัน ซึ่งแสดงถึงความน่าจะเป็นที่อนุภาคนั้นจะถูกสุ่มจากฟังก์ชันความหนาแน่นของความน่าจะเป็น ความไม่สมดุลของน้ำหนักที่นำไปสู่การยุบตัวของน้ำหนักเป็นปัญหาทั่วไปที่พบในอัลกอริธึมการกรองเหล่านี้ อย่างไรก็ตาม สามารถลดปัญหานี้ได้โดยการเพิ่มขั้นตอนการสุ่มตัวอย่างใหม่ก่อนที่น้ำหนักจะไม่เท่ากัน สามารถใช้เกณฑ์การสุ่มตัวอย่างใหม่แบบปรับได้หลายอย่าง รวมถึงความแปรปรวนของน้ำหนักและเอนโทรปี สัมพัทธ์ ที่เกี่ยวข้องกับการกระจายแบบสม่ำเสมอ[ 6 ]ในขั้นตอนการสุ่มตัวอย่างใหม่ อนุภาคที่มีน้ำหนักน้อยมากจะถูกแทนที่ด้วยอนุภาคใหม่ที่อยู่ใกล้กับอนุภาคที่มีน้ำหนักมากกว่า
จากมุมมองทางสถิติและความน่าจะเป็น ตัวกรองอนุภาคอาจถูกตีความว่าเป็นการตีความอนุภาคสนามเฉลี่ย ของ การวัดความน่าจะเป็น ของ Feynman-Kac [ 7 ] [ 8 ] [ 9 ] [ 10 ] [ 11 ]เทคนิคการบูรณาการอนุภาคเหล่านี้ได้รับการพัฒนาในเคมีโมเลกุลและฟิสิกส์เชิงคำนวณโดยTheodore E. HarrisและHerman Kahnในปี 1951, Marshall N. RosenbluthและArianna W. Rosenbluthในปี 1955 [ 12 ]และล่าสุดโดย Jack H. Hetherington ในปี 1984 [ 13 ]ในฟิสิกส์เชิงคำนวณ วิธีการบูรณาการอนุภาคเส้นทางประเภท Feynman-Kac เหล่านี้ยังใช้ในQuantum Monte Carloและโดยเฉพาะอย่างยิ่งวิธีการ Diffusion Monte Carlo [ 14 ] [ 15 ] [ 16 ]วิธีการอนุภาคปฏิสัมพันธ์ของ Feynman-Kac ยังมีความเกี่ยวข้องอย่างมากกับอัลกอริธึมทางพันธุกรรมแบบการกลายพันธุ์และการคัดเลือกที่ใช้ในปัจจุบันในการคำนวณเชิงวิวัฒนาการเพื่อแก้ปัญหาการเพิ่มประสิทธิภาพที่ซับซ้อน
ระเบียบวิธีตัวกรองอนุภาคใช้ในการแก้ ปัญหา แบบจำลองมาร์คอฟที่ซ่อนอยู่ (HMM) และ ปัญหา การกรองแบบไม่เชิงเส้นยกเว้นแบบจำลองสัญญาณ-การสังเกตเชิงเส้น-เกาส์เซียน ( ตัวกรอง Kalman ) หรือแบบจำลองประเภทที่กว้างกว่า (ตัวกรอง Benes [ 17 ] ) Mireille Chaleyat-Maurel และ Dominique Michel ได้พิสูจน์ในปี 1984 ว่าลำดับของการแจกแจงแบบโพสทีเรียร์ของสถานะสุ่มของสัญญาณ เมื่อพิจารณาจากการสังเกต (หรือที่เรียกว่าตัวกรองที่เหมาะสมที่สุด) ไม่มีการเวียนเกิดแบบจำกัด[ 18 ]วิธีการเชิงตัวเลขอื่นๆ ที่ใช้การประมาณค่ากริดคงที่เทคนิคMarkov Chain Monte Carlo การทำให้เป็นเชิงเส้นแบบดั้งเดิม ตัวกรอง Kalman แบบขยายหรือการกำหนดระบบเชิงเส้นที่ดีที่สุด (ในแง่ของต้นทุน-ข้อผิดพลาดที่คาดหวัง) ไม่สามารถรับมือกับระบบขนาดใหญ่ กระบวนการที่ไม่เสถียร หรือความไม่เชิงเส้นที่ไม่เรียบเพียงพอได้
ตัวกรองอนุภาคและระเบียบวิธีอนุภาค Feynman-Kac พบการประยุกต์ใช้ใน การ ประมวลผลสัญญาณและภาพ การอนุมานแบบเบย์เซียนการ เรียนรู้ ของเครื่องการวิเคราะห์ความเสี่ยงและการสุ่มตัวอย่างเหตุการณ์หายากวิศวกรรมและหุ่นยนต์ปัญญาประดิษฐ์ชีวสารสนเทศ [ 19 ]พันธุศาสตร์เชิงวิวัฒนาการวิทยาศาสตร์การคำนวณเศรษฐศาสตร์และการเงินเชิงคณิตศาสตร์เคมีโมเลกุล ฟิสิกส์เชิงคำนวณเภสัชจลนศาสตร์ความเสี่ยงเชิงปริมาณและการประกันภัย[ 20 ] [ 21 ]และสาขาอื่นๆ
ประวัติศาสตร์
อัลกอริทึมแบบฮิวริสติก
จากมุมมองทางสถิติและความน่าจะเป็น ตัวกรองอนุภาคจัดอยู่ในกลุ่มของอัลกอริทึมแบบแตกแขนง / แบบพันธุกรรม และระเบียบวิธีอนุภาคแบบมีปฏิสัมพันธ์ประเภทสนามเฉลี่ยการตีความวิธีการอนุภาคเหล่านี้ขึ้นอยู่กับสาขาวิทยาศาสตร์ ในการคำนวณเชิงวิวัฒนาการระเบียบ วิธี อนุภาคแบบพันธุกรรมประเภทสนามเฉลี่ยมักถูกใช้เป็นอัลกอริทึมการค้นหาแบบฮิวริสติกและแบบธรรมชาติ (หรือที่เรียกว่า เมตาฮิวริสติก ) ในฟิสิกส์เชิงคำนวณและเคมีโมเลกุลพวกมันถูกใช้เพื่อแก้ ปัญหา การอินทิเกรตเส้นทาง ของ Feynman-Kac หรือเพื่อคำนวณค่า Boltzmann-Gibbs ค่าลักษณะเฉพาะสูงสุด และสถานะพื้นฐานของ ตัวดำเนินการ Schrödingerในชีววิทยาและพันธุศาสตร์พวกมันแสดงถึงวิวัฒนาการของประชากรของแต่ละบุคคลหรือยีนในสภาพแวดล้อมบางอย่าง
ที่มาของ เทคนิคการคำนวณเชิงวิวัฒนาการแบบสนามเฉลี่ยสามารถสืบย้อนไปได้ถึงปี 1950 และ 1954 ด้วยงานของ Alan Turing เกี่ยวกับเครื่องจักรการเรียนรู้แบบการกลายพันธุ์และการคัดเลือกทางพันธุกรรม [ 22 ]และบทความของNils Aall Barricelliที่Institute for Advanced StudyในPrinceton รัฐนิวเจอร์ซีย์[ 23 ] [ 24 ]ร่องรอยแรกของตัวกรองอนุภาคในวิธีการทางสถิติย้อนกลับไปในช่วงกลางทศวรรษ 1950; 'Poor Man's Monte Carlo' [ 25 ]ที่เสนอโดยJohn Hammersleyและคณะในปี 1954 มีคำแนะนำเกี่ยวกับวิธีการกรองอนุภาคแบบพันธุกรรมที่ใช้ในปัจจุบัน ในปี 1963 Nils Aall Barricelliได้จำลองอัลกอริทึมแบบพันธุกรรมเพื่อเลียนแบบความสามารถของแต่ละบุคคลในการเล่นเกมง่ายๆ[ 26 ]ใน วรรณกรรม การคำนวณเชิงวิวัฒนาการอัลกอริทึมการคัดเลือกการกลายพันธุ์แบบพันธุกรรมได้รับความนิยมจากผลงานสำคัญของJohn Hollandในช่วงต้นทศวรรษ 1970 โดยเฉพาะหนังสือของเขา[ 27 ]ที่ตีพิมพ์ในปี 1975
ในชีววิทยาและพันธุศาสตร์นักพันธุศาสตร์ชาวออสเตรเลียAlex Fraserยังได้ตีพิมพ์บทความชุดหนึ่งเกี่ยวกับการจำลองทางพันธุกรรมของการคัดเลือกเทียมของสิ่งมีชีวิต ในปี พ.ศ. 2490 [ 28 ]การจำลองวิวัฒนาการด้วยคอมพิวเตอร์โดยนักชีววิทยาเริ่มแพร่หลายมากขึ้นในช่วงต้นทศวรรษ พ.ศ. 2503 และวิธีการต่างๆ ได้รับการอธิบายไว้ในหนังสือของ Fraser และ Burnell (1970) [ 29 ]และ Crosby (1973) [ 30 ]การจำลองของ Fraser ประกอบด้วยองค์ประกอบสำคัญทั้งหมดของอัลกอริทึมอนุภาคทางพันธุกรรมการกลายพันธุ์และการคัดเลือกสมัยใหม่
จากมุมมองทางคณิตศาสตร์การกระจายแบบมีเงื่อนไขของสถานะสุ่มของสัญญาณที่กำหนดโดยการสังเกตบางส่วนและมีสัญญาณรบกวนจะถูกอธิบายโดยความน่าจะเป็นของ Feynman-Kac บนวิถีสุ่มของสัญญาณที่ถ่วงน้ำหนักด้วยลำดับของฟังก์ชันศักยภาพความน่าจะเป็น[ 7 ] [ 8 ] วิธี Quantum Monte Carloและโดยเฉพาะอย่างยิ่งวิธี Diffusion Monte Carloสามารถตีความได้ว่าเป็นค่าประมาณอนุภาคประเภทพันธุกรรมสนามเฉลี่ยของปริพันธ์เส้นทาง Feynman-Kac [ 7 ] [ 8 ] [ 9 ] [ 13 ] [ 14 ] [ 31 ] [ 32 ]ต้นกำเนิดของ วิธีการ Quantum Monte Carloมักถูกยกให้เป็นผลงานของEnrico FermiและRobert Richtmyerซึ่งพัฒนาการตีความอนุภาคแบบ mean-field ของปฏิกิริยาลูกโซ่นิวตรอน ในปี 1948 [ 33 ] แต่ขั้นตอนวิธี อนุภาคแบบฮิวริสติกและแบบพันธุกรรม (หรือที่เรียกว่าวิธีการ Resampled หรือ Reconfiguration Monte Carlo) สำหรับการประมาณพลังงานสถานะพื้นฐานของระบบควอนตัม (ในแบบจำลองเมทริกซ์ลดรูป) นั้นเป็นผลงานของ Jack H. Hetherington ในปี 1984 [ 13 ]นอกจากนี้ยังสามารถอ้างถึงผลงานสำคัญก่อนหน้านี้ของTheodore E. HarrisและHerman Kahnในฟิสิกส์อนุภาคที่ตีพิมพ์ในปี 1951 ซึ่งใช้วิธีการแบบ mean-field แต่เป็นแบบฮิวริสติกและแบบพันธุกรรมสำหรับการประมาณพลังงานการส่งผ่านอนุภาค[ 34 ]ในเคมีโมเลกุล การใช้วิธีการอนุภาคแบบฮิวริสติกทางพันธุกรรม (หรือที่เรียกว่ากลยุทธ์การตัดแต่งและการเสริมคุณค่า) สามารถสืบย้อนไปได้ถึงปี 1955 ด้วยผลงานสำคัญของMarshall N. RosenbluthและArianna W. Rosenbluth [ 12 ]
การใช้อัลกอริทึมอนุภาคทางพันธุกรรมในการประมวลผลสัญญาณ ขั้นสูง และการอนุมานแบบเบย์เซียนนั้นค่อนข้างใหม่ ในเดือนมกราคม พ.ศ. 2536 Genshiro Kitagawa ได้พัฒนา "ตัวกรองมอนเตคาร์โล" [ 35 ]เวอร์ชันที่แก้ไขเล็กน้อยของบทความนี้ปรากฏใน พ.ศ. 2539 [ 36 ]ในเดือนเมษายน พ.ศ. 2536 Neil J. Gordon และคณะ ได้ตีพิมพ์งานสำคัญของพวกเขา[ 37 ]เกี่ยวกับการประยุกต์ใช้อัลกอริทึมประเภทพันธุกรรมในการอนุมานทางสถิติแบบเบย์เซียน ผู้เขียนตั้งชื่ออัลกอริทึมของพวกเขาว่า 'ตัวกรองบูตสแตรป' และแสดงให้เห็นว่าเมื่อเปรียบเทียบกับวิธีการกรองอื่นๆ อัลกอริทึมบูตสแตรปของพวกเขาไม่จำเป็นต้องมีข้อสมมติใดๆ เกี่ยวกับพื้นที่สถานะหรือสัญญาณรบกวนของระบบ ในขณะเดียวกัน งานวิจัยของ Pierre Del Moral [ 2 ]และ Himilcon Carvalho, Pierre Del Moral, André Moninและ Gérard Salut [ 38 ]เกี่ยวกับตัวกรองอนุภาคที่ตีพิมพ์ในช่วงกลางทศวรรษ พ.ศ. 2533 ก็ได้รับการตีพิมพ์ โดยอิสระเช่นกัน ตัวกรองอนุภาคยังได้รับการพัฒนาในการประมวลผลสัญญาณในช่วงต้นปี 1989–1992 โดย P. Del Moral, JC Noyer, G. Rigal และ G. Salut ในLAAS-CNRSในชุดรายงานการวิจัยที่จำกัดและเป็นความลับร่วมกับ STCAN (Service Technique des Constructions et Armes Navales), บริษัทไอที DIGILOG และLAAS-CNRS (ห้องปฏิบัติการวิเคราะห์และสถาปัตยกรรมของระบบ) เกี่ยวกับปัญหาการประมวลผลสัญญาณ RADAR/SONAR และ GPS [ 39 ] [ 40 ] [ 41 ] [ 42 ] [ 43 ] [ 44 ]
พื้นฐานทางคณิตศาสตร์
ตั้งแต่ปี 1950 ถึงปี 1996 สิ่งพิมพ์ทั้งหมดเกี่ยวกับตัวกรองอนุภาคและอัลกอริทึมทางพันธุกรรม รวมถึงวิธีการตัดแต่งและการสุ่มตัวอย่างแบบมอนเตคาร์โลที่นำเสนอในฟิสิกส์เชิงคำนวณและเคมีโมเลกุล ล้วนนำเสนออัลกอริทึมที่เป็นธรรมชาติและคล้ายฮิวริสติกที่นำไปใช้กับสถานการณ์ต่างๆ โดยปราศจากการพิสูจน์ความสอดคล้องหรือการอภิปรายเกี่ยวกับอคติของการประมาณค่าและอัลกอริทึมที่อิงตามลำดับวงศ์ตระกูลและต้นไม้บรรพบุรุษแม้แต่น้อย
พื้นฐานทางคณิตศาสตร์และการวิเคราะห์อย่างเข้มงวดครั้งแรกของอัลกอริธึมอนุภาคเหล่านี้มาจาก Pierre Del Moral [ 2 ] [ 4 ]ในปี 1996 บทความ[ 2 ]ยังมีการพิสูจน์คุณสมบัติที่ไม่เอนเอียงของการประมาณอนุภาคของฟังก์ชันความน่าจะเป็นและ การวัด ความน่าจะเป็นแบบมีเงื่อนไข ที่ไม่เป็นมาตรฐาน ตัวประมาณอนุภาคที่ไม่เอนเอียงของฟังก์ชันความน่าจะเป็นที่นำเสนอในบทความนี้ถูกนำมาใช้ในปัจจุบันในการอนุมานทางสถิติแบบเบย์เซียน
Dan Crisan, Jessica Gaines และTerry Lyons [ 45 ] [ 46 ] [ 47 ] รวมถึง Pierre Del Moral และ Terry Lyons [ 48 ]ได้สร้างเทคนิคอนุภาคแบบแตกแขนงที่มีขนาดประชากรต่างๆ กันในช่วงปลายทศวรรษ 1990 P. Del Moral, A. Guionnet และ L. Miclo [ 8 ] [ 49 ] [ 50 ] ได้พัฒนาเพิ่มเติมในเรื่องนี้ในปี 2000 Pierre Del Moral และ Alice Guionnet [ 51 ]ได้พิสูจน์ทฤษฎีบทขีดจำกัดกลางครั้งแรกในปี 1999 และ Pierre Del Moral และ Laurent Miclo [ 8 ]ได้พิสูจน์ทฤษฎีบทเหล่านั้นในปี 2000 ผลลัพธ์การบรรจบกันแบบสม่ำเสมอครั้งแรกเกี่ยวกับพารามิเตอร์เวลาสำหรับตัวกรองอนุภาคได้รับการพัฒนาในช่วงปลายทศวรรษ 1990 โดย Pierre Del Moral และAlice Guionnet [ 49 ] [ 50 ]การวิเคราะห์อย่างเข้มงวดครั้งแรกของตัวกรองอนุภาคแบบต้นไม้ตามลำดับวงศ์ตระกูลเป็นผลงานของ P. Del Moral และ L. Miclo ในปี 2544 [ 52 ]
ทฤษฎีเกี่ยวกับระเบียบวิธีอนุภาค Feynman-Kac และอัลกอริธึมตัวกรองอนุภาคที่เกี่ยวข้องได้รับการพัฒนาในปี 2000 และ 2004 ในหนังสือ[ 8 ] [ 5 ]แบบจำลองความน่าจะเป็นเชิงนามธรรมเหล่านี้ครอบคลุมอัลกอริธึมประเภทพันธุกรรม อนุภาค และตัวกรองบูตสแตรป ตัวกรอง Kalman แบบโต้ตอบ (หรือที่เรียกว่าตัวกรองอนุภาค Rao–Blackwellized [ 53 ] ) เทคนิค การสุ่มตัวอย่างความสำคัญและเทคนิคการสุ่มตัวอย่างซ้ำแบบอนุภาค รวมถึงระเบียบวิธีแบบต้นไม้ทางสายเลือดและแบบย้อนกลับของอนุภาคสำหรับการแก้ปัญหาการกรองและการปรับให้เรียบ วิธีการกรองอนุภาคประเภทอื่นๆ ได้แก่ โมเดลแบบต้นไม้ตามลำดับวงศ์ตระกูล[ 10 ] [ 5 ] [ 54 ]โมเดลอนุภาค Markov ย้อนกลับ[ 10 ] [ 55 ]โมเดลอนุภาคสนามเฉลี่ยแบบปรับตัว[ 6 ]โมเดลอนุภาคแบบเกาะ[ 56 ] [ 57 ]วิธีการ Monte Carlo แบบลูกโซ่ Markov อนุภาค[ 58 ] [ 59 ]ตัวสุ่ม Monte Carlo แบบลำดับ[ 60 ] [ 61 ] [ 62 ]และวิธีการคำนวณ Bayesian โดยประมาณแบบลำดับ Monte Carlo [ 63 ]และ Bayesian Bootstrap แบบลำดับ Monte Carlo ABC [ 64 ]
ปัญหาการกรอง
วัตถุประสงค์
เป้าหมายของตัวกรองอนุภาคคือการประมาณความหนาแน่นของความน่าจะเป็นภายหลังของตัวแปรสถานะ โดยพิจารณาจากตัวแปรสังเกต ตัวกรองอนุภาคมีจุดประสงค์เพื่อใช้กับแบบจำลองมาร์คอฟแบบซ่อนเร้นซึ่งระบบประกอบด้วยทั้งตัวแปรซ่อนเร้นและตัวแปรสังเกตได้ ตัวแปรสังเกตได้ (กระบวนการสังเกต) เชื่อมโยงกับตัวแปรซ่อนเร้น (กระบวนการสถานะ) ผ่านรูปแบบฟังก์ชันที่ทราบ ในทำนองเดียวกัน คำอธิบายเชิงความน่าจะเป็นของระบบพลวัตที่กำหนดวิวัฒนาการของตัวแปรสถานะก็เป็นที่รู้จักเช่นกัน
ตัวกรองอนุภาคทั่วไปจะประมาณการการแจกแจงความน่าจะเป็นภายหลังของสถานะที่ซ่อนอยู่โดยใช้กระบวนการวัดการสังเกต โดยพิจารณาจากปริภูมิสถานะดังที่แสดงด้านล่าง:
ปัญหาการกรองคือการประมาณค่าของสถานะที่ซ่อนอยู่ตามลำดับ โดยพิจารณาจาก ค่าของกระบวนการสังเกตณ ช่วงเวลาใดๆk
การประมาณค่าแบบเบย์ทั้งหมดได้มาจากความหนาแน่นของความน่าจะเป็นภายหลังระเบียบวิธีตัวกรองอนุภาคให้ค่าประมาณของความน่าจะเป็นแบบมีเงื่อนไขเหล่านี้โดยใช้การวัดเชิงประจักษ์ที่เกี่ยวข้องกับอัลกอริทึมอนุภาคแบบพันธุกรรม ในทางตรงกันข้าม วิธีการมาร์คอฟเชน มอนเตคาร์โล หรือการสุ่มตัวอย่างแบบสำคัญจะจำลองความน่าจะเป็นภายหลังแบบเต็มรูปแบบ
แบบจำลองการสังเกตสัญญาณ
วิธีการทางอนุภาคมักจะตั้งสมมติฐาน และ สามารถจำลอง การสังเกตการณ์ ได้ในรูปแบบนี้:
- เป็นกระบวนการมาร์คอฟบน(สำหรับบางค่า) ที่วิวัฒนาการไปตามความหนาแน่นของความน่าจะเป็นของการเปลี่ยนสถานะแบบจำลองนี้มักเขียนในรูปแบบสังเคราะห์ว่า
- โดยมีความหนาแน่นของความน่าจะเป็นเริ่มต้น
- ค่า ที่สังเกตได้ จะอยู่ในปริภูมิสถานะบางอย่างบน(สำหรับบางค่า) และเป็นอิสระต่อกันแบบมีเงื่อนไขก็ต่อเมื่อทราบค่า กล่าวอีกนัยหนึ่งคือ แต่ละค่าขึ้นอยู่กับ เท่านั้นนอกจากนี้ เรายังสมมติว่าการแจกแจงแบบมีเงื่อนไขสำหรับเมื่อกำหนดให้เป็นแบบต่อเนื่องสัมบูรณ์ และในทางสังเคราะห์เรามี
ตัวอย่างของระบบที่มีคุณสมบัติเหล่านี้คือ:
โดยที่ทั้งและเป็นลำดับอิสระต่อกันที่มีฟังก์ชันความหนาแน่นความน่าจะ เป็นที่ทราบ และgและhเป็นฟังก์ชันที่ทราบ สมการทั้งสองนี้สามารถมองได้ว่าเป็น สมการ ปริภูมิสถานะและมีลักษณะคล้ายกับสมการปริภูมิสถานะสำหรับตัวกรอง Kalman หากฟังก์ชันgและhในตัวอย่างข้างต้นเป็นเชิงเส้น และหากทั้งและเป็นแบบ Gaussianตัวกรอง Kalman จะพบการกระจายการกรองแบบ Bayesian ที่แม่นยำ หากไม่เป็นเช่นนั้น วิธีการที่ใช้ตัวกรอง Kalman จะเป็นการประมาณอันดับแรก ( EKF ) หรือการประมาณอันดับสอง ( UKFโดยทั่วไป แต่ถ้าการกระจายความน่าจะเป็นเป็นแบบ Gaussian การประมาณอันดับสามก็เป็นไปได้)
ข้อสมมติที่ว่าการกระจายเริ่มต้นและการเปลี่ยนสถานะของห่วงโซ่มาร์คอฟมีความต่อเนื่องสำหรับการวัดแบบเลเบสสามารถผ่อนคลายได้ ในการออกแบบตัวกรองอนุภาค เราเพียงแค่ต้องสมมติว่าเราสามารถสุ่มตัวอย่างการเปลี่ยนสถานะของห่วงโซ่มาร์คอฟและคำนวณฟังก์ชันความน่าจะเป็นได้(ดูตัวอย่างเช่น คำอธิบายการกลายพันธุ์จากการคัดเลือกทางพันธุกรรมของตัวกรองอนุภาคที่กล่าวถึงด้านล่าง) ข้อสมมติเรื่องความต่อเนื่องของการเปลี่ยนสถานะของมาร์คอฟนั้นใช้เพื่ออนุมานสูตรที่แตกต่างกันระหว่างการกระจายความน่าจะเป็นภายหลังโดยใช้กฎของเบย์สสำหรับความหนาแน่นแบบมีเงื่อนไขในลักษณะที่ไม่เป็นทางการ (และค่อนข้างไม่ถูกต้อง) เท่านั้น
แบบจำลองการคำนวณแบบเบย์เซียนโดยประมาณ
ในปัญหาบางประการ การกระจายแบบมีเงื่อนไขของการสังเกต โดยพิจารณาจากสถานะสุ่มของสัญญาณ อาจไม่มีความหนาแน่น ซึ่งอาจเป็นไปไม่ได้หรือซับซ้อนเกินไปที่จะคำนวณ[ 19 ]ในสถานการณ์นี้ จำเป็นต้องมีการประมาณค่าเพิ่มเติมอีกระดับหนึ่ง กลยุทธ์หนึ่งคือการแทนที่สัญญาณด้วยห่วงโซ่มาร์คอฟและแนะนำการสังเกตเสมือนในรูปแบบ
สำหรับลำดับของตัวแปรสุ่มอิสระที่มีฟังก์ชันความหนาแน่นความน่าจะ เป็นที่ทราบแล้ว แนวคิดหลักคือการสังเกตว่า
ตัวกรองอนุภาคที่เกี่ยวข้องกับกระบวนการ Markov ที่กำหนดโดยการสังเกตบางส่วนนั้นถูกกำหนดในแง่ของอนุภาคที่วิวัฒนาการด้วยฟังก์ชันความน่าจะเป็นที่กำหนดด้วยสัญกรณ์ที่ไม่เหมาะสมอย่างเห็นได้ชัดโดยเทคนิคความน่าจะเป็นเหล่านี้มีความเกี่ยวข้องอย่างใกล้ชิดกับการคำนวณแบบเบย์เซียนโดยประมาณ (ABC) ในบริบทของตัวกรองอนุภาค เทคนิคการกรองอนุภาค ABC เหล่านี้ได้รับการแนะนำในปี 1998 โดย P. Del Moral, J. Jacod และ P. Protter [ 65 ]และได้รับการพัฒนาเพิ่มเติมโดย P. Del Moral, A. Doucet และ A. Jasra [ 66 ] [ 67 ]
สมการการกรองแบบไม่เชิงเส้น
กฎของเบย์สสำหรับความน่าจะเป็นแบบมีเงื่อนไขมีดังนี้:
ที่ไหน
ตัวกรองอนุภาคก็เป็นการประมาณเช่นกัน แต่หากมีอนุภาคมากพอ ก็สามารถมีความแม่นยำมากขึ้นได้[ 2 ] [ 4 ] [ 5 ] [ 49 ] [ 50 ]สมการการกรองแบบไม่เชิงเส้นกำหนดโดยการเรียกซ้ำ
| สมการที่ 1 |
โดยใช้ข้อตกลงสำหรับk = 0 ปัญหาการกรองแบบไม่เชิงเส้นประกอบด้วยการคำนวณการแจกแจงแบบมีเงื่อนไขเหล่านี้ตามลำดับ
สูตรของเฟย์นแมน-แคค
เรากำหนดช่วงเวลา n และลำดับการสังเกตการณ์และสำหรับแต่ละk = 0, ..., nเราตั้งค่าดังนี้:
ในสัญลักษณ์นี้ สำหรับฟังก์ชันขอบเขตใดๆFบนเซตของวิถีโคจรจากจุดกำเนิดk = 0 จนถึงเวลาk = nเราจะได้สูตรของ Feynman-Kac
แบบจำลองการบูรณาการเส้นทาง Feynman-Kac เกิดขึ้นในสาขาวิทยาศาสตร์หลายแขนง รวมถึงฟิสิกส์เชิงคำนวณ ชีววิทยา ทฤษฎีสารสนเทศ และวิทยาศาสตร์คอมพิวเตอร์[ 8 ] [ 10 ] [ 5 ]การตีความขึ้นอยู่กับโดเมนการใช้งาน ตัวอย่างเช่น หากเราเลือกฟังก์ชันตัวบ่งชี้ของเซตย่อยบางส่วนของปริภูมิสถานะ ฟังก์ชันเหล่านี้จะแสดงถึงการกระจายแบบมีเงื่อนไขของห่วงโซ่ Markov โดยที่ห่วงโซ่นั้นยังคงอยู่ในท่อที่กำหนด นั่นคือ เรามี:
และ
ทันทีที่ค่าคงที่การทำให้เป็นมาตรฐานเป็นค่าบวกอย่างเคร่งครัด
ตัวกรองอนุภาค
อัลกอริทึมอนุภาคประเภทพันธุกรรม
ในขั้นต้น อัลกอริทึมดังกล่าวเริ่มต้นด้วยตัวแปรสุ่มอิสระN ตัว ที่มีความหนาแน่นความน่าจะเป็นร่วมกันการเปลี่ยนผ่านการคัดเลือก-การกลายพันธุ์ของอัลกอริทึมทางพันธุกรรม[ 2 ] [ 4 ]
เลียนแบบ/ประมาณการเปลี่ยนผ่านการอัปเดต-การทำนายของการวิวัฒนาการตัวกรองที่เหมาะสมที่สุด ( สมการที่ 1 ):
- ในระหว่างช่วงการเปลี่ยนผ่านของการเลือกและการปรับปรุงเราจะสุ่มตัวแปรสุ่มอิสระ (แบบมีเงื่อนไข) จำนวน N ตัว ซึ่งมีการแจกแจงร่วมกัน (แบบมีเงื่อนไข)
โดยที่หมายถึงมาตรวัด Diracณ สถานะ a ที่กำหนด
- ในระหว่างการเปลี่ยนผ่านจากการทำนายการกลายพันธุ์เราจะสุ่มตัวอย่างการเปลี่ยนผ่านจากอนุภาคที่เลือกแต่ละตัวอย่าง อิสระ
ในสูตรที่แสดงด้านบน หมายถึงฟังก์ชันความน่าจะเป็นที่ประเมินค่า ณ จุดและหมายถึงความหนาแน่นแบบมีเงื่อนไขที่ประเมินค่า ณ จุด.
ในแต่ละช่วงเวลาkเราจะได้ค่าประมาณของอนุภาค
และ
ในชุมชนอัลกอริทึมทางพันธุกรรมและการคำนวณเชิงวิวัฒนาการโซ่ Markov การกลายพันธุ์-การคัดเลือกที่อธิบายไว้ข้างต้นมักเรียกว่าอัลกอริทึมทางพันธุกรรมที่มีการคัดเลือกตามสัดส่วน มีการเสนอตัวแปรการแตกแขนงหลายแบบ รวมถึงขนาดประชากรแบบสุ่มในบทความต่างๆ[ 5 ] [ 45 ] [ 48 ]
วิธีการแบบอนุภาค เช่นเดียวกับวิธีการสุ่มตัวอย่างอื่นๆ (เช่นMarkov Chain Monte Carlo ) จะสร้างชุดตัวอย่างที่ประมาณความหนาแน่นของการกรอง
ตัวอย่างเช่น เราอาจมี ตัวอย่าง Nตัวอย่างจากความน่าจะเป็นภายหลังโดยประมาณของโดยที่ตัวอย่างเหล่านั้นมีป้ายกำกับด้วยตัวยกดังนี้:
จากนั้น ค่าคาดหวังเกี่ยวกับการกระจายการกรองจะถูกประมาณโดย
| สมการที่ 2 |
กับ
โดยที่หมายถึงการวัดแบบ Diracณ สถานะ a ที่กำหนด ฟังก์ชันfในแบบปกติของ Monte Carlo สามารถให้ค่าโมเมนต์ฯลฯ ทั้งหมดของการกระจายได้จนถึงข้อผิดพลาดในการประมาณค่าบางอย่าง เมื่อสมการการประมาณค่า ( สมการที่ 2 ) เป็นจริงสำหรับฟังก์ชันf ที่มีขอบเขตใดๆ เราจะเขียนได้ว่า
ตัวกรองอนุภาคสามารถตีความได้ว่าเป็นอัลกอริทึมอนุภาคประเภทพันธุกรรมที่วิวัฒนาการไปพร้อมกับการกลายพันธุ์และการคัดเลือก เราสามารถติดตามสายบรรพบุรุษได้
ของอนุภาคสถานะสุ่มที่มีดัชนีล่าง l=0,...,k หมายถึงบรรพบุรุษของแต่ละบุคคลที่ระดับ l=0,...,k ในสถานการณ์นี้ เรามีสูตรการประมาณค่า
| สมการที่ 3 |
ในที่นี้Fหมายถึงฟังก์ชันที่ก่อตั้งขึ้นบนปริภูมิเส้นทางของสัญญาณ ในรูปแบบที่สังเคราะห์มากขึ้น ( สมการที่ 3 ) จะเทียบเท่ากับ
ตัวกรองอนุภาคสามารถตีความได้หลายวิธี จากมุมมองเชิงความน่าจะเป็น ตัวกรองอนุภาคจะสอดคล้องกับ การตีความ อนุภาคสนามเฉลี่ยของสมการการกรองแบบไม่เชิงเส้น การเปลี่ยนผ่านการอัปเดต-การทำนายของการวิวัฒนาการตัวกรองที่เหมาะสมที่สุดยังสามารถตีความได้ว่าเป็นการเปลี่ยนผ่านการคัดเลือก-การกลายพันธุ์แบบคลาสสิกทางพันธุกรรมของแต่ละบุคคล เทคนิคการสุ่มตัวอย่างความสำคัญตามลำดับให้การตีความอีกแบบหนึ่งของการเปลี่ยนผ่านของการกรองโดยเชื่อมโยงการสุ่มตัวอย่างความสำคัญกับขั้นตอนการสุ่มตัวอย่างบูตสแตรป สุดท้ายแต่ไม่ท้ายสุด ตัวกรองอนุภาคสามารถมองได้ว่าเป็นวิธีการยอมรับ-ปฏิเสธที่มาพร้อมกับกลไกการรีไซเคิล[ 10 ] [ 5 ]
หลักการความน่าจะเป็นทั่วไป
วิวัฒนาการของการกรองแบบไม่เชิงเส้นสามารถตีความได้ว่าเป็นระบบพลวัตในชุดของการวัดความน่าจะเป็นในรูปแบบที่หมายถึงการแมปบางอย่างจากชุดของการกระจายความน่าจะเป็นไปยังตัวมันเอง ตัวอย่างเช่น วิวัฒนาการของตัวทำนายที่เหมาะสมที่สุดแบบขั้นตอนเดียว
สอดคล้องกับการวิวัฒนาการแบบไม่เชิงเส้น โดยเริ่มต้นจากการกระจายความน่าจะเป็น หนึ่งในวิธีที่ง่ายที่สุดในการประมาณค่ามาตรวัดความน่าจะเป็นเหล่านี้ คือการเริ่มต้นด้วยตัวแปรสุ่มอิสระN ตัว ที่มีการกระจายความน่าจะเป็นร่วมกัน สมมติว่าเราได้กำหนดลำดับของตัวแปรสุ่มN ตัว ไว้ดังนี้
ขั้นตอนต่อไป เราจะสุ่มตัวแปรสุ่มอิสระ (แบบมีเงื่อนไข) จำนวนN ตัว โดยใช้กฎทั่วไป
การตีความสมการการกรองในเชิงอนุภาค
เราจะอธิบายหลักการของอนุภาคสนามเฉลี่ยนี้ในบริบทของการวิวัฒนาการของตัวทำนายที่ดีที่สุดแบบขั้นตอนเดียว
| สมการที่ 4 |
สำหรับk = 0 เราใช้ข้อตกลงนี้
ตามกฎของจำนวนมาก เราจะได้ว่า
ในแง่ที่ว่า
สำหรับฟังก์ชันที่มีขอบเขตใดๆเรายังสมมติเพิ่มเติมว่าเราได้สร้างลำดับของอนุภาคที่อันดับk บางอันดับ แล้ว โดยที่
ในแง่ที่ว่าสำหรับฟังก์ชันที่มีขอบเขตใดๆเราจะมี
ในสถานการณ์นี้ เมื่อแทนที่ด้วยการวัดเชิงประจักษ์ในสมการวิวัฒนาการของตัวกรองที่เหมาะสมที่สุดแบบขั้นตอนเดียวที่ระบุไว้ใน ( สมการ 4 ) เราพบว่า
โปรดสังเกตว่าด้านขวามือในสูตรข้างต้นคือส่วนผสมความน่าจะเป็นแบบถ่วงน้ำหนัก
โดยที่ แทนความหนาแน่นที่ประเมิน ณและแทนความหนาแน่นที่ประเมิน ณสำหรับ
จากนั้น เราสุ่มตัวแปรสุ่มอิสระN ตัว ที่มีความหนาแน่นความน่าจะเป็นร่วมกัน เพื่อให้
ด้วยการทำซ้ำขั้นตอนดังกล่าว เราจึงออกแบบห่วงโซ่มาร์คอฟได้ดังนี้
โปรดสังเกตว่าตัวกรองที่เหมาะสมที่สุดจะถูกประมาณค่าในแต่ละช่วงเวลา k โดยใช้สูตรของเบย์ส
คำศัพท์ "การประมาณค่าเฉลี่ยสนาม" มาจากข้อเท็จจริงที่ว่าเราแทนที่การวัดความน่าจะเป็นด้วยการประมาณเชิงประจักษ์ ในแต่ละขั้นตอนเวลา การประมาณอนุภาคค่าเฉลี่ยสนามของปัญหาการกรองนั้นห่างไกลจากความเป็นเอกลักษณ์ มีกลยุทธ์หลายอย่างที่พัฒนาขึ้นในหนังสือ[ 10 ] [ 5 ]
ผลลัพธ์การบรรจบกันบางประการ
การวิเคราะห์การบรรจบกันของตัวกรองอนุภาคเริ่มต้นในปี 1996 [ 2 ] [ 4 ]และในปี 2000 ในหนังสือ[ 8 ]และชุดบทความ[ 48 ] [ 49 ] [ 50 ] [ 51 ] [ 52 ] [ 68 ] [ 69 ]การพัฒนาล่าสุดสามารถพบได้ในหนังสือ[ 10 ] [ 5 ]เมื่อสมการการกรองมีเสถียรภาพ (ในแง่ที่ว่ามันแก้ไขเงื่อนไขเริ่มต้นที่ผิดพลาดใดๆ) อคติและความแปรปรวนของการประมาณค่าอนุภาค
ถูกควบคุมโดยการประมาณค่าสม่ำเสมอที่ไม่ใช่เชิงอะซิมโทติก
สำหรับฟังก์ชันf ใดๆ ที่มีขอบเขตไม่เกิน 1 และสำหรับค่าคงที่จำกัดบางค่า นอกจากนี้ สำหรับ:
สำหรับค่าคงที่จำกัดบางค่าที่เกี่ยวข้องกับอคติเชิงอะซิมโทติกและความแปรปรวนของการประมาณค่าอนุภาค และค่าคงที่จำกัดc บาง ค่า ผลลัพธ์เดียวกันนี้ยังคงเป็นไปได้หากเราแทนที่ตัวทำนายที่เหมาะสมที่สุดแบบขั้นตอนเดียวด้วยการประมาณค่าตัวกรองที่เหมาะสมที่สุด
แผนผังลำดับวงศ์ตระกูลและคุณสมบัติของความเป็นกลาง
การปรับเรียบอนุภาคตามแผนผังลำดับวงศ์ตระกูล
สืบย้อนรอยสายตระกูลไปในอดีต
ของแต่ละบุคคลและในแต่ละช่วงเวลาkเรายังมีการประมาณค่าอนุภาคด้วย
การประมาณเชิงประจักษ์เหล่านี้เทียบเท่ากับการประมาณเชิงปริพันธ์ของอนุภาค
สำหรับฟังก์ชันขอบเขตใดๆFบนวิถีสุ่มของสัญญาณ ดังที่แสดงใน[ 54 ]วิวัฒนาการของต้นไม้ลำดับวงศ์ตระกูลสอดคล้องกับการตีความอนุภาคสนามเฉลี่ยของสมการวิวัฒนาการที่เกี่ยวข้องกับความหนาแน่นภายหลังของวิถีสัญญาณ สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับแบบจำลองพื้นที่เส้นทางเหล่านี้ โปรดดูหนังสือ[ 10 ] [ 5 ]
การประมาณค่าฟังก์ชันความน่าจะเป็นของอนุภาคที่ไม่ลำเอียง
เราใช้สูตรผลิตภัณฑ์
กับ
และข้อตกลงและสำหรับk = 0 แทนที่ด้วยการประมาณ เชิงประจักษ์
ในสูตรที่แสดงข้างต้น เราได้ออกแบบการประมาณอนุภาคที่ไม่เอนเอียงของฟังก์ชันความน่าจะเป็นดังต่อไปนี้
กับ
โดยที่หมายถึงความหนาแน่นที่ประเมิน ณ จุดนั้นการออกแบบการประมาณอนุภาคนี้และคุณสมบัติที่ไม่เอนเอียงได้รับการพิสูจน์แล้วในปี 1996 ในบทความ[ 2 ]การประมาณค่าความแปรปรวนที่ปรับปรุงแล้วสามารถพบได้ใน[ 5 ]และ[ 10 ]
ตัวปรับเรียบอนุภาคแบบย้อนกลับ
เมื่อใช้กฎของเบย์ส เราจะได้สูตรดังนี้
โปรดสังเกตว่า
นี่หมายความว่า
การแทนที่ตัวทำนายที่เหมาะสมที่สุดแบบขั้นตอนเดียว ด้วย มาตรวัดเชิงประจักษ์ของอนุภาค
เราพบว่า
เราสรุปได้ว่า
ด้วยการประมาณอนุภาคย้อนกลับ
การวัดความน่าจะเป็น
คือความน่าจะเป็นของเส้นทางสุ่มของห่วงโซ่มาร์คอฟที่วิ่งย้อนกลับไปในเวลาจากเวลา k=n ถึงเวลา k=0 และมีการเปลี่ยนแปลงในแต่ละขั้นตอนเวลา k ในปริภูมิสถานะที่เกี่ยวข้องกับประชากรของอนุภาค
- ในตอนเริ่มต้น (ที่เวลา k=n) โซ่จะเลือกสถานะแบบสุ่มโดยใช้การแจกแจง
- ตั้งแต่เวลา k ถึงเวลา (k-1) ลำดับที่เริ่มต้นจากสถานะบางสถานะสำหรับบางค่าณ เวลา k จะเคลื่อนไปยังสถานะสุ่มที่เลือกด้วยความน่าจะเป็นถ่วงน้ำหนักแบบไม่ต่อเนื่อง ณ เวลา (k-1)
ในสูตรที่แสดงข้างต้น หมายถึงการแจกแจงแบบมีเงื่อนไขที่ประเมิน ณ เวลาในทำนองเดียวกันและหมายถึงความหนาแน่นแบบมีเงื่อนไขและที่ประเมิน ณ เวลาและแบบจำลองเหล่านี้ช่วยลดการบูรณาการโดยสัมพันธ์กับความหนาแน่นในแง่ของการดำเนินการเมทริกซ์โดยสัมพันธ์กับการเปลี่ยนผ่านแบบมาร์คอฟของห่วงโซ่ที่อธิบายไว้ข้างต้น[ 55 ]ตัวอย่างเช่น สำหรับฟังก์ชันใดๆเรามีการประมาณค่าอนุภาค
ที่ไหน
สิ่งนี้ยังแสดงให้เห็นว่าถ้า
แล้ว
การปรับอนุภาคให้เรียบยังสามารถทำได้ในการดำเนินการออนไลน์เพียงครั้งเดียวผ่านการประมาณค่าความล่าช้าคงที่[ 70 ]
ผลลัพธ์การบรรจบกันบางประการ
เราจะถือว่าสมการการกรองมีเสถียรภาพ ในแง่ที่ว่ามันแก้ไขเงื่อนไขเริ่มต้นที่ผิดพลาดใดๆ ได้
ในสถานการณ์นี้การประมาณค่าอนุภาคของฟังก์ชันความน่าจะเป็นจะไม่เอนเอียง และความแปรปรวนสัมพัทธ์จะถูกควบคุมโดย
สำหรับค่าคงที่จำกัดc บางค่า นอกจากนี้ สำหรับค่าใดๆ:
สำหรับค่าคงที่จำกัดบางค่าที่เกี่ยวข้องกับอคติเชิงอะซิมโทติกและความแปรปรวนของการประมาณค่าอนุภาค และสำหรับค่าคงที่จำกัดc บาง ค่า
ความเอนเอียงและความแปรปรวนของ การประมาณค่าอนุภาคโดยอิงจากสายบรรพบุรุษของแผนผังลำดับวงศ์ตระกูล
ถูกควบคุมโดยการประมาณค่าสม่ำเสมอที่ไม่ใช่เชิงอะซิมโทติก
สำหรับฟังก์ชันF ใดๆ ที่มีขอบเขตไม่เกิน 1 และสำหรับค่าคงที่จำกัดบางค่านอกจากนี้ สำหรับใดๆ:
สำหรับค่าคงที่จำกัดบางค่าที่เกี่ยวข้องกับอคติและความแปรปรวนเชิงอะซิมโทติกของการประมาณค่าอนุภาค และสำหรับค่าคงที่จำกัดc บาง ค่า การประมาณค่าอคติและความแปรปรวนประเภทเดียวกันนี้ใช้ได้กับตัวปรับเรียบอนุภาคแบบย้อนกลับ สำหรับฟังก์ชันบวกในรูปแบบ
กับ
โดยที่ฟังก์ชันมีค่าจำกัดอยู่ที่ 1 เราจะได้ว่า
และ
สำหรับค่าคงที่จำกัดบางค่า การประมาณค่าที่ละเอียดขึ้นซึ่งรวมถึงความน่าจะเป็นของข้อผิดพลาดที่เล็กมากแบบเลขชี้กำลังได้รับการพัฒนาใน[ 10 ]
การสุ่มตัวอย่างซ้ำเชิงความสำคัญแบบลำดับ (Sequential Importance Resampling: SIR)
ตัวกรองมอนเตคาร์โลและตัวกรองบูตสแตรป
การสุ่มตัวอย่างซ้ำตามความสำคัญแบบลำดับ(SIR)การกรองแบบมอนเตคาร์โล (Kitagawa 1993 [ 35 ] ) อัลกอริทึมการกรองแบบบูตสแตรป (Gordon et al. 1993 [ 37 ] ) และการสุ่มตัวอย่างซ้ำแบบกระจายเดี่ยว (Bejuri WMYB et al. 2017 [ 71 ] ) ก็เป็นอัลกอริทึมการกรองที่ใช้กันทั่วไปเช่นกัน ซึ่งประมาณความหนาแน่นของความน่าจะเป็นในการกรองด้วยชุดตัวอย่าง N ที่ถ่วงน้ำหนัก
ค่าน้ำหนักความสำคัญ เป็นการประมาณค่าความน่าจะเป็นภายหลังสัมพัทธ์ (หรือความหนาแน่น) ของตัวอย่าง โดยที่
การสุ่มตัวอย่างแบบสำคัญตามลำดับ (Sequential Importance Sampling: SIS) เป็นการสุ่มตัวอย่างแบบสำคัญ ในรูปแบบลำดับ (กล่าวคือ แบบวนซ้ำ) เช่นเดียวกับการสุ่มตัวอย่างแบบสำคัญ ค่าคาดหวังของฟังก์ชันfสามารถประมาณได้โดยใช้ค่าเฉลี่ยถ่วงน้ำหนัก
สำหรับชุดตัวอย่างที่มีจำนวนจำกัด ประสิทธิภาพของอัลกอริธึมจะขึ้นอยู่กับการเลือกการกระจายความน่าจะเป็น
- .
การแจกแจงข้อเสนอที่ " เหมาะสมที่สุด"จะถูกกำหนดเป็นการแจกแจงเป้าหมาย
ทางเลือกการเปลี่ยนข้อเสนอเฉพาะนี้ได้รับการเสนอโดย P. Del Moral ในปี 1996 และ 1998 [ 4 ]เมื่อการสุ่มตัวอย่างการเปลี่ยนตามการกระจายทำได้ยาก กลยุทธ์ตามธรรมชาติอย่างหนึ่งคือการใช้การประมาณอนุภาคต่อไปนี้
ด้วยการประมาณเชิงประจักษ์
เกี่ยวข้องกับ ตัวอย่างสุ่มอิสระ N (หรือตัวอย่างจำนวนมากอื่นๆ) ที่มีการแจกแจงแบบมีเงื่อนไขของสถานะสุ่มที่กำหนดความสอดคล้องของตัวกรองอนุภาคที่ได้จากการประมาณนี้และส่วนขยายอื่นๆ ได้รับการพัฒนาใน[ 4 ]ในการแสดงผลข้างต้นหมายถึงการวัด Diracที่สถานะ a ที่กำหนด
อย่างไรก็ตาม โดยทั่วไปแล้ว การกระจายความน่าจะเป็นก่อนหน้าของการเปลี่ยนผ่านมักถูกใช้เป็นฟังก์ชันความสำคัญ เนื่องจากง่ายต่อการสุ่มอนุภาค (หรือตัวอย่าง) และดำเนินการคำนวณน้ำหนักความสำคัญในภายหลัง:
ตัวกรองการสุ่มตัวอย่างความสำคัญตามลำดับ ( Sequential Importance Resampling : SIR) ที่ใช้การกระจายความน่าจะเป็นก่อนหน้าของการเปลี่ยนผ่านเป็นฟังก์ชันความสำคัญ มักเรียกกันว่าตัวกรองบูตสแตรป (bootstrap filter ) และ อัลกอริ ธึมการควบแน่น (condensation algorithm )
การสุ่มตัวอย่างซ้ำใช้เพื่อหลีกเลี่ยงปัญหาความเสื่อมของอัลกอริทึม กล่าวคือ หลีกเลี่ยงสถานการณ์ที่น้ำหนักความสำคัญทั้งหมด ยกเว้นเพียงหนึ่งเดียว มีค่าใกล้เคียงศูนย์ ประสิทธิภาพของอัลกอริทึมอาจได้รับผลกระทบจากการเลือกวิธีการสุ่มตัวอย่างซ้ำที่เหมาะสมการสุ่มตัวอย่างแบบแบ่งชั้นที่เสนอโดย Kitagawa (1993 [ 35 ] ) ถือว่าเหมาะสมที่สุดในแง่ของความแปรปรวน
ขั้นตอนเดียวของการสุ่มตัวอย่างซ้ำตามความสำคัญแบบลำดับมีดังนี้:
- 1) เพื่อสุ่มตัวอย่างจากชุดการแจกแจงข้อเสนอ
- 2) สำหรับการปรับปรุงค่าน้ำหนักความสำคัญให้เป็นไปตามค่าคงที่มาตรฐาน:
- โปรดทราบว่าเมื่อเราใช้การแจกแจงความน่าจะเป็นก่อนหน้าของการเปลี่ยนผ่านเป็นฟังก์ชันความสำคัญ
- ซึ่งสามารถลดรูปได้ดังนี้:
- 3) สำหรับการคำนวณค่าน้ำหนักความสำคัญแบบนอร์มาไลซ์:
- 4) คำนวณค่าประมาณของจำนวนอนุภาคที่มีประสิทธิภาพดังนี้
- เกณฑ์นี้สะท้อนถึงความแปรปรวนของน้ำหนัก เกณฑ์อื่นๆ สามารถพบได้ในบทความ[ 6 ]รวมถึงการวิเคราะห์อย่างเข้มงวดและทฤษฎีบทขีดจำกัดกลาง
- 5) หากจำนวนอนุภาคที่มีประสิทธิภาพน้อยกว่าเกณฑ์ที่กำหนดให้ทำการสุ่มตัวอย่างใหม่:
- ก) สุ่มเลือก อนุภาค Nตัวจากชุดอนุภาคปัจจุบัน โดยให้ความน่าจะเป็นแปรผันตามน้ำหนักของอนุภาคแต่ละตัว จากนั้นแทนที่ชุดอนุภาคปัจจุบันด้วยชุดอนุภาคใหม่นี้
- ข) สำหรับชุด
คำว่า "การสุ่มตัวอย่างแบบสำคัญ" (Sampling Importance Resampling) บางครั้งก็ถูกนำมาใช้เมื่อกล่าวถึงตัวกรอง SIR แต่คำว่าImportance Resamplingนั้นแม่นยำกว่า เพราะคำว่า "resampling" หมายความว่าการสุ่มตัวอย่างเริ่มต้นได้ดำเนินการไปแล้ว[ 72 ]
การสุ่มตัวอย่างความสำคัญตามลำดับ (SIS)
การสุ่มตัวอย่างแบบสำคัญตามลำดับ (Sequential Importance Sampling: SIS) นั้นเหมือนกับอัลกอริธึม SIR แต่ไม่มีขั้นตอนการสุ่มตัวอย่างซ้ำ เวอร์ชันนี้มักแสดงปัญหาการยุบตัวของน้ำหนักอนุภาค ซึ่งความน่าจะเป็นทั้งหมดจะกระจุกตัวอยู่ที่อนุภาคหนึ่งหรือสองตัว และน้ำหนักของอนุภาคที่เหลือจะสอดคล้องกับความน่าจะเป็นที่น้อยมาก การเพิ่มขั้นตอนการสุ่มตัวอย่างซ้ำจะช่วยลดปัญหานี้ได้
อัลกอริทึม "เวอร์ชันโดยตรง"
อัลกอริทึม "เวอร์ชันโดยตรง" นั้นค่อนข้างง่าย (เมื่อเทียบกับอัลกอริทึมการกรองอนุภาคอื่นๆ) และใช้การประกอบและการปฏิเสธ เพื่อสร้างตัวอย่างเดียวxที่kจาก:
- 1) ตั้งค่าn = 0 (ซึ่งจะนับจำนวนอนุภาคที่สร้างขึ้นจนถึงปัจจุบัน)
- 2) เลือกดัชนี i จากช่วงอย่างสม่ำเสมอ
- 3) สร้างชุดทดสอบจากชุดการแจกแจงด้วย
- 4) สร้างความน่าจะเป็นของการใช้ค่าที่ วัด ได้
- 5) สร้าง ค่า u ที่เป็นเอกรูป อีกค่าหนึ่งจาก ตำแหน่งใด
- 6) เปรียบเทียบ u และ
- 6a) ถ้า u มีค่ามากกว่า ให้ทำซ้ำตั้งแต่ขั้นตอนที่ 2
- 6b) ถ้า u มีค่าน้อยกว่า ให้บันทึกเป็นค่าเดิมและเพิ่มค่า n ขึ้นหนึ่ง
- 7) ถ้าn == Nให้หยุด
เป้าหมายคือการสร้าง "อนุภาค" จำนวน P ที่ตำแหน่งk โดย ใช้เฉพาะอนุภาคจาก เท่านั้นซึ่งจำเป็นต้องเขียน (และคำนวณ) สมการมาร์คอฟเพื่อสร้างโดยอาศัย เพียงอย่างเดียวอัลกอริทึมนี้ใช้การประกอบกันของอนุภาค P จากเพื่อสร้างอนุภาคที่ตำแหน่งkและทำซ้ำ (ขั้นตอนที่ 2–6) จนกว่าจะสร้างอนุภาค P ที่ตำแหน่งk ได้ ครบ
สามารถมองเห็นภาพได้ชัดเจนยิ่งขึ้นหากมองx เป็นอาร์เรย์สองมิติ มิติหนึ่งคือ kและอีกมิติหนึ่งคือหมายเลขอนุภาค ตัวอย่างเช่นจะเป็นอนุภาคที่ i ที่และสามารถเขียนได้เป็น(ดังที่แสดงไว้ในขั้นตอนวิธีข้างต้น) ขั้นตอนที่ 3 สร้างศักยภาพโดยอิงจากอนุภาคที่เลือกแบบสุ่ม ( ) ที่เวลาและปฏิเสธหรือยอมรับในขั้นตอนที่ 6 กล่าวอีกนัยหนึ่งคือค่าต่างๆ ถูกสร้างขึ้นโดยใช้ ที่สร้างขึ้นก่อนหน้านี้
แอปพลิเคชัน
ตัวกรองอนุภาคและระเบียบวิธีอนุภาคของ Feynman-Kac มีการประยุกต์ใช้ในหลายบริบท ในฐานะวิธีการที่มีประสิทธิภาพในการจัดการกับการสังเกตการณ์ที่มีสัญญาณรบกวนหรือความไม่เป็นเชิงเส้นที่รุนแรง เช่น:
- การอนุมานแบบเบย์เซียนการเรียนรู้ของเครื่องจักร การวิเคราะห์ความเสี่ยง และการสุ่มตัวอย่างเหตุการณ์หายาก
- ชีวสารสนเทศ[ 19 ]
- วิทยาศาสตร์การคำนวณ
- เศรษฐศาสตร์คณิตศาสตร์การเงินและคณิตศาสตร์การเงิน : ตัวกรองอนุภาคสามารถทำการจำลองที่จำเป็นในการคำนวณปริพันธ์มิติสูงและ/หรือซับซ้อนที่เกี่ยวข้องกับปัญหาต่างๆ เช่น แบบจำลองสมดุลทั่วไปแบบสุ่มไดนามิกในเศรษฐศาสตร์มหภาคและการกำหนดราคาออปชั่น[ 73 ]
- วิศวกรรม
- ระบาดวิทยาของโรคติดเชื้อซึ่งได้นำไปประยุกต์ใช้กับปัญหาการพยากรณ์การระบาดหลายประการ เช่น การทำนายการระบาดของไข้หวัดใหญ่ตามฤดูกาล[ 74 ]
- การตรวจจับและแยกความผิดพลาด : ในแผนผังแบบอิงผู้สังเกตการณ์ ตัวกรองอนุภาคสามารถคาดการณ์เอาต์พุตเซ็นเซอร์ที่คาดหวังได้ ทำให้สามารถแยกความผิดพลาดได้[ 75 ] [ 76 ] [ 77 ]
- เคมีโมเลกุลและฟิสิกส์เชิงคำนวณ
- เภสัชจลนศาสตร์[ 78 ]
- วิวัฒนาการทางสายพันธุ์
- หุ่นยนต์ปัญญาประดิษฐ์ : การระบุตำแหน่งแบบมอนเตคาร์โลถือเป็นมาตรฐานโดยพฤตินัยในการระบุตำแหน่งหุ่นยนต์เคลื่อนที่[ 79 ] [ 80 ] [ 81 ]
- การประมวลผลสัญญาณและภาพ : การระบุตำแหน่งภาพ การติดตามการจดจำคุณลักษณะ[ 82 ]
ตัวกรองอนุภาคชนิดอื่นๆ
- ตัวกรองอนุภาคเสริม[ 83 ]
- ตัวกรองอนุภาคอ้างอิงต้นทุน
- ตัวกรองอนุภาคธรรมชาติแบบเอกซ์โพเนนเชียล[ 84 ]
- ระเบียบวิธีอนุภาค Feynman-Kac และสนามเฉลี่ย[ 2 ] [ 10 ] [ 5 ]
- ตัวกรองอนุภาคเกาส์เซียน
- ตัวกรองอนุภาคเกาส์-เฮอร์ไมต์
- ตัวกรองอนุภาคแบบลำดับชั้น/ปรับขนาดได้[ 85 ]
- ตัวกรองอนุภาคแบบขยับ[ 86 ]
- Particle Markov-Chain Monte-Carlo ดูตัวอย่างเช่นอัลกอริทึม pseudo-marginal Metropolis– Hastings
- ตัวกรองอนุภาค Rao–Blackwellized [ 53 ]
- ตัวกรองอนุภาคเสริมแบบปกติ[ 87 ]
- ตัวกรองอนุภาคที่เหมาะสมที่สุดตามการสุ่มตัวอย่างแบบปฏิเสธ[ 88 ] [ 89 ]
- ตัวกรองอนุภาคไร้กลิ่น
- ตัวปรับเรียบอนุภาคออนไลน์[ 70 ]
ดูเพิ่มเติม
- ตัวกรอง Kalman แบบกลุ่ม
- การกรองทั่วไป
- อัลกอริทึมทางพันธุกรรม
- วิธีการอนุภาคสนามเฉลี่ย
- การหาตำแหน่งแบบมอนเตคาร์โล
- การประมาณค่าขอบเขตเคลื่อนที่
- การประมาณค่าแบบเบย์เซียนแบบเรียกซ้ำ
บรรณานุกรม
- Del Moral, Pierre (1996). "การกรองแบบไม่เชิงเส้น: วิธีแก้ปัญหาอนุภาคที่มีปฏิสัมพันธ์" (PDF)กระบวนการมาร์คอฟและสาขาที่เกี่ยวข้อง 2 ( 4): 555– 580. เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 2016-03-04 สืบค้นเมื่อ2015-05-31
- เดล โมราล, ปิแอร์ (2004). สูตรเฟย์นแมน-แคค การประมาณเชิงลำดับวงศ์และอนุภาคที่มีปฏิสัมพันธ์สปริงเกอร์ หน้า 575 "ชุด: ความน่าจะเป็นและการประยุกต์ใช้"
- เดล โมราล, ปิแอร์ (2013). การจำลองสนามเฉลี่ยสำหรับการบูรณาการมอนเตคาร์โล .แชปแมน แอนด์ ฮอลล์/ซีอาร์ซี เพรส. หน้า 626. "เอกสารทางวิชาการเกี่ยวกับสถิติและความน่าจะเป็นประยุกต์"
- Cappe, O.; Moulines, E.; Ryden, T. (2005). การอนุมานในแบบจำลองมาร์คอฟที่ซ่อนอยู่ Springer.
- Liu, JS (2001). กลยุทธ์มอนเตคาร์โลในการคำนวณทางวิทยาศาสตร์ . Springer.
- Kong, A.; Liu, JS; Wong, WH (1994). "การเติมข้อมูลตามลำดับและปัญหาข้อมูลที่หายไปแบบเบย์เซียน" (PDF)วารสารสมาคมสถิติอเมริกัน 89 ( 425): 278– 288. doi : 10.1080/01621459.1994.10476469 .
- Liu, JS; Chen, R. (1995). "การแยกส่วนแบบตาบอดผ่านการเติมข้อมูลตามลำดับ" (PDF)วารสารสมาคมสถิติอเมริกัน 90 ( 430): 567– 576. doi : 10.2307/2291068 . JSTOR 2291068 .
- Ristic, B.; Arulampalam, S.; Gordon, N. (2004). นอกเหนือจากตัวกรอง Kalman: ตัวกรองอนุภาคสำหรับการใช้งานติดตาม Artech House.
- Doucet, A.; Johansen, AM (ธันวาคม 2008). "คู่มือการกรองอนุภาคและการปรับให้เรียบ: สิบห้าปีต่อมา" (PDF) . รายงานทางเทคนิค .
- Doucet, A.; Godsill, S.; Andrieu, C. (2000). "เกี่ยวกับวิธีการสุ่มตัวอย่างแบบมอนเตคาร์โลตามลำดับสำหรับการกรองแบบเบย์เซียน" สถิติและการคำนวณ 10 ( 3): 197– 208. doi : 10.1023/A:1008935410038 . S2CID 16288401 .
- Arulampalam, MS; Maskell, S.; Gordon, N.; Clapp, T. (2002). "บทช่วยสอนเกี่ยวกับตัวกรองอนุภาคสำหรับการติดตามแบบเบย์เซียนที่ไม่เป็นเชิงเส้น/ไม่เป็นเกาส์เซียนแบบออนไลน์" IEEE Transactions on Signal Processing . 50 (2): 174– 188. Bibcode : 2002ITSP...50..174A . CiteSeerX 10.1.1.471.8617 . doi : 10.1109/78.978374 . S2CID 55577025 .
- Cappe, O.; Godsill, S.; Moulines, E. (2007). "ภาพรวมของวิธีการที่มีอยู่และความก้าวหน้าล่าสุดใน Monte Carlo แบบลำดับ" Proceedings of the IEEE . 95 (5): 899– 924. Bibcode : 2007IEEEP..95..899C . doi : 10.1109/JPROC.2007.893250 . S2CID 3081664 .
- Kitagawa, G. (1996). "ตัวกรอง Monte Carlo และตัวปรับเรียบสำหรับแบบจำลองปริภูมิสถานะไม่เชิงเส้นที่ไม่ใช่แบบเกาส์เซียน" วารสารสถิติเชิงคำนวณและกราฟิก 5 ( 1): 1– 25. doi : 10.2307/1390750 . JSTOR 1390750 .
- Kotecha, JH; Djuric, P. (2003). "การกรองอนุภาคเกาส์เซียน". IEEE Transactions on Signal Processing . 51 (10): 2592. Bibcode : 2003ITSP...51.2592K . doi : 10.1109/TSP.2003.816758 .
- Haug, AJ (2005). "คู่มือการประมาณค่าแบบเบย์เซียนและเทคนิคการติดตามที่ใช้ได้กับกระบวนการที่ไม่เป็นเชิงเส้นและไม่เป็นแบบเกาส์เซียน" (PDF) . บริษัท MITRE ประเทศสหรัฐอเมริกา รายงานทางเทคนิค กุมภาพันธ์ . เก็บถาวร(PDF)จากต้นฉบับเมื่อวันที่ 22 ธันวาคม 2021 . สืบค้นเมื่อ 22 ธันวาคม 2021 .
- Pitt, MK; Shephard, N. (1999). "การกรองผ่านการจำลอง: ตัวกรองอนุภาคเสริม"วารสาร สมาคม สถิติอเมริกัน94 (446): 590– 591. doi : 10.2307/2670179 . JSTOR 2670179 . เก็บถาวรจากต้นฉบับเมื่อ 2007-10-16 . สืบค้นเมื่อ2008-05-06 .
- Gordon, NJ; Salmond, DJ; Smith, AFM (1993). "แนวทางใหม่ในการประมาณค่าสถานะแบบเบย์เซียนที่ไม่เป็นเชิงเส้น/ไม่เป็นเกาส์เซียน" IEE Proceedings F - Radar and Signal Processing . 140 (2): 107– 113. doi : 10.1049/ip-f-2.1993.0015 .
- Vaswani, N. ; Rathi, Y.; Yezzi, A.; Tannenbaum, A. (2007). "การติดตามวัตถุที่เปลี่ยนรูปโดยใช้การกรองอนุภาคสำหรับเส้นขอบที่ใช้งานอยู่ทางเรขาคณิต" . IEEE Transactions on Pattern Analysis and Machine Intelligence . 29 (8): 1470– 1475. Bibcode : 2007ITPAM..29.1470R . doi : 10.1109/tpami.2007.1081 . PMC 3663080 . PMID 17568149 .
ลิงก์ภายนอก
- แบบจำลอง Feynman–Kac และอัลกอริทึมอนุภาคปฏิสัมพันธ์ (หรือที่เรียกว่า การกรองอนุภาค)แง่มุมทางทฤษฎีและรายการโดเมนการประยุกต์ใช้ของตัวกรองอนุภาค
- หน้าหลัก ของวิธีการมอนเตคาร์โลแบบลำดับ (การกรองอนุภาค)บนเว็บไซต์มหาวิทยาลัยเคมบริดจ์
- แอนิเมชั่น MCL ของ Dieter Fox
- ซอฟต์แวร์ฟรีของ Rob Hess
- SMCTC: คลาสแม่แบบสำหรับใช้งานอัลกอริธึม SMC ในภาษา C++
- แอปเพล็ต Java เกี่ยวกับการกรองอนุภาค
- vSMC: Vectorized Sequential Monte Carlo
- คำอธิบายเกี่ยวกับตัวกรองอนุภาคในบริบทของรถยนต์ขับเคลื่อนอัตโนมัติ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ตัวกรองอนุภาค
ตัวกรองอนุภาคหรือที่รู้จักกันในชื่อ วิธีการ มอนเตคาร์โลแบบลำดับคือชุดของ อัลกอริธึ...
อัลกอริทึมแบบฮิวริสติก
จากมุมมองทางสถิติและความน่าจะเป็น ตัวกรองอนุภาคจัดอยู่ในกลุ่มของ อัลกอริทึมแบบ แตกแขนง / แบบพันธุกรรม และ ระเบียบวิธีอนุภาคแบบมีปฏิสัมพันธ์ประเภทสนามเฉลี่ย การตีความวิธีการอนุภาคเหล่านี้ขึ้นอยู่กับสาขาวิทยาศาสตร์ ใน การคำนวณเชิงวิวัฒนาการ ระเบียบ วิธี...
พื้นฐานทางคณิตศาสตร์
ตั้งแต่ปี 1950 ถึงปี 1996 สิ่งพิมพ์ทั้งหมดเกี่ยวกับตัวกรองอนุภาคและอัลกอริทึมทางพันธุกรรม รวมถึงวิธีการตัดแต่งและการสุ่มตัวอย่างแบบมอนเตคาร์โลที่นำเสนอในฟิสิกส์เชิงคำนวณและเคมีโมเลกุล...
วัตถุประสงค์
เป้าหมายของตัวกรองอนุภาคคือการประมาณความหนาแน่นของความน่าจะเป็นภายหลังของตัวแปรสถานะ โดยพิจารณาจากตัวแปรสังเกต ตัวกรองอนุภาคมีจุดประสงค์เพื่อใช้กับ แบบจำลองมาร์คอฟแบบซ่อนเร้น ซึ่งระบบประกอบด้วยทั้งตัวแปรซ่อนเร้นและตัวแปรสังเกตได้ ตัวแปรสังเกตได้...