ตัวกรองอนุภาค

ตัวกรองอนุภาคหรือที่รู้จักกันในชื่อ วิธีการ มอนเตคาร์โลแบบลำดับคือชุดของ อัลกอริธึ มมอนเตคาร์โลที่ใช้ในการค้นหาคำตอบโดยประมาณสำหรับปัญหาการกรองสำหรับระบบปริภูมิสถานะที่ไม่เป็นเชิงเส้น เช่นการประมวลผลสัญญาณและ การอนุมานทางสถิติแบบเบ ย์เซียน^{[ 1 ]}ปัญหาการกรองประกอบด้วยการประมาณสถานะภายในในระบบไดนามิกเมื่อมีการสังเกตบางส่วนและมีการรบกวนแบบสุ่มในเซ็นเซอร์และในระบบไดนามิก วัตถุประสงค์คือการคำนวณการแจกแจงความน่าจะเป็นภายหลังของสถานะของกระบวนการมาร์คอฟโดยพิจารณาจากการสังเกตที่มีเสียงรบกวนและบางส่วน คำว่า "ตัวกรองอนุภาค" ถูกบัญญัติขึ้นครั้งแรกในปี 1996 โดย Pierre Del Moral เกี่ยวกับวิธีการอนุภาคที่มีปฏิสัมพันธ์แบบสนามเฉลี่ยที่ใช้ในกลศาสตร์ของไหลตั้งแต่ต้นทศวรรษ 1960 ^{[ 2 ]}คำว่า "มอนเตคาร์โลแบบลำดับ" ถูกบัญญัติขึ้นโดยJun S. Liuและ Rong Chen ในปี 1998 ^{[ 3 ]}

การกรองอนุภาคใช้ชุดอนุภาค (เรียกอีกอย่างว่าตัวอย่าง) เพื่อแสดงการแจกแจงความน่าจะเป็นภายหลังของกระบวนการสุ่มโดยพิจารณาจากการสังเกตที่มีเสียงรบกวนและ/หรือบางส่วน แบบจำลองปริภูมิสถานะสามารถเป็นแบบไม่เชิงเส้นได้ และการแจกแจงสถานะเริ่มต้นและเสียงรบกวนสามารถมีรูปแบบใดก็ได้ตามต้องการ เทคนิคการกรองอนุภาคเป็นวิธีการที่ได้รับการยอมรับอย่างดี^{[ 2 ]}^{[ 4 ]}^{[ 5 ]}สำหรับการสร้างตัวอย่างจากการแจกแจงที่ต้องการโดยไม่ต้องมีข้อสมมติเกี่ยวกับแบบจำลองปริภูมิสถานะหรือการแจกแจงสถานะ อย่างไรก็ตาม วิธีการเหล่านี้ทำงานได้ไม่ดีเมื่อนำไปใช้กับระบบที่มีมิติสูงมาก

ตัวกรองอนุภาคจะอัปเดตการทำนายในลักษณะโดยประมาณ (ทางสถิติ) ตัวอย่างจากการกระจายจะถูกแทนด้วยชุดของอนุภาค แต่ละอนุภาคจะมีน้ำหนักความน่าจะเป็นที่กำหนดให้กับมัน ซึ่งแสดงถึงความน่าจะเป็นที่อนุภาคนั้นจะถูกสุ่มจากฟังก์ชันความหนาแน่นของความน่าจะเป็น ความไม่สมดุลของน้ำหนักที่นำไปสู่การยุบตัวของน้ำหนักเป็นปัญหาทั่วไปที่พบในอัลกอริธึมการกรองเหล่านี้ อย่างไรก็ตาม สามารถลดปัญหานี้ได้โดยการเพิ่มขั้นตอนการสุ่มตัวอย่างใหม่ก่อนที่น้ำหนักจะไม่เท่ากัน สามารถใช้เกณฑ์การสุ่มตัวอย่างใหม่แบบปรับได้หลายอย่าง รวมถึงความแปรปรวนของน้ำหนักและเอนโทรปี สัมพัทธ์ ที่เกี่ยวข้องกับการกระจายแบบสม่ำเสมอ^{[ 6 ]}ในขั้นตอนการสุ่มตัวอย่างใหม่ อนุภาคที่มีน้ำหนักน้อยมากจะถูกแทนที่ด้วยอนุภาคใหม่ที่อยู่ใกล้กับอนุภาคที่มีน้ำหนักมากกว่า

จากมุมมองทางสถิติและความน่าจะเป็น ตัวกรองอนุภาคอาจถูกตีความว่าเป็นการตีความอนุภาคสนามเฉลี่ย ของ การวัดความน่าจะเป็น ของ Feynman-Kac ^{[ 7 ]}^{[ 8 ]}^{[ 9 ]}^{[ 10 ]}^{[ 11 ]}เทคนิคการบูรณาการอนุภาคเหล่านี้ได้รับการพัฒนาในเคมีโมเลกุลและฟิสิกส์เชิงคำนวณโดยTheodore E. HarrisและHerman Kahnในปี 1951, Marshall N. RosenbluthและArianna W. Rosenbluthในปี 1955 ^{[ 12 ]}และล่าสุดโดย Jack H. Hetherington ในปี 1984 ^{[ 13 ]}ในฟิสิกส์เชิงคำนวณ วิธีการบูรณาการอนุภาคเส้นทางประเภท Feynman-Kac เหล่านี้ยังใช้ในQuantum Monte Carloและโดยเฉพาะอย่างยิ่งวิธีการ Diffusion Monte Carlo ^{[ 14 ]}^{[ 15 ]}^{[ 16 ]}วิธีการอนุภาคปฏิสัมพันธ์ของ Feynman-Kac ยังมีความเกี่ยวข้องอย่างมากกับอัลกอริธึมทางพันธุกรรมแบบการกลายพันธุ์และการคัดเลือกที่ใช้ในปัจจุบันในการคำนวณเชิงวิวัฒนาการเพื่อแก้ปัญหาการเพิ่มประสิทธิภาพที่ซับซ้อน

ระเบียบวิธีตัวกรองอนุภาคใช้ในการแก้ ปัญหา แบบจำลองมาร์คอฟที่ซ่อนอยู่ (HMM) และ ปัญหา การกรองแบบไม่เชิงเส้นยกเว้นแบบจำลองสัญญาณ-การสังเกตเชิงเส้น-เกาส์เซียน ( ตัวกรอง Kalman ) หรือแบบจำลองประเภทที่กว้างกว่า (ตัวกรอง Benes ^{[ 17 ]} ) Mireille Chaleyat-Maurel และ Dominique Michel ได้พิสูจน์ในปี 1984 ว่าลำดับของการแจกแจงแบบโพสทีเรียร์ของสถานะสุ่มของสัญญาณ เมื่อพิจารณาจากการสังเกต (หรือที่เรียกว่าตัวกรองที่เหมาะสมที่สุด) ไม่มีการเวียนเกิดแบบจำกัด^{[ 18 ]}วิธีการเชิงตัวเลขอื่นๆ ที่ใช้การประมาณค่ากริดคงที่เทคนิคMarkov Chain Monte Carlo การทำให้เป็นเชิงเส้นแบบดั้งเดิม ตัวกรอง Kalman แบบขยายหรือการกำหนดระบบเชิงเส้นที่ดีที่สุด (ในแง่ของต้นทุน-ข้อผิดพลาดที่คาดหวัง) ไม่สามารถรับมือกับระบบขนาดใหญ่ กระบวนการที่ไม่เสถียร หรือความไม่เชิงเส้นที่ไม่เรียบเพียงพอได้

ตัวกรองอนุภาคและระเบียบวิธีอนุภาค Feynman-Kac พบการประยุกต์ใช้ใน การ ประมวลผลสัญญาณและภาพ การ อนุมานแบบเบย์เซียนการ เรียนรู้ ของเครื่อง การวิเคราะห์ความเสี่ยงและการสุ่มตัวอย่างเหตุการณ์หายากวิศวกรรมและ หุ่นยนต์ปัญญาประดิษฐ์ชีวสารสนเทศ [ ^{19 ]}พันธุศาสตร์เชิงวิวัฒนาการวิทยาศาสตร์การคำนวณเศรษฐศาสตร์^และการเงิน เชิง คณิตศาสตร์เคมีโมเลกุล ฟิสิกส์เชิงคำนวณเภสัชจลนศาสตร์ความเสี่ยงเชิงปริมาณและการประกันภัย^[²⁰^]^[²¹^]และสาขาอื่นๆ

ประวัติศาสตร์

อัลกอริทึมแบบฮิวริสติก

จากมุมมองทางสถิติและความน่าจะเป็น ตัวกรองอนุภาคจัดอยู่ในกลุ่มของอัลกอริทึมแบบ แตกแขนง / แบบพันธุกรรม และระเบียบวิธีอนุภาคแบบมีปฏิสัมพันธ์ประเภทสนามเฉลี่ยการตีความวิธีการอนุภาคเหล่านี้ขึ้นอยู่กับสาขาวิทยาศาสตร์ ในการคำนวณเชิงวิวัฒนาการระเบียบ วิธี อนุภาคแบบพันธุกรรมประเภทสนามเฉลี่ยมักถูกใช้เป็นอัลกอริทึมการค้นหาแบบฮิวริสติกและแบบธรรมชาติ (หรือที่เรียกว่า เมตาฮิวริสติก ) ในฟิสิกส์เชิงคำนวณและเคมีโมเลกุลพวกมันถูกใช้เพื่อแก้ ปัญหา การอินทิเกรตเส้นทาง ของ Feynman-Kac หรือเพื่อคำนวณค่า Boltzmann-Gibbs ค่าลักษณะเฉพาะสูงสุด และสถานะพื้นฐานของ ตัวดำเนินการ Schrödingerในชีววิทยาและพันธุศาสตร์พวกมันแสดงถึงวิวัฒนาการของประชากรของแต่ละบุคคลหรือยีนในสภาพแวดล้อมบางอย่าง

ที่มาของ เทคนิคการคำนวณเชิงวิวัฒนาการแบบสนามเฉลี่ยสามารถสืบย้อนไปได้ถึงปี 1950 และ 1954 ด้วยงานของ Alan Turing เกี่ยวกับเครื่องจักรการเรียนรู้แบบการกลายพันธุ์และการคัดเลือกทางพันธุกรรม ^{[ 22 ]}และบทความของNils Aall Barricelliที่Institute for Advanced StudyในPrinceton รัฐนิวเจอร์ซีย์^{[ 23 ]}^{[ 24 ]}ร่องรอยแรกของตัวกรองอนุภาคในวิธีการทางสถิติย้อนกลับไปในช่วงกลางทศวรรษ 1950; 'Poor Man's Monte Carlo' ^{[ 25 ]}ที่เสนอโดยJohn Hammersleyและคณะในปี 1954 มีคำแนะนำเกี่ยวกับวิธีการกรองอนุภาคแบบพันธุกรรมที่ใช้ในปัจจุบัน ในปี 1963 Nils Aall Barricelliได้จำลองอัลกอริทึมแบบพันธุกรรมเพื่อเลียนแบบความสามารถของแต่ละบุคคลในการเล่นเกมง่ายๆ^{[ 26 ]}ใน วรรณกรรม การคำนวณเชิงวิวัฒนาการอัลกอริทึมการคัดเลือกการกลายพันธุ์แบบพันธุกรรมได้รับความนิยมจากผลงานสำคัญของJohn Hollandในช่วงต้นทศวรรษ 1970 โดยเฉพาะหนังสือของเขา^{[ 27 ]}ที่ตีพิมพ์ในปี 1975

ในชีววิทยาและพันธุศาสตร์นักพันธุศาสตร์ชาวออสเตรเลียAlex Fraserยังได้ตีพิมพ์บทความชุดหนึ่งเกี่ยวกับการจำลองทางพันธุกรรมของการคัดเลือกเทียมของสิ่งมีชีวิต ในปี พ.ศ. 2490 ^{[ 28 ]}การจำลองวิวัฒนาการด้วยคอมพิวเตอร์โดยนักชีววิทยาเริ่มแพร่หลายมากขึ้นในช่วงต้นทศวรรษ พ.ศ. 2503 และวิธีการต่างๆ ได้รับการอธิบายไว้ในหนังสือของ Fraser และ Burnell (1970) ^{[ 29 ]}และ Crosby (1973) ^{[ 30 ]}การจำลองของ Fraser ประกอบด้วยองค์ประกอบสำคัญทั้งหมดของอัลกอริทึมอนุภาคทางพันธุกรรมการกลายพันธุ์และการคัดเลือกสมัยใหม่

จากมุมมองทางคณิตศาสตร์การกระจายแบบมีเงื่อนไขของสถานะสุ่มของสัญญาณที่กำหนดโดยการสังเกตบางส่วนและมีสัญญาณรบกวนจะถูกอธิบายโดยความน่าจะเป็นของ Feynman-Kac บนวิถีสุ่มของสัญญาณที่ถ่วงน้ำหนักด้วยลำดับของฟังก์ชันศักยภาพความน่าจะเป็น^{[ 7 ]}^{[ 8 ]} วิธี Quantum Monte Carloและโดยเฉพาะอย่างยิ่งวิธี Diffusion Monte Carloสามารถตีความได้ว่าเป็นค่าประมาณอนุภาคประเภทพันธุกรรมสนามเฉลี่ยของปริพันธ์เส้นทาง Feynman-Kac ^{[ 7 ]}^{[ 8 ]}^{[ 9 ]}^{[ 13 ]}^{[ 14 ]}^{[ 31 ]}^{[ 32 ]}ต้นกำเนิดของ วิธีการ Quantum Monte Carloมักถูกยกให้เป็นผลงานของEnrico FermiและRobert Richtmyerซึ่งพัฒนาการตีความอนุภาคแบบ mean-field ของปฏิกิริยาลูกโซ่นิวตรอน ในปี 1948 [ ^{33 ] แต่ขั้นตอนวิธี อนุภาค}แบบฮิวริสติกและแบบพันธุกรรม (หรือที่เรียกว่าวิธีการ Resampled หรือ Reconfiguration Monte Carlo) สำหรับการประมาณพลังงานสถานะพื้นฐานของระบบควอนตัม (ในแบบจำลองเมทริกซ์ลดรูป) นั้นเป็นผลงานของ Jack H. Hetherington ในปี 1984 ^{[ 13 ]}นอกจากนี้ยังสามารถอ้างถึงผลงานสำคัญก่อนหน้านี้ของTheodore E. HarrisและHerman Kahnในฟิสิกส์อนุภาคที่ตีพิมพ์ในปี 1951 ซึ่งใช้วิธีการแบบ mean-field แต่เป็นแบบฮิวริสติกและแบบพันธุกรรมสำหรับการประมาณพลังงานการส่งผ่านอนุภาค^{[ 34 ]}ในเคมีโมเลกุล การใช้วิธีการอนุภาคแบบฮิวริสติกทางพันธุกรรม (หรือที่เรียกว่ากลยุทธ์การตัดแต่งและการเสริมคุณค่า) สามารถสืบย้อนไปได้ถึงปี 1955 ด้วยผลงานสำคัญของMarshall N. RosenbluthและArianna W. Rosenbluth ^{[ 12 ]}

การใช้อัลกอริทึมอนุภาคทางพันธุกรรมในการประมวลผลสัญญาณ ขั้นสูง และการอนุมานแบบเบย์เซียนนั้นค่อนข้างใหม่ ในเดือนมกราคม พ.ศ. 2536 Genshiro Kitagawa ได้พัฒนา "ตัวกรองมอนเตคาร์โล" ^{[ 35 ]}เวอร์ชันที่แก้ไขเล็กน้อยของบทความนี้ปรากฏใน พ.ศ. 2539 ^{[ 36 ]}ในเดือนเมษายน พ.ศ. 2536 Neil J. Gordon และคณะ ได้ตีพิมพ์งานสำคัญของพวกเขา^{[ 37 ]}เกี่ยวกับการประยุกต์ใช้อัลกอริทึมประเภทพันธุกรรมในการอนุมานทางสถิติแบบเบย์เซียน ผู้เขียนตั้งชื่ออัลกอริทึมของพวกเขาว่า 'ตัวกรองบูตสแตรป' และแสดงให้เห็นว่าเมื่อเปรียบเทียบกับวิธีการกรองอื่นๆ อัลกอริทึมบูตสแตรปของพวกเขาไม่จำเป็นต้องมีข้อสมมติใดๆ เกี่ยวกับพื้นที่สถานะหรือสัญญาณรบกวนของระบบ ในขณะเดียวกัน งานวิจัยของ Pierre Del Moral ^{[ 2 ]}และ Himilcon Carvalho, Pierre Del Moral, André Moninและ Gérard Salut ^{[ 38 ]}เกี่ยวกับตัวกรองอนุภาคที่ตีพิมพ์ในช่วงกลางทศวรรษ พ.ศ. 2533 ก็ได้รับการตีพิมพ์ โดยอิสระเช่นกัน ตัวกรองอนุภาคยังได้รับการพัฒนาในการประมวลผลสัญญาณในช่วงต้นปี 1989–1992 โดย P. Del Moral, JC Noyer, G. Rigal และ G. Salut ในLAAS-CNRSในชุดรายงานการวิจัยที่จำกัดและเป็นความลับร่วมกับ STCAN (Service Technique des Constructions et Armes Navales), บริษัทไอที DIGILOG และLAAS-CNRS (ห้องปฏิบัติการวิเคราะห์และสถาปัตยกรรมของระบบ) เกี่ยวกับปัญหาการประมวลผลสัญญาณ RADAR/SONAR และ GPS ^{[ 39 ]}^{[ 40 ]}^{[ 41 ]}^{[ 42 ]}^{[ 43 ]}^{[ 44 ]}

พื้นฐานทางคณิตศาสตร์

ตั้งแต่ปี 1950 ถึงปี 1996 สิ่งพิมพ์ทั้งหมดเกี่ยวกับตัวกรองอนุภาคและอัลกอริทึมทางพันธุกรรม รวมถึงวิธีการตัดแต่งและการสุ่มตัวอย่างแบบมอนเตคาร์โลที่นำเสนอในฟิสิกส์เชิงคำนวณและเคมีโมเลกุล ล้วนนำเสนออัลกอริทึมที่เป็นธรรมชาติและคล้ายฮิวริสติกที่นำไปใช้กับสถานการณ์ต่างๆ โดยปราศจากการพิสูจน์ความสอดคล้องหรือการอภิปรายเกี่ยวกับอคติของการประมาณค่าและอัลกอริทึมที่อิงตามลำดับวงศ์ตระกูลและต้นไม้บรรพบุรุษแม้แต่น้อย

พื้นฐานทางคณิตศาสตร์และการวิเคราะห์อย่างเข้มงวดครั้งแรกของอัลกอริธึมอนุภาคเหล่านี้มาจาก Pierre Del Moral ^{[ 2 ]}^{[ 4 ]}ในปี 1996 บทความ^{[ 2 ]}ยังมีการพิสูจน์คุณสมบัติที่ไม่เอนเอียงของการประมาณอนุภาคของฟังก์ชันความน่าจะเป็นและ การวัด ความน่าจะเป็นแบบมีเงื่อนไข ที่ไม่เป็นมาตรฐาน ตัวประมาณอนุภาคที่ไม่เอนเอียงของฟังก์ชันความน่าจะเป็นที่นำเสนอในบทความนี้ถูกนำมาใช้ในปัจจุบันในการอนุมานทางสถิติแบบเบย์เซียน

Dan Crisan, Jessica Gaines และTerry Lyons [ ^{45 ] [}^{46 ] [}^{47 ] รวม}ถึง Pierre Del Moral และ Terry Lyons ^{[ 48 ]}ได้สร้างเทคนิคอนุภาคแบบแตกแขนงที่มีขนาดประชากรต่างๆ กันในช่วงปลายทศวรรษ 1990 P. Del Moral, A. Guionnet และ L. Miclo ^{[ 8 ]}^{[ 49 ]}^{[ 50 ]} ได้พัฒนาเพิ่มเติมในเรื่องนี้ในปี 2000 Pierre Del Moral และ Alice Guionnet ^{[ 51 ]}ได้พิสูจน์ทฤษฎีบทขีดจำกัดกลางครั้งแรกในปี 1999 และ Pierre Del Moral และ Laurent Miclo ^{[ 8 ]}ได้พิสูจน์ทฤษฎีบทเหล่านั้นในปี 2000 ผลลัพธ์การบรรจบกันแบบสม่ำเสมอครั้งแรกเกี่ยวกับพารามิเตอร์เวลาสำหรับตัวกรองอนุภาคได้รับการพัฒนาในช่วงปลายทศวรรษ 1990 โดย Pierre Del Moral และAlice Guionnet ^{[ 49 ]}^{[ 50 ]}การวิเคราะห์อย่างเข้มงวดครั้งแรกของตัวกรองอนุภาคแบบต้นไม้ตามลำดับวงศ์ตระกูลเป็นผลงานของ P. Del Moral และ L. Miclo ในปี 2544 ^{[ 52 ]}

ทฤษฎีเกี่ยวกับระเบียบวิธีอนุภาค Feynman-Kac และอัลกอริธึมตัวกรองอนุภาคที่เกี่ยวข้องได้รับการพัฒนาในปี 2000 และ 2004 ในหนังสือ^{[ 8 ]}^{[ 5 ]}แบบจำลองความน่าจะเป็นเชิงนามธรรมเหล่านี้ครอบคลุมอัลกอริธึมประเภทพันธุกรรม อนุภาค และตัวกรองบูตสแตรป ตัวกรอง Kalman แบบโต้ตอบ (หรือที่เรียกว่าตัวกรองอนุภาค Rao–Blackwellized ^{[ 53 ]} ) เทคนิค การสุ่มตัวอย่างความสำคัญและเทคนิคการสุ่มตัวอย่างซ้ำแบบอนุภาค รวมถึงระเบียบวิธีแบบต้นไม้ทางสายเลือดและแบบย้อนกลับของอนุภาคสำหรับการแก้ปัญหาการกรองและการปรับให้เรียบ วิธีการกรองอนุภาคประเภทอื่นๆ ได้แก่ โมเดลแบบต้นไม้ตามลำดับวงศ์ตระกูล^{[ 10 ]}^{[ 5 ]}^{[ 54 ]}โมเดลอนุภาค Markov ย้อนกลับ^{[ 10 ]}^{[ 55 ]}โมเดลอนุภาคสนามเฉลี่ยแบบปรับตัว^{[ 6 ]}โมเดลอนุภาคแบบเกาะ^{[ 56 ]}^{[ 57 ]}วิธีการ Monte Carlo แบบลูกโซ่ Markov อนุภาค^{[ 58 ]}^{[ 59 ]}ตัวสุ่ม Monte Carlo แบบลำดับ^{[ 60 ]}^{[ 61 ]}^{[ 62 ]}และวิธีการคำนวณ Bayesian โดยประมาณแบบลำดับ Monte Carlo ^{[ 63 ]}และ Bayesian Bootstrap แบบลำดับ Monte Carlo ABC ^{[ 64 ]}

ปัญหาการกรอง

วัตถุประสงค์

เป้าหมายของตัวกรองอนุภาคคือการประมาณความหนาแน่นของความน่าจะเป็นภายหลังของตัวแปรสถานะ โดยพิจารณาจากตัวแปรสังเกต ตัวกรองอนุภาคมีจุดประสงค์เพื่อใช้กับแบบจำลองมาร์คอฟแบบซ่อนเร้นซึ่งระบบประกอบด้วยทั้งตัวแปรซ่อนเร้นและตัวแปรสังเกตได้ ตัวแปรสังเกตได้ (กระบวนการสังเกต) เชื่อมโยงกับตัวแปรซ่อนเร้น (กระบวนการสถานะ) ผ่านรูปแบบฟังก์ชันที่ทราบ ในทำนองเดียวกัน คำอธิบายเชิงความน่าจะเป็นของระบบพลวัตที่กำหนดวิวัฒนาการของตัวแปรสถานะก็เป็นที่รู้จักเช่นกัน

ตัวกรองอนุภาคทั่วไปจะประมาณการการแจกแจงความน่าจะเป็นภายหลังของสถานะที่ซ่อนอยู่โดยใช้กระบวนการวัดการสังเกต โดยพิจารณาจากปริภูมิสถานะดังที่แสดงด้านล่าง:

{\begin{array}{cccccccccc}X_{0}&\to &X_{1}&\to &X_{2}&\to &X_{3}&\to &\cdots &{\text{signal}}\\\downarrow &&\downarrow &&\downarrow &&\downarrow &&\cdots &\\Y_{0}&&Y_{1}&&Y_{2}&&Y_{3}&&\cdots &{\text{observation}}\end{array}}

ปัญหาการกรองคือการประมาณค่าของสถานะที่ซ่อนอยู่ตามลำดับ โดยพิจารณาจาก ค่าของกระบวนการสังเกตณ ช่วงเวลาใดๆk $X_{k}$ $Y_{0},\cdots ,Y_{k},$

การประมาณค่าแบบเบย์ทั้งหมดได้มาจากความหนาแน่นของความน่าจะเป็นภายหลังระเบียบวิธีตัวกรองอนุภาคให้ค่าประมาณของความน่าจะเป็นแบบมีเงื่อนไขเหล่านี้โดยใช้การวัดเชิงประจักษ์ที่เกี่ยวข้องกับอัลกอริทึมอนุภาคแบบพันธุกรรม ในทางตรงกันข้าม วิธีการมาร์คอฟเชน มอนเตคาร์โล หรือการสุ่มตัวอย่างแบบสำคัญจะจำลองความน่าจะเป็นภายหลังแบบเต็มรูปแบบ $X_{k}$ $p(x_{k}|y_{0},y_{1},...,y_{k})$ $p(x_{0},x_{1},...,x_{k}|y_{0},y_{1},...,y_{k})$

แบบจำลองการสังเกตสัญญาณ

วิธีการทางอนุภาคมักจะตั้งสมมติฐาน และ สามารถจำลอง การสังเกตการณ์ ได้ในรูปแบบนี้: $X_{k}$ $Y_{k}$

$X_{0},X_{1},\cdots$ เป็นกระบวนการมาร์คอฟบน(สำหรับบางค่า) ที่วิวัฒนาการไปตามความหนาแน่นของความน่าจะเป็นของการเปลี่ยนสถานะแบบจำลองนี้มักเขียนในรูปแบบสังเคราะห์ว่า $\mathbb {R} ^{d_{x}}$ $d_{x}\geqslant 1$ $p(x_{k}|x_{k-1})$
$X_{k}|X_{k-1}=x_{k}\sim p(x_{k}|x_{k-1})$

โดยมีความหนาแน่นของความน่าจะเป็นเริ่มต้น

p(x_{0})

ค่า ที่สังเกตได้ จะอยู่ในปริภูมิสถานะบางอย่างบน(สำหรับบางค่า) และเป็นอิสระต่อกันแบบมีเงื่อนไขก็ต่อเมื่อทราบค่า กล่าวอีกนัยหนึ่งคือ แต่ละค่าขึ้นอยู่กับ เท่านั้นนอกจากนี้ เรายังสมมติว่าการแจกแจงแบบมีเงื่อนไขสำหรับเมื่อกำหนดให้เป็นแบบต่อเนื่องสัมบูรณ์ และในทางสังเคราะห์เรามี $Y_{0},Y_{1},\cdots$ $\mathbb {R} ^{d_{y}}$ $d_{y}\geqslant 1$ $X_{0},X_{1},\cdots$ $Y_{k}$ $X_{k}$ $Y_{k}$ $X_{k}=x_{k}$
$Y_{k}|X_{k}=y_{k}\sim p(y_{k}|x_{k})$

ตัวอย่างของระบบที่มีคุณสมบัติเหล่านี้คือ:

X_{k}=g(X_{k-1})+W_{k-1}

Y_{k}=h(X_{k})+V_{k}

โดยที่ทั้งและเป็นลำดับอิสระต่อกันที่มีฟังก์ชันความหนาแน่นความน่าจะ เป็นที่ทราบ และgและhเป็นฟังก์ชันที่ทราบ สมการทั้งสองนี้สามารถมองได้ว่าเป็น สมการ ปริภูมิสถานะและมีลักษณะคล้ายกับสมการปริภูมิสถานะสำหรับตัวกรอง Kalman หากฟังก์ชันgและhในตัวอย่างข้างต้นเป็นเชิงเส้น และหากทั้งและเป็นแบบ Gaussianตัวกรอง Kalman จะพบการกระจายการกรองแบบ Bayesian ที่แม่นยำ หากไม่เป็นเช่นนั้น วิธีการที่ใช้ตัวกรอง Kalman จะเป็นการประมาณอันดับแรก ( EKF ) หรือการประมาณอันดับสอง ( UKFโดยทั่วไป แต่ถ้าการกระจายความน่าจะเป็นเป็นแบบ Gaussian การประมาณอันดับสามก็เป็นไปได้) $W_{k}$ $V_{k}$ $W_{k}$ $V_{k}$

ข้อสมมติที่ว่าการกระจายเริ่มต้นและการเปลี่ยนสถานะของห่วงโซ่มาร์คอฟมีความต่อเนื่องสำหรับการวัดแบบเลเบสสามารถผ่อนคลายได้ ในการออกแบบตัวกรองอนุภาค เราเพียงแค่ต้องสมมติว่าเราสามารถสุ่มตัวอย่างการเปลี่ยนสถานะของห่วงโซ่มาร์คอฟและคำนวณฟังก์ชันความน่าจะเป็นได้(ดูตัวอย่างเช่น คำอธิบายการกลายพันธุ์จากการคัดเลือกทางพันธุกรรมของตัวกรองอนุภาคที่กล่าวถึงด้านล่าง) ข้อสมมติเรื่องความต่อเนื่องของการเปลี่ยนสถานะของมาร์คอฟนั้นใช้เพื่ออนุมานสูตรที่แตกต่างกันระหว่างการกระจายความน่าจะเป็นภายหลังโดยใช้กฎของเบย์สสำหรับความหนาแน่นแบบมีเงื่อนไขในลักษณะที่ไม่เป็นทางการ (และค่อนข้างไม่ถูกต้อง) เท่านั้น $X_{k-1}\to X_{k}$ $X_{k},$ $x_{k}\mapsto p(y_{k}|x_{k})$ $X_{k}$

แบบจำลองการคำนวณแบบเบย์เซียนโดยประมาณ

ในปัญหาบางประการ การกระจายแบบมีเงื่อนไขของการสังเกต โดยพิจารณาจากสถานะสุ่มของสัญญาณ อาจไม่มีความหนาแน่น ซึ่งอาจเป็นไปไม่ได้หรือซับซ้อนเกินไปที่จะคำนวณ^{[ 19 ]}ในสถานการณ์นี้ จำเป็นต้องมีการประมาณค่าเพิ่มเติมอีกระดับหนึ่ง กลยุทธ์หนึ่งคือการแทนที่สัญญาณด้วยห่วงโซ่มาร์คอฟและแนะนำการสังเกตเสมือนในรูปแบบ $X_{k}$ ${\mathcal {X}}_{k}=\left(X_{k},Y_{k}\right)$

{\mathcal {Y}}_{k}=Y_{k}+\epsilon {\mathcal {V}}_{k}\quad {\mbox{for some parameter}}\quad \epsilon \in [0,1]

สำหรับลำดับของตัวแปรสุ่มอิสระที่มีฟังก์ชันความหนาแน่นความน่าจะ เป็นที่ทราบแล้ว แนวคิดหลักคือการสังเกตว่า ${\mathcal {V}}_{k}$

{\text{Law}}\left(X_{k}|{\mathcal {Y}}_{0}=y_{0},\cdots ,{\mathcal {Y}}_{k}=y_{k}\right)\approx _{\epsilon \downarrow 0}{\text{Law}}\left(X_{k}|Y_{0}=y_{0},\cdots ,Y_{k}=y_{k}\right)

ตัวกรองอนุภาคที่เกี่ยวข้องกับกระบวนการ Markov ที่กำหนดโดยการสังเกตบางส่วนนั้นถูกกำหนดในแง่ของอนุภาคที่วิวัฒนาการด้วยฟังก์ชันความน่าจะเป็นที่กำหนดด้วยสัญกรณ์ที่ไม่เหมาะสมอย่างเห็นได้ชัดโดยเทคนิคความน่าจะเป็นเหล่านี้มีความเกี่ยวข้องอย่างใกล้ชิดกับการคำนวณแบบเบย์เซียนโดยประมาณ (ABC) ในบริบทของตัวกรองอนุภาค เทคนิคการกรองอนุภาค ABC เหล่านี้ได้รับการแนะนำในปี 1998 โดย P. Del Moral, J. Jacod และ P. Protter ^[⁶⁵^]และได้รับการพัฒนาเพิ่มเติมโดย P. Del Moral, A. Doucet และ A. Jasra ^[⁶⁶^]^[⁶⁷^] ${\mathcal {X}}_{k}=\left(X_{k},Y_{k}\right)$ ${\mathcal {Y}}_{0}=y_{0},\cdots ,{\mathcal {Y}}_{k}=y_{k},$ $\mathbb {R} ^{d_{x}+d_{y}}$ $p({\mathcal {Y}}_{k}|{\mathcal {X}}_{k})$

สมการการกรองแบบไม่เชิงเส้น

กฎของเบย์สสำหรับความน่าจะเป็นแบบมีเงื่อนไขมีดังนี้:

p(x_{0},\cdots ,x_{k}|y_{0},\cdots ,y_{k})={\frac {p(y_{0},\cdots ,y_{k}|x_{0},\cdots ,x_{k})p(x_{0},\cdots ,x_{k})}{p(y_{0},\cdots ,y_{k})}}

ที่ไหน

{\begin{aligned}p(y_{0},\cdots ,y_{k})&=\int p(y_{0},\cdots ,y_{k}|x_{0},\cdots ,x_{k})p(x_{0},\cdots ,x_{k})dx_{0}\cdots dx_{k}\\p(y_{0},\cdots ,y_{k}|x_{0},\cdots ,x_{k})&=\prod _{l=0}^{k}p(y_{l}|x_{l})\\p(x_{0},\cdots ,x_{k})&=p_{0}(x_{0})\prod _{l=1}^{k}p(x_{l}|x_{l-1})\end{aligned}}

ตัวกรองอนุภาคก็เป็นการประมาณเช่นกัน แต่หากมีอนุภาคมากพอ ก็สามารถมีความแม่นยำมากขึ้นได้^{[ 2 ]}^{[ 4 ]}^{[ 5 ]}^{[ 49 ]}^{[ 50 ]}สมการการกรองแบบไม่เชิงเส้นกำหนดโดยการเรียกซ้ำ

${\begin{aligned}p(x_{k}|y_{0},\cdots ,y_{k-1})&{\stackrel {\text{updating}}{\longrightarrow }}p(x_{k}|y_{0},\cdots ,y_{k})={\frac {p(y_{k}|x_{k})p(x_{k}|y_{0},\cdots ,y_{k-1})}{\int p(y_{k}|x'_{k})p(x'_{k}|y_{0},\cdots ,y_{k-1})dx'_{k}}}\\&{\stackrel {\text{prediction}}{\longrightarrow }}p(x_{k+1}|y_{0},\cdots ,y_{k})=\int p(x_{k+1}|x_{k})p(x_{k}|y_{0},\cdots ,y_{k})dx_{k}\end{aligned}}$

สมการที่ 1

โดยใช้ข้อตกลงสำหรับk = 0 ปัญหาการกรองแบบไม่เชิงเส้นประกอบด้วยการคำนวณการแจกแจงแบบมีเงื่อนไขเหล่านี้ตามลำดับ $p(x_{0}|y_{0},\cdots ,y_{k-1})=p(x_{0})$

สูตรของเฟย์นแมน-แคค

เรากำหนดช่วงเวลา n และลำดับการสังเกตการณ์และสำหรับแต่ละk = 0, ..., nเราตั้งค่าดังนี้: $Y_{0}=y_{0},\cdots ,Y_{n}=y_{n}$

G_{k}(x_{k})=p(y_{k}|x_{k}).

ในสัญลักษณ์นี้ สำหรับฟังก์ชันขอบเขตใดๆFบนเซตของวิถีโคจรจากจุดกำเนิดk = 0 จนถึงเวลาk = nเราจะได้สูตรของ Feynman-Kac $X_{k}$

{\begin{aligned}\int F(x_{0},\cdots ,x_{n})p(x_{0},\cdots ,x_{n}|y_{0},\cdots ,y_{n})dx_{0}\cdots dx_{n}&={\frac {\int F(x_{0},\cdots ,x_{n})\left\{\prod \limits _{k=0}^{n}p(y_{k}|x_{k})\right\}p(x_{0},\cdots ,x_{n})dx_{0}\cdots dx_{n}}{\int \left\{\prod \limits _{k=0}^{n}p(y_{k}|x_{k})\right\}p(x_{0},\cdots ,x_{n})dx_{0}\cdots dx_{n}}}\\&={\frac {E\left(F(X_{0},\cdots ,X_{n})\prod \limits _{k=0}^{n}G_{k}(X_{k})\right)}{E\left(\prod \limits _{k=0}^{n}G_{k}(X_{k})\right)}}\end{aligned}}

แบบจำลองการบูรณาการเส้นทาง Feynman-Kac เกิดขึ้นในสาขาวิทยาศาสตร์หลายแขนง รวมถึงฟิสิกส์เชิงคำนวณ ชีววิทยา ทฤษฎีสารสนเทศ และวิทยาศาสตร์คอมพิวเตอร์^{[ 8 ]}^{[ 10 ]}^{[ 5 ]}การตีความขึ้นอยู่กับโดเมนการใช้งาน ตัวอย่างเช่น หากเราเลือกฟังก์ชันตัวบ่งชี้ของเซตย่อยบางส่วนของปริภูมิสถานะ ฟังก์ชันเหล่านี้จะแสดงถึงการกระจายแบบมีเงื่อนไขของห่วงโซ่ Markov โดยที่ห่วงโซ่นั้นยังคงอยู่ในท่อที่กำหนด นั่นคือ เรามี: $G_{n}(x_{n})=1_{A}(x_{n})$

E\left(F(X_{0},\cdots ,X_{n})|X_{0}\in A,\cdots ,X_{n}\in A\right)={\frac {E\left(F(X_{0},\cdots ,X_{n})\prod \limits _{k=0}^{n}G_{k}(X_{k})\right)}{E\left(\prod \limits _{k=0}^{n}G_{k}(X_{k})\right)}}

และ

P\left(X_{0}\in A,\cdots ,X_{n}\in A\right)=E\left(\prod \limits _{k=0}^{n}G_{k}(X_{k})\right)

ทันทีที่ค่าคงที่การทำให้เป็นมาตรฐานเป็นค่าบวกอย่างเคร่งครัด

ตัวกรองอนุภาค

อัลกอริทึมอนุภาคประเภทพันธุกรรม

ในขั้นต้น อัลกอริทึมดังกล่าวเริ่มต้นด้วยตัวแปรสุ่มอิสระN ตัว ที่มีความหนาแน่นความน่าจะเป็นร่วมกันการเปลี่ยนผ่านการคัดเลือก-การกลายพันธุ์ของอัลกอริทึมทางพันธุกรรม^[²^]^[⁴^] $\left(\xi _{0}^{i}\right)_{1\leqslant i\leqslant N}$ $p(x_{0})$

\xi _{k}:=\left(\xi _{k}^{i}\right)_{1\leqslant i\leqslant N}{\stackrel {\text{selection}}{\longrightarrow }}{\widehat {\xi }}_{k}:=\left({\widehat {\xi }}_{k}^{i}\right)_{1\leqslant i\leqslant N}{\stackrel {\text{mutation}}{\longrightarrow }}\xi _{k+1}:=\left(\xi _{k+1}^{i}\right)_{1\leqslant i\leqslant N}

เลียนแบบ/ประมาณการเปลี่ยนผ่านการอัปเดต-การทำนายของการวิวัฒนาการตัวกรองที่เหมาะสมที่สุด ( สมการที่ 1 ):

ในระหว่างช่วงการเปลี่ยนผ่านของการเลือกและการปรับปรุงเราจะสุ่มตัวแปรสุ่มอิสระ (แบบมีเงื่อนไข) จำนวน N ตัว ซึ่งมีการแจกแจงร่วมกัน (แบบมีเงื่อนไข) ${\widehat {\xi }}_{k}:=\left({\widehat {\xi }}_{k}^{i}\right)_{1\leqslant i\leqslant N}$

\sum _{i=1}^{N}{\frac {p(y_{k}|\xi _{k}^{i})}{\sum _{j=1}^{N}p(y_{k}|\xi _{k}^{j})}}\delta _{\xi _{k}^{i}}(dx_{k})

โดยที่หมายถึงมาตรวัด Diracณ สถานะ a ที่กำหนด $\delta _{a}$

ในระหว่างการเปลี่ยนผ่านจากการทำนายการกลายพันธุ์เราจะสุ่มตัวอย่างการเปลี่ยนผ่านจากอนุภาคที่เลือกแต่ละตัวอย่าง อิสระ ${\widehat {\xi }}_{k}^{i}$

{\widehat {\xi }}_{k}^{i}\longrightarrow \xi _{k+1}^{i}\sim p(x_{k+1}|{\widehat {\xi }}_{k}^{i}),\qquad i=1,\cdots ,N.

ในสูตรที่แสดงด้านบน หมายถึงฟังก์ชันความน่าจะเป็นที่ประเมินค่า ณ จุดและหมายถึงความหนาแน่นแบบมีเงื่อนไขที่ประเมินค่า ณ จุด. $p(y_{k}|\xi _{k}^{i})$ $x_{k}\mapsto p(y_{k}|x_{k})$ $x_{k}=\xi _{k}^{i}$ $p(x_{k+1}|{\widehat {\xi }}_{k}^{i})$ $p(x_{k+1}|x_{k})$ $x_{k}={\widehat {\xi }}_{k}^{i}$

ในแต่ละช่วงเวลาkเราจะได้ค่าประมาณของอนุภาค

{\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k}):={\frac {1}{N}}\sum _{i=1}^{N}\delta _{{\widehat {\xi }}_{k}^{i}}(dx_{k})\approx _{N\uparrow \infty }p(dx_{k}|y_{0},\cdots ,y_{k})\approx _{N\uparrow \infty }\sum _{i=1}^{N}{\frac {p(y_{k}|\xi _{k}^{i})}{\sum _{i=1}^{N}p(y_{k}|\xi _{k}^{j})}}\delta _{\xi _{k}^{i}}(dx_{k})

และ

{\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1}):={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{k}^{i}}(dx_{k})\approx _{N\uparrow \infty }p(dx_{k}|y_{0},\cdots ,y_{k-1})

ในชุมชนอัลกอริทึมทางพันธุกรรมและการคำนวณเชิงวิวัฒนาการโซ่ Markov การกลายพันธุ์-การคัดเลือกที่อธิบายไว้ข้างต้นมักเรียกว่าอัลกอริทึมทางพันธุกรรมที่มีการคัดเลือกตามสัดส่วน มีการเสนอตัวแปรการแตกแขนงหลายแบบ รวมถึงขนาดประชากรแบบสุ่มในบทความต่างๆ^{[ 5 ]}^{[ 45 ]}^{[ 48 ]}

หลักการมอนเตคาร์โล

วิธีการแบบอนุภาค เช่นเดียวกับวิธีการสุ่มตัวอย่างอื่นๆ (เช่นMarkov Chain Monte Carlo ) จะสร้างชุดตัวอย่างที่ประมาณความหนาแน่นของการกรอง

p(x_{k}|y_{0},\cdots ,y_{k}).

ตัวอย่างเช่น เราอาจมี ตัวอย่าง Nตัวอย่างจากความน่าจะเป็นภายหลังโดยประมาณของโดยที่ตัวอย่างเหล่านั้นมีป้ายกำกับด้วยตัวยกดังนี้: $X_{k}$

{\widehat {\xi }}_{k}^{1},\cdots ,{\widehat {\xi }}_{k}^{N}.

จากนั้น ค่าคาดหวังเกี่ยวกับการกระจายการกรองจะถูกประมาณโดย

\int f(x_{k})p(x_{k}|y_{0},\cdots ,y_{k})\,dx_{k}\approx _{N\uparrow \infty }{\frac {1}{N}}\sum _{i=1}^{N}f\left({\widehat {\xi }}_{k}^{i}\right)=\int f(x_{k}){\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k})

สมการที่ 2

กับ

{\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k})={\frac {1}{N}}\sum _{i=1}^{N}\delta _{{\widehat {\xi }}_{k}^{i}}(dx_{k})

โดยที่หมายถึงการวัดแบบ Diracณ สถานะ a ที่กำหนด ฟังก์ชันfในแบบปกติของ Monte Carlo สามารถให้ค่าโมเมนต์ฯลฯ ทั้งหมดของการกระจายได้จนถึงข้อผิดพลาดในการประมาณค่าบางอย่าง เมื่อสมการการประมาณค่า ( สมการที่ 2 ) เป็นจริงสำหรับฟังก์ชันf ที่มีขอบเขตใดๆ เราจะเขียนได้ว่า $\delta _{a}$

p(dx_{k}|y_{0},\cdots ,y_{k}):=p(x_{k}|y_{0},\cdots ,y_{k})dx_{k}\approx _{N\uparrow \infty }{\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k})={\frac {1}{N}}\sum _{i=1}^{N}\delta _{{\widehat {\xi }}_{k}^{i}}(dx_{k})

ตัวกรองอนุภาคสามารถตีความได้ว่าเป็นอัลกอริทึมอนุภาคประเภทพันธุกรรมที่วิวัฒนาการไปพร้อมกับการกลายพันธุ์และการคัดเลือก เราสามารถติดตามสายบรรพบุรุษได้

\left({\widehat {\xi }}_{0,k}^{i},{\widehat {\xi }}_{1,k}^{i},\cdots ,{\widehat {\xi }}_{k-1,k}^{i},{\widehat {\xi }}_{k,k}^{i}\right)

ของอนุภาคสถานะสุ่มที่มีดัชนีล่าง l=0,...,k หมายถึงบรรพบุรุษของแต่ละบุคคลที่ระดับ l=0,...,k ในสถานการณ์นี้ เรามีสูตรการประมาณค่า $i=1,\cdots ,N$ ${\widehat {\xi }}_{l,k}^{i}$ ${\widehat {\xi }}_{k,k}^{i}={\widehat {\xi }}_{k}^{i}$

{\begin{aligned}\int F(x_{0},\cdots ,x_{k})p(x_{0},\cdots ,x_{k}|y_{0},\cdots ,y_{k})\,dx_{0}\cdots dx_{k}&\approx _{N\uparrow \infty }{\frac {1}{N}}\sum _{i=1}^{N}F\left({\widehat {\xi }}_{0,k}^{i},{\widehat {\xi }}_{1,k}^{i},\cdots ,{\widehat {\xi }}_{k,k}^{i}\right)\\&=\int F(x_{0},\cdots ,x_{k}){\widehat {p}}(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k})\end{aligned}}

สมการที่ 3

ด้วยการวัดเชิงประจักษ์

{\widehat {p}}(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k}):={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\left({\widehat {\xi }}_{0,k}^{i},{\widehat {\xi }}_{1,k}^{i},\cdots ,{\widehat {\xi }}_{k,k}^{i}\right)}(d(x_{0},\cdots ,x_{k}))

ในที่นี้Fหมายถึงฟังก์ชันที่ก่อตั้งขึ้นบนปริภูมิเส้นทางของสัญญาณ ในรูปแบบที่สังเคราะห์มากขึ้น ( สมการที่ 3 ) จะเทียบเท่ากับ

{\begin{aligned}p(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k})&:=p(x_{0},\cdots ,x_{k}|y_{0},\cdots ,y_{k})\,dx_{0}\cdots dx_{k}\\&\approx _{N\uparrow \infty }{\widehat {p}}(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k})\\&:={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\left({\widehat {\xi }}_{0,k}^{i},\cdots ,{\widehat {\xi }}_{k,k}^{i}\right)}(d(x_{0},\cdots ,x_{k}))\end{aligned}}

ตัวกรองอนุภาคสามารถตีความได้หลายวิธี จากมุมมองเชิงความน่าจะเป็น ตัวกรองอนุภาคจะสอดคล้องกับ การตีความ อนุภาคสนามเฉลี่ยของสมการการกรองแบบไม่เชิงเส้น การเปลี่ยนผ่านการอัปเดต-การทำนายของการวิวัฒนาการตัวกรองที่เหมาะสมที่สุดยังสามารถตีความได้ว่าเป็นการเปลี่ยนผ่านการคัดเลือก-การกลายพันธุ์แบบคลาสสิกทางพันธุกรรมของแต่ละบุคคล เทคนิคการสุ่มตัวอย่างความสำคัญตามลำดับให้การตีความอีกแบบหนึ่งของการเปลี่ยนผ่านของการกรองโดยเชื่อมโยงการสุ่มตัวอย่างความสำคัญกับขั้นตอนการสุ่มตัวอย่างบูตสแตรป สุดท้ายแต่ไม่ท้ายสุด ตัวกรองอนุภาคสามารถมองได้ว่าเป็นวิธีการยอมรับ-ปฏิเสธที่มาพร้อมกับกลไกการรีไซเคิล^{[ 10 ]}^{[ 5 ]}

การจำลองอนุภาคแบบสนามเฉลี่ย

หลักการความน่าจะเป็นทั่วไป

วิวัฒนาการของการกรองแบบไม่เชิงเส้นสามารถตีความได้ว่าเป็นระบบพลวัตในชุดของการวัดความน่าจะเป็นในรูปแบบที่หมายถึงการแมปบางอย่างจากชุดของการกระจายความน่าจะเป็นไปยังตัวมันเอง ตัวอย่างเช่น วิวัฒนาการของตัวทำนายที่เหมาะสมที่สุดแบบขั้นตอนเดียว $\eta _{n+1}=\Phi _{n+1}\left(\eta _{n}\right)$ $\Phi _{n+1}$ $\eta _{n}(dx_{n})=p(x_{n}|y_{0},\cdots ,y_{n-1})dx_{n}$

สอดคล้องกับการวิวัฒนาการแบบไม่เชิงเส้น โดยเริ่มต้นจากการกระจายความน่าจะเป็น หนึ่งในวิธีที่ง่ายที่สุดในการประมาณค่ามาตรวัดความน่าจะเป็นเหล่านี้ คือการเริ่มต้นด้วยตัวแปรสุ่มอิสระN ตัว ที่มีการกระจายความน่าจะเป็นร่วมกัน สมมติว่าเราได้กำหนดลำดับของตัวแปรสุ่มN ตัว ไว้ดังนี้ $\eta _{0}(dx_{0})=p(x_{0})dx_{0}$ $\left(\xi _{0}^{i}\right)_{1\leqslant i\leqslant N}$ $\eta _{0}(dx_{0})=p(x_{0})dx_{0}$ $\left(\xi _{n}^{i}\right)_{1\leqslant i\leqslant N}$

{\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{n}^{i}}(dx_{n})\approx _{N\uparrow \infty }\eta _{n}(dx_{n})

ขั้นตอนต่อไป เราจะสุ่มตัวแปรสุ่มอิสระ (แบบมีเงื่อนไข) จำนวนN ตัว โดยใช้กฎทั่วไป $\xi _{n+1}:=\left(\xi _{n+1}^{i}\right)_{1\leqslant i\leqslant N}$

\Phi _{n+1}\left({\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{n}^{i}}\right)\approx _{N\uparrow \infty }\Phi _{n+1}\left(\eta _{n}\right)=\eta _{n+1}

การตีความสมการการกรองในเชิงอนุภาค

เราจะอธิบายหลักการของอนุภาคสนามเฉลี่ยนี้ในบริบทของการวิวัฒนาการของตัวทำนายที่ดีที่สุดแบบขั้นตอนเดียว

$p(x_{k}|y_{0},\cdots ,y_{k-1})dx_{k}\to p(x_{k+1}|y_{0},\cdots ,y_{k})=\int p(x_{k+1}|x'_{k}){\frac {p(y_{k}|x_{k}')p(x'_{k}|y_{0},\cdots ,y_{k-1})dx'_{k}}{\int p(y_{k}|x''_{k})p(x''_{k}|y_{0},\cdots ,y_{k-1})dx''_{k}}}$

สมการที่ 4

สำหรับk = 0 เราใช้ข้อตกลงนี้ $p(x_{0}|y_{0},\cdots ,y_{-1}):=p(x_{0})$

ตามกฎของจำนวนมาก เราจะได้ว่า

{\widehat {p}}(dx_{0})={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{0}^{i}}(dx_{0})\approx _{N\uparrow \infty }p(x_{0})dx_{0}

ในแง่ที่ว่า

\int f(x_{0}){\widehat {p}}(dx_{0})={\frac {1}{N}}\sum _{i=1}^{N}f(\xi _{0}^{i})\approx _{N\uparrow \infty }\int f(x_{0})p(dx_{0})dx_{0}

สำหรับฟังก์ชันที่มีขอบเขตใดๆเรายังสมมติเพิ่มเติมว่าเราได้สร้างลำดับของอนุภาคที่อันดับk บางอันดับ แล้ว โดยที่ $f$ $\left(\xi _{k}^{i}\right)_{1\leqslant i\leqslant N}$

{\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1}):={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{k}^{i}}(dx_{k})\approx _{N\uparrow \infty }~p(x_{k}~|~y_{0},\cdots ,y_{k-1})dx_{k}

ในแง่ที่ว่าสำหรับฟังก์ชันที่มีขอบเขตใดๆเราจะมี $f$

\int f(x_{k}){\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1})={\frac {1}{N}}\sum _{i=1}^{N}f(\xi _{k}^{i})\approx _{N\uparrow \infty }\int f(x_{k})p(dx_{k}|y_{0},\cdots ,y_{k-1})dx_{k}

ในสถานการณ์นี้ เมื่อแทนที่ด้วยการวัดเชิงประจักษ์ในสมการวิวัฒนาการของตัวกรองที่เหมาะสมที่สุดแบบขั้นตอนเดียวที่ระบุไว้ใน ( สมการ 4 ) เราพบว่า $p(x_{k}|y_{0},\cdots ,y_{k-1})dx_{k}$ ${\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1})$

p(x_{k+1}|y_{0},\cdots ,y_{k})\approx _{N\uparrow \infty }\int p(x_{k+1}|x'_{k}){\frac {p(y_{k}|x_{k}'){\widehat {p}}(dx'_{k}|y_{0},\cdots ,y_{k-1})}{\int p(y_{k}|x''_{k}){\widehat {p}}(dx''_{k}|y_{0},\cdots ,y_{k-1})}}

โปรดสังเกตว่าด้านขวามือในสูตรข้างต้นคือส่วนผสมความน่าจะเป็นแบบถ่วงน้ำหนัก

\int p(x_{k+1}|x'_{k}){\frac {p(y_{k}|x_{k}'){\widehat {p}}(dx'_{k}|y_{0},\cdots ,y_{k-1})}{\int p(y_{k}|x''_{k}){\widehat {p}}(dx''_{k}|y_{0},\cdots ,y_{k-1})}}=\sum _{i=1}^{N}{\frac {p(y_{k}|\xi _{k}^{i})}{\sum _{i=1}^{N}p(y_{k}|\xi _{k}^{j})}}p(x_{k+1}|\xi _{k}^{i})=:{\widehat {q}}(x_{k+1}|y_{0},\cdots ,y_{k})

โดยที่ แทนความหนาแน่นที่ประเมิน ณและแทนความหนาแน่นที่ประเมิน ณสำหรับ $p(y_{k}|\xi _{k}^{i})$ $p(y_{k}|x_{k})$ $x_{k}=\xi _{k}^{i}$ $p(x_{k+1}|\xi _{k}^{i})$ $p(x_{k+1}|x_{k})$ $x_{k}=\xi _{k}^{i}$ $i=1,\cdots ,N.$

จากนั้น เราสุ่มตัวแปรสุ่มอิสระN ตัว ที่มีความหนาแน่นความน่าจะเป็นร่วมกัน เพื่อให้ $\left(\xi _{k+1}^{i}\right)_{1\leqslant i\leqslant N}$ ${\widehat {q}}(x_{k+1}|y_{0},\cdots ,y_{k})$

{\widehat {p}}(dx_{k+1}|y_{0},\cdots ,y_{k}):={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{k+1}^{i}}(dx_{k+1})\approx _{N\uparrow \infty }{\widehat {q}}(x_{k+1}|y_{0},\cdots ,y_{k})dx_{k+1}\approx _{N\uparrow \infty }p(x_{k+1}|y_{0},\cdots ,y_{k})dx_{k+1}

ด้วยการทำซ้ำขั้นตอนดังกล่าว เราจึงออกแบบห่วงโซ่มาร์คอฟได้ดังนี้

{\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1}):={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{k}^{i}}(dx_{k})\approx _{N\uparrow \infty }p(dx_{k}|y_{0},\cdots ,y_{k-1}):=p(x_{k}|y_{0},\cdots ,y_{k-1})dx_{k}

โปรดสังเกตว่าตัวกรองที่เหมาะสมที่สุดจะถูกประมาณค่าในแต่ละช่วงเวลา k โดยใช้สูตรของเบย์ส

p(dx_{k}|y_{0},\cdots ,y_{k})\approx _{N\uparrow \infty }{\frac {p(y_{k}|x_{k}){\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1})}{\int p(y_{k}|x'_{k}){\widehat {p}}(dx'_{k}|y_{0},\cdots ,y_{k-1})}}=\sum _{i=1}^{N}{\frac {p(y_{k}|\xi _{k}^{i})}{\sum _{j=1}^{N}p(y_{k}|\xi _{k}^{j})}}~\delta _{\xi _{k}^{i}}(dx_{k})

คำศัพท์ "การประมาณค่าเฉลี่ยสนาม" มาจากข้อเท็จจริงที่ว่าเราแทนที่การวัดความน่าจะเป็นด้วยการประมาณเชิงประจักษ์ ในแต่ละขั้นตอนเวลา การประมาณอนุภาคค่าเฉลี่ยสนามของปัญหาการกรองนั้นห่างไกลจากความเป็นเอกลักษณ์ มีกลยุทธ์หลายอย่างที่พัฒนาขึ้นในหนังสือ^[¹⁰^]^[⁵^] $p(dx_{k}|y_{0},\cdots ,y_{k-1})$ ${\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1})$

ผลลัพธ์การบรรจบกันบางประการ

การวิเคราะห์การบรรจบกันของตัวกรองอนุภาคเริ่มต้นในปี 1996 ^{[ 2 ]}^{[ 4 ]}และในปี 2000 ในหนังสือ^{[ 8 ]}และชุดบทความ^{[ 48 ]}^{[ 49 ]}^{[ 50 ]}^{[ 51 ]}^{[ 52 ]}^{[ 68 ]}^{[ 69 ]}การพัฒนาล่าสุดสามารถพบได้ในหนังสือ^{[ 10 ]}^{[ 5 ]}เมื่อสมการการกรองมีเสถียรภาพ (ในแง่ที่ว่ามันแก้ไขเงื่อนไขเริ่มต้นที่ผิดพลาดใดๆ) อคติและความแปรปรวนของการประมาณค่าอนุภาค

I_{k}(f):=\int f(x_{k})p(dx_{k}|y_{0},\cdots ,y_{k-1})\approx _{N\uparrow \infty }{\widehat {I}}_{k}(f):=\int f(x_{k}){\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1})

ถูกควบคุมโดยการประมาณค่าสม่ำเสมอที่ไม่ใช่เชิงอะซิมโทติก

\sup _{k\geqslant 0}\left\vert E\left({\widehat {I}}_{k}(f)\right)-I_{k}(f)\right\vert \leqslant {\frac {c_{1}}{N}}

\sup _{k\geqslant 0}E\left(\left[{\widehat {I}}_{k}(f)-I_{k}(f)\right]^{2}\right)\leqslant {\frac {c_{2}}{N}}

สำหรับฟังก์ชันf ใดๆ ที่มีขอบเขตไม่เกิน 1 และสำหรับค่าคงที่จำกัดบางค่า นอกจากนี้ สำหรับ: $c_{1},c_{2}.$ $x\geqslant 0$

\mathbf {P} \left(\left|{\widehat {I}}_{k}(f)-I_{k}(f)\right|\leqslant c_{1}{\frac {x}{N}}+c_{2}{\sqrt {\frac {x}{N}}}\land \sup _{0\leqslant k\leqslant n}\left|{\widehat {I}}_{k}(f)-I_{k}(f)\right|\leqslant c{\sqrt {\frac {x\log(n)}{N}}}\right)>1-e^{-x}

สำหรับค่าคงที่จำกัดบางค่าที่เกี่ยวข้องกับอคติเชิงอะซิมโทติกและความแปรปรวนของการประมาณค่าอนุภาค และค่าคงที่จำกัดc บาง ค่า ผลลัพธ์เดียวกันนี้ยังคงเป็นไปได้หากเราแทนที่ตัวทำนายที่เหมาะสมที่สุดแบบขั้นตอนเดียวด้วยการประมาณค่าตัวกรองที่เหมาะสมที่สุด $c_{1},c_{2}$

แผนผังลำดับวงศ์ตระกูลและคุณสมบัติของความเป็นกลาง

การปรับเรียบอนุภาคตามแผนผังลำดับวงศ์ตระกูล

สืบย้อนรอยสายตระกูลไปในอดีต

\left({\widehat {\xi }}_{0,k}^{i},{\widehat {\xi }}_{1,k}^{i},\cdots ,{\widehat {\xi }}_{k-1,k}^{i},{\widehat {\xi }}_{k,k}^{i}\right),\quad \left(\xi _{0,k}^{i},\xi _{1,k}^{i},\cdots ,\xi _{k-1,k}^{i},\xi _{k,k}^{i}\right)

ของแต่ละบุคคลและในแต่ละช่วงเวลาkเรายังมีการประมาณค่าอนุภาคด้วย ${\widehat {\xi }}_{k}^{i}\left(={\widehat {\xi }}_{k,k}^{i}\right)$ $\xi _{k}^{i}\left(={\xi }_{k,k}^{i}\right)$

{\begin{aligned}{\widehat {p}}(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k})&:={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\left({\widehat {\xi }}_{0,k}^{i},\cdots ,{\widehat {\xi }}_{0,k}^{i}\right)}(d(x_{0},\cdots ,x_{k}))\\&\approx _{N\uparrow \infty }p(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k})\\&\approx _{N\uparrow \infty }\sum _{i=1}^{N}{\frac {p(y_{k}|\xi _{k,k}^{i})}{\sum _{j=1}^{N}p(y_{k}|\xi _{k,k}^{j})}}\delta _{\left(\xi _{0,k}^{i},\cdots ,\xi _{0,k}^{i}\right)}(d(x_{0},\cdots ,x_{k}))\\&\ \\{\widehat {p}}(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k-1})&:={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\left(\xi _{0,k}^{i},\cdots ,\xi _{k,k}^{i}\right)}(d(x_{0},\cdots ,x_{k}))\\&\approx _{N\uparrow \infty }p(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k-1})\\&:=p(x_{0},\cdots ,x_{k}|y_{0},\cdots ,y_{k-1})dx_{0},\cdots ,dx_{k}\end{aligned}}

การประมาณเชิงประจักษ์เหล่านี้เทียบเท่ากับการประมาณเชิงปริพันธ์ของอนุภาค

{\begin{aligned}\int F(x_{0},\cdots ,x_{n}){\widehat {p}}(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k})&:={\frac {1}{N}}\sum _{i=1}^{N}F\left({\widehat {\xi }}_{0,k}^{i},\cdots ,{\widehat {\xi }}_{0,k}^{i}\right)\\&\approx _{N\uparrow \infty }\int F(x_{0},\cdots ,x_{n})p(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k})\\&\approx _{N\uparrow \infty }\sum _{i=1}^{N}{\frac {p(y_{k}|\xi _{k,k}^{i})}{\sum _{j=1}^{N}p(y_{k}|\xi _{k,k}^{j})}}F\left(\xi _{0,k}^{i},\cdots ,\xi _{k,k}^{i}\right)\\&\ \\\int F(x_{0},\cdots ,x_{n}){\widehat {p}}(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k-1})&:={\frac {1}{N}}\sum _{i=1}^{N}F\left(\xi _{0,k}^{i},\cdots ,\xi _{k,k}^{i}\right)\\&\approx _{N\uparrow \infty }\int F(x_{0},\cdots ,x_{n})p(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k-1})\end{aligned}}

สำหรับฟังก์ชันขอบเขตใดๆFบนวิถีสุ่มของสัญญาณ ดังที่แสดงใน^{[ 54 ]}วิวัฒนาการของต้นไม้ลำดับวงศ์ตระกูลสอดคล้องกับการตีความอนุภาคสนามเฉลี่ยของสมการวิวัฒนาการที่เกี่ยวข้องกับความหนาแน่นภายหลังของวิถีสัญญาณ สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับแบบจำลองพื้นที่เส้นทางเหล่านี้ โปรดดูหนังสือ^{[ 10 ]}^{[ 5 ]}

การประมาณค่าฟังก์ชันความน่าจะเป็นของอนุภาคที่ไม่ลำเอียง

เราใช้สูตรผลิตภัณฑ์

p(y_{0},\cdots ,y_{n})=\prod _{k=0}^{n}p(y_{k}|y_{0},\cdots ,y_{k-1})

กับ

p(y_{k}|y_{0},\cdots ,y_{k-1})=\int p(y_{k}|x_{k})p(dx_{k}|y_{0},\cdots ,y_{k-1})

และข้อตกลงและสำหรับk = 0 แทนที่ด้วยการประมาณ เชิงประจักษ์ $p(y_{0}|y_{0},\cdots ,y_{-1})=p(y_{0})$ $p(x_{0}|y_{0},\cdots ,y_{-1})=p(x_{0}),$ $p(x_{k}|y_{0},\cdots ,y_{k-1})dx_{k}$

{\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1}):={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{k}^{i}}(dx_{k})\approx _{N\uparrow \infty }p(dx_{k}|y_{0},\cdots ,y_{k-1})

ในสูตรที่แสดงข้างต้น เราได้ออกแบบการประมาณอนุภาคที่ไม่เอนเอียงของฟังก์ชันความน่าจะเป็นดังต่อไปนี้

p(y_{0},\cdots ,y_{n})\approx _{N\uparrow \infty }{\widehat {p}}(y_{0},\cdots ,y_{n})=\prod _{k=0}^{n}{\widehat {p}}(y_{k}|y_{0},\cdots ,y_{k-1})

กับ

{\widehat {p}}(y_{k}|y_{0},\cdots ,y_{k-1})=\int p(y_{k}|x_{k}){\widehat {p}}(dx_{k}|y_{0},\cdots ,y_{k-1})={\frac {1}{N}}\sum _{i=1}^{N}p(y_{k}|\xi _{k}^{i})

โดยที่หมายถึงความหนาแน่นที่ประเมิน ณ จุดนั้นการออกแบบการประมาณอนุภาคนี้และคุณสมบัติที่ไม่เอนเอียงได้รับการพิสูจน์แล้วในปี 1996 ในบทความ^[²^]การประมาณค่าความแปรปรวนที่ปรับปรุงแล้วสามารถพบได้ใน^[⁵^]และ^[¹⁰^] $p(y_{k}|\xi _{k}^{i})$ $p(y_{k}|x_{k})$ $x_{k}=\xi _{k}^{i}$

ตัวปรับเรียบอนุภาคแบบย้อนกลับ

เมื่อใช้กฎของเบย์ส เราจะได้สูตรดังนี้

p(x_{0},\cdots ,x_{n}|y_{0},\cdots ,y_{n-1})=p(x_{n}|y_{0},\cdots ,y_{n-1})p(x_{n-1}|x_{n},y_{0},\cdots ,y_{n-1})\cdots p(x_{1}|x_{2},y_{0},y_{1})p(x_{0}|x_{1},y_{0})

โปรดสังเกตว่า

{\begin{aligned}p(x_{k-1}|x_{k},(y_{0},\cdots ,y_{k-1}))&\propto p(x_{k}|x_{k-1})p(x_{k-1}|(y_{0},\cdots ,y_{k-1}))\\p(x_{k-1}|(y_{0},\cdots ,y_{k-1})&\propto p(y_{k-1}|x_{k-1})p(x_{k-1}|(y_{0},\cdots ,y_{k-2})\end{aligned}}

นี่หมายความว่า

p(x_{k-1}|x_{k},(y_{0},\cdots ,y_{k-1}))={\frac {p(y_{k-1}|x_{k-1})p(x_{k}|x_{k-1})p(x_{k-1}|y_{0},\cdots ,y_{k-2})}{\int p(y_{k-1}|x'_{k-1})p(x_{k}|x'_{k-1})p(x'_{k-1}|y_{0},\cdots ,y_{k-2})dx'_{k-1}}}

การแทนที่ตัวทำนายที่เหมาะสมที่สุดแบบขั้นตอนเดียว ด้วย มาตรวัดเชิงประจักษ์ของอนุภาค $p(x_{k-1}|(y_{0},\cdots ,y_{k-2}))dx_{k-1}$

{\widehat {p}}(dx_{k-1}|(y_{0},\cdots ,y_{k-2}))={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{k-1}^{i}}(dx_{k-1})\left(\approx _{N\uparrow \infty }p(dx_{k-1}|(y_{0},\cdots ,y_{k-2})):={p}(x_{k-1}|(y_{0},\cdots ,y_{k-2}))dx_{k-1}\right)

เราพบว่า

{\begin{aligned}p(dx_{k-1}|x_{k},(y_{0},\cdots ,y_{k-1}))&\approx _{N\uparrow \infty }{\widehat {p}}(dx_{k-1}|x_{k},(y_{0},\cdots ,y_{k-1}))\\&:={\frac {p(y_{k-1}|x_{k-1})p(x_{k}|x_{k-1}){\widehat {p}}(dx_{k-1}|y_{0},\cdots ,y_{k-2})}{\int p(y_{k-1}|x'_{k-1})~p(x_{k}|x'_{k-1}){\widehat {p}}(dx'_{k-1}|y_{0},\cdots ,y_{k-2})}}\\&=\sum _{i=1}^{N}{\frac {p(y_{k-1}|\xi _{k-1}^{i})p(x_{k}|\xi _{k-1}^{i})}{\sum _{j=1}^{N}p(y_{k-1}|\xi _{k-1}^{j})p(x_{k}|\xi _{k-1}^{j})}}\delta _{\xi _{k-1}^{i}}(dx_{k-1})\end{aligned}}

เราสรุปได้ว่า

p(d(x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))\approx _{N\uparrow \infty }{\widehat {p}}_{backward}(d(x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))

ด้วยการประมาณอนุภาคย้อนกลับ

{\begin{aligned}{\widehat {p}}_{backward}(d(x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))={\widehat {p}}(dx_{n}|(y_{0},\cdots ,y_{n-1})){\widehat {p}}(dx_{n-1}|x_{n},(y_{0},\cdots ,y_{n-1}))\cdots {\widehat {p}}(dx_{1}|x_{2},(y_{0},y_{1})){\widehat {p}}(dx_{0}|x_{1},y_{0})\end{aligned}}

การวัดความน่าจะเป็น

{\widehat {p}}_{backward}(d(x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))

คือความน่าจะเป็นของเส้นทางสุ่มของห่วงโซ่มาร์คอฟที่วิ่งย้อนกลับไปในเวลาจากเวลา k=n ถึงเวลา k=0 และมีการเปลี่ยนแปลงในแต่ละขั้นตอนเวลา k ในปริภูมิสถานะที่เกี่ยวข้องกับประชากรของอนุภาค $\left(\mathbb {X} _{k,n}^{\flat }\right)_{0\leqslant k\leqslant n}$ $\xi _{k}^{i},i=1,\cdots ,N.$

ในตอนเริ่มต้น (ที่เวลา k=n) โซ่จะเลือกสถานะแบบสุ่มโดยใช้การแจกแจง $\mathbb {X} _{n,n}^{\flat }$

{\widehat {p}}(dx_{n}|(y_{0},\cdots ,y_{n-1}))={\frac {1}{N}}\sum _{i=1}^{N}\delta _{\xi _{n}^{i}}(dx_{n})

ตั้งแต่เวลา k ถึงเวลา (k-1) ลำดับที่เริ่มต้นจากสถานะบางสถานะสำหรับบางค่าณ เวลา k จะเคลื่อนไปยังสถานะสุ่มที่เลือกด้วยความน่าจะเป็นถ่วงน้ำหนักแบบไม่ต่อเนื่อง ณ เวลา (k-1) $\mathbb {X} _{k,n}^{\flat }=\xi _{k}^{i}$ $i=1,\cdots ,N$ $\mathbb {X} _{k-1,n}^{\flat }$

{\widehat {p}}(dx_{k-1}|\xi _{k}^{i},(y_{0},\cdots ,y_{k-1}))=\sum _{j=1}^{N}{\frac {p(y_{k-1}|\xi _{k-1}^{j})p(\xi _{k}^{i}|\xi _{k-1}^{j})}{\sum _{l=1}^{N}p(y_{k-1}|\xi _{k-1}^{l})p(\xi _{k}^{i}|\xi _{k-1}^{l})}}~\delta _{\xi _{k-1}^{j}}(dx_{k-1})

ในสูตรที่แสดงข้างต้น หมายถึงการแจกแจงแบบมีเงื่อนไขที่ประเมิน ณ เวลาในทำนองเดียวกันและหมายถึงความหนาแน่นแบบมีเงื่อนไขและที่ประเมิน ณ เวลาและแบบจำลองเหล่านี้ช่วยลดการบูรณาการโดยสัมพันธ์กับความหนาแน่นในแง่ของการดำเนินการเมทริกซ์โดยสัมพันธ์กับการเปลี่ยนผ่านแบบมาร์คอฟของห่วงโซ่ที่อธิบายไว้ข้างต้น^[⁵⁵^]ตัวอย่างเช่น สำหรับฟังก์ชันใดๆเรามีการประมาณค่าอนุภาค ${\widehat {p}}(dx_{k-1}|\xi _{k}^{i},(y_{0},\cdots ,y_{k-1}))$ ${\widehat {p}}(dx_{k-1}|x_{k},(y_{0},\cdots ,y_{k-1}))$ $x_{k}=\xi _{k}^{i}$ $p(y_{k-1}|\xi _{k-1}^{j})$ $p(\xi _{k}^{i}|\xi _{k-1}^{j})$ $p(y_{k-1}|x_{k-1})$ $p(x_{k}|x_{k-1})$ $x_{k}=\xi _{k}^{i}$ $x_{k-1}=\xi _{k-1}^{j}.$ $p((x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))$ $f_{k}$

{\begin{aligned}\int p(d(x_{0},\cdots ,x_{n})&|(y_{0},\cdots ,y_{n-1}))f_{k}(x_{k})\\&\approx _{N\uparrow \infty }\int {\widehat {p}}_{backward}(d(x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))f_{k}(x_{k})\\&=\int {\widehat {p}}(dx_{n}|(y_{0},\cdots ,y_{n-1})){\widehat {p}}(dx_{n-1}|x_{n},(y_{0},\cdots ,y_{n-1}))\cdots {\widehat {p}}(dx_{k}|x_{k+1},(y_{0},\cdots ,y_{k}))f_{k}(x_{k})\\&=\underbrace {\left[{\tfrac {1}{N}},\cdots ,{\tfrac {1}{N}}\right]} _{N{\text{ times}}}\mathbb {M} _{n-1}\cdots \mathbb {M} _{k}{\begin{bmatrix}f_{k}(\xi _{k}^{1})\\\vdots \\f_{k}(\xi _{k}^{N})\end{bmatrix}}\end{aligned}}

ที่ไหน

\mathbb {M} _{k}=(\mathbb {M} _{k}(i,j))_{1\leqslant i,j\leqslant N}:\qquad \mathbb {M} _{k}(i,j)={\frac {p(\xi _{k}^{i}|\xi _{k-1}^{j})~p(y_{k-1}|\xi _{k-1}^{j})}{\sum \limits _{l=1}^{N}p(\xi _{k}^{i}|\xi _{k-1}^{l})p(y_{k-1}|\xi _{k-1}^{l})}}

สิ่งนี้ยังแสดงให้เห็นว่าถ้า

{\overline {F}}(x_{0},\cdots ,x_{n}):={\frac {1}{n+1}}\sum _{k=0}^{n}f_{k}(x_{k})

แล้ว

{\begin{aligned}\int {\overline {F}}(x_{0},\cdots ,x_{n})p(d(x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))&\approx _{N\uparrow \infty }\int {\overline {F}}(x_{0},\cdots ,x_{n}){\widehat {p}}_{backward}(d(x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))\\&={\frac {1}{n+1}}\sum _{k=0}^{n}\underbrace {\left[{\tfrac {1}{N}},\cdots ,{\tfrac {1}{N}}\right]} _{N{\text{ times}}}\mathbb {M} _{n-1}\mathbb {M} _{n-2}\cdots \mathbb {M} _{k}{\begin{bmatrix}f_{k}(\xi _{k}^{1})\\\vdots \\f_{k}(\xi _{k}^{N})\end{bmatrix}}\end{aligned}}

การปรับอนุภาคให้เรียบยังสามารถทำได้ในการดำเนินการออนไลน์เพียงครั้งเดียวผ่านการประมาณค่าความล่าช้าคงที่^{[ 70 ]}

ผลลัพธ์การบรรจบกันบางประการ

เราจะถือว่าสมการการกรองมีเสถียรภาพ ในแง่ที่ว่ามันแก้ไขเงื่อนไขเริ่มต้นที่ผิดพลาดใดๆ ได้

ในสถานการณ์นี้การประมาณค่าอนุภาคของฟังก์ชันความน่าจะเป็นจะไม่เอนเอียง และความแปรปรวนสัมพัทธ์จะถูกควบคุมโดย

E\left({\widehat {p}}(y_{0},\cdots ,y_{n})\right)=p(y_{0},\cdots ,y_{n}),\qquad E\left(\left[{\frac {{\widehat {p}}(y_{0},\cdots ,y_{n})}{p(y_{0},\cdots ,y_{n})}}-1\right]^{2}\right)\leqslant {\frac {cn}{N}},

สำหรับค่าคงที่จำกัดc บางค่า นอกจากนี้ สำหรับค่าใดๆ: $x\geqslant 0$

\mathbf {P} \left(\left\vert {\frac {1}{n}}\log {{\widehat {p}}(y_{0},\cdots ,y_{n})}-{\frac {1}{n}}\log {p(y_{0},\cdots ,y_{n})}\right\vert \leqslant c_{1}{\frac {x}{N}}+c_{2}{\sqrt {\frac {x}{N}}}\right)>1-e^{-x}

สำหรับค่าคงที่จำกัดบางค่าที่เกี่ยวข้องกับอคติเชิงอะซิมโทติกและความแปรปรวนของการประมาณค่าอนุภาค และสำหรับค่าคงที่จำกัดc บาง ค่า $c_{1},c_{2}$

ความเอนเอียงและความแปรปรวนของ การประมาณค่าอนุภาคโดยอิงจากสายบรรพบุรุษของแผนผังลำดับวงศ์ตระกูล

{\begin{aligned}I_{k}^{path}(F)&:=\int F(x_{0},\cdots ,x_{k})p(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k-1})\\&\approx _{N\uparrow \infty }{\widehat {I}}_{k}^{path}(F)\\&:=\int F(x_{0},\cdots ,x_{k}){\widehat {p}}(d(x_{0},\cdots ,x_{k})|y_{0},\cdots ,y_{k-1})\\&={\frac {1}{N}}\sum _{i=1}^{N}F\left(\xi _{0,k}^{i},\cdots ,\xi _{k,k}^{i}\right)\end{aligned}}

ถูกควบคุมโดยการประมาณค่าสม่ำเสมอที่ไม่ใช่เชิงอะซิมโทติก

\left|E\left({\widehat {I}}_{k}^{path}(F)\right)-I_{k}^{path}(F)\right|\leqslant {\frac {c_{1}k}{N}},\qquad E\left(\left[{\widehat {I}}_{k}^{path}(F)-I_{k}^{path}(F)\right]^{2}\right)\leqslant {\frac {c_{2}k}{N}},

สำหรับฟังก์ชันF ใดๆ ที่มีขอบเขตไม่เกิน 1 และสำหรับค่าคงที่จำกัดบางค่านอกจากนี้ สำหรับใดๆ: $c_{1},c_{2}.$ $x\geqslant 0$

\mathbf {P} \left(\left|{\widehat {I}}_{k}^{path}(F)-I_{k}^{path}(F)\right|\leqslant c_{1}{\frac {kx}{N}}+c_{2}{\sqrt {\frac {kx}{N}}}\land \sup _{0\leqslant k\leqslant n}\left|{\widehat {I}}_{k}^{path}(F)-I_{k}^{path}(F)\right|\leqslant c{\sqrt {\frac {xn\log(n)}{N}}}\right)>1-e^{-x}

สำหรับค่าคงที่จำกัดบางค่าที่เกี่ยวข้องกับอคติและความแปรปรวนเชิงอะซิมโทติกของการประมาณค่าอนุภาค และสำหรับค่าคงที่จำกัดc บาง ค่า การประมาณค่าอคติและความแปรปรวนประเภทเดียวกันนี้ใช้ได้กับตัวปรับเรียบอนุภาคแบบย้อนกลับ สำหรับฟังก์ชันบวกในรูปแบบ $c_{1},c_{2}$

{\overline {F}}(x_{0},\cdots ,x_{n}):={\frac {1}{n+1}}\sum _{0\leqslant k\leqslant n}f_{k}(x_{k})

กับ

I_{n}^{path}({\overline {F}})\approx _{N\uparrow \infty }I_{n}^{\flat ,path}({\overline {F}}):=\int {\overline {F}}(x_{0},\cdots ,x_{n}){\widehat {p}}_{backward}(d(x_{0},\cdots ,x_{n})|(y_{0},\cdots ,y_{n-1}))

โดยที่ฟังก์ชันมีค่าจำกัดอยู่ที่ 1 เราจะได้ว่า $f_{k}$

\sup _{n\geqslant 0}{\left\vert E\left({\widehat {I}}_{n}^{\flat ,path}({\overline {F}})\right)-I_{n}^{path}({\overline {F}})\right\vert }\leqslant {\frac {c_{1}}{N}}

และ

E\left(\left[{\widehat {I}}_{n}^{\flat ,path}(F)-I_{n}^{path}(F)\right]^{2}\right)\leqslant {\frac {c_{2}}{nN}}+{\frac {c_{3}}{N^{2}}}

สำหรับค่าคงที่จำกัดบางค่า การประมาณค่าที่ละเอียดขึ้นซึ่งรวมถึงความน่าจะเป็นของข้อผิดพลาดที่เล็กมากแบบเลขชี้กำลังได้รับการพัฒนาใน^[¹⁰^] $c_{1},c_{2},c_{3}.$

การสุ่มตัวอย่างซ้ำเชิงความสำคัญแบบลำดับ (Sequential Importance Resampling: SIR)

ตัวกรองมอนเตคาร์โลและตัวกรองบูตสแตรป

การสุ่มตัวอย่างซ้ำตามความสำคัญแบบลำดับ(SIR)การกรองแบบมอนเตคาร์โล (Kitagawa 1993 ^{[ 35 ]} ) อัลกอริทึมการกรองแบบบูตสแตรป (Gordon et al. 1993 ^{[ 37 ]} ) และการสุ่มตัวอย่างซ้ำแบบกระจายเดี่ยว (Bejuri WMYB et al. 2017 ^{[ 71 ]} ) ก็เป็นอัลกอริทึมการกรองที่ใช้กันทั่วไปเช่นกัน ซึ่งประมาณความหนาแน่นของความน่าจะเป็นในการกรองด้วยชุดตัวอย่าง N ที่ถ่วงน้ำหนัก $p(x_{k}|y_{0},\cdots ,y_{k})$

\left\{\left(w_{k}^{(i)},x_{k}^{(i)}\right)\ :\ i\in \{1,\cdots ,N\}\right\}.

ค่าน้ำหนักความสำคัญ เป็นการประมาณค่าความน่าจะเป็นภายหลังสัมพัทธ์ (หรือความหนาแน่น) ของตัวอย่าง โดยที่ $w_{k}^{(i)}$

\sum _{i=1}^{N}w_{k}^{(i)}=1.

การสุ่มตัวอย่างแบบสำคัญตามลำดับ (Sequential Importance Sampling: SIS) เป็นการสุ่มตัวอย่างแบบสำคัญ ในรูปแบบลำดับ (กล่าวคือ แบบวนซ้ำ) เช่นเดียวกับการสุ่มตัวอย่างแบบสำคัญ ค่าคาดหวังของฟังก์ชันfสามารถประมาณได้โดยใช้ค่าเฉลี่ยถ่วงน้ำหนัก

\int f(x_{k})p(x_{k}|y_{0},\dots ,y_{k})dx_{k}\approx \sum _{i=1}^{N}w_{k}^{(i)}f(x_{k}^{(i)}).

สำหรับชุดตัวอย่างที่มีจำนวนจำกัด ประสิทธิภาพของอัลกอริธึมจะขึ้นอยู่กับการเลือกการกระจายความน่าจะเป็น

\pi (x_{k}|x_{0:k-1},y_{0:k})\,

.

การแจกแจงข้อเสนอที่ " เหมาะสมที่สุด"จะถูกกำหนดเป็นการแจกแจงเป้าหมาย

\pi (x_{k}|x_{0:k-1},y_{0:k})=p(x_{k}|x_{k-1},y_{k})={\frac {p(y_{k}|x_{k})}{\int p(y_{k}|x_{k})p(x_{k}|x_{k-1})dx_{k}}}~p(x_{k}|x_{k-1}).

ทางเลือกการเปลี่ยนข้อเสนอเฉพาะนี้ได้รับการเสนอโดย P. Del Moral ในปี 1996 และ 1998 ^{[ 4 ]}เมื่อการสุ่มตัวอย่างการเปลี่ยนตามการกระจายทำได้ยาก กลยุทธ์ตามธรรมชาติอย่างหนึ่งคือการใช้การประมาณอนุภาคต่อไปนี้ $p(x_{k}|x_{k-1},y_{k})$

{\begin{aligned}{\frac {p(y_{k}|x_{k})}{\int p(y_{k}|x_{k})p(x_{k}|x_{k-1})dx_{k}}}p(x_{k}|x_{k-1})dx_{k}&\simeq _{N\uparrow \infty }{\frac {p(y_{k}|x_{k})}{\int p(y_{k}|x_{k}){\widehat {p}}(dx_{k}|x_{k-1})}}{\widehat {p}}(dx_{k}|x_{k-1})\\&=\sum _{i=1}^{N}{\frac {p(y_{k}|X_{k}^{i}(x_{k-1}))}{\sum _{j=1}^{N}p(y_{k}|X_{k}^{j}(x_{k-1}))}}\delta _{X_{k}^{i}(x_{k-1})}(dx_{k})\end{aligned}}

ด้วยการประมาณเชิงประจักษ์

{\widehat {p}}(dx_{k}|x_{k-1})={\frac {1}{N}}\sum _{i=1}^{N}\delta _{X_{k}^{i}(x_{k-1})}(dx_{k})~\simeq _{N\uparrow \infty }p(x_{k}|x_{k-1})dx_{k}

เกี่ยวข้องกับ ตัวอย่างสุ่มอิสระ N (หรือตัวอย่างจำนวนมากอื่นๆ) ที่มีการแจกแจงแบบมีเงื่อนไขของสถานะสุ่มที่กำหนดความสอดคล้องของตัวกรองอนุภาคที่ได้จากการประมาณนี้และส่วนขยายอื่นๆ ได้รับการพัฒนาใน^[⁴^]ในการแสดงผลข้างต้นหมายถึงการวัด Diracที่สถานะ a ที่กำหนด $X_{k}^{i}(x_{k-1}),i=1,\cdots ,N$ $X_{k}$ $X_{k-1}=x_{k-1}$ $\delta _{a}$

อย่างไรก็ตาม โดยทั่วไปแล้ว การกระจายความน่าจะเป็นก่อนหน้าของการเปลี่ยนผ่านมักถูกใช้เป็นฟังก์ชันความสำคัญ เนื่องจากง่ายต่อการสุ่มอนุภาค (หรือตัวอย่าง) และดำเนินการคำนวณน้ำหนักความสำคัญในภายหลัง:

\pi (x_{k}|x_{0:k-1},y_{0:k})=p(x_{k}|x_{k-1}).

ตัวกรองการสุ่มตัวอย่างความสำคัญตามลำดับ ( Sequential Importance Resampling : SIR) ที่ใช้การกระจายความน่าจะเป็นก่อนหน้าของการเปลี่ยนผ่านเป็นฟังก์ชันความสำคัญ มักเรียกกันว่าตัวกรองบูตสแตรป (bootstrap filter ) และ อัลกอริ ธึมการควบแน่น (condensation algorithm )

การสุ่มตัวอย่างซ้ำใช้เพื่อหลีกเลี่ยงปัญหาความเสื่อมของอัลกอริทึม กล่าวคือ หลีกเลี่ยงสถานการณ์ที่น้ำหนักความสำคัญทั้งหมด ยกเว้นเพียงหนึ่งเดียว มีค่าใกล้เคียงศูนย์ ประสิทธิภาพของอัลกอริทึมอาจได้รับผลกระทบจากการเลือกวิธีการสุ่มตัวอย่างซ้ำที่เหมาะสมการสุ่มตัวอย่างแบบแบ่งชั้นที่เสนอโดย Kitagawa (1993 ^{[ 35 ]} ) ถือว่าเหมาะสมที่สุดในแง่ของความแปรปรวน

ขั้นตอนเดียวของการสุ่มตัวอย่างซ้ำตามความสำคัญแบบลำดับมีดังนี้:

1) เพื่อสุ่มตัวอย่างจากชุดการแจกแจงข้อเสนอ

i=1,\cdots ,N

x_{k}^{(i)}\sim \pi (x_{k}|x_{0:k-1}^{(i)},y_{0:k})

2) สำหรับการปรับปรุงค่าน้ำหนักความสำคัญให้เป็นไปตามค่าคงที่มาตรฐาน:

i=1,\cdots ,N

{\hat {w}}_{k}^{(i)}=w_{k-1}^{(i)}{\frac {p(y_{k}|x_{k}^{(i)})p(x_{k}^{(i)}|x_{k-1}^{(i)})}{\pi (x_{k}^{(i)}|x_{0:k-1}^{(i)},y_{0:k})}}.

โปรดทราบว่าเมื่อเราใช้การแจกแจงความน่าจะเป็นก่อนหน้าของการเปลี่ยนผ่านเป็นฟังก์ชันความสำคัญ

\pi (x_{k}^{(i)}|x_{0:k-1}^{(i)},y_{0:k})=p(x_{k}^{(i)}|x_{k-1}^{(i)}),

ซึ่งสามารถลดรูปได้ดังนี้:

{\hat {w}}_{k}^{(i)}=w_{k-1}^{(i)}p(y_{k}|x_{k}^{(i)}),

3) สำหรับการคำนวณค่าน้ำหนักความสำคัญแบบนอร์มาไลซ์:

i=1,\cdots ,N

w_{k}^{(i)}={\frac {{\hat {w}}_{k}^{(i)}}{\sum _{j=1}^{N}{\hat {w}}_{k}^{(j)}}}

4) คำนวณค่าประมาณของจำนวนอนุภาคที่มีประสิทธิภาพดังนี้

{\hat {N}}_{\mathit {eff}}={\frac {1}{\sum _{i=1}^{N}\left(w_{k}^{(i)}\right)^{2}}}

เกณฑ์นี้สะท้อนถึงความแปรปรวนของน้ำหนัก เกณฑ์อื่นๆ สามารถพบได้ในบทความ^{[ 6 ]}รวมถึงการวิเคราะห์อย่างเข้มงวดและทฤษฎีบทขีดจำกัดกลาง

5) หากจำนวนอนุภาคที่มีประสิทธิภาพน้อยกว่าเกณฑ์ที่กำหนดให้ทำการสุ่มตัวอย่างใหม่:

{\hat {N}}_{\mathit {eff}}<N_{thr}

ก) สุ่มเลือก อนุภาค Nตัวจากชุดอนุภาคปัจจุบัน โดยให้ความน่าจะเป็นแปรผันตามน้ำหนักของอนุภาคแต่ละตัว จากนั้นแทนที่ชุดอนุภาคปัจจุบันด้วยชุดอนุภาคใหม่นี้

ข) สำหรับชุด

i=1,\cdots ,N

w_{k}^{(i)}=1/N.

คำว่า "การสุ่มตัวอย่างแบบสำคัญ" (Sampling Importance Resampling) บางครั้งก็ถูกนำมาใช้เมื่อกล่าวถึงตัวกรอง SIR แต่คำว่าImportance Resamplingนั้นแม่นยำกว่า เพราะคำว่า "resampling" หมายความว่าการสุ่มตัวอย่างเริ่มต้นได้ดำเนินการไปแล้ว^{[ 72 ]}

การสุ่มตัวอย่างความสำคัญตามลำดับ (SIS)

การสุ่มตัวอย่างแบบสำคัญตามลำดับ (Sequential Importance Sampling: SIS) นั้นเหมือนกับอัลกอริธึม SIR แต่ไม่มีขั้นตอนการสุ่มตัวอย่างซ้ำ เวอร์ชันนี้มักแสดงปัญหาการยุบตัวของน้ำหนักอนุภาค ซึ่งความน่าจะเป็นทั้งหมดจะกระจุกตัวอยู่ที่อนุภาคหนึ่งหรือสองตัว และน้ำหนักของอนุภาคที่เหลือจะสอดคล้องกับความน่าจะเป็นที่น้อยมาก การเพิ่มขั้นตอนการสุ่มตัวอย่างซ้ำจะช่วยลดปัญหานี้ได้

อัลกอริทึม "เวอร์ชันโดยตรง"

อัลกอริทึม "เวอร์ชันโดยตรง" นั้นค่อนข้างง่าย (เมื่อเทียบกับอัลกอริทึมการกรองอนุภาคอื่นๆ) และใช้การประกอบและการปฏิเสธ เพื่อสร้างตัวอย่างเดียวxที่kจาก: $p_{x_{k}|y_{1:k}}(x|y_{1:k})$

1) ตั้งค่าn = 0 (ซึ่งจะนับจำนวนอนุภาคที่สร้างขึ้นจนถึงปัจจุบัน)

2) เลือกดัชนี i จากช่วงอย่างสม่ำเสมอ

\{1,...,N\}

3) สร้างชุดทดสอบจากชุดการแจกแจงด้วย

{\hat {x}}

p(x_{k}|x_{k-1})

x_{k-1}=x_{k-1|k-1}^{(i)}

4) สร้างความน่าจะเป็นของการใช้ค่าที่ วัด ได้

{\hat {y}}

{\hat {x}}

p(y_{k}|x_{k}),~{\mbox{with}}~x_{k}={\hat {x}}

y_{k}

5) สร้าง ค่า u ที่เป็นเอกรูป อีกค่าหนึ่งจาก ตำแหน่งใด

[0,m_{k}]

m_{k}=\sup _{x_{k}}p(y_{k}|x_{k})

6) เปรียบเทียบ u และ

p\left({\hat {y}}\right)

6a) ถ้า u มีค่ามากกว่า ให้ทำซ้ำตั้งแต่ขั้นตอนที่ 2

6b) ถ้า u มีค่าน้อยกว่า ให้บันทึกเป็นค่าเดิมและเพิ่มค่า n ขึ้นหนึ่ง

{\hat {x}}

x_{k|k}^{(i)}

7) ถ้าn == Nให้หยุด

เป้าหมายคือการสร้าง "อนุภาค" จำนวน P ที่ตำแหน่งk โดย ใช้เฉพาะอนุภาคจาก เท่านั้นซึ่งจำเป็นต้องเขียน (และคำนวณ) สมการมาร์คอฟเพื่อสร้างโดยอาศัย เพียงอย่างเดียวอัลกอริทึมนี้ใช้การประกอบกันของอนุภาค P จากเพื่อสร้างอนุภาคที่ตำแหน่งkและทำซ้ำ (ขั้นตอนที่ 2–6) จนกว่าจะสร้างอนุภาค P ที่ตำแหน่งk ได้ ครบ $k-1$ $x_{k}$ $x_{k-1}$ $k-1$

สามารถมองเห็นภาพได้ชัดเจนยิ่งขึ้นหากมองx เป็นอาร์เรย์สองมิติ มิติหนึ่งคือ kและอีกมิติหนึ่งคือหมายเลขอนุภาค ตัวอย่างเช่นจะเป็นอนุภาคที่ i ที่^และสามารถเขียนได้เป็น(ดังที่แสดงไว้ในขั้นตอนวิธีข้างต้น) ขั้นตอนที่ 3 สร้างศักยภาพโดยอิงจากอนุภาคที่เลือกแบบสุ่ม ( ) ที่เวลาและปฏิเสธหรือยอมรับในขั้นตอนที่ 6 กล่าวอีกนัยหนึ่งคือค่าต่างๆ ถูกสร้างขึ้นโดยใช้ ที่สร้างขึ้นก่อนหน้านี้ $x(k,i)$ $k$ $x_{k}^{(i)}$ $x_{k}$ $x_{k-1}^{(i)}$ $k-1$ $x_{k}$ $x_{k-1}$

แอปพลิเคชัน

ตัวกรองอนุภาคและระเบียบวิธีอนุภาคของ Feynman-Kac มีการประยุกต์ใช้ในหลายบริบท ในฐานะวิธีการที่มีประสิทธิภาพในการจัดการกับการสังเกตการณ์ที่มีสัญญาณรบกวนหรือความไม่เป็นเชิงเส้นที่รุนแรง เช่น:

การอนุมานแบบเบย์เซียนการเรียนรู้ของเครื่องจักร การวิเคราะห์ความเสี่ยง และการสุ่มตัวอย่างเหตุการณ์หายาก
ชีวสารสนเทศ^{[ 19 ]}
วิทยาศาสตร์การคำนวณ
เศรษฐศาสตร์คณิตศาสตร์การเงินและคณิตศาสตร์การเงิน : ตัวกรองอนุภาคสามารถทำการจำลองที่จำเป็นในการคำนวณปริพันธ์มิติสูงและ/หรือซับซ้อนที่เกี่ยวข้องกับปัญหาต่างๆ เช่น แบบจำลองสมดุลทั่วไปแบบสุ่มไดนามิกในเศรษฐศาสตร์มหภาคและการกำหนดราคาออปชั่น^{[ 73 ]}
วิศวกรรม
ระบาดวิทยาของโรคติดเชื้อซึ่งได้นำไปประยุกต์ใช้กับปัญหาการพยากรณ์การระบาดหลายประการ เช่น การทำนายการระบาดของไข้หวัดใหญ่ตามฤดูกาล^{[ 74 ]}
การตรวจจับและแยกความผิดพลาด : ในแผนผังแบบอิงผู้สังเกตการณ์ ตัวกรองอนุภาคสามารถคาดการณ์เอาต์พุตเซ็นเซอร์ที่คาดหวังได้ ทำให้สามารถแยกความผิดพลาดได้^{[ 75 ]}^{[ 76 ]}^{[ 77 ]}
เคมีโมเลกุลและฟิสิกส์เชิงคำนวณ
เภสัชจลนศาสตร์^{[ 78 ]}
วิวัฒนาการทางสายพันธุ์
หุ่นยนต์ปัญญาประดิษฐ์ : การระบุตำแหน่งแบบมอนเตคาร์โลถือเป็นมาตรฐานโดยพฤตินัยในการระบุตำแหน่งหุ่นยนต์เคลื่อนที่^{[ 79 ]}^{[ 80 ]}^{[ 81 ]}
การประมวลผลสัญญาณและภาพ : การระบุตำแหน่งภาพ การติดตามการจดจำคุณลักษณะ^{[ 82 ]}

ตัวกรองอนุภาคชนิดอื่นๆ

ตัวกรองอนุภาคเสริม^{[ 83 ]}
ตัวกรองอนุภาคอ้างอิงต้นทุน
ตัวกรองอนุภาคธรรมชาติแบบเอกซ์โพเนนเชียล^{[ 84 ]}
ระเบียบวิธีอนุภาค Feynman-Kac และสนามเฉลี่ย^{[ 2 ]}^{[ 10 ]}^{[ 5 ]}
ตัวกรองอนุภาคเกาส์เซียน
ตัวกรองอนุภาคเกาส์-เฮอร์ไมต์
ตัวกรองอนุภาคแบบลำดับชั้น/ปรับขนาดได้^{[ 85 ]}
ตัวกรองอนุภาคแบบขยับ^{[ 86 ]}
Particle Markov-Chain Monte-Carlo ดูตัวอย่างเช่นอัลกอริทึม pseudo-marginal Metropolis– Hastings
ตัวกรองอนุภาค Rao–Blackwellized ^{[ 53 ]}
ตัวกรองอนุภาคเสริมแบบปกติ^{[ 87 ]}
ตัวกรองอนุภาคที่เหมาะสมที่สุดตามการสุ่มตัวอย่างแบบปฏิเสธ^{[ 88 ]}^{[ 89 ]}
ตัวกรองอนุภาคไร้กลิ่น
ตัวปรับเรียบอนุภาคออนไลน์^{[ 70 ]}

ดูเพิ่มเติม

บรรณานุกรม

Del Moral, Pierre (1996). "การกรองแบบไม่เชิงเส้น: วิธีแก้ปัญหาอนุภาคที่มีปฏิสัมพันธ์" (PDF)กระบวนการมาร์คอฟและสาขาที่เกี่ยวข้อง 2 ( 4): 555– 580. เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 2016-03-04 สืบค้นเมื่อ2015-05-31
เดล โมราล, ปิแอร์ (2004). สูตรเฟย์นแมน-แคค การประมาณเชิงลำดับวงศ์และอนุภาคที่มีปฏิสัมพันธ์สปริงเกอร์ หน้า 575 "ชุด: ความน่าจะเป็นและการประยุกต์ใช้"
เดล โมราล, ปิแอร์ (2013). การจำลองสนามเฉลี่ยสำหรับการบูรณาการมอนเตคาร์โล .แชปแมน แอนด์ ฮอลล์/ซีอาร์ซี เพรส. หน้า 626. "เอกสารทางวิชาการเกี่ยวกับสถิติและความน่าจะเป็นประยุกต์"
Cappe, O.; Moulines, E.; Ryden, T. (2005). การอนุมานในแบบจำลองมาร์คอฟที่ซ่อนอยู่ Springer.
Liu, JS (2001). กลยุทธ์มอนเตคาร์โลในการคำนวณทางวิทยาศาสตร์ . Springer.
Kong, A.; Liu, JS; Wong, WH (1994). "การเติมข้อมูลตามลำดับและปัญหาข้อมูลที่หายไปแบบเบย์เซียน" (PDF)วารสารสมาคมสถิติอเมริกัน 89 ( 425): 278– 288. doi : 10.1080/01621459.1994.10476469 .
Liu, JS; Chen, R. (1995). "การแยกส่วนแบบตาบอดผ่านการเติมข้อมูลตามลำดับ" (PDF)วารสารสมาคมสถิติอเมริกัน 90 ( 430): 567– 576. doi : 10.2307/2291068 . JSTOR 2291068 .
Ristic, B.; Arulampalam, S.; Gordon, N. (2004). นอกเหนือจากตัวกรอง Kalman: ตัวกรองอนุภาคสำหรับการใช้งานติดตาม Artech House.
Doucet, A.; Johansen, AM (ธันวาคม 2008). "คู่มือการกรองอนุภาคและการปรับให้เรียบ: สิบห้าปีต่อมา" (PDF) . รายงานทางเทคนิค .
Doucet, A.; Godsill, S.; Andrieu, C. (2000). "เกี่ยวกับวิธีการสุ่มตัวอย่างแบบมอนเตคาร์โลตามลำดับสำหรับการกรองแบบเบย์เซียน" สถิติและการคำนวณ 10 ( 3): 197– 208. doi : 10.1023/A:1008935410038 . S2CID 16288401 .
Arulampalam, MS; Maskell, S.; Gordon, N.; Clapp, T. (2002). "บทช่วยสอนเกี่ยวกับตัวกรองอนุภาคสำหรับการติดตามแบบเบย์เซียนที่ไม่เป็นเชิงเส้น/ไม่เป็นเกาส์เซียนแบบออนไลน์" IEEE Transactions on Signal Processing . 50 (2): 174– 188. Bibcode : 2002ITSP...50..174A . CiteSeerX 10.1.1.471.8617 . doi : 10.1109/78.978374 . S2CID 55577025 .
Cappe, O.; Godsill, S.; Moulines, E. (2007). "ภาพรวมของวิธีการที่มีอยู่และความก้าวหน้าล่าสุดใน Monte Carlo แบบลำดับ" Proceedings of the IEEE . 95 (5): 899– 924. Bibcode : 2007IEEEP..95..899C . doi : 10.1109/JPROC.2007.893250 . S2CID 3081664 .
Kitagawa, G. (1996). "ตัวกรอง Monte Carlo และตัวปรับเรียบสำหรับแบบจำลองปริภูมิสถานะไม่เชิงเส้นที่ไม่ใช่แบบเกาส์เซียน" วารสารสถิติเชิงคำนวณและกราฟิก 5 ( 1): 1– 25. doi : 10.2307/1390750 . JSTOR 1390750 .
Kotecha, JH; Djuric, P. (2003). "การกรองอนุภาคเกาส์เซียน". IEEE Transactions on Signal Processing . 51 (10): 2592. Bibcode : 2003ITSP...51.2592K . doi : 10.1109/TSP.2003.816758 .
Haug, AJ (2005). "คู่มือการประมาณค่าแบบเบย์เซียนและเทคนิคการติดตามที่ใช้ได้กับกระบวนการที่ไม่เป็นเชิงเส้นและไม่เป็นแบบเกาส์เซียน" (PDF) . บริษัท MITRE ประเทศสหรัฐอเมริกา รายงานทางเทคนิค กุมภาพันธ์ . เก็บถาวร(PDF)จากต้นฉบับเมื่อวันที่ 22 ธันวาคม 2021 . สืบค้นเมื่อ 22 ธันวาคม 2021 .
Pitt, MK; Shephard, N. (1999). "การกรองผ่านการจำลอง: ตัวกรองอนุภาคเสริม"วารสาร สมาคม สถิติอเมริกัน94 (446): 590– 591. doi : 10.2307/2670179 . JSTOR 2670179 . เก็บถาวรจากต้นฉบับเมื่อ 2007-10-16 . สืบค้นเมื่อ2008-05-06 .
Gordon, NJ; Salmond, DJ; Smith, AFM (1993). "แนวทางใหม่ในการประมาณค่าสถานะแบบเบย์เซียนที่ไม่เป็นเชิงเส้น/ไม่เป็นเกาส์เซียน" IEE Proceedings F - Radar and Signal Processing . 140 (2): 107– 113. doi : 10.1049/ip-f-2.1993.0015 .
Vaswani, N. ; Rathi, Y.; Yezzi, A.; Tannenbaum, A. (2007). "การติดตามวัตถุที่เปลี่ยนรูปโดยใช้การกรองอนุภาคสำหรับเส้นขอบที่ใช้งานอยู่ทางเรขาคณิต" . IEEE Transactions on Pattern Analysis and Machine Intelligence . 29 (8): 1470– 1475. Bibcode : 2007ITPAM..29.1470R . doi : 10.1109/tpami.2007.1081 . PMC 3663080 . PMID 17568149 .

ลิงก์ภายนอก

แบบจำลอง Feynman–Kac และอัลกอริทึมอนุภาคปฏิสัมพันธ์ (หรือที่เรียกว่า การกรองอนุภาค)แง่มุมทางทฤษฎีและรายการโดเมนการประยุกต์ใช้ของตัวกรองอนุภาค
หน้าหลัก ของวิธีการมอนเตคาร์โลแบบลำดับ (การกรองอนุภาค)บนเว็บไซต์มหาวิทยาลัยเคมบริดจ์
แอนิเมชั่น MCL ของ Dieter Fox
ซอฟต์แวร์ฟรีของ Rob Hess
SMCTC: คลาสแม่แบบสำหรับใช้งานอัลกอริธึม SMC ในภาษา C++
แอปเพล็ต Java เกี่ยวกับการกรองอนุภาค
vSMC: Vectorized Sequential Monte Carlo
คำอธิบายเกี่ยวกับตัวกรองอนุภาคในบริบทของรถยนต์ขับเคลื่อนอัตโนมัติ

[ 1 ]

[ 2 ]

[ 3 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[

[

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

33 ] แต่ขั้นตอนวิธี อนุภาค

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

[ 44 ]

46 ] [

47 ] รวม

[ 49 ]

[ 50 ]

[ 53 ]

[ 56 ]

[ 57 ]

[ 58 ]

[ 59 ]

[ 60 ]

[ 61 ]

[ 62 ]

[ 63 ]

[ 64 ]

[

[

[

[ 68 ]

[ 69 ]

[ 71 ]

[ 72 ]

[ 73 ]

[ 74 ]

[ 75 ]

[ 76 ]

[ 77 ]

[ 78 ]

[ 79 ]

[ 80 ]

[ 81 ]

[ 82 ]

[ 83 ]

[ 84 ]

[ 85 ]

[ 86 ]

[ 87 ]

[ 88 ]

[ 89 ]

ตัวกรองอนุภาค

ประวัติศาสตร์

อัลกอริทึมแบบฮิวริสติก

พื้นฐานทางคณิตศาสตร์

ปัญหาการกรอง

วัตถุประสงค์

แบบจำลองการสังเกตสัญญาณ

แบบจำลองการคำนวณแบบเบย์เซียนโดยประมาณ

สมการการกรองแบบไม่เชิงเส้น

สูตรของเฟย์นแมน-แคค

ตัวกรองอนุภาค

อัลกอริทึมอนุภาคประเภทพันธุกรรม

หลักการมอนเตคาร์โล

การจำลองอนุภาคแบบสนามเฉลี่ย

หลักการความน่าจะเป็นทั่วไป

การตีความสมการการกรองในเชิงอนุภาค

ผลลัพธ์การบรรจบกันบางประการ

แผนผังลำดับวงศ์ตระกูลและคุณสมบัติของความเป็นกลาง

การปรับเรียบอนุภาคตามแผนผังลำดับวงศ์ตระกูล

การประมาณค่าฟังก์ชันความน่าจะเป็นของอนุภาคที่ไม่ลำเอียง

ตัวปรับเรียบอนุภาคแบบย้อนกลับ

ผลลัพธ์การบรรจบกันบางประการ

การสุ่มตัวอย่างซ้ำเชิงความสำคัญแบบลำดับ (Sequential Importance Resampling: SIR)

ตัวกรองมอนเตคาร์โลและตัวกรองบูตสแตรป

การสุ่มตัวอย่างความสำคัญตามลำดับ (SIS)

อัลกอริทึม "เวอร์ชันโดยตรง"

แอปพลิเคชัน

ตัวกรองอนุภาคชนิดอื่นๆ

ดูเพิ่มเติม

บรรณานุกรม

ลิงก์ภายนอก

ข้อมูลสำคัญจากบทความ