ตัวกรองคาลมาน

Q: ประวัติศาสตร์

วิธีการกรองนี้ตั้งชื่อตาม Rudolf E. Kálmán ผู้ลี้ภัย ชาวฮังการี แม้ว่า Thorvald Nicolai Thiele [ 12 ] [ 13 ] และ Peter Swerling จะพัฒนาอัลกอริทึมที่คล้ายกันมาก่อนแล้วก็ตาม Richard S.

ในสถิติและทฤษฎีการควบคุมการกรอง Kalman (หรือที่รู้จักกันในชื่อการประมาณเชิงเส้นกำลังสอง ) เป็นอัลกอริทึมที่ใช้ชุดการวัดที่สังเกตได้ในช่วงเวลาหนึ่ง รวมถึงสัญญาณรบกวนทางสถิติและความไม่แม่นยำอื่นๆ เพื่อสร้างการประมาณค่าของตัวแปรที่ไม่ทราบค่าซึ่งมีแนวโน้มที่จะแม่นยำกว่าการประมาณค่าที่ได้จากการวัดเพียงครั้งเดียว โดยการประมาณการกระจายความน่าจะเป็นร่วมกันของตัวแปรสำหรับแต่ละขั้นตอนเวลา ตัวกรองถูกสร้างขึ้นเป็น ตัวลด ค่าความคลาดเคลื่อนกำลังสองเฉลี่ยให้เหลือน้อยที่สุดแต่ยังมีวิธีการสร้างตัวกรองแบบอื่นที่แสดงให้เห็นว่าตัวกรองมีความสัมพันธ์กับสถิติความน่าจะเป็นสูงสุดอย่างไร^{[ 1 ]}ตัวกรองนี้ตั้งชื่อตามRudolf E. Kálmán

การกรอง Kalman มีการใช้งานทางเทคโนโลยีมากมาย การใช้งานทั่วไปอย่างหนึ่งคือการนำทาง การกำหนดตำแหน่ง และการควบคุมยานพาหนะ โดยเฉพาะอย่างยิ่งเครื่องบิน ยานอวกาศ และเรือที่วางตำแหน่งแบบไดนามิก [ ^{2 ] นอกจาก}นี้ การกรอง Kalman ยังถูกนำไปใช้อย่างมากใน งานวิเคราะห์ อนุกรมเวลาเช่นการประมวลผลสัญญาณและเศรษฐศาสตร์การกรอง Kalman ยังมีความสำคัญต่อ การวางแผน และการควบคุมการเคลื่อนที่ ของหุ่นยนต์ ^{[ 3 ]}^{[ 4 ]}และสามารถใช้สำหรับการเพิ่มประสิทธิภาพวิถีการเคลื่อนที่ [ ^{5 ] การ}กรอง Kalman ยังทำงานสำหรับการสร้างแบบจำลอง การควบคุมการเคลื่อนไหวของ ระบบประสาทส่วนกลางเนื่องจากความล่าช้าของเวลาระหว่างการออกคำสั่งมอเตอร์และการรับข้อมูลป้อนกลับทางประสาทสัมผัสการใช้ตัวกรอง Kalman จึงให้แบบจำลองที่สมจริงสำหรับการประมาณสถานะปัจจุบันของระบบมอเตอร์และการออกคำสั่งที่อัปเดต^{[ 6 ]}

อัลกอริทึมทำงานผ่านกระบวนการสองขั้นตอน ได้แก่ขั้นตอนการทำนายและขั้นตอนการปรับปรุงในขั้นตอนการทำนาย ตัวกรอง Kalman จะสร้างค่าประมาณของตัวแปรสถานะ ปัจจุบัน รวมถึงความไม่แน่นอนของตัวแปรเหล่านั้น เมื่อได้ผลลัพธ์จากการวัดครั้งต่อไป (ซึ่งอาจมีข้อผิดพลาดอยู่บ้าง รวมถึงสัญญาณรบกวนแบบสุ่ม) ค่าประมาณเหล่านี้จะได้รับการปรับปรุงโดยใช้ค่าเฉลี่ยถ่วงน้ำหนักโดยให้น้ำหนักมากขึ้นกับค่าประมาณที่มีความแน่นอนสูงกว่า อัลกอริทึมนี้เป็นแบบเรียกซ้ำสามารถทำงานได้แบบเรียลไทม์โดยใช้เพียงการวัดค่าปัจจุบันและสถานะที่คำนวณไว้ก่อนหน้านี้และเมทริกซ์ความไม่แน่นอนเท่านั้น ไม่จำเป็นต้องใช้ข้อมูลในอดีตเพิ่มเติม

ความเหมาะสมที่สุดของการกรอง Kalman ถือว่าข้อผิดพลาดมี การกระจาย แบบปกติ (Gaussian)ตามคำกล่าวของRudolf E. Kálmán “สมมติฐานต่อไปนี้ถูกนำมาใช้เกี่ยวกับกระบวนการสุ่ม: ปรากฏการณ์สุ่มทางกายภาพอาจถือได้ว่าเกิดจากแหล่งกำเนิดสุ่มหลักที่กระตุ้นระบบไดนามิก แหล่งกำเนิดหลักถือว่าเป็นกระบวนการสุ่มแบบ Gaussian ที่เป็นอิสระโดยมีค่าเฉลี่ยเป็นศูนย์ ระบบไดนามิกจะเป็นเชิงเส้น” ^{[ 7 ]}อย่างไรก็ตาม ไม่ว่าจะเป็นแบบ Gaussian หรือไม่ก็ตาม หากทราบความแปรปรวนร่วมของกระบวนการและการวัด ตัวกรอง Kalman ก็เป็น ตัวประมาณ เชิงเส้น ที่ดีที่สุดเท่าที่จะเป็นไป ^ได้ในแง่ของข้อผิดพลาดกำลังสองเฉลี่ยต่ำสุด [ ⁸^]แม้ว่าอาจมีตัวประมาณแบบไม่เชิงเส้นที่ดีกว่าก็ตาม เป็นความเข้าใจผิดทั่วไป (ที่แพร่หลายในวรรณกรรม) ว่าตัวกรอง Kalman ไม่สามารถนำไปใช้ได้อย่างเคร่งครัดเว้นแต่จะถือว่ากระบวนการเสียงรบกวนทั้งหมดเป็นแบบ Gaussian ^[⁹^]

ส่วนขยายและการวางนัยทั่วไปของวิธีการนี้ได้รับการพัฒนาขึ้นเช่นกัน เช่นตัวกรอง Kalman แบบขยายและตัวกรอง Kalman แบบไม่ระบุทิศทางซึ่งทำงานบนระบบที่ไม่เป็นเชิงเส้นพื้นฐานคือแบบจำลอง Markov ที่ซ่อนอยู่โดยที่ปริภูมิสถานะของตัวแปรแฝงมีความต่อเนื่องและตัวแปรแฝงและตัวแปรที่สังเกตได้ทั้งหมดมีการกระจายแบบเกาส์เซียน การกรอง Kalman ถูกนำมาใช้ประสบความสำเร็จใน การรวม ^{ข้อมูล}จากเซ็นเซอร์หลายตัว [ ¹⁰^]และเครือข่ายเซ็นเซอร์ แบบกระจายเพื่อพัฒนาการ กรอง Kalman แบบกระจายหรือแบบฉันทามติ^[¹¹^]

ประวัติศาสตร์

วิธีการกรองนี้ตั้งชื่อตามRudolf E. Kálmán ผู้ลี้ภัย ชาวฮังการี แม้ว่าThorvald Nicolai Thiele ^[¹²^]^[¹³^]และPeter Swerlingจะพัฒนาอัลกอริทึมที่คล้ายกันมาก่อนแล้วก็ตาม Richard S. Bucy จากห้องปฏิบัติการฟิสิกส์ประยุกต์ของ Johns Hopkinsมีส่วนร่วมในทฤษฎี ทำให้บางครั้งเรียกวิธีการนี้ว่าการกรอง Kalman–Bucy Kalman ได้รับแรงบันดาลใจในการสร้างตัวกรอง Kalman โดยการใช้ตัวแปรสถานะกับปัญหาการกรอง Wiener ^[¹⁴^] โดยทั่วไปแล้ว Stanley F. Schmidtได้รับการยกย่องว่าเป็นผู้พัฒนาการใช้งานตัวกรอง Kalman ครั้งแรก เขาตระหนักว่าตัวกรองสามารถแบ่งออกเป็นสองส่วนที่แตกต่างกัน โดยส่วนหนึ่งสำหรับช่วงเวลาระหว่างเอาต์พุตของเซ็นเซอร์ และอีกส่วนหนึ่งสำหรับการรวมการวัด^[¹⁵^]ในระหว่างที่ Kálmán มาเยือนศูนย์วิจัย NASA Ames Schmidt ได้เห็นถึงการประยุกต์ใช้แนวคิดของ Kálmán กับปัญหาการประมาณวิถีโคจรแบบไม่เชิงเส้นสำหรับโครงการ Apolloซึ่งส่งผลให้มีการนำไปรวมไว้ในคอมพิวเตอร์นำทาง Apollo ^[¹⁶^]^{: 16}

ตัวกรองดิจิทัลนี้บางครั้งเรียกว่าตัวกรอง Stratonovich–Kalman–Bucyเนื่องจากเป็นกรณีพิเศษของตัวกรองแบบไม่เชิงเส้นทั่วไปที่พัฒนาโดยนักคณิตศาสตร์ชาวโซเวียต Ruslan Stratonovich [ ¹⁷^]^[¹⁸^]^[¹⁹^]^[²⁰^]^อันที่จริง สมการบางส่วนของตัวกรองเชิงเส้นกรณีพิเศษปรากฏในเอกสารของ Stratonovich ที่ตีพิมพ์ก่อนฤดูร้อนปี 1961 เมื่อ Kalman พบกับ Stratonovich ระหว่างการประชุมในมอสโก^[²¹^]

การกรองแบบ Kalman นี้ได้รับการอธิบายและพัฒนาบางส่วนเป็นครั้งแรกในเอกสารทางเทคนิคโดย Swerling (1958), Kalman (1960) และ Kalman และ Bucy (1961)

คอมพิวเตอร์ Apollo ใช้ RAM แบบแกนแม่เหล็กขนาด 2k และสายเคเบิลลวดขนาด 36k [...] ซีพียูสร้างขึ้นจากวงจรรวม [...] ความเร็วสัญญาณนาฬิกาต่ำกว่า 100 kHz [...] ความจริงที่ว่าวิศวกรของ MIT สามารถบรรจุซอฟต์แวร์ที่ดีเช่นนี้ (หนึ่งในแอปพลิเคชันแรกๆ ของตัวกรอง Kalman) ลงในคอมพิวเตอร์ขนาดเล็กเช่นนี้ได้นั้นเป็นสิ่งที่น่าทึ่งอย่างแท้จริง

— บทสัมภาษณ์ Jack Crenshaw โดย Matthew Reed, TRS-80.org (2009) [1]

ตัวกรอง Kalman มีบทบาทสำคัญในการนำระบบนำทางของเรือดำน้ำขีปนาวุธนิวเคลียร์ ของ กองทัพเรือสหรัฐฯมาใช้ และในระบบนำทางของขีปนาวุธร่อน เช่นขีปนาวุธ Tomahawk ของกองทัพเรือสหรัฐฯ และขีปนาวุธร่อนปล่อยจากอากาศของกองทัพอากาศสหรัฐฯนอกจากนี้ยังใช้ในระบบนำทางของยานปล่อยที่สามารถนำกลับมาใช้ใหม่ได้^และระบบควบคุมทิศทางและการนำทางของยานอวกาศที่เทียบท่าที่สถานีอวกาศนานาชาติ [ ²²^]

ภาพรวมของการคำนวณ

การกรองแบบ Kalman ใช้แบบจำลองพลวัตของระบบ (เช่น กฎการเคลื่อนที่ทางฟิสิกส์) อินพุตควบคุมที่ทราบของระบบนั้น และการวัดหลายครั้งต่อเนื่องกัน (เช่น จากเซ็นเซอร์) เพื่อสร้างค่าประมาณของปริมาณที่เปลี่ยนแปลงของระบบ ( สถานะ ของระบบ ) ซึ่งดีกว่าค่าประมาณที่ได้จากการใช้การวัดเพียงครั้งเดียว ดังนั้นจึงเป็นอัลกอริธึม การรวมข้อมูลจากเซ็นเซอร์และการรวมข้อมูล ที่ใช้กันทั่วไป

ข้อมูลเซ็นเซอร์ที่มีสัญญาณรบกวน การประมาณค่าในสมการที่อธิบายวิวัฒนาการของระบบ และปัจจัยภายนอกที่ไม่ได้นำมาพิจารณา ล้วนจำกัดความสามารถในการกำหนดสถานะของระบบได้อย่างแม่นยำ ตัวกรอง Kalman สามารถจัดการกับความไม่แน่นอนที่เกิดจากข้อมูลเซ็นเซอร์ที่มีสัญญาณรบกวนได้อย่างมีประสิทธิภาพ และในระดับหนึ่งก็จัดการกับปัจจัยภายนอกแบบสุ่มได้ด้วย ตัวกรอง Kalman สร้างค่าประมาณสถานะของระบบโดยเฉลี่ยจากสถานะที่คาดการณ์ไว้ของระบบและจากการวัดใหม่โดยใช้ค่าเฉลี่ยถ่วงน้ำหนักจุดประสงค์ของน้ำหนักคือการ "เชื่อถือ" ค่าที่มีความไม่แน่นอนที่คาดการณ์ได้ดีกว่า (เช่น น้อยกว่า) มากกว่า น้ำหนักคำนวณจากค่าความแปรปรวนร่วมซึ่งเป็นตัววัดความไม่แน่นอนที่คาดการณ์ไว้ของการคาดการณ์สถานะของระบบ ผลลัพธ์ของค่าเฉลี่ยถ่วงน้ำหนักคือค่าประมาณสถานะใหม่ที่อยู่ระหว่างสถานะที่คาดการณ์และสถานะที่วัดได้ และมีความไม่แน่นอนที่คาดการณ์ได้ดีกว่าค่าใดค่าหนึ่งเพียงอย่างเดียว กระบวนการนี้จะทำซ้ำในทุกขั้นตอนเวลา โดยค่าประมาณใหม่และค่าความแปรปรวนร่วมจะใช้ในการคาดการณ์ในรอบถัดไป นั่นหมายความว่าตัวกรอง Kalman ทำงานแบบเรียกซ้ำและต้องการเพียง "การคาดเดาที่ดีที่สุด" ครั้งล่าสุดเท่านั้น ไม่จำเป็นต้องใช้ประวัติทั้งหมดของสถานะของระบบ เพื่อคำนวณสถานะใหม่

การจัดระดับความแน่นอนของการวัดและการประมาณสถานะปัจจุบันเป็นสิ่งสำคัญที่ต้องพิจารณา โดยทั่วไปแล้วจะมีการอธิบายการตอบสนองของตัวกรองในแง่ของค่าเกน ของตัวกรอง Kalman ค่าเกนของ Kalman คือน้ำหนักที่ให้กับการวัดและการประมาณสถานะปัจจุบัน และสามารถ "ปรับแต่ง" เพื่อให้ได้ประสิทธิภาพที่ต้องการได้ หากค่าเกนสูง ตัวกรองจะให้น้ำหนักกับการวัดล่าสุดมากกว่า และปรับตัวให้เข้ากับการวัดเหล่านั้นได้รวดเร็วยิ่งขึ้น ในทางกลับกัน หากค่าเกนต่ำ ตัวกรองจะปรับตัวให้เข้ากับการคาดการณ์ของแบบจำลองได้ใกล้เคียงมากขึ้น ในกรณีสุดขั้ว ค่าเกนสูง (ใกล้หนึ่ง) จะทำให้วิถีการประมาณค่ากระโดดไปมา ในขณะที่ค่าเกนต่ำ (ใกล้ศูนย์) จะช่วยลดสัญญาณรบกวนแต่ลดการตอบสนองลง

เมื่อทำการคำนวณจริงสำหรับตัวกรอง (ดังที่กล่าวไว้ด้านล่าง) ค่าประมาณสถานะและความแปรปรวนร่วมจะถูกเข้ารหัสเป็นเมทริกซ์เนื่องจากมีมิติหลายมิติที่เกี่ยวข้องในชุดการคำนวณเดียว วิธีนี้ช่วยให้สามารถแสดงความสัมพันธ์เชิงเส้นระหว่างตัวแปรสถานะต่างๆ (เช่น ตำแหน่ง ความเร็ว และความเร่ง) ในแบบจำลองการเปลี่ยนสถานะหรือความแปรปรวนร่วมใดๆ ก็ได้

ตัวอย่างการใช้งาน

ตัวอย่างการประยุกต์ใช้ ลองพิจารณาปัญหาการกำหนดตำแหน่งที่แม่นยำของรถบรรทุก รถบรรทุกอาจติดตั้ง อุปกรณ์ GPSที่ให้ค่าประมาณตำแหน่งภายในไม่กี่เมตร ค่าประมาณจาก GPS มักจะมีสัญญาณรบกวนสูง ค่าที่อ่านได้จะ "กระโดดไปมา" อย่างรวดเร็ว แม้ว่าจะยังคงอยู่ในช่วงไม่กี่เมตรจากตำแหน่งจริงก็ตาม นอกจากนี้ เนื่องจากคาดว่ารถบรรทุกจะปฏิบัติตามกฎทางฟิสิกส์ ตำแหน่งของรถบรรทุกจึงสามารถประมาณได้โดยการอินทิเกรตความเร็วของรถบรรทุกเมื่อเวลาผ่านไป ซึ่งกำหนดโดยการติดตามการหมุนของล้อและมุมของพวงมาลัย นี่คือเทคนิคที่เรียกว่าการคำนวณตำแหน่งโดยประมาณ (dead reckoning ) โดยทั่วไปแล้ว การคำนวณตำแหน่งโดยประมาณจะให้ค่าประมาณตำแหน่งของรถบรรทุกที่ราบเรียบมาก แต่จะคลาดเคลื่อนไปตามเวลาเนื่องจากข้อผิดพลาดเล็กๆ น้อยๆ สะสมกัน

ในตัวอย่างนี้ ตัวกรอง Kalman สามารถมองได้ว่าทำงานในสองขั้นตอนที่แตกต่างกัน คือ การคาดการณ์และการปรับปรุง ในขั้นตอนการคาดการณ์ ตำแหน่งเดิมของรถบรรทุกจะถูกปรับเปลี่ยนตามกฎการเคลื่อนที่ ทางฟิสิกส์ (แบบจำลองพลวัตหรือ "การเปลี่ยนสถานะ") ไม่เพียงแต่จะคำนวณค่าประมาณตำแหน่งใหม่เท่านั้น แต่ยังคำนวณค่าความแปรปรวนร่วมใหม่ด้วย อาจเป็นไปได้ว่าค่าความแปรปรวนร่วมเป็นสัดส่วนกับความเร็วของรถบรรทุก เนื่องจากเราไม่แน่ใจเกี่ยวกับความแม่นยำของค่าประมาณตำแหน่งจากการคำนวณแบบ Dead Reckoning ที่ความเร็วสูง แต่แน่ใจมากเกี่ยวกับค่าประมาณตำแหน่งที่ความเร็วต่ำ ต่อมา ในขั้นตอนการปรับปรุง จะมีการวัดตำแหน่งของรถบรรทุกจากหน่วย GPS การวัดนี้มาพร้อมกับความไม่แน่นอนบางส่วน และค่าความแปรปรวนร่วมของการวัดนี้เมื่อเทียบกับค่าความแปรปรวนร่วมของการคาดการณ์จากขั้นตอนก่อนหน้าจะเป็นตัวกำหนดว่าการวัดใหม่จะส่งผลต่อการคาดการณ์ที่ปรับปรุงแล้วมากน้อยเพียงใด ในอุดมคติแล้ว เนื่องจากค่าประมาณแบบ Dead Reckoning มีแนวโน้มที่จะคลาดเคลื่อนจากตำแหน่งจริง การวัดจาก GPS ควรดึงค่าประมาณตำแหน่งกลับมาสู่ตำแหน่งจริง แต่ไม่ควรทำให้เกิดความคลาดเคลื่อนจนถึงจุดที่เกิดสัญญาณรบกวนและกระโดดอย่างรวดเร็ว

คำอธิบายทางเทคนิคและบริบท

ตัวกรอง Kalman เป็นตัวกรองแบบวนซ้ำ ที่มีประสิทธิภาพ ในการประมาณสถานะภายในของระบบไดนามิกเชิงเส้นจากชุด การวัด ที่มีสัญญาณรบกวนมีการใช้งานในหลากหลายด้านทางวิศวกรรมและเศรษฐศาสตร์ตั้งแต่เรดาร์และคอมพิวเตอร์วิชั่นไปจนถึงการประมาณแบบจำลองโครงสร้างเศรษฐกิจมหภาค^{[ 23 ]}^{[ 24 ]}และเป็นหัวข้อสำคัญในทฤษฎีการควบคุมและ วิศวกรรม ระบบควบคุมร่วมกับตัวควบคุมเชิงเส้น-กำลังสอง (LQR) ตัวกรอง Kalman สามารถแก้ ปัญหา การควบคุมเชิงเส้น-กำลังสอง-เกาส์เซียน (LQG) ได้ ตัวกรอง Kalman ตัวควบคุมเชิงเส้น-กำลังสอง และตัวควบคุมเชิงเส้น-กำลังสอง-เกาส์เซียน เป็นวิธีแก้ปัญหาที่อาจกล่าวได้ว่าเป็นปัญหาพื้นฐานที่สุดของทฤษฎีการควบคุม

ในแอปพลิเคชันส่วนใหญ่ สถานะภายในมักมีขนาดใหญ่กว่า (มีระดับความเป็นอิสระ มากกว่า ) พารามิเตอร์ "ที่สังเกตได้" เพียงไม่กี่ตัวที่วัดได้ อย่างไรก็ตาม ด้วยการรวมการวัดหลายๆ ครั้ง ตัวกรอง Kalman สามารถประมาณสถานะภายในทั้งหมดได้

สำหรับทฤษฎี Dempster–Shaferนั้น สมการสถานะหรือการสังเกตแต่ละครั้งถือเป็นกรณีพิเศษของฟังก์ชันความเชื่อเชิงเส้นและการกรอง Kalman เป็นกรณีพิเศษของการรวมฟังก์ชันความเชื่อเชิงเส้นบนแผนผังการเชื่อมต่อหรือแผนผัง Markovนอกจากนี้ยังมีวิธีการกรองความเชื่อที่ใช้การปรับปรุงแบบ Bayes หรือแบบอิงหลักฐานกับสมการสถานะ ด้วย

ปัจจุบันมีตัวกรอง Kalman หลากหลายประเภท ได้แก่ สูตรดั้งเดิมของ Kalman ซึ่งปัจจุบันเรียกว่าตัวกรอง Kalman แบบ "ง่าย" ตัวกรองKalman–Bucy ตัวกรองแบบ "ขยาย" ของ Schmidt ตัวกรองข้อมูลและตัวกรองแบบ "รากที่สอง" หลายประเภทที่พัฒนาโดย Bierman, Thornton และคนอื่นๆ อีกมากมาย ตัวกรอง Kalman แบบง่ายที่ใช้กันทั่วไปมากที่สุดอาจเป็นวงจรล็อกเฟส (phase-locked loop ) ซึ่งพบได้ทั่วไปในวิทยุ โดยเฉพาะ วิทยุ แบบปรับความถี่ (FM) โทรทัศน์ เครื่องรับ สัญญาณดาวเทียมระบบสื่อสารในอวกาศ และอุปกรณ์สื่อสาร อิเล็กทรอนิกส์ อื่นๆ เกือบทุกชนิด

แบบจำลองระบบพลวัตพื้นฐาน

การกรองแบบ Kalman นั้นอยู่บนพื้นฐานของระบบ พลวัตเชิงเส้นที่ถูกทำให้เป็นแบบไม่ต่อเนื่องในโดเมนเวลา โดยแบบจำลองจะสร้างขึ้น จาก ห่วงโซ่ Markovที่สร้างขึ้นจากตัวดำเนินการเชิงเส้นที่ถูกรบกวนด้วยข้อผิดพลาด ซึ่งอาจรวมถึงสัญญาณรบกวน แบบ Gaussian สถานะของระบบเป้าหมายหมายถึงการกำหนดค่าระบบที่แท้จริง (แต่ซ่อนอยู่) ซึ่งแสดงเป็นเวกเตอร์ของจำนวนจริงในแต่ละช่วงเวลาที่ไม่ต่อเนื่อง ตัวดำเนินการเชิงเส้นจะถูกนำไปใช้กับสถานะเพื่อสร้างสถานะใหม่ โดยมีสัญญาณรบกวนผสมอยู่ด้วย และอาจมีข้อมูลจากตัวควบคุมในระบบหากทราบ จากนั้น ตัวดำเนินการเชิงเส้นอีกตัวหนึ่งที่ผสมกับสัญญาณรบกวนเพิ่มเติมจะสร้างเอาต์พุตที่วัดได้ (เช่น การสังเกต) จากสถานะที่แท้จริง ("ซ่อนอยู่") ตัวกรอง Kalman อาจถือได้ว่าคล้ายคลึงกับแบบจำลอง Markov ที่ซ่อนอยู่ โดยมีความแตกต่างตรงที่ตัวแปรสถานะที่ซ่อนอยู่มีค่าอยู่ในพื้นที่ต่อเนื่อง ตรงข้ามกับพื้นที่สถานะแบบไม่ต่อเนื่องเช่นเดียวกับแบบจำลอง Markov ที่ซ่อนอยู่ มีความคล้ายคลึงกันอย่างมากระหว่างสมการของตัวกรอง Kalman และสมการของแบบจำลอง Markov ที่ซ่อนอยู่ บทวิจารณ์เกี่ยวกับโมเดลนี้และโมเดลอื่นๆ อยู่ใน Roweis และGhahramani (1999) ^[²⁵^]และ Hamilton (1994) บทที่ 13 ^[²⁶^]

ในการใช้ตัวกรอง Kalman เพื่อประมาณสถานะภายในของกระบวนการโดยใช้เพียงลำดับของการสังเกตที่มีสัญญาณรบกวน จำเป็นต้องสร้างแบบจำลองกระบวนการตามกรอบต่อไปนี้ ซึ่งหมายถึงการระบุเมทริกซ์สำหรับแต่ละช่วงเวลาดังนี้: $k$

$\mathbf {F} _{k}$ แบบจำลองการเปลี่ยนสถานะ;
$\mathbf {H} _{k}$ แบบจำลองการสังเกต;
$\mathbf {Q} _{k}$ ค่าความแปรปรวนร่วมของสัญญาณรบกวนในกระบวนการ;
$\mathbf {R} _{k}$ ค่าความแปรปรวนร่วมของสัญญาณรบกวนจากการสังเกต;
และบางครั้งรูปแบบการควบคุมอินพุตดังที่อธิบายไว้ด้านล่าง หากรวมอยู่ด้วย ก็จะมีด้วยเช่นกัน $\mathbf {B} _{k}$ $\mathbf {B} _{k}$
$\mathbf {u} _{k}$ เวกเตอร์ควบคุม ซึ่งแสดงถึงอินพุตควบคุมในแบบจำลองอินพุตควบคุม

ดังที่แสดงด้านล่าง เป็นเรื่องปกติในหลายๆ แอปพลิเคชันที่เมทริกซ์, , , , และมีค่าคงที่ตลอดเวลา ในกรณีเช่นนี้ดัชนีของเมทริกซ์เหล่านี้อาจถูกตัดทิ้งได้ $\mathbf {F}$ $\mathbf {H}$ $\mathbf {Q}$ $\mathbf {R}$ $\mathbf {B}$ $k$

แบบจำลองตัวกรอง Kalman ถือว่าสถานะที่แท้จริง ณ เวลา t มีการเปลี่ยนแปลงมาจากสถานะ ณ เวลา t ตามสมการ $k$ $k-1$

\mathbf {x} _{k}=\mathbf {F} _{k}\mathbf {x} _{k-1}+\mathbf {B} _{k}\mathbf {u} _{k}+\mathbf {w} _{k}

ที่ไหน

$\mathbf {F} _{k}$ คือแบบจำลองการเปลี่ยนสถานะซึ่งนำไปใช้กับสถานะก่อนหน้าx _{k −1} ;
$\mathbf {B} _{k}$ คือแบบจำลองอินพุตควบคุมซึ่งนำไปใช้กับเวกเตอร์ควบคุม $\mathbf {u} _{k}$
$\mathbf {w} _{k}$ คือสัญญาณรบกวนของกระบวนการ ซึ่งถือว่าได้มาจากการกระจายแบบปกติหลายตัวแปรที่ มีค่าเฉลี่ยเป็นศูนย์ , , และค่าความแปรปรวนร่วม , : . ${\mathcal {N}}$ $\mathbf {Q} _{k}$ $\mathbf {w} _{k}\sim {\mathcal {N}}\left(0,\mathbf {Q} _{k}\right)$

หากเป็นอิสระจากเวลา เราอาจเขียน แทน Roweis และ Ghahramani ^[²⁵^]^{: 307}เพื่อเน้นว่าเสียงรบกวนไม่มีความรู้ที่ชัดเจนเกี่ยวกับเวลา $\mathbf {Q}$ $\mathbf {w} _{\bullet }$ $\mathbf {w} _{k}$

ในเวลาหนึ่ง จะมี การสังเกต (หรือวัด) สถานะที่แท้จริงตาม $k$ $\mathbf {z} _{k}$ $\mathbf {x} _{k}$

\mathbf {z} _{k}=\mathbf {H} _{k}\mathbf {x} _{k}+\mathbf {v} _{k}

ที่ไหน

$\mathbf {H} _{k}$ คือแบบจำลองการสังเกต ซึ่งแปลงพื้นที่สถานะที่แท้จริงไปเป็นพื้นที่ที่สังเกตได้ และ
$\mathbf {v} _{k}$ คือสัญญาณรบกวนจากการสังเกต ซึ่งถือว่าเป็นสัญญาณรบกวนสีขาว แบบเกาส์เซียนที่มีค่าเฉลี่ยเป็นศูนย์ และมีความแปรปรวนร่วม: . $\mathbf {R} _{k}$ $\mathbf {v} _{k}\sim {\mathcal {N}}\left(0,\mathbf {R} _{k}\right)$

ในทำนองเดียวกันกับสถานการณ์สำหรับ เราอาจเขียนแทนได้ หากไม่ขึ้นอยู่กับเวลา $\mathbf {w} _{k}$ $\mathbf {v} _{\bullet }$ $\mathbf {v} _{k}$ $\mathbf {R}$

สถานะเริ่มต้นและเวกเตอร์สัญญาณรบกวนในแต่ละขั้นตอนถือว่ามีความเป็นอิสระ ต่อ กัน $\{\mathbf {x} _{0},\mathbf {w} _{1},\dots ,\mathbf {w} _{k},\mathbf {v} _{1},\dots ,\mathbf {v} _{k}\}$

ระบบไดนามิกแบบเรียลไทม์จำนวนมากไม่ได้สอดคล้องกับแบบจำลองนี้อย่างแม่นยำ อันที่จริง ไดนามิกที่ไม่ได้จำลองไว้อาจทำให้ประสิทธิภาพของตัวกรองลดลงอย่างมาก แม้ว่าจะถูกออกแบบมาให้ทำงานกับสัญญาณสุ่มที่ไม่ทราบค่าเป็นอินพุตก็ตาม เหตุผลก็คือ ผลกระทบของไดนามิกที่ไม่ได้จำลองไว้นั้นขึ้นอยู่กับอินพุต และด้วยเหตุนี้จึงอาจทำให้ขั้นตอนวิธีประมาณค่าไม่เสถียร (เกิดการเบี่ยงเบน) ในทางกลับกัน สัญญาณรบกวนสีขาวที่เป็นอิสระจะไม่ทำให้ขั้นตอนวิธีเบี่ยงเบน ปัญหาของการแยกแยะระหว่างสัญญาณรบกวนจากการวัดและไดนามิกที่ไม่ได้จำลองไว้นั้นเป็นปัญหาที่ยาก และถือเป็นปัญหาของทฤษฎีการควบคุมโดยใช้ การ ควบคุมที่แข็งแกร่ง^{[ 27 ]}^{[ 28 ]}

รายละเอียด

ตัวกรอง Kalman เป็น ตัวประมาณค่าแบบ เรียกซ้ำซึ่งหมายความว่าจำเป็นต้องใช้เพียงค่าประมาณสถานะจากขั้นตอนเวลาที่ผ่านมาและการวัดค่าปัจจุบันเพื่อคำนวณค่าประมาณสำหรับสถานะปัจจุบัน แตกต่างจากเทคนิคการประมาณค่าแบบกลุ่ม ไม่จำเป็นต้องมีประวัติการสังเกตและ/หรือค่าประมาณ ต่อไปนี้ สัญลักษณ์จะแทนค่าประมาณของณ เวลาn โดย พิจารณา จากการสังเกตจนถึงและรวมถึง ณ เวลาm ≤ n ${\hat {\mathbf {x} }}_{n\mid m}$ $\mathbf {x}$

สถานะของตัวกรองแสดงด้วยตัวแปรสองตัว:

${\hat {\mathbf {x} }}_{k\mid k}$ ค่าเฉลี่ยการประมาณสถานะ ภายหลังณ เวลาkโดย พิจารณาจากการ สังเกตการณ์จนถึงและรวมถึงเวลาk
$\mathbf {P} _{k\mid k}$ เมท ริกซ์ความแปรปรวนร่วมของการประมาณค่า ภายหลัง (ซึ่งเป็นตัววัดความแม่นยำของการประมาณค่าสถานะ)

โครงสร้างอัลกอริธึมของตัวกรอง Kalman คล้ายคลึงกับตัวกรอง Alpha betaตัวกรอง Kalman สามารถเขียนได้ในรูปสมการเดียว แต่โดยทั่วไปแล้วมักจะถูกมองว่าเป็นสองขั้นตอนที่แตกต่างกัน คือ "การทำนาย" และ "การปรับปรุง" ขั้นตอนการทำนายใช้ค่าประมาณสถานะจากช่วงเวลาที่ผ่านมาเพื่อสร้างค่าประมาณสถานะในช่วงเวลาปัจจุบัน ค่าประมาณสถานะที่ทำนายได้นี้เรียกว่า ค่าประมาณสถานะ ก่อนหน้า (a priori state estimate) เพราะถึงแม้จะเป็นค่าประมาณสถานะในช่วงเวลาปัจจุบัน แต่ก็ไม่ได้รวมข้อมูลการสังเกตจากช่วงเวลาปัจจุบัน ในขั้นตอนการปรับปรุงนวัตกรรม (ค่าตกค้างจากการปรับแบบจำลองก่อนหน้า) กล่าวคือ ความแตกต่างระหว่าง การทำนาย ก่อนหน้า ในปัจจุบัน กับข้อมูลการสังเกตในปัจจุบัน จะถูกคูณด้วยค่า Kalman gain ที่เหมาะสมที่สุดและรวมกับค่าประมาณสถานะก่อนหน้าเพื่อปรับปรุงค่าประมาณสถานะ ค่าประมาณที่ได้รับการปรับปรุงนี้โดยอิงจากการสังเกตในปัจจุบันเรียกว่า ค่าประมาณสถานะ ภายหลัง (a posteriori state estimate)

โดยทั่วไปแล้ว ทั้งสองขั้นตอนจะสลับกัน โดยการคาดการณ์จะทำให้สถานะก้าวหน้าไปจนถึงการสังเกตการณ์ตามกำหนดการครั้งถัดไป และการอัปเดตจะรวมการสังเกตการณ์นั้นเข้าไปด้วย อย่างไรก็ตาม ไม่จำเป็นต้องเป็นเช่นนั้นเสมอไป หากไม่มีการสังเกตการณ์ด้วยเหตุผลบางประการ การอัปเดตอาจถูกข้ามไปและดำเนินการขั้นตอนการคาดการณ์หลายขั้นตอน ในทำนองเดียวกัน หากมีการสังเกตการณ์อิสระหลายรายการในเวลาเดียวกัน อาจมีการดำเนินการขั้นตอนการอัปเดตหลายขั้นตอน (โดยทั่วไปแล้วจะใช้เมทริกซ์การสังเกตการณ์H _k ที่แตกต่างกัน ) ^{[ 29 ]}^{[ 30 ]}

ทำนาย

การประมาณค่าสถานะ ที่คาดการณ์ไว้ล่วงหน้า ( a priori )	${\hat {\mathbf {x} }__{k\mid k-1}=\mathbf {F} _{k}{\hat {\mathbf {x} }__{k-1\mid k-1}+\mathbf {B} _{k}\mathbf {u} _{k}$
ค่าประมาณความแปรปรวน ที่คาดการณ์ไว้ ( ล่วงหน้า )	${\mathbf {P} __{k\mid k-1}=\mathbf {F} _{k}\mathbf {P} _{k-1\mid k-1}\mathbf {F} _{k}^{\textsf {T}}+\mathbf {Q} _{k}$

อัปเดต

นวัตกรรมหรือการวัดค่าคงเหลือก่อนการติดตั้ง	${\tilde {\mathbf {y} }__{k}=\mathbf {z} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }__{k\mid k-1}$
ความแปรปรวนร่วมของนวัตกรรม (หรือค่าตกค้างก่อนการปรับ)	$\mathbf {S} _{k}=\mathbf {H} _{k}{\mathbf {P} __{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}+\mathbf {R} _{k}$
ค่าเกน Kalman ที่เหมาะสมที่สุด	$\mathbf {K} _{k}={\mathbf {P} __{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}$
การประเมินสถานะ ที่ปรับปรุงแล้ว ( ภายหลัง )	${\hat {\mathbf {x} }__{k\mid k}={\hat {\mathbf {x} }__{k\mid k-1}+\mathbf {K} _{k}{\tilde {\mathbf {y} }__{k}$
ค่าความแปรปรวนร่วม ที่ปรับปรุงแล้ว ( หลัง การปรับปรุง ) (รูปแบบปกติ)	$\mathbf {P} _{k\mid k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\|k-1}$
ค่าประมาณความแปรปรวน ที่ปรับปรุงแล้ว ( ภายหลัง การปรับปรุง ) (รูปแบบของโจเซฟ)	$\mathbf {P} _{k\mid k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\mathbf {R} _{k}\mathbf {K} _{k}^{\textsf {T}}$
ค่าความคลาดเคลื่อนหลังการวัดหลังการปรับ	${\tilde {\mathbf {y} }__{k\mid k}=\mathbf {z} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }__{k\mid k}$

สูตรที่สองสำหรับการประมาณค่าความแปรปรวนที่ปรับปรุงแล้ว ( ภายหลัง ) ข้างต้นเรียกว่า "รูปแบบโจเซฟ" ซึ่งมักใช้ในการประยุกต์ใช้ (มีความเสถียรทางตัวเลขมากกว่าสูตรทั่วไปที่ง่ายกว่า) การพิสูจน์สูตรสามารถพบได้ใน ส่วน การหาอนุพันธ์ ซึ่ง แสดงให้เห็นว่า สูตรนั้นใช้ได้กับK _{k ใดๆ ด้วย}

วิธีที่เข้าใจง่ายกว่าในการแสดงค่าประมาณสถานะที่อัปเดตแล้ว ( ) คือ: ${\hat {\mathbf {x} }}_{k\mid k}$

{\hat {\mathbf {x} }}_{k\mid k}=(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}){\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\mathbf {z} _{k}

นิพจน์นี้ทำให้เรานึกถึงการประมาณค่าเชิงเส้นในช่วงระหว่าง [0,1] ในกรณีของเรา: $x=(1-t)(a)+t(b)$ $t$

$t$ คือเมทริกซ์ที่รับค่าจาก(ความคลาดเคลื่อนสูงในเซ็นเซอร์) ไปยังหรือค่าที่ฉายออกมา (ความคลาดเคลื่อนต่ำ) $\mathbf {K} _{k}\mathbf {H} _{k}$ $0$ $I$
$a$ คือสถานะภายในที่ประเมินจากแบบจำลอง ${\hat {\mathbf {x} }}_{k\mid k-1}$
$b$ คือสถานะภายในที่ประมาณได้จากการวัด โดยสมมติว่าเมทริกซ์นั้นไม่ใช่เมทริกซ์เอกฐาน (ซึ่งในหลายแอปพลิเคชันนั้นไม่ใช่สมมติฐานที่สมเหตุสมผล เช่น เมื่อมิติของสถานะมากกว่ามิติของการสังเกต) $\mathbf {H} _{k}^{-1}\mathbf {z} _{k}$ $\mathbf {H} _{k}$

นิพจน์นี้ยังมีลักษณะคล้ายกับขั้นตอนการอัปเดต ตัวกรองอัลฟาเบตา ด้วย

ตัวแปรคงที่

หากแบบจำลองมีความแม่นยำ และค่าสำหรับและสะท้อนถึงการกระจายของค่าสถานะเริ่มต้นอย่างถูกต้องแล้ว ค่าคงที่ต่อไปนี้จะยังคงอยู่: ${\hat {\mathbf {x} }}_{0\mid 0}$ $\mathbf {P} _{0\mid 0}$

{\begin{aligned}\operatorname {E} [\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}]&=\operatorname {E} [\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}]=0\\\operatorname {E} [{\tilde {\mathbf {y} }}_{k}]&=0\end{aligned}}

โดยที่คือค่าที่คาดหวังของนั่นคือ ค่าประมาณทั้งหมดมีค่าความคลาดเคลื่อนเฉลี่ยเป็นศูนย์ $\operatorname {E} [\xi ]$ $\xi$

อีกด้วย:

{\begin{aligned}\mathbf {P} _{k\mid k}&=\operatorname {cov} \left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)\\\mathbf {P} _{k\mid k-1}&=\operatorname {cov} \left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)\\\mathbf {S} _{k}&=\operatorname {cov} \left({\tilde {\mathbf {y} }}_{k}\right)\end{aligned}}

ดังนั้นเมทริกซ์ความแปรปรวนร่วมจึงสะท้อนความแปรปรวนร่วมของการประมาณค่าได้อย่างแม่นยำ

การประมาณค่าความแปรปรวนร่วมของสัญญาณรบกวน Q _kและ R _k

การนำ Kalman Filter ไปใช้ในทางปฏิบัติมักเป็นเรื่องยาก เนื่องจากความยากลำบากในการประมาณเมทริกซ์ความแปรปรวนร่วมของสัญญาณรบกวนQ _kและR _kได้อย่างแม่นยำ มีการวิจัยอย่างกว้างขวางเพื่อประมาณค่าความแปรปรวนร่วมเหล่านี้จากข้อมูล วิธีการปฏิบัติวิธีหนึ่งในการทำเช่นนี้คือ เทคนิค กำลังสองน้อยที่สุดของความแปรปรวนร่วมอัตโนมัติ (ALS) ซึ่งใช้ ความแปรปรวนร่วมอัตโนมัติที่ล่าช้าตามเวลาของข้อมูลการทำงานประจำวันเพื่อประมาณค่าความแปรปรวนร่วม^{[ 31 ]}^{[ 32 ]} รหัสGNU OctaveและMatlabที่ใช้ในการคำนวณเมทริกซ์ความแปรปรวนร่วมของสัญญาณรบกวนโดยใช้เทคนิค ALS มีให้ใช้งานออนไลน์ภายใต้ใบอนุญาตสาธารณะทั่วไปของ GNU ^{[ 33 ]}

ตัวกรอง Kalman ของสนาม (FKF) ซึ่งเป็นอัลกอริทึมแบบเบย์เซียนที่ช่วยให้สามารถประมาณค่าสถานะ พารามิเตอร์ และความแปรปรวนร่วมของสัญญาณรบกวนได้พร้อมกัน ได้รับการเสนอ^{[ 34 ]}อัลกอริทึม FKF มีสูตรแบบวนซ้ำ มีการบรรจบกันที่สังเกตได้ดี และมีความซับซ้อนค่อนข้างต่ำ จึงแนะนำว่าอัลกอริทึม FKF อาจเป็นทางเลือกที่คุ้มค่าสำหรับวิธีการกำลังสองน้อยที่สุดของความแปรปรวนร่วมอัตโนมัติ

แนวทางอื่นคือตัวกรอง Kalman ที่ได้รับการปรับให้เหมาะสม (OKF) ซึ่งพิจารณาเมทริกซ์ความแปรปรวนร่วมไม่ใช่ในฐานะตัวแทนของสัญญาณรบกวน แต่เป็นพารามิเตอร์ที่มุ่งไปสู่การประมาณสถานะที่แม่นยำที่สุด^{[ 35 ]}มุมมองทั้งสองนี้สอดคล้องกันภายใต้สมมติฐานของ KF แต่มักจะขัดแย้งกันในระบบจริง ดังนั้น การประมาณสถานะของ OKF จึงมีความทนทานต่อความไม่แม่นยำของการสร้างแบบจำลองมากกว่า

ความเหมาะสมและประสิทธิภาพ

ตัวกรอง Kalman ให้การประมาณสถานะที่เหมาะสมที่สุดในกรณีที่ ก) แบบจำลองตรงกับระบบจริงอย่างสมบูรณ์ ข) สัญญาณรบกวนขาเข้าเป็น "สีขาว" (ไม่สัมพันธ์กัน) และ ค) ทราบค่าความแปรปรวนร่วมของสัญญาณรบกวนอย่างแม่นยำ สัญญาณรบกวนที่สัมพันธ์กันก็สามารถจัดการได้โดยใช้ตัวกรอง Kalman เช่นกัน^{[ 36 ]}

ในช่วงหลายทศวรรษที่ผ่านมา มีการเสนอวิธีการประมาณค่าความแปรปรวนร่วมของสัญญาณรบกวนหลายวิธี รวมถึง ALS ที่กล่าวถึงในส่วนด้านบน โดยทั่วไปแล้ว หากสมมติฐานของแบบจำลองไม่ตรงกับระบบจริงอย่างสมบูรณ์ การประมาณค่าสถานะที่เหมาะสมที่สุดอาจไม่ได้มาจากการตั้งค่าQ _kและR _kให้เป็นค่าความแปรปรวนร่วมของสัญญาณรบกวนเสมอไป แต่ในกรณีนั้น พารามิเตอร์Q _kและR _kอาจถูกกำหนดเพื่อเพิ่มประสิทธิภาพการประมาณค่าสถานะอย่างชัดเจน^{[ 35 ]}เช่น การใช้การเรียนรู้แบบมีผู้กำกับดูแลมาตรฐาน

หลังจากตั้งค่าความแปรปรวนร่วมแล้ว การประเมินประสิทธิภาพของตัวกรองจะเป็นประโยชน์ กล่าวคือ เป็นไปได้หรือไม่ที่จะปรับปรุงคุณภาพการประมาณค่าสถานะ หากตัวกรอง Kalman ทำงานได้อย่างเหมาะสม ลำดับนวัตกรรม (ข้อผิดพลาดในการทำนายเอาต์พุต) จะเป็นสัญญาณรบกวนสีขาว ดังนั้นคุณสมบัติความเป็นสีขาวของนวัตกรรม จึง วัดประสิทธิภาพของตัวกรอง สามารถใช้วิธีการต่างๆ หลายวิธีเพื่อจุดประสงค์นี้^{[ 37 ]}หากเทอมสัญญาณรบกวนมีการกระจายแบบไม่เป็นแบบเกาส์เซียน วิธีการประเมินประสิทธิภาพของการประมาณค่าตัวกรองซึ่งใช้ความไม่เท่าเทียมกันของความน่าจะเป็นหรือทฤษฎีตัวอย่างขนาดใหญ่เป็นที่รู้จักในวรรณกรรม^{[ 38 ]}^{[ 39 ]}

ตัวอย่างการใช้งานทางเทคนิค

ลองพิจารณาถึงรถบรรทุกที่วิ่งอยู่บนรางตรงที่ไม่มีแรงเสียดทาน ในตอนเริ่มต้น รถบรรทุกจะอยู่นิ่งที่ตำแหน่ง 0 แต่จะถูกแรงสุ่มที่ไม่สามารถควบคุมได้กระทำต่อมัน เราวัดตำแหน่งของรถบรรทุกทุกๆ Δt วินาที แต่การวัดเหล่านี้ไม่แม่นยำ เราจึงต้องการรักษารูปแบบของตำแหน่งและ ความเร็วของรถ บรรทุก ไว้ เราจะแสดงวิธีการสร้างแบบจำลองซึ่งเราใช้สร้างตัวกรอง Kalman ของเรา

เนื่องจากค่าเหล่านี้คงที่ ดัชนีเวลาจึงถูกตัดทิ้ง $\mathbf {F} ,\mathbf {H} ,\mathbf {R} ,\mathbf {Q}$

ตำแหน่งและความเร็วของรถบรรทุกถูกอธิบายโดยปริภูมิสถานะเชิงเส้น

\mathbf {x} _{k}={\begin{bmatrix}x\\{\dot {x}}\end{bmatrix}}

โดยที่ความเร็วคืออนุพันธ์ของตำแหน่งเทียบกับเวลา ${\dot {x}}$

เราสมมติว่าระหว่างช่วงเวลา ( k − 1) และkแรงที่ควบคุมไม่ได้ทำให้เกิดความเร่งคงที่เท่ากับ_kซึ่งมีการกระจายแบบปกติโดยมีค่าเฉลี่ย 0 และส่วนเบี่ยงเบนมาตรฐานσaจากกฎการเคลื่อนที่ของนิวตันเราสรุปได้ _ว่า

\mathbf {x} _{k}=\mathbf {F} \mathbf {x} _{k-1}+\mathbf {G} a_{k}

(ไม่มีเทอมเนื่องจากไม่มีอินพุตควบคุมที่ทราบ แต่kคือผลของอินพุตที่ไม่ทราบค่าและ นำผลนั้นไปใช้ _กับเวกเตอร์สถานะ) โดยที่ $\mathbf {B} u$ $\mathbf {G}$

{\begin{aligned}\mathbf {F} &={\begin{bmatrix}1&\Delta t\\0&1\end{bmatrix}}\\[4pt]\mathbf {G} &={\begin{bmatrix}{\frac {1}{2}}{\Delta t}^{2}\\[6pt]\Delta t\end{bmatrix}}\end{aligned}}

ดังนั้น

\mathbf {x} _{k}=\mathbf {F} \mathbf {x} _{k-1}+\mathbf {w} _{k}

ที่ไหน

{\begin{aligned}\mathbf {w} _{k}&\sim N(0,\mathbf {Q} )\\\mathbf {Q} &=\mathbf {G} \mathbf {G} ^{\textsf {T}}\sigma _{a}^{2}={\begin{bmatrix}{\frac {1}{4}}{\Delta t}^{4}&{\frac {1}{2}}{\Delta t}^{3}\\[6pt]{\frac {1}{2}}{\Delta t}^{3}&{\Delta t}^{2}\end{bmatrix}}\sigma _{a}^{2}.\end{aligned}}

เมทริกซ์นี้ไม่ใช่เมทริกซ์ที่มีอันดับเต็ม (จะมีอันดับหนึ่งก็ต่อเมื่อ) ดังนั้น การแจกแจงจึงไม่ต่อเนื่องอย่างสมบูรณ์และไม่มีฟังก์ชันความหนาแน่นความน่าจะเป็นอีกวิธีหนึ่งในการแสดงสิ่งนี้โดยหลีกเลี่ยงการแจกแจงแบบเสื่อมสภาพอย่างชัดเจนคือ $\mathbf {Q}$ $\Delta t\neq 0$ $N(0,\mathbf {Q} )$

\mathbf {w} _{k}\sim \mathbf {G} \cdot N\left(0,\sigma _{a}^{2}\right).

ในแต่ละช่วงเวลา จะมีการวัด ตำแหน่ง ที่แท้จริงของรถบรรทุกซึ่งมีสัญญาณรบกวนอยู่ สมมติว่าสัญญาณรบกวนในการวัดv _kมีการกระจายแบบปกติเช่นกัน โดยมีค่าเฉลี่ย 0 และส่วนเบี่ยงเบนมาตรฐานσ _z

\mathbf {z} _{k}=\mathbf {Hx} _{k}+\mathbf {v} _{k}

ที่ไหน

\mathbf {H} ={\begin{bmatrix}1&0\end{bmatrix}}

และ

\mathbf {R} =\mathrm {E} \left[\mathbf {v} _{k}\mathbf {v} _{k}^{\textsf {T}}\right]={\begin{bmatrix}\sigma _{z}^{2}\end{bmatrix}}

เราทราบสถานะเริ่มต้นของรถบรรทุกอย่างแม่นยำ ดังนั้นเราจึงทำการเริ่มต้นระบบ

{\hat {\mathbf {x} }}_{0\mid 0}={\begin{bmatrix}0\\0\end{bmatrix}}

และเพื่อให้ตัวกรองทราบว่าเรารู้ตำแหน่งและความเร็วที่แน่นอน เราจึงกำหนดเมทริกซ์ความแปรปรวนร่วมเป็นศูนย์ให้กับมัน:

\mathbf {P} _{0\mid 0}={\begin{bmatrix}0&0\\0&0\end{bmatrix}}

หากไม่ทราบตำแหน่งและความเร็วเริ่มต้นอย่างแม่นยำ ควรตั้งค่าเมทริกซ์ความแปรปรวนร่วมเริ่มต้นด้วยค่าความแปรปรวนที่เหมาะสมบนแนวทแยงมุมของเมทริกซ์:

\mathbf {P} _{0\mid 0}={\begin{bmatrix}\sigma _{x}^{2}&0\\0&\sigma _{\dot {x}}^{2}\end{bmatrix}}

จากนั้นตัวกรองจะเลือกใช้ข้อมูลจากการวัดครั้งแรกมากกว่าข้อมูลที่มีอยู่แล้วในแบบจำลอง

รูปแบบเชิงเส้นกำกับ

เพื่อความง่าย ให้สมมติว่าอินพุตควบคุมคือจากนั้นตัวกรอง Kalman สามารถเขียนได้ดังนี้: $\mathbf {u} _{k}=\mathbf {0}$

{\hat {\mathbf {x} }}_{k\mid k}=\mathbf {F} _{k}{\hat {\mathbf {x} }}_{k-1\mid k-1}+\mathbf {K} _{k}[\mathbf {z} _{k}-\mathbf {H} _{k}\mathbf {F} _{k}{\hat {\mathbf {x} }}_{k-1\mid k-1}].

สมการที่คล้ายกันนี้ยังคงใช้ได้หากเรารวมอินพุตควบคุมที่ไม่เป็นศูนย์เข้าไปด้วย เมทริกซ์อัตราขยายและเมทริกซ์ความแปรปรวนร่วมจะเปลี่ยนแปลงไปโดยอิสระจากการวัดจากข้างต้น สมการทั้งสี่ที่จำเป็นสำหรับการอัปเดตเมทริกซ์มีดังนี้: $\mathbf {K} _{k}$ $\mathbf {P} _{k\mid k}$ $\mathbf {z} _{k}$

{\begin{aligned}\mathbf {P} _{k\mid k-1}&=\mathbf {F} _{k}\mathbf {P} _{k-1\mid k-1}\mathbf {F} _{k}^{\textsf {T}}+\mathbf {Q} _{k},\\\mathbf {S} _{k}&=\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}+\mathbf {R} _{k},\\\mathbf {K} _{k}&=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1},\\\mathbf {P} _{k|k}&=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k|k-1}.\end{aligned}}

เนื่องจากสิ่งเหล่านี้ขึ้นอยู่กับแบบจำลองเท่านั้น ไม่ใช่การวัด จึงสามารถคำนวณแบบออฟไลน์ได้ การลู่เข้าของเมทริกซ์เกนไปยังเมทริกซ์เชิง เส้นกำกับ นั้นใช้ได้กับเงื่อนไขที่กำหนดไว้ใน Walrand และ Dimakis ^[⁴⁰^]หากอนุกรมลู่เข้า ก็จะลู่เข้าแบบเอกซ์โพเนนเชียลไปยังเชิงเส้น กำกับ โดย สมมติว่ามีสัญญาณรบกวนของระบบที่ไม่เป็นศูนย์^[⁴¹^]การวิเคราะห์ล่าสุดแสดงให้เห็นว่าอัตราและลักษณะของการลู่เข้านี้อาจเกี่ยวข้องกับโหมดร่วมที่เท่ากันหลายโหมด รวมถึงส่วนประกอบการสั่น ขึ้นอยู่กับโครงสร้างค่าลักษณะเฉพาะของ Jacobian ของแผนที่ Riccati ข้างต้นที่ประเมินที่[ ⁴²^]^{สำหรับ}ตัวอย่างรถบรรทุกเคลื่อนที่ที่อธิบายไว้ข้างต้น โดยที่และการจำลองแสดงให้เห็นการลู่เข้าในจำนวนรอบ $\mathbf {K} _{k}$ $\mathbf {K} _{\infty }$ $\mathbf {P} _{k\mid k}$ $\mathbf {P} _{\infty }$ $\mathbf {P} _{\infty }$ $\Delta t=1$ $\sigma _{a}^{2}=\sigma _{z}^{2}=\sigma _{x}^{2}=\sigma _{\dot {x}}^{2}=1$ $10$

เมื่อใช้ค่าเกนเชิงอะซิมโทติก และสมมติว่าและเป็นอิสระจากตัวกรอง Kalman จะกลายเป็น ตัวกรองเชิง เส้นที่ไม่เปลี่ยนแปลงตามเวลา : $\mathbf {H} _{k}$ $\mathbf {F} _{k}$ $k$

{\hat {\mathbf {x} }}_{k}=\mathbf {F} {\hat {\mathbf {x} }}_{k-1}+\mathbf {K} _{\infty }[\mathbf {z} _{k}-\mathbf {H} \mathbf {F} {\hat {\mathbf {x} }}_{k-1}].

หากมี การได้กำไรแบบอะซิมโทติกจะสามารถคำนวณได้โดยการแก้สมการ Riccati แบบไม่ต่อเนื่องต่อไปนี้ สำหรับความแปรปรวนของสถานะอะซิมโทติก ก่อน : ^[⁴⁰^] $\mathbf {K} _{\infty }$ $\mathbf {P} _{\infty }$

\mathbf {P} _{\infty }=\mathbf {F} \left(\mathbf {P} _{\infty }-\mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}\left(\mathbf {H} \mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}+\mathbf {R} \right)^{-1}\mathbf {H} \mathbf {P} _{\infty }\right)\mathbf {F} ^{\textsf {T}}+\mathbf {Q} .

จากนั้นจึงคำนวณค่ากำไรเชิงอะซิมโทติกตามวิธีการเดิม

\mathbf {K} _{\infty }=\mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}\left(\mathbf {R} +\mathbf {H} \mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}\right)^{-1}.

นอกจากนี้ รูปแบบของตัวกรอง Kalman แบบ asymptotic ที่นิยมใช้ในทฤษฎีการควบคุมนั้นแสดงได้ดังนี้

{\displaystyle {\hat {\mathbf {x} }}_{k+1}=\mathbf {F} {\hat {\mathbf {x} }}_{k}+\mathbf {B} \mathbf {u} _{k}+\mathbf {\overline {K}} _{\infty }[\mathbf {z} _{k}-\mathbf {H} {\hat {\mathbf {x} }}_{k}],}

ที่ไหน

{\overline {\mathbf {K} }}_{\infty }=\mathbf {F} \mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}\left(\mathbf {R} +\mathbf {H} \mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}\right)^{-1}.

สิ่งนี้ทำให้ได้ตัวประมาณค่าในรูปแบบ

{\displaystyle {\hat {\mathbf {x} }}_{k+1}=(\mathbf {F} -{\overline {\mathbf {K} }}_{\infty }\mathbf {H} ){\hat {\mathbf {x} }}_{k}+\mathbf {B} \mathbf {u} _{k}+\mathbf {\overline {K}} _{\infty }\mathbf {z} _{k},}

อนุพันธ์

ตัวกรอง Kalman สามารถอนุมานได้ว่าเป็น วิธี การกำลังสองน้อยที่สุดแบบทั่วไปที่ดำเนินการกับข้อมูลก่อนหน้า^{[ 43 ]}

การหาเมทริกซ์ความแปรปรวนร่วมของการประมาณค่าภายหลัง

เริ่มต้นด้วยค่าคงที่ของเราเกี่ยวกับความแปรปรวนร่วมของข้อผิดพลาดP _{k | k}ดังที่กล่าวมาข้างต้น

\mathbf {P} _{k\mid k}=\operatorname {cov} \left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)

แทนที่ในคำจำกัดความของ ${\hat {\mathbf {x} }}_{k\mid k}$

\mathbf {P} _{k\mid k}=\operatorname {cov} \left[\mathbf {x} _{k}-\left({\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}{\tilde {\mathbf {y} }}_{k}\right)\right]

และทดแทน ${\tilde {\mathbf {y} }}_{k}$

\mathbf {P} _{k\mid k}=\operatorname {cov} \left(\mathbf {x} _{k}-\left[{\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\left(\mathbf {z} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}\right)\right]\right)

และ $\mathbf {z} _{k}$

\mathbf {P} _{k\mid k}=\operatorname {cov} \left(\mathbf {x} _{k}-\left[{\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\left(\mathbf {H} _{k}\mathbf {x} _{k}+\mathbf {v} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}\right)\right]\right)

และโดยการรวบรวมเวกเตอร์ข้อผิดพลาด เราจะได้

\mathbf {P} _{k\mid k}=\operatorname {cov} \left[\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)-\mathbf {K} _{k}\mathbf {v} _{k}\right]

เนื่องจากข้อผิดพลาดในการวัดv _kไม่มีความสัมพันธ์กับพารามิเตอร์อื่นๆ ดังนั้นจึงกลายเป็นเช่นนี้

\mathbf {P} _{k\mid k}=\operatorname {cov} \left[\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)\right]+\operatorname {cov} \left[\mathbf {K} _{k}\mathbf {v} _{k}\right]

โดยอาศัยคุณสมบัติของความแปรปรวนร่วมของเวกเตอร์จะได้ว่า

\mathbf {P} _{k\mid k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\operatorname {cov} \left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\operatorname {cov} \left(\mathbf {v} _{k}\right)\mathbf {K} _{k}^{\textsf {T}}

ซึ่งเมื่อใช้ค่าคงที่ของเราบนP _{k | k −1}และนิยามของR _kจะได้ว่า

\mathbf {P} _{k\mid k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\mathbf {R} _{k}\mathbf {K} _{k}^{\textsf {T}}

สูตรนี้ (บางครั้งเรียกว่ารูปแบบโจเซฟของสมการปรับปรุงความแปรปรวนร่วม) ใช้ได้กับค่าK _k ใดๆ ก็ตาม ปรากฏว่าหากK _kคือค่าเกนของ Kalman ที่เหมาะสมที่สุด สูตรนี้สามารถลดรูปให้ง่ายขึ้นได้อีกดังที่แสดงด้านล่าง

การหาค่ากำไรของ Kalman

ตัวกรอง Kalman เป็น ตัวประมาณ ค่าความคลาดเคลื่อนกำลังสองเฉลี่ยต่ำสุด (MMSE)ความคลาดเคลื่อนใน การประมาณค่าสถานะ ภายหลังคือ

\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}

เราต้องการลดค่าคาดหวังของกำลังสองของขนาดของเวกเตอร์นี้ให้เหลือน้อยที่สุดซึ่งเทียบเท่ากับการลดค่าร่องรอยของเมทริกซ์ความแปรปรวนร่วมของการประมาณค่าภายหลังให้ เหลือน้อยที่สุด โดยการกระจายพจน์ในสมการข้างต้นและรวบรวม เราจะได้: $\operatorname {E} \left[\left\|\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k|k}\right\|^{2}\right]$ $\mathbf {P} _{k|k}$

{\begin{aligned}\mathbf {P} _{k\mid k}&=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {K} _{k}^{\textsf {T}}+\mathbf {K} _{k}\left(\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}+\mathbf {R} _{k}\right)\mathbf {K} _{k}^{\textsf {T}}\\[6pt]&=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {K} _{k}^{\textsf {T}}+\mathbf {K} _{k}\mathbf {S} _{k}\mathbf {K} _{k}^{\textsf {T}}\end{aligned}}

ค่าร่องรอยจะมีค่าน้อยที่สุดเมื่ออนุพันธ์เมทริกซ์ของร่องรอย นั้น เทียบกับเมทริกซ์อัตราขยายเป็นศูนย์ โดยใช้กฎของเมทริกซ์เกรเดียนต์และความสมมาตรของเมทริกซ์ที่เกี่ยวข้อง เราพบว่า

{\frac {\partial \;\operatorname {tr} (\mathbf {P} _{k\mid k})}{\partial \;\mathbf {K} _{k}}}=-2\left(\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\right)^{\textsf {T}}+2\mathbf {K} _{k}\mathbf {S} _{k}=0.

เมื่อแก้สมการนี้เพื่อ หาค่า K _kจะได้ค่า Kalman gain:

{\begin{aligned}\mathbf {K} _{k}\mathbf {S} _{k}&=\left(\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\right)^{\textsf {T}}=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\\\Rightarrow \mathbf {K} _{k}&=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}\end{aligned}}

ค่าเกนนี้ ซึ่งเรียกว่าค่าเกนคาลมานที่เหมาะสมที่สุดคือค่าเกนที่ให้ค่าประมาณ MMSE เมื่อนำไปใช้

การลดรูปสูตรความแปรปรวนร่วมของข้อผิดพลาดภายหลัง

สูตรที่ใช้ในการคำนวณ ความแปรปรวนร่วมของข้อผิดพลาด ภายหลังสามารถทำให้ง่ายขึ้นได้เมื่อค่าเกนของ Kalman เท่ากับค่าที่เหมาะสมที่สุดที่ได้มาข้างต้น การคูณทั้งสองข้างของสูตรเกนของ Kalman ทางด้านขวาด้วยS _k K _k^Tจะได้ว่า

\mathbf {K} _{k}\mathbf {S} _{k}\mathbf {K} _{k}^{\textsf {T}}=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {K} _{k}^{\textsf {T}}

เมื่ออ้างอิงกลับไปยังสูตรที่ขยายแล้วของเราสำหรับค่าความแปรปรวนร่วมของข้อผิดพลาด ภายหลัง

\mathbf {P} _{k\mid k}=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {K} _{k}^{\textsf {T}}+\mathbf {K} _{k}\mathbf {S} _{k}\mathbf {K} _{k}^{\textsf {T}}

เราพบว่าพจน์สองพจน์สุดท้ายหักล้างกัน ทำให้ได้ผลลัพธ์ดังนี้

\mathbf {P} _{k\mid k}=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}=(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k})\mathbf {P} _{k\mid k-1}

สูตรนี้ใช้ต้นทุนการคำนวณน้อยกว่า จึงมักถูกนำมาใช้ในทางปฏิบัติ แต่จะถูกต้องเฉพาะกับค่าเกนที่เหมาะสมที่สุดเท่านั้น หากความแม่นยำทางคณิตศาสตร์ต่ำผิดปกติจนทำให้เกิดปัญหาเกี่ยวกับเสถียรภาพเชิงตัวเลขหรือหากจงใจใช้ค่าเกนของ Kalman ที่ไม่เหมาะสม การลดรูปนี้จะไม่สามารถนำไปใช้ได้ ต้องใช้สูตรความแปรปรวนของข้อผิดพลาด ภายหลังการคำนวณตามที่ได้มาจากข้างต้น (รูปแบบของ Joseph) แทน

การวิเคราะห์ความไว

สมการการกรอง Kalman ให้ค่าประมาณของสถานะและความแปรปรวนร่วมของข้อผิดพลาดแบบวนซ้ำ ค่าประมาณและคุณภาพของค่าประมาณนั้นขึ้นอยู่กับพารามิเตอร์ของระบบและสถิติของสัญญาณรบกวนที่ป้อนเป็นอินพุตให้กับตัวประมาณ ส่วนนี้จะวิเคราะห์ผลกระทบของความไม่แน่นอนในอินพุตทางสถิติของตัวกรอง^[⁴⁴^]ในกรณีที่ไม่มีสถิติที่เชื่อถือได้หรือค่าที่แท้จริงของเมทริกซ์ความแปรปรวนร่วมของสัญญาณรบกวนและนิพจน์ ${\hat {\mathbf {x} }}_{k\mid k}$ $\mathbf {P} _{k\mid k}$ $\mathbf {Q} _{k}$ $\mathbf {R} _{k}$

\mathbf {P} _{k\mid k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\mathbf {R} _{k}\mathbf {K} _{k}^{\textsf {T}}

ไม่สามารถให้ค่าความแปรปรวนของข้อผิดพลาดที่แท้จริงได้อีกต่อไป กล่าวอีกนัยหนึ่งคือในแอปพลิเคชันแบบเรียลไทม์ส่วนใหญ่ เมทริกซ์ความแปรปรวนที่ใช้ในการออกแบบตัวกรอง Kalman จะแตกต่างจากเมทริกซ์ความแปรปรวนของสัญญาณรบกวนที่แท้จริง การวิเคราะห์ความไวนี้อธิบายพฤติกรรมของค่าความแปรปรวนของข้อผิดพลาดในการประมาณค่าเมื่อเมทริกซ์ความแปรปรวนของสัญญาณรบกวน รวมถึงเมทริกซ์ระบบที่ป้อนเป็นอินพุตให้กับตัวกรองนั้นไม่ถูกต้อง ดังนั้น การวิเคราะห์ความไวจึงอธิบายถึงความทนทาน (หรือความไว) ของตัวประมาณค่าต่ออินพุตทางสถิติและพารามิเตอร์ที่ไม่ถูกต้องของตัวประมาณค่า $\mathbf {P} _{k\mid k}\neq E\left[\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)^{\textsf {T}}\right]$ $\mathbf {F} _{k}$ $\mathbf {H} _{k}$

การอภิปรายนี้จำกัดเฉพาะการวิเคราะห์ความไวต่อข้อผิดพลาดสำหรับกรณีของความไม่แน่นอนทางสถิติ ในที่นี้ ค่าความแปรปรวนร่วมของสัญญาณรบกวนจริงจะถูกแทนด้วยและตามลำดับ ในขณะที่ค่าออกแบบที่ใช้ในตัวประมาณค่าคือและตามลำดับ ค่าความแปรปรวนร่วมของข้อผิดพลาดจริงจะถูกแทนด้วยและค่าที่คำนวณโดยตัวกรอง Kalman จะเรียกว่าตัวแปร Riccati เมื่อและหมายความว่าเมื่อคำนวณค่าความแปรปรวนร่วมของข้อผิดพลาดจริงโดยใช้แทนค่าและใช้ข้อเท็จจริงที่ว่าและส่งผลให้ได้สมการเวียนเกิดต่อไปนี้สำหรับ : $\mathbf {Q} _{k}^{a}$ $\mathbf {R} _{k}^{a}$ $\mathbf {Q} _{k}$ $\mathbf {R} _{k}$ $\mathbf {P} _{k\mid k}^{a}$ $\mathbf {P} _{k\mid k}$ $\mathbf {Q} _{k}\equiv \mathbf {Q} _{k}^{a}$ $\mathbf {R} _{k}\equiv \mathbf {R} _{k}^{a}$ $\mathbf {P} _{k\mid k}=\mathbf {P} _{k\mid k}^{a}$ $\mathbf {P} _{k\mid k}^{a}=E\left[\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)^{\textsf {T}}\right]$ ${\widehat {\mathbf {x} }}_{k\mid k}$ $E\left[\mathbf {w} _{k}\mathbf {w} _{k}^{\textsf {T}}\right]=\mathbf {Q} _{k}^{a}$ $E\left[\mathbf {v} _{k}\mathbf {v} _{k}^{\textsf {T}}\right]=\mathbf {R} _{k}^{a}$ $\mathbf {P} _{k\mid k}^{a}$

\mathbf {P} _{k\mid k-1}^{a}=\mathbf {F} _{k}\mathbf {P} _{k-1\mid k-1}^{a}\mathbf {F} _{k}^{\textsf {T}}+\mathbf {Q} _{k}^{a}

และ

\mathbf {P} _{k\mid k}^{a}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}^{a}\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\mathbf {R} _{k}^{a}\mathbf {K} _{k}^{\textsf {T}}

ในระหว่างการคำนวณตัวกรองจะออกแบบโดยปริยายว่าและนิพจน์แบบเรียกซ้ำสำหรับและจะเหมือนกัน ยกเว้นการมีอยู่ของและแทนที่ค่าการออกแบบและตามลำดับ มีการวิจัยเพื่อวิเคราะห์ความทนทานของระบบตัวกรอง Kalman ^[⁴⁵^] $\mathbf {P} _{k\mid k}$ $E\left[\mathbf {w} _{k}\mathbf {w} _{k}^{\textsf {T}}\right]=\mathbf {Q} _{k}$ $E\left[\mathbf {v} _{k}\mathbf {v} _{k}^{\textsf {T}}\right]=\mathbf {R} _{k}$ $\mathbf {P} _{k\mid k}^{a}$ $\mathbf {P} _{k\mid k}$ $\mathbf {Q} _{k}^{a}$ $\mathbf {R} _{k}^{a}$ $\mathbf {Q} _{k}$ $\mathbf {R} _{k}$

รูปแบบตัวประกอบ

ปัญหาหนึ่งของตัวกรอง Kalman คือความเสถียรเชิงตัวเลขหากค่าความแปรปรวนร่วมของสัญญาณรบกวนกระบวนการQ _kมีค่าน้อย ข้อผิดพลาดจากการปัดเศษมักทำให้ค่าไอเกนบวกขนาดเล็กของเมทริกซ์ความแปรปรวนร่วมของสถานะPถูกคำนวณเป็นจำนวนลบ ซึ่งทำให้การแสดงผลเชิงตัวเลขของP ไม่แน่นอนในขณะที่รูปแบบที่แท้จริงของมันเป็นบวก แน่นอน

เมทริก ซ์บวกกำหนด (Positive definite matrices) มีคุณสมบัติที่สามารถแยกตัวประกอบได้เป็นผลคูณของ เมทริกซ์สามเหลี่ยมล่างที่ ไม่เอกฐาน (non-singular , lower-triangular matrix ) S และ เมทริกซ์ทรานสโพส (transpose) ของมัน : P = S · S ^TโดยสามารถคำนวณตัวประกอบS ได้อย่างมีประสิทธิภาพโดยใช้อัลกอริทึม การแยกตัวประกอบ Choleskyรูปแบบผลคูณของเมทริกซ์ความแปรปรวนร่วมP นี้ รับประกันได้ว่าเป็นเมทริกซ์สมมาตร และสำหรับทุก 1 <= k <= n องค์ประกอบแนวทแยงมุมที่ k ของ P _kkจะเท่ากับกำลังสองของนอร์มยุคลิดของแถวที่ k ของSซึ่งจำเป็นต้องมีค่าเป็นบวก รูปแบบที่เทียบเท่ากัน ซึ่งหลีกเลี่ยง การดำเนินการ รากที่สอง จำนวนมาก ที่เกี่ยวข้องกับ อัลกอริทึม การแยกตัวประกอบ Choleskyแต่ยังคงรักษาคุณสมบัติเชิงตัวเลขที่พึงประสงค์ไว้ คือ รูปแบบการแยกตัวประกอบ UD: P = U · D · U ^Tโดยที่Uเป็นเมทริกซ์สามเหลี่ยมเอกลักษณ์ (มีแนวทแยงมุมเป็นหนึ่ง ) และDเป็นเมทริกซ์แนวทแยงมุม

ระหว่างสองวิธีนี้ การแยกตัวประกอบ UD ใช้พื้นที่จัดเก็บเท่ากัน และใช้การคำนวณน้อยกว่าเล็กน้อย และเป็นการแยกตัวประกอบสามเหลี่ยมที่ใช้กันทั่วไปมากที่สุด (เอกสารในยุคแรกเกี่ยวกับประสิทธิภาพเชิงสัมพัทธ์ค่อนข้างทำให้เข้าใจผิด เนื่องจากสันนิษฐานว่ารากที่สองใช้เวลานานกว่าการหารมาก^{[ 46 ]}^{: 69}ในขณะที่ในคอมพิวเตอร์ยุคศตวรรษที่ 21 รากที่สองมีราคาแพงกว่าเพียงเล็กน้อยเท่านั้น)

GJ Bierman และ CL Thornton ได้พัฒนาอัลกอริธึมที่มีประสิทธิภาพสำหรับขั้นตอนการทำนายและการอัปเดต Kalman ในรูปแบบแยกส่วน^{[ 46 ]}^{[ 47 ]}

การแยกส่วน L · D · L ^Tของเมทริกซ์ความแปรปรวนร่วมของนวัตกรรมS _kเป็นพื้นฐานสำหรับตัวกรองรากที่สองที่มีประสิทธิภาพเชิงตัวเลขและแข็งแกร่งอีกประเภทหนึ่ง^{[ 48 ]}อัลกอริทึมเริ่มต้นด้วยการแยกส่วน LUตามที่นำไปใช้ใน Linear Algebra PACKage ( LAPACK ) ผลลัพธ์เหล่านี้จะถูกแยกส่วนเพิ่มเติมเป็น โครงสร้าง L · D · L ^Tด้วยวิธีการที่ Golub และ Van Loan ให้ไว้ (อัลกอริทึม 4.1.2) สำหรับเมทริกซ์สมมาตรที่ไม่เอกฐาน^{[ 49 ]}เมทริกซ์ความแปรปรวนร่วมเอกฐานใด ๆ จะถูกหมุนเพื่อให้พาร์ติชันแนวทแยงแรกไม่เอกฐานและมีสภาพดีอัลกอริทึมการหมุนต้องเก็บส่วนใด ๆ ของเมทริกซ์ความแปรปรวนร่วมของนวัตกรรมที่สอดคล้องโดยตรงกับตัวแปรสถานะที่สังเกตได้H _k · x _k|k-1ที่เกี่ยวข้องกับการสังเกตเสริมใน y _kตัวกรองรากที่สองl · d · l t ^{ต้องการ}การตั้งฉากของเวกเตอร์การสังเกต^{[ 47 ]}^{[ 48 ]}สามารถทำได้โดยใช้รากที่สองผกผันของเมทริกซ์ความแปรปรวนร่วมสำหรับตัวแปรเสริมโดยใช้วิธีที่ 2 ใน Higham (2002, หน้า 263) ^{[ 50 ]}

รูปแบบขนาน

ตัวกรอง Kalman มีประสิทธิภาพสำหรับการประมวลผลข้อมูลแบบลำดับบนหน่วยประมวลผลกลาง (CPU) แต่ในรูปแบบดั้งเดิมนั้นไม่มีประสิทธิภาพบนสถาปัตยกรรมแบบขนาน เช่นหน่วยประมวลผลกราฟิก (GPU) อย่างไรก็ตาม เป็นไปได้ที่จะแสดงขั้นตอนการอัปเดตตัวกรองในรูปของตัวดำเนินการแบบเชื่อมโยงโดยใช้สูตรใน Särkkä และ García-Fernández (2021) ^{[ 51 ]}จากนั้นสามารถดึงโซลูชันตัวกรองได้โดยใช้ อัลกอริธึมผล รวมคำนำหน้าซึ่งสามารถนำไปใช้งานบน GPU ได้อย่างมีประสิทธิภาพ^{[ 52 ]}ซึ่งจะลดความซับซ้อนในการคำนวณจากจำนวนขั้นตอนเวลาเป็น $O(N)$ $O(\log(N))$

ความสัมพันธ์กับการประมาณค่าแบบเบย์เซียนแบบวนซ้ำ

ตัวกรอง Kalman สามารถนำเสนอได้ว่าเป็นเครือข่าย Bayesian แบบไดนามิก ที่ง่ายที่สุดเครือ ข่ายหนึ่ง ตัวกรอง Kalman คำนวณค่าประมาณของค่าจริงของสถานะแบบวนซ้ำตลอดเวลาโดยใช้การวัดที่เข้ามาและแบบจำลองกระบวนการทางคณิตศาสตร์ ในทำนองเดียวกันการประมาณค่า Bayesian แบบวนซ้ำจะคำนวณค่าประมาณของฟังก์ชันความหนาแน่นความ น่าจะเป็น (PDF) ที่ไม่ทราบค่าแบบวนซ้ำตลอดเวลาโดยใช้การวัดที่เข้ามาและแบบจำลองกระบวนการทางคณิตศาสตร์^{[ 53 ]}

ในการประมาณค่าแบบเบย์เซียนแบบวนซ้ำ สถานะที่แท้จริงจะถือว่าเป็นกระบวนการมาร์คอฟ ที่ไม่สามารถสังเกตได้ และค่าที่วัดได้คือสถานะที่สังเกตได้ของแบบจำลองมาร์คอฟแบบซ่อนเร้น (HMM)

เนื่องจากสมมติฐานของมาร์คอฟ สถานะที่แท้จริงจึงเป็นอิสระจากสถานะก่อนหน้าทั้งหมดแบบมีเงื่อนไข โดยพิจารณาจากสถานะก่อนหน้าทันที

p(\mathbf {x} _{k}\mid \mathbf {x} _{0},\dots ,\mathbf {x} _{k-1})=p(\mathbf {x} _{k}\mid \mathbf {x} _{k-1})

ในทำนองเดียวกัน การวัดที่ขั้นเวลาที่k นั้นขึ้นอยู่กับสถานะปัจจุบันเท่านั้น และเป็นอิสระจากสถานะอื่นๆ อย่างมีเงื่อนไข เมื่อกำหนดสถานะปัจจุบันแล้ว

p(\mathbf {z} _{k}\mid \mathbf {x} _{0},\dots ,\mathbf {x} _{k})=p(\mathbf {z} _{k}\mid \mathbf {x} _{k})

โดยใช้สมมติฐานเหล่านี้ การกระจายความน่าจะเป็นเหนือสถานะทั้งหมดของแบบจำลองมาร์คอฟที่ซ่อนอยู่สามารถเขียนได้อย่างง่ายๆ ดังนี้:

p\left(\mathbf {x} _{0},\dots ,\mathbf {x} _{k},\mathbf {z} _{1},\dots ,\mathbf {z} _{k}\right)=p\left(\mathbf {x} _{0}\right)\prod _{i=1}^{k}p\left(\mathbf {z} _{i}\mid \mathbf {x} _{i}\right)p\left(\mathbf {x} _{i}\mid \mathbf {x} _{i-1}\right)

อย่างไรก็ตาม เมื่อใช้ตัวกรอง Kalman เพื่อประมาณค่าสถานะxการกระจายความน่าจะเป็นที่สนใจคือการกระจายความน่าจะเป็นที่เกี่ยวข้องกับสถานะปัจจุบันโดยมีเงื่อนไขจากการวัดจนถึงช่วงเวลาปัจจุบัน ซึ่งทำได้โดยการตัดสถานะก่อนหน้าออกและหารด้วยความน่าจะเป็นของชุดการวัด

ผลลัพธ์ที่ได้คือ ขั้นตอน การทำนายและการปรับปรุงของตัวกรอง Kalman ที่เขียนในรูปแบบความน่าจะเป็น การกระจายความน่าจะเป็นที่เกี่ยวข้องกับสถานะที่ทำนายได้คือผลรวม (ปริพันธ์) ของผลคูณของการกระจายความน่าจะเป็นที่เกี่ยวข้องกับการเปลี่ยนจากช่วงเวลาที่ ( k − 1) ไปยังช่วงเวลาที่kและการกระจายความน่าจะเป็นที่เกี่ยวข้องกับสถานะก่อนหน้า ครอบคลุมทุกค่าที่เป็นไปได้ $x_{k-1}$

p\left(\mathbf {x} _{k}\mid \mathbf {Z} _{k-1}\right)=\int p\left(\mathbf {x} _{k}\mid \mathbf {x} _{k-1}\right)p\left(\mathbf {x} _{k-1}\mid \mathbf {Z} _{k-1}\right)\,d\mathbf {x} _{k-1}

ชุดการวัดที่ตั้งไว้จนถึงเวลาtคือ

\mathbf {Z} _{t}=\left\{\mathbf {z} _{1},\dots ,\mathbf {z} _{t}\right\}

การกระจายความน่าจะเป็นของการอัปเดตจะเป็นสัดส่วนกับผลคูณของความน่าจะเป็นของการวัดและสถานะที่คาดการณ์ไว้

p\left(\mathbf {x} _{k}\mid \mathbf {Z} _{k}\right)={\frac {p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)p\left(\mathbf {x} _{k}\mid \mathbf {Z} _{k-1}\right)}{p\left(\mathbf {z} _{k}\mid \mathbf {Z} _{k-1}\right)}}

ตัวหาร

p\left(\mathbf {z} _{k}\mid \mathbf {Z} _{k-1}\right)=\int p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)p\left(\mathbf {x} _{k}\mid \mathbf {Z} _{k-1}\right)\,d\mathbf {x} _{k}

เป็นเงื่อนไขการทำให้เป็นมาตรฐาน

ฟังก์ชันความหนาแน่นความน่าจะเป็นที่เหลืออยู่คือ

{\begin{aligned}p\left(\mathbf {x} _{k}\mid \mathbf {x} _{k-1}\right)&={\mathcal {N}}\left(\mathbf {F} _{k}\mathbf {x} _{k-1}+\mathbf {B} _{k}\mathbf {u} _{k},\mathbf {Q} _{k}\right)\\p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)&={\mathcal {N}}\left(\mathbf {H} _{k}\mathbf {x} _{k},\mathbf {R} _{k}\right)\\p\left(\mathbf {x} _{k-1}\mid \mathbf {Z} _{k-1}\right)&={\mathcal {N}}\left({\hat {\mathbf {x} }}_{k-1},\mathbf {P} _{k-1}\right)\end{aligned}}

โดยหลักการแล้ว ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ในขั้นตอนเวลาที่ผ่านมา ถือว่าเป็นค่าประมาณสถานะและความแปรปรวนร่วม ซึ่งมีเหตุผลรองรับ เนื่องจากตัวกรอง Kalman เป็นตัวประมาณค่าที่ดีที่สุด จึงใช้ประโยชน์จากการวัดได้อย่างดีที่สุด ดังนั้น PDF สำหรับ ค่าที่วัดได้จึงเป็นค่าประมาณของตัวกรอง Kalman $\mathbf {x} _{k}$ $\mathbf {Z} _{k}$

ความน่าจะเป็นแบบมาร์จินัล

เมื่อพิจารณาตามการตีความแบบเบย์เซียนเชิงเวียนซ้ำที่อธิบายไว้ข้างต้น ตัวกรองคาลมานสามารถมองได้ว่าเป็นแบบจำลองเชิงกำเนิดกล่าวคือ กระบวนการสร้างกระแสของการสังเกตแบบสุ่มz = ( z ₀ , z ₁ , z ₂ , ...) โดยเฉพาะอย่างยิ่ง กระบวนการนี้คือ

สุ่มเลือกสถานะที่ซ่อนอยู่จากความน่าจะเป็นล่วงหน้าแบบเกาส์เซียน $\mathbf {x} _{0}$ $p\left(\mathbf {x} _{0}\right)={\mathcal {N}}\left({\hat {\mathbf {x} }}_{0\mid 0},\mathbf {P} _{0\mid 0}\right)$
สุ่มตัวอย่างข้อมูลจากแบบจำลองการสังเกต $\mathbf {z} _{0}$ $p\left(\mathbf {z} _{0}\mid \mathbf {x} _{0}\right)={\mathcal {N}}\left(\mathbf {H} _{0}\mathbf {x} _{0},\mathbf {R} _{0}\right)$
สำหรับ, ทำ $k=1,2,3,\ldots$ $k=1,2,3,\ldots$
1. สุ่มเลือกสถานะที่ซ่อนอยู่ถัดไปจากแบบจำลองการเปลี่ยนสถานะ $\mathbf {x} _{k}$ $p\left(\mathbf {x} _{k}\mid \mathbf {x} _{k-1}\right)={\mathcal {N}}\left(\mathbf {F} _{k}\mathbf {x} _{k-1}+\mathbf {B} _{k}\mathbf {u} _{k},\mathbf {Q} _{k}\right).$
2. สุ่มตัวอย่างการสังเกตจากแบบจำลองการสังเกต $\mathbf {z} _{k}$ $p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)={\mathcal {N}}\left(\mathbf {H} _{k}\mathbf {x} _{k},\mathbf {R} _{k}\right).$

กระบวนการนี้มีโครงสร้างเหมือนกับแบบจำลองมาร์คอฟที่ซ่อนอยู่ทุกประการยกเว้นว่าสถานะและการสังเกตแบบไม่ต่อเนื่องจะถูกแทนที่ด้วยตัวแปรต่อเนื่องที่สุ่มมาจาก1การแจกแจงแบบเกาส์เซียน

ในบางแอปพลิเคชัน การคำนวณความน่าจะเป็นที่ตัวกรอง Kalman ที่มีชุดพารามิเตอร์ที่กำหนด (การกระจายความน่าจะเป็นก่อนหน้า รูปแบบการเปลี่ยนผ่านและการสังเกต และอินพุตควบคุม) จะสร้างสัญญาณที่สังเกตได้เฉพาะเจาะจงนั้นมีประโยชน์ ความน่าจะเป็นนี้เรียกว่าความน่าจะเป็นแบบมาร์จินัล (marginal likelihood ) เนื่องจากเป็นการอินทิเกรต (ตัดส่วนมาร์จินัลออกไป) ค่าของตัวแปรสถานะที่ซ่อนอยู่ ดังนั้นจึงสามารถคำนวณได้โดยใช้เพียงสัญญาณที่สังเกตได้เท่านั้น ความน่าจะเป็นแบบมาร์จินัลมีประโยชน์ในการประเมินตัวเลือกพารามิเตอร์ต่างๆ หรือเพื่อเปรียบเทียบตัวกรอง Kalman กับแบบจำลองอื่นๆ โดยใช้การเปรียบเทียบแบบจำลองแบบเบย์เซียน

การคำนวณความน่าจะเป็นส่วนชายขอบนั้นทำได้ง่าย โดยเป็นผลพลอยได้จากการคำนวณการกรองแบบวนซ้ำ ตามกฎลูกโซ่ความน่าจะเป็นสามารถแยกตัวประกอบได้เป็นผลคูณของความน่าจะเป็นของการสังเกตแต่ละครั้งโดยพิจารณาจากการสังเกตครั้งก่อนหน้า

p(\mathbf {z} )=\prod _{k=0}^{T}p\left(\mathbf {z} _{k}\mid \mathbf {z} _{k-1},\ldots ,\mathbf {z} _{0}\right)

,

และเนื่องจากตัวกรอง Kalman อธิบายกระบวนการ Markov ข้อมูลที่เกี่ยวข้องทั้งหมดจากการสังเกตการณ์ก่อนหน้านี้จึงบรรจุอยู่ในค่าประมาณสถานะปัจจุบันดังนั้นความน่าจะเป็นแบบมาร์จินัลจึงกำหนดโดย ${\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {P} _{k\mid k-1}.$

{\begin{aligned}p(\mathbf {z} )&=\prod _{k=0}^{T}\int p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)p\left(\mathbf {x} _{k}\mid \mathbf {z} _{k-1},\ldots ,\mathbf {z} _{0}\right)d\mathbf {x} _{k}\\&=\prod _{k=0}^{T}\int {\mathcal {N}}\left(\mathbf {z} _{k};\mathbf {H} _{k}\mathbf {x} _{k},\mathbf {R} _{k}\right){\mathcal {N}}\left(\mathbf {x} _{k};{\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {P} _{k\mid k-1}\right)d\mathbf {x} _{k}\\&=\prod _{k=0}^{T}{\mathcal {N}}\left(\mathbf {z} _{k};\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {R} _{k}+\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\right)\\&=\prod _{k=0}^{T}{\mathcal {N}}\left(\mathbf {z} _{k};\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {S} _{k}\right),\end{aligned}}

กล่าวคือ ผลคูณของความหนาแน่นแบบเกาส์เซียน โดยแต่ละความหนาแน่นสอดคล้องกับความหนาแน่นของการสังเกตz _k หนึ่ง รายการภายใต้การกระจายการกรองปัจจุบันสามารถคำนวณได้ง่ายๆ โดยใช้การอัปเดตแบบวนซ้ำอย่างง่าย อย่างไรก็ตาม เพื่อหลีกเลี่ยงปัญหาค่าต่ำเกินไป (numeric underflow)ในการใช้งานจริง มักเป็นที่พึงปรารถนาที่จะคำนวณค่าลอการิทึมความน่าจะเป็นแบบมาร์ จินัลแทน โดยใช้ธรรมเนียมนี้ สามารถทำได้ผ่านกฎการอัปเดตแบบวนซ้ำ $\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {S} _{k}$ $\ell =\log p(\mathbf {z} )$ $\ell ^{(-1)}=0$

\ell ^{(k)}=\ell ^{(k-1)}-{\frac {1}{2}}\left({\tilde {\mathbf {y} }}_{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}{\tilde {\mathbf {y} }}_{k}+\log \left|\mathbf {S} _{k}\right|+d_{y}\log 2\pi \right),

โดยที่มิติของเวกเตอร์การวัดคือ^[⁵⁴^] $d_{y}$

แอปพลิเคชันที่สำคัญอย่างหนึ่งที่ใช้ความน่าจะเป็น (แบบลอการิทึม) ของการสังเกตการณ์ (โดยพิจารณาจากพารามิเตอร์ของตัวกรอง) คือการติดตามเป้าหมายหลายเป้าหมาย ตัวอย่างเช่น พิจารณาสถานการณ์การติดตามวัตถุที่ข้อมูลการสังเกตการณ์เป็นอินพุต แต่ไม่ทราบจำนวนวัตถุในฉาก (หรือทราบจำนวนวัตถุแต่มากกว่าหนึ่ง) สำหรับสถานการณ์เช่นนี้ อาจไม่ทราบล่วงหน้าว่าการสังเกตการณ์/การวัดใดถูกสร้างขึ้นโดยวัตถุใด ตัวติดตามสมมติฐานหลายตัว (MHT) โดยทั่วไปจะสร้างสมมติฐานการเชื่อมโยงการติดตามที่แตกต่างกัน โดยแต่ละสมมติฐานสามารถพิจารณาได้ว่าเป็นตัวกรอง Kalman (สำหรับกรณี Gaussian เชิงเส้น) ที่มีชุดพารามิเตอร์เฉพาะที่เกี่ยวข้องกับวัตถุที่ตั้งสมมติฐานไว้ ดังนั้น การคำนวณความน่าจะเป็นของการสังเกตการณ์สำหรับสมมติฐานต่างๆ ที่กำลังพิจารณาจึงมีความสำคัญ เพื่อให้สามารถค้นหาสมมติฐานที่มีความน่าจะเป็นสูงสุดได้

ตัวกรองข้อมูล

ในกรณีที่มิติของเวกเตอร์การสังเกตyมีขนาดใหญ่กว่ามิติของเวกเตอร์ปริภูมิสถานะxตัวกรองข้อมูลสามารถหลีกเลี่ยงการผกผันเมทริกซ์ขนาดใหญ่ในการคำนวณกำไร Kalman โดยแลกกับการผกผันเมทริกซ์ขนาดเล็กในขั้นตอนการทำนาย ซึ่งจะช่วยประหยัดเวลาในการคำนวณ นอกจากนี้ ตัวกรองข้อมูลยังช่วยให้สามารถเริ่มต้นข้อมูลระบบตามซึ่งจะไม่สามารถทำได้สำหรับตัวกรอง Kalman ทั่วไป^[⁵⁵^]ในตัวกรองข้อมูล หรือตัวกรองความแปรปรวนร่วมผกผัน ความแปรปรวนร่วมที่ประมาณค่าและสถานะที่ประมาณค่าจะถูกแทนที่ด้วยเมทริกซ์ข้อมูลและ เวกเตอร์ ข้อมูลตามลำดับ ซึ่งกำหนดไว้ดังนี้: ${I_{1|0}=P_{1|0}^{-1}=0}$

{\begin{aligned}\mathbf {Y} _{k\mid k}&=\mathbf {P} _{k\mid k}^{-1}\\{\hat {\mathbf {y} }}_{k\mid k}&=\mathbf {P} _{k\mid k}^{-1}{\hat {\mathbf {x} }}_{k\mid k}\end{aligned}}

ในทำนองเดียวกัน ค่าความแปรปรวนร่วมที่คาดการณ์ไว้และสถานะมีรูปแบบข้อมูลที่เทียบเท่ากัน ซึ่งกำหนดไว้ดังนี้:

{\begin{aligned}\mathbf {Y} _{k\mid k-1}&=\mathbf {P} _{k\mid k-1}^{-1}\\{\hat {\mathbf {y} }}_{k\mid k-1}&=\mathbf {P} _{k\mid k-1}^{-1}{\hat {\mathbf {x} }}_{k\mid k-1}\end{aligned}}

และค่าความแปรปรวนร่วมของการวัดและเวกเตอร์การวัด ซึ่งกำหนดไว้ดังนี้:

{\begin{aligned}\mathbf {I} _{k}&=\mathbf {H} _{k}^{\textsf {T}}\mathbf {R} _{k}^{-1}\mathbf {H} _{k}\\\mathbf {i} _{k}&=\mathbf {H} _{k}^{\textsf {T}}\mathbf {R} _{k}^{-1}\mathbf {z} _{k}\end{aligned}}

การอัปเดตข้อมูลในตอนนี้กลายเป็นผลรวมเล็กน้อย^{[ 56 ]}

{\begin{aligned}\mathbf {Y} _{k\mid k}&=\mathbf {Y} _{k\mid k-1}+\mathbf {I} _{k}\\{\hat {\mathbf {y} }}_{k\mid k}&={\hat {\mathbf {y} }}_{k\mid k-1}+\mathbf {i} _{k}\end{aligned}}

ข้อได้เปรียบหลักของตัวกรองข้อมูลคือสามารถกรองข้อมูลการวัด N ค่าในแต่ละช่วงเวลาได้ง่ายๆ โดยการรวมเมทริกซ์และเวกเตอร์ข้อมูลของค่าเหล่านั้นเข้าด้วยกัน

{\begin{aligned}\mathbf {Y} _{k\mid k}&=\mathbf {Y} _{k\mid k-1}+\sum _{j=1}^{N}\mathbf {I} _{k,j}\\{\hat {\mathbf {y} }}_{k\mid k}&={\hat {\mathbf {y} }}_{k\mid k-1}+\sum _{j=1}^{N}\mathbf {i} _{k,j}\end{aligned}}

เพื่อทำนายตัวกรองข้อมูล เมทริกซ์ข้อมูลและเวกเตอร์สามารถแปลงกลับไปเป็นค่าเทียบเท่าในปริภูมิสถานะได้ หรืออีกทางเลือกหนึ่งคือสามารถใช้การทำนายปริภูมิข้อมูลได้^{[ 56 ]}

{\begin{aligned}\mathbf {M} _{k}&=\left[\mathbf {F} _{k}^{-1}\right]^{\textsf {T}}\mathbf {Y} _{k-1\mid k-1}\mathbf {F} _{k}^{-1}\\\mathbf {C} _{k}&=\mathbf {M} _{k}\left[\mathbf {M} _{k}+\mathbf {Q} _{k}^{-1}\right]^{-1}\\\mathbf {L} _{k}&=\mathbf {I} -\mathbf {C} _{k}\\\mathbf {Y} _{k\mid k-1}&=\mathbf {L} _{k}\mathbf {M} _{k}+\mathbf {C} _{k}\mathbf {Q} _{k}^{-1}\mathbf {C} _{k}^{\textsf {T}}\\{\hat {\mathbf {y} }}_{k\mid k-1}&=\mathbf {L} _{k}\left[\mathbf {F} _{k}^{-1}\right]^{\textsf {T}}{\hat {\mathbf {y} }}_{k-1\mid k-1}\end{aligned}}

ตัวปรับความเรียบแบบหน่วงคงที่

ตัวปรับเรียบแบบหน่วงเวลาคงที่ที่เหมาะสมจะให้ค่าประมาณที่เหมาะสมของ สำหรับ ^ค่าหน่วงเวลาคงที่ที่กำหนดโดยใช้การวัดจากถึง^[ 57 ^]สามารถอนุมานได้โดยใช้ทฤษฎีก่อนหน้าผ่านสถานะเสริม และสมการหลักของตัวกรองมีดังต่อไปนี้: ${\hat {\mathbf {x} }}_{k-N\mid k}$ $N$ $\mathbf {z} _{1}$ $\mathbf {z} _{k}$

{\begin{bmatrix}{\hat {\mathbf {x} }}_{t\mid t}\\{\hat {\mathbf {x} }}_{t-1\mid t}\\\vdots \\{\hat {\mathbf {x} }}_{t-N+1\mid t}\\\end{bmatrix}}={\begin{bmatrix}\mathbf {I} \\0\\\vdots \\0\\\end{bmatrix}}{\hat {\mathbf {x} }}_{t\mid t-1}+{\begin{bmatrix}0&\ldots &0\\\mathbf {I} &0&\vdots \\\vdots &\ddots &\vdots \\0&\ldots &\mathbf {I} \\\end{bmatrix}}{\begin{bmatrix}{\hat {\mathbf {x} }}_{t-1\mid t-1}\\{\hat {\mathbf {x} }}_{t-2\mid t-1}\\\vdots \\{\hat {\mathbf {x} }}_{t-N+1\mid t-1}\\\end{bmatrix}}+{\begin{bmatrix}\mathbf {K} ^{(0)}\\\mathbf {K} ^{(1)}\\\vdots \\\mathbf {K} ^{(N-1)}\\\end{bmatrix}}\mathbf {y} _{t\mid t-1}

ที่ไหน:

${\hat {\mathbf {x} }}_{t\mid t-1}$ คำนวณโดยใช้ตัวกรอง Kalman มาตรฐาน
$\mathbf {y} _{t\mid t-1}=\mathbf {z} _{t}-\mathbf {H} {\hat {\mathbf {x} }}_{t\mid t-1}$ นวัตกรรมนี้เกิดขึ้นโดยพิจารณาจากการประมาณค่าของตัวกรอง Kalman มาตรฐานหรือไม่
ตัวแปร ต่างๆ เหล่านี้เป็นตัวแปรใหม่ กล่าวคือ ตัวแปรเหล่านี้ไม่ปรากฏในตัวกรอง Kalman มาตรฐาน ${\hat {\mathbf {x} }}_{t-i\mid t}$ $i=1,\ldots ,N-1$
ผลกำไรจะคำนวณโดยใช้แผนการดังต่อไปนี้:
$\mathbf {K} ^{(i+1)}=\mathbf {P} ^{(i)}\mathbf {H} ^{\textsf {T}}\left[\mathbf {H} \mathbf {P} \mathbf {H} ^{\textsf {T}}+\mathbf {R} \right]^{-1}$

และ

\mathbf {P} ^{(i)}=\mathbf {P} \left[\left(\mathbf {F} -\mathbf {K} \mathbf {H} \right)^{\textsf {T}}\right]^{i}

โดยที่และคือค่าความแปรปรวนร่วมของข้อผิดพลาดในการทำนาย และค่าเกณฑ์ของตัวกรอง Kalman มาตรฐาน (เช่น)

\mathbf {P}

\mathbf {K}

\mathbf {P} _{t\mid t-1}

หากกำหนดค่าความแปรปรวนร่วมของข้อผิดพลาดในการประมาณค่าไว้ดังนี้

\mathbf {P} _{i}:=E\left[\left(\mathbf {x} _{t-i}-{\hat {\mathbf {x} }}_{t-i\mid t}\right)^{*}\left(\mathbf {x} _{t-i}-{\hat {\mathbf {x} }}_{t-i\mid t}\right)\mid z_{1}\ldots z_{t}\right],

จากนั้นเราจะได้ว่าการปรับปรุงการประมาณค่าของนั้นกำหนดโดย: $\mathbf {x} _{t-i}$

\mathbf {P} -\mathbf {P} _{i}=\sum _{j=0}^{i}\left[\mathbf {P} ^{(j)}\mathbf {H} ^{\textsf {T}}\left(\mathbf {H} \mathbf {P} \mathbf {H} ^{\textsf {T}}+\mathbf {R} \right)^{-1}\mathbf {H} \left(\mathbf {P} ^{(i)}\right)^{\textsf {T}}\right]

ตัวปรับเรียบช่วงเวลาคงที่

ตัวปรับเรียบช่วงเวลาคงที่ที่เหมาะสมที่สุดจะให้ค่าประมาณที่เหมาะสมที่สุดของ( ) โดยใช้การวัดจากช่วงเวลาคงที่ถึงซึ่งเรียกอีกอย่างว่า "การปรับเรียบแบบ Kalman" มีอัลกอริธึมการปรับเรียบหลายแบบที่ใช้กันทั่วไป ${\hat {\mathbf {x} }}_{k\mid n}$ $k<n$ $\mathbf {z} _{1}$ $\mathbf {z} _{n}$

ราวช์-ตุง-สตรีเบล

ตัวปรับเรียบ Rauch–Tung–Striebel (RTS) เป็นอัลกอริธึมแบบสองรอบที่มีประสิทธิภาพสำหรับการปรับเรียบช่วงเวลาคงที่^{[ 58 ]}

ขั้นตอนการส่งผ่านไปข้างหน้าจะเหมือนกับอัลกอริธึมตัวกรอง Kalman ทั่วไปค่าประมาณสถานะก่อนและหลังการกรองรวมถึงค่าความแปรปรวนจะถูกบันทึกไว้เพื่อใช้ในขั้นตอนการส่งผ่านย้อนกลับ (สำหรับการทำนายย้อนหลัง ) ${\hat {\mathbf {x} }}_{k\mid k-1}$ ${\hat {\mathbf {x} }}_{k\mid k}$ $\mathbf {P} _{k\mid k-1}$ $\mathbf {P} _{k\mid k}$

ในการคำนวณย้อนกลับ เราจะคำนวณค่าประมาณสถานะที่ปรับเรียบแล้วและค่าความแปรปรวนร่วมโดยเริ่มจากขั้นตอนเวลาสุดท้ายและดำเนินการย้อนกลับไปตามเวลาโดยใช้สมการเวียนเกิดต่อไปนี้: ${\hat {\mathbf {x} }}_{k\mid n}$ $\mathbf {P} _{k\mid n}$

{\begin{aligned}{\hat {\mathbf {x} }}_{k\mid n}&={\hat {\mathbf {x} }}_{k\mid k}+\mathbf {C} _{k}\left({\hat {\mathbf {x} }}_{k+1\mid n}-{\hat {\mathbf {x} }}_{k+1\mid k}\right)\\\mathbf {P} _{k\mid n}&=\mathbf {P} _{k\mid k}+\mathbf {C} _{k}\left(\mathbf {P} _{k+1\mid n}-\mathbf {P} _{k+1\mid k}\right)\mathbf {C} _{k}^{\textsf {T}}\end{aligned}}

ที่ไหน

\mathbf {C} _{k}=\mathbf {P} _{k\mid k}\mathbf {F} _{k+1}^{\textsf {T}}\mathbf {P} _{k+1\mid k}^{-1}.

$\mathbf {x} _{k\mid k}$ คือค่าประมาณสถานะภายหลังของช่วงเวลาและคือค่าประมาณสถานะก่อนหน้าของช่วงเวลาสัญลักษณ์เดียวกันนี้ใช้กับค่าความแปรปรวนร่วมด้วย $k$ $\mathbf {x} _{k+1\mid k}$ $k+1$

เครื่องปรับผิวเรียบแบบ Bryson–Frazier ดัดแปลง

ทางเลือกอื่นนอกเหนือจากอัลกอริธึม RTS คือตัวปรับเรียบช่วงเวลาคงที่ Bryson–Frazier ที่ได้รับการดัดแปลง (MBF) ซึ่งพัฒนาโดย Bierman ^{[ 47 ]}วิธีนี้ใช้การส่งผ่านย้อนกลับที่ประมวลผลข้อมูลที่บันทึกไว้จากการส่งผ่านไปข้างหน้าของตัวกรอง Kalman สมการสำหรับการส่งผ่านย้อนกลับเกี่ยวข้องกับการคำนวณข้อมูลแบบวนซ้ำซึ่งใช้ในแต่ละเวลาการสังเกตเพื่อคำนวณสถานะที่ปรับเรียบและความแปรปรวนร่วม

สมการเวียนเกิดคือ

{\begin{aligned}{\tilde {\Lambda }}_{k}&=\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}\mathbf {H} _{k}+{\hat {\mathbf {C} }}_{k}^{\textsf {T}}{\hat {\Lambda }}_{k}{\hat {\mathbf {C} }}_{k}\\{\hat {\Lambda }}_{k-1}&=\mathbf {F} _{k}^{\textsf {T}}{\tilde {\Lambda }}_{k}\mathbf {F} _{k}\\{\hat {\Lambda }}_{n}&=0\\{\tilde {\lambda }}_{k}&=-\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}\mathbf {y} _{k}+{\hat {\mathbf {C} }}_{k}^{\textsf {T}}{\hat {\lambda }}_{k}\\{\hat {\lambda }}_{k-1}&=\mathbf {F} _{k}^{\textsf {T}}{\tilde {\lambda }}_{k}\\{\hat {\lambda }}_{n}&=0\end{aligned}}

โดยที่คือค่าความแปรปรวนส่วนเหลือ และ. จากนั้นสามารถหาค่าสถานะและความแปรปรวนที่ปรับเรียบแล้วได้โดยการแทนค่าลงในสมการ $\mathbf {S} _{k}$ ${\hat {\mathbf {C} }}_{k}=\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}$

{\begin{aligned}\mathbf {P} _{k\mid n}&=\mathbf {P} _{k\mid k}-\mathbf {P} _{k\mid k}{\hat {\Lambda }}_{k}\mathbf {P} _{k\mid k}\\\mathbf {x} _{k\mid n}&=\mathbf {x} _{k\mid k}-\mathbf {P} _{k\mid k}{\hat {\lambda }}_{k}\end{aligned}}

หรือ

{\begin{aligned}\mathbf {P} _{k\mid n}&=\mathbf {P} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}{\tilde {\Lambda }}_{k}\mathbf {P} _{k\mid k-1}\\\mathbf {x} _{k\mid n}&=\mathbf {x} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}{\tilde {\lambda }}_{k}.\end{aligned}}

ข้อได้เปรียบที่สำคัญของ MBF คือไม่จำเป็นต้องหาเมทริกซ์ผกผันของเมทริกซ์ความแปรปรวนร่วม การพิสูจน์ของ Bierman ขึ้นอยู่กับตัวปรับเรียบ RTS ซึ่งถือว่าการแจกแจงพื้นฐานเป็นแบบเกาส์เซียน อย่างไรก็ตาม Gibbs ได้ให้การพิสูจน์ MBF โดยอาศัยแนวคิดของตัวปรับเรียบจุดคงที่ ซึ่งไม่จำเป็นต้องใช้สมมติฐานแบบเกาส์เซียน^{[ 59 ]}

MBF ยังสามารถใช้เพื่อตรวจสอบความสอดคล้องของค่าตกค้างของตัวกรองและความแตกต่างระหว่างค่าของสถานะตัวกรองหลังจากการอัปเดตและค่าสถานะที่ปรับให้เรียบ นั่นคือ^[⁶⁰^] $\mathbf {x} _{k\mid k}-\mathbf {x} _{k\mid n}$

ตัวปรับเรียบความแปรปรวนต่ำสุด

ตัวปรับเรียบความแปรปรวนต่ำสุดสามารถบรรลุประสิทธิภาพข้อผิดพลาดที่ดีที่สุดได้ หากแบบจำลองเป็นเชิงเส้น พารามิเตอร์และสถิติของสัญญาณรบกวนเป็นที่ทราบอย่างแม่นยำ^{[ 61 ]}ตัวปรับเรียบนี้เป็นการวางนัยทั่วไปของพื้นที่สถานะที่เปลี่ยนแปลงตามเวลาของตัวกรอง Wiener ที่ไม่เป็นสาเหตุที่เหมาะสม ที่สุด

การคำนวณที่ราบรื่นกว่านั้นทำในสองรอบ การคำนวณล่วงหน้าเกี่ยวข้องกับตัวทำนายล่วงหน้าหนึ่งขั้นตอนและกำหนดโดย

{\begin{aligned}{\hat {\mathbf {x} }}_{k+1\mid k}&=(\mathbf {F} _{k}-\mathbf {K} _{k}\mathbf {H} _{k}){\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\mathbf {z} _{k}\\\alpha _{k}&=-\mathbf {S} _{k}^{-{\frac {1}{2}}}\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {S} _{k}^{-{\frac {1}{2}}}\mathbf {z} _{k}\end{aligned}}

ระบบข้างต้นเรียกว่าตัวประกอบ Wiener-Hopf ผกผัน การเรียกย้อนกลับคือตัวผกผันของระบบส่งต่อข้างต้น ผลลัพธ์ของการส่งผ่านย้อนกลับ สามารถคำนวณได้โดยการดำเนินการสมการส่งต่อกับผลลัพธ์ที่ย้อนเวลา และย้อนเวลา ในกรณีของการประมาณค่าเอาต์พุต ค่าประมาณที่ปรับเรียบจะได้รับจาก $\beta _{k}$ $\alpha _{k}$

{\hat {\mathbf {y} }}_{k\mid N}=\mathbf {z} _{k}-\mathbf {R} _{k}\beta _{k}

การนำส่วนที่เป็นเหตุเป็นผลของตัวปรับเรียบความแปรปรวนต่ำสุดนี้มาใช้จะได้ผลลัพธ์ดังนี้

{\hat {\mathbf {y} }}_{k\mid k}=\mathbf {z} _{k}-\mathbf {R} _{k}\mathbf {S} _{k}^{-{\frac {1}{2}}}\alpha _{k}

ซึ่งเหมือนกับตัวกรอง Kalman ที่มีความแปรปรวนต่ำสุด วิธีแก้ปัญหาข้างต้นจะลดความแปรปรวนของข้อผิดพลาดในการประมาณค่าเอาต์พุตให้เหลือน้อยที่สุด โปรดทราบว่าการหาค่าตัวปรับเรียบ Rauch–Tung–Striebel นั้นสมมติว่าการกระจายตัวพื้นฐานเป็นแบบเกาส์เซียน ในขณะที่วิธีแก้ปัญหาที่มีความแปรปรวนต่ำสุดไม่ได้สมมติเช่นนั้น สามารถสร้างตัวปรับเรียบที่เหมาะสมที่สุดสำหรับการประมาณค่าสถานะและการประมาณค่าอินพุตได้ในทำนองเดียวกัน

เวอร์ชันเวลาต่อเนื่องของตัวปรับเรียบข้างต้นอธิบายไว้ใน^{[ 62 ]}^{[ 63 ]}

อัลกอริทึมการคาดการณ์-การเพิ่มค่าสูงสุดอาจถูกนำมาใช้เพื่อคำนวณค่าประมาณความน่าจะเป็นสูงสุดของพารามิเตอร์ปริภูมิสถานะที่ไม่ทราบค่าภายในตัวกรองและตัวปรับเรียบที่มีความแปรปรวนต่ำสุด บ่อยครั้งที่ความไม่แน่นอนยังคงอยู่ภายในสมมติฐานของปัญหา ตัวปรับเรียบที่รองรับความไม่แน่นอนสามารถออกแบบได้โดยการเพิ่มเทอมบวกที่แน่นอนลงในสมการ Riccati ^{[ 64 ]}

ในกรณีที่แบบจำลองไม่เป็นเชิงเส้น การแปลงเป็นเชิงเส้นทีละขั้นตอนอาจอยู่ภายในตัวกรองความแปรปรวนต่ำสุดและการคำนวณแบบวนซ้ำที่ราบเรียบกว่า ( การกรอง Kalman แบบขยาย )

ตัวกรอง Kalman แบบถ่วงน้ำหนักความถี่

งานวิจัยบุกเบิกเกี่ยวกับการรับรู้เสียงที่ความถี่ต่างๆ นั้นดำเนินการโดยเฟลตเชอร์และมุนสันในช่วงทศวรรษ 1930 งานของพวกเขานำไปสู่มาตรฐานการถ่วงน้ำหนักระดับเสียงที่วัดได้ในการตรวจสอบเสียงรบกวนในอุตสาหกรรมและการสูญเสียการได้ยิน ตั้งแต่นั้นมา การถ่วงน้ำหนักความถี่ได้ถูกนำมาใช้ในการออกแบบตัวกรองและตัวควบคุมเพื่อจัดการประสิทธิภาพภายในย่านความถี่ที่สนใจ

โดยทั่วไป ฟังก์ชันปรับรูปความถี่จะถูกใช้เพื่อถ่วงน้ำหนักกำลังเฉลี่ยของความหนาแน่นสเปกตรัมของข้อผิดพลาดในแถบความถี่ที่กำหนด ให้แทนข้อผิดพลาดในการประมาณค่าเอาต์พุตที่แสดงโดยตัวกรอง Kalman แบบดั้งเดิม และให้แทนฟังก์ชันถ่ายโอนการถ่วงน้ำหนักความถี่เชิงสาเหตุ คำตอบที่เหมาะสมที่สุดซึ่งลดความแปรปรวนของ ให้เหลือน้อยที่สุดนั้นเกิดขึ้นจากการสร้าง อย่างง่ายๆ $\mathbf {y} -{\hat {\mathbf {y} }}$ $\mathbf {W}$ $\mathbf {W} \left(\mathbf {y} -{\hat {\mathbf {y} }}\right)$ $\mathbf {W} ^{-1}{\hat {\mathbf {y} }}$

การออกแบบยังคงเป็นคำถามที่เปิดกว้าง วิธีหนึ่งในการดำเนินการคือการระบุระบบที่สร้างข้อผิดพลาดในการประมาณค่าและตั้งค่าให้เท่ากับค่าผกผันของระบบนั้น^[⁶⁵^]ขั้นตอนนี้สามารถทำซ้ำได้เพื่อให้ได้การปรับปรุงข้อผิดพลาดกำลังสองเฉลี่ยโดยแลกกับการเพิ่มลำดับตัวกรอง เทคนิคเดียวกันนี้สามารถนำไปใช้กับตัวปรับเรียบได้ $\mathbf {W}$ $\mathbf {W}$

ตัวกรองแบบไม่เชิงเส้น

ตัวกรอง Kalman พื้นฐานนั้นจำกัดอยู่เพียงสมมติฐานเชิงเส้น อย่างไรก็ตาม ระบบที่ซับซ้อนกว่านั้นอาจเป็นแบบไม่เชิงเส้นได้ความไม่เป็นเชิงเส้นนั้นอาจเกี่ยวข้องกับแบบจำลองกระบวนการ หรือแบบจำลองการสังเกต หรือทั้งสองอย่าง

ตัวกรอง Kalman ที่ใช้กันทั่วไปสำหรับระบบที่ไม่เป็นเชิงเส้น ได้แก่ ตัวกรอง Kalman แบบขยายและตัวกรอง Kalman แบบไม่ใช้การประมาณค่าเชิงเส้น ความเหมาะสมของตัวกรองที่จะใช้ขึ้นอยู่กับดัชนีความไม่เป็นเชิงเส้นของกระบวนการและแบบจำลองการสังเกต^{[ 66 ]}

ตัวกรอง Kalman แบบขยาย

ในตัวกรอง Kalman แบบขยาย (EKF) แบบจำลองการเปลี่ยนสถานะและการสังเกตไม่จำเป็นต้องเป็นฟังก์ชันเชิงเส้นของสถานะ แต่สามารถเป็นฟังก์ชันไม่เชิงเส้นได้ โดยฟังก์ชันเหล่านี้เป็นฟังก์ชันที่ สามารถหาอนุพันธ์ได้

{\begin{aligned}\mathbf {x} _{k}&=f(\mathbf {x} _{k-1},\mathbf {u} _{k})+\mathbf {w} _{k}\\\mathbf {z} _{k}&=h(\mathbf {x} _{k})+\mathbf {v} _{k}\end{aligned}}

ฟังก์ชันfสามารถใช้คำนวณสถานะที่คาดการณ์ได้จากค่าประมาณก่อนหน้า และในทำนองเดียวกัน ฟังก์ชันhสามารถใช้คำนวณค่าการวัดที่คาดการณ์ได้จากสถานะที่คาดการณ์ไว้ อย่างไรก็ตาม ฟังก์ชันfและh ไม่สามารถนำไปใช้กับเมทริกซ์ความแปรปรวนร่วมโดยตรงได้ จึง ต้องคำนวณ เมทริกซ์อนุพันธ์ย่อย (เมทริกซ์จาโคเบียน ) แทน

ในแต่ละช่วงเวลา จะมีการประเมินเมทริกซ์ Jacobian โดยใช้สถานะที่คาดการณ์ไว้ในปัจจุบัน เมทริกซ์เหล่านี้สามารถนำไปใช้ในสมการตัวกรอง Kalman ได้ กระบวนการนี้โดยพื้นฐานแล้วเป็นการแปลงฟังก์ชันที่ไม่เป็นเชิงเส้นให้เป็นเชิงเส้นโดยรอบค่าประมาณปัจจุบัน

ไส้กรอง Kalman ไร้กลิ่น

เมื่อแบบจำลองการเปลี่ยนสถานะและการสังเกต—นั่นคือ ฟังก์ชันการทำนายและการอัปเดต — มีความไม่เป็นเชิงเส้นสูง ตัวกรอง Kalman แบบขยายอาจให้ประสิทธิภาพที่แย่เป็นพิเศษ^[⁶⁷^]^[⁶⁸^]ทั้งนี้เนื่องจากความแปรปรวนร่วมถูกส่งผ่านการทำให้เป็นเชิงเส้นของแบบจำลองที่ไม่เป็นเชิงเส้นพื้นฐาน ตัวกรอง Kalman แบบไม่ใช้การประมาณค่า (UKF) ^[⁶⁷^]ใช้เทคนิคการสุ่มตัวอย่างแบบกำหนดที่เรียกว่าการแปลงแบบไม่ใช้การประมาณค่า (UT)เพื่อเลือกชุดจุดตัวอย่างขั้นต่ำ (เรียกว่าจุดซิกมา) รอบค่าเฉลี่ย จากนั้นจุดซิกมาจะถูกส่งผ่านฟังก์ชันที่ไม่เป็นเชิงเส้น ซึ่งจะสร้างค่าเฉลี่ยและการประมาณค่าความแปรปรวนร่วมใหม่ ตัวกรองที่ได้จะขึ้นอยู่กับวิธีการคำนวณสถิติที่แปลงแล้วของ UT และชุดจุดซิกมาที่ใช้ ควรสังเกตว่าสามารถสร้าง UKF ใหม่ได้เสมอในลักษณะที่สอดคล้องกัน^[⁶⁹^] สำหรับบางระบบ UKF ที่ได้จะประมาณค่าเฉลี่ยและความแปรปรวนร่วมที่แท้จริงได้แม่นยำยิ่งขึ้น^[⁷⁰^] สามารถตรวจสอบได้ด้วยการสุ่มตัวอย่างแบบมอนเตคาร์โลหรือ การขยาย อนุกรมเทย์เลอร์ของสถิติภายหลัง นอกจากนี้ เทคนิคนี้ยังขจัดความจำเป็นในการคำนวณจาโคเบียนอย่างชัดเจน ซึ่งสำหรับฟังก์ชันที่ซับซ้อนอาจเป็นงานที่ยากในตัวเอง (เช่น ต้องใช้การอนุพันธ์ที่ซับซ้อนหากทำแบบวิเคราะห์ หรือมีค่าใช้จ่ายในการคำนวณสูงหากทำแบบเชิงตัวเลข) หรืออาจเป็นไปไม่ได้เลย (หากฟังก์ชันเหล่านั้นไม่สามารถหาอนุพันธ์ได้) $f$ $h$

คะแนนซิกมา

สำหรับเวกเตอร์สุ่มจุดซิกมาคือเซตของเวกเตอร์ใดๆ $\mathbf {x} =(x_{1},\dots ,x_{L})$

\{\mathbf {s} _{0},\dots ,\mathbf {s} _{N}\}={\bigl \{}{\begin{pmatrix}s_{0,1}&s_{0,2}&\ldots &s_{0,L}\end{pmatrix}},\dots ,{\begin{pmatrix}s_{N,1}&s_{N,2}&\ldots &s_{N,L}\end{pmatrix}}{\bigr \}}

มีคุณสมบัติที่ได้รับการรับรองจาก

น้ำหนักลำดับแรกที่ตรงตามเงื่อนไข $W_{0}^{a},\dots ,W_{N}^{a}$

$\sum _{j=0}^{N}W_{j}^{a}=1$
สำหรับทุกคน: $i=1,\dots ,L$ $E[x_{i}]=\sum _{j=0}^{N}W_{j}^{a}s_{j,i}$

น้ำหนักลำดับที่สองที่ตรงตามข้อกำหนด $W_{0}^{c},\dots ,W_{N}^{c}$

$\sum _{j=0}^{N}W_{j}^{c}=1$
สำหรับทุกคู่ $(i,l)\in \{1,\dots ,L\}^{2}:E[x_{i}x_{l}]=\sum _{j=0}^{N}W_{j}^{c}s_{j,i}s_{j,l}$

การเลือกจุดซิกมาและน้ำหนักอย่างง่ายสำหรับอัลกอริทึม UKF คือ $\mathbf {x} _{k-1\mid k-1}$

{\begin{aligned}\mathbf {s} _{0}&={\hat {\mathbf {x} }}_{k-1\mid k-1}\\-1&<W_{0}^{a}=W_{0}^{c}<1\\\mathbf {s} _{j}&={\hat {\mathbf {x} }}_{k-1\mid k-1}+{\sqrt {\frac {L}{1-W_{0}}}}\mathbf {A} _{j},\quad j=1,\dots ,L\\\mathbf {s} _{L+j}&={\hat {\mathbf {x} }}_{k-1\mid k-1}-{\sqrt {\frac {L}{1-W_{0}}}}\mathbf {A} _{j},\quad j=1,\dots ,L\\W_{j}^{a}&=W_{j}^{c}={\frac {1-W_{0}}{2L}},\quad j=1,\dots ,2L\end{aligned}}

โดยที่คือค่าประมาณเฉลี่ยของเวกเตอร์คือคอลัมน์ที่j ของ โดย ที่โดยทั่วไปจะได้มาจากการแยกส่วน Choleskyของด้วยความระมัดระวัง สมการตัวกรองสามารถแสดงในลักษณะที่จะถูกประเมินโดยตรงโดยไม่ต้องคำนวณขั้นกลางของซึ่งเรียกว่า ตัวกรอง Kalman แบบรากที่สองที่ไม่ระบุค่า^[⁷¹^] ${\hat {\mathbf {x} }}_{k-1\mid k-1}$ $\mathbf {x} _{k-1\mid k-1}$ $\mathbf {A} _{j}$ $\mathbf {A}$ $\mathbf {P} _{k-1\mid k-1}=\mathbf {AA} ^{\textsf {T}}$ $\mathbf {A}$ $\mathbf {P} _{k-1\mid k-1}$ $\mathbf {A}$ $\mathbf {P} _{k-1\mid k-1}$

สามารถเลือก น้ำหนักของค่าเฉลี่ย ได้อย่างอิสระ $W_{0}$

การกำหนดพารามิเตอร์อีกวิธีที่นิยมใช้ (ซึ่งเป็นการขยายความจากวิธีข้างต้น) คือ

{\begin{aligned}\mathbf {s} _{0}&={\hat {\mathbf {x} }}_{k-1\mid k-1}\\W_{0}^{a}&={\frac {\alpha ^{2}\kappa -L}{\alpha ^{2}\kappa }}\\W_{0}^{c}&=W_{0}^{a}+1-\alpha ^{2}+\beta \\\mathbf {s} _{j}&={\hat {\mathbf {x} }}_{k-1\mid k-1}+\alpha {\sqrt {\kappa }}\mathbf {A} _{j},\quad j=1,\dots ,L\\\mathbf {s} _{L+j}&={\hat {\mathbf {x} }}_{k-1\mid k-1}-\alpha {\sqrt {\kappa }}\mathbf {A} _{j},\quad j=1,\dots ,L\\W_{j}^{a}&=W_{j}^{c}={\frac {1}{2\alpha ^{2}\kappa }},\quad j=1,\dots ,2L.\end{aligned}}

$\alpha$ และควบคุมการกระจายของจุดซิกมา เกี่ยวข้องกับการกระจายของ โปรดทราบว่านี่เป็นการกำหนดพารามิเตอร์มากเกินไปในแง่ที่ว่าสามารถเลือกค่าใดค่าหนึ่งของ, และได้ตามอำเภอใจ $\kappa$ $\beta$ $x$ $\alpha$ $\beta$ $\kappa$

ค่าที่เหมาะสมจะขึ้นอยู่กับปัญหาที่เกิดขึ้น แต่โดยทั่วไปแล้วคำแนะนำคือ, , และ. หากการกระจายที่แท้จริงของเป็นแบบเกาส์เซียน ค่าจะเหมาะสมที่สุด^[⁷²^] $\alpha =1$ $\beta =0$ $\kappa \approx 3L/2$ $x$ $\beta =2$

ทำนาย

เช่นเดียวกับ EKF การทำนายของ UKF สามารถนำไปใช้ได้อย่างอิสระจากการปรับปรุง UKF ใช้ร่วมกับการปรับปรุงเชิงเส้น (หรือแม้แต่ EKF) หรือในทางกลับกันก็ได้

เมื่อกำหนดค่าประมาณของค่าเฉลี่ยและความแปรปรวนร่วมและ แล้วจะได้จุดซิกมาตามที่อธิบายไว้ในส่วนด้านบน จุดซิกมาเหล่านี้จะถูกส่งผ่านฟังก์ชันการเปลี่ยนผ่าน f ${\hat {\mathbf {x} }}_{k-1\mid k-1}$ $\mathbf {P} _{k-1\mid k-1}$ $N=2L+1$

\mathbf {x} _{j}=f\left(\mathbf {s} _{j}\right)\quad j=0,\dots ,2L

.

ค่าซิกมาที่ได้จากการแพร่กระจายจะถูกถ่วงน้ำหนักเพื่อสร้างค่าเฉลี่ยและความแปรปรวนที่คาดการณ์ไว้

{\begin{aligned}{\hat {\mathbf {x} }}_{k\mid k-1}&=\sum _{j=0}^{2L}W_{j}^{a}\mathbf {x} _{j}\\\mathbf {P} _{k\mid k-1}&=\sum _{j=0}^{2L}W_{j}^{c}\left(\mathbf {x} _{j}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)\left(\mathbf {x} _{j}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)^{\textsf {T}}+\mathbf {Q} _{k}\end{aligned}}

โดยที่คือค่าน้ำหนักอันดับแรกของจุดซิกมาดั้งเดิม และคือค่าน้ำหนักอันดับสอง เมทริกซ์คือเมทริกซ์ความแปรปรวนร่วมของสัญญาณรบกวนการเปลี่ยนผ่าน $W_{j}^{a}$ $W_{j}^{c}$ $\mathbf {Q} _{k}$ $\mathbf {w} _{k}$

อัปเดต

เมื่อพิจารณาค่าประมาณการคาดการณ์และจะมีการคำนวณชุดจุดซิกมา ใหม่ พร้อมน้ำหนักลำดับแรกและน้ำหนักลำดับที่สอง ที่สอดคล้องกัน ^[⁷³^]จุดซิกมาเหล่านี้จะถูกแปลงผ่านฟังก์ชันการวัด ${\hat {\mathbf {x} }}_{k\mid k-1}$ $\mathbf {P} _{k\mid k-1}$ $N=2L+1$ $\mathbf {s} _{0},\dots ,\mathbf {s} _{2L}$ $W_{0}^{a},\dots W_{2L}^{a}$ $W_{0}^{c},\dots ,W_{2L}^{c}$ $h$

\mathbf {z} _{j}=h(\mathbf {s} _{j}),\,\,j=0,1,\dots ,2L

.

จากนั้นจึงคำนวณค่าเฉลี่ยเชิงประจักษ์และค่าความแปรปรวนร่วมของจุดที่แปลงแล้ว

{\begin{aligned}{\hat {\mathbf {z} }}&=\sum _{j=0}^{2L}W_{j}^{a}\mathbf {z} _{j}\\[6pt]{\hat {\mathbf {S} }}_{k}&=\sum _{j=0}^{2L}W_{j}^{c}(\mathbf {z} _{j}-{\hat {\mathbf {z} }})(\mathbf {z} _{j}-{\hat {\mathbf {z} }})^{\textsf {T}}+\mathbf {R_{k}} \end{aligned}}

โดยที่คือเมทริกซ์ความแปรปรวนร่วมของสัญญาณรบกวนจากการสังเกตนอกจากนี้ ยังจำเป็นต้องมีเมทริกซ์ความแปรปรวนร่วมไขว้ด้วย $\mathbf {R} _{k}$ $\mathbf {v} _{k}$

{\begin{aligned}\mathbf {C_{xz}} &=\sum _{j=0}^{2L}W_{j}^{c}(\mathbf {x} _{j}-{\hat {\mathbf {x} }}_{k|k-1})(\mathbf {z} _{j}-{\hat {\mathbf {z} }})^{\textsf {T}}.\end{aligned}}

กำไรของ Kalman คือ

{\begin{aligned}\mathbf {K} _{k}=\mathbf {C_{xz}} {\hat {\mathbf {S} }}_{k}^{-1}.\end{aligned}}

ค่าประมาณค่าเฉลี่ยและความแปรปรวนร่วมที่ปรับปรุงแล้วมีดังนี้

{\begin{aligned}{\hat {\mathbf {x} }}_{k\mid k}&={\hat {\mathbf {x} }}_{k|k-1}+\mathbf {K} _{k}(\mathbf {z} _{k}-{\hat {\mathbf {z} }})\\\mathbf {P} _{k\mid k}&=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}{\hat {\mathbf {S} }}_{k}\mathbf {K} _{k}^{\textsf {T}}.\end{aligned}}

ตัวกรอง Kalman แบบจำแนก

เมื่อแบบจำลองการสังเกต มีความไม่เป็นเชิงเส้นสูงและ/หรือไม่เป็นแบบเกาส์เซียน การใช้ กฎของเบย์สและการประมาณค่า อาจเป็นประโยชน์ $p(\mathbf {z} _{k}\mid \mathbf {x} _{k})$

p(\mathbf {z} _{k}\mid \mathbf {x} _{k})\approx {\frac {p(\mathbf {x} _{k}\mid \mathbf {z} _{k})}{p(\mathbf {x} _{k})}}

โดยที่สำหรับฟังก์ชันที่ไม่เป็นเชิงเส้นวิธีนี้จะแทนที่ข้อกำหนดเชิงกำเนิดของตัวกรอง Kalman มาตรฐานด้วยแบบจำลองเชิงจำแนกสำหรับสถานะแฝงโดยพิจารณาจากข้อมูลสังเกตการณ์ $p(\mathbf {x} _{k}\mid \mathbf {z} _{k})\approx {\mathcal {N}}(g(\mathbf {z} _{k}),Q(\mathbf {z} _{k}))$ $g,Q$

ภายใต้แบบจำลองสถานะ คงที่

{\begin{aligned}p(\mathbf {x} _{1})&={\mathcal {N}}(0,\mathbf {T} ),\\p(\mathbf {x} _{k}\mid \mathbf {x} _{k-1})&={\mathcal {N}}(\mathbf {F} \mathbf {x} _{k-1},\mathbf {C} ),\end{aligned}}

ที่ไหนถ้า $\mathbf {T} =\mathbf {F} \mathbf {T} \mathbf {F} ^{\intercal }+\mathbf {C}$

p(\mathbf {x} _{k}\mid \mathbf {z} _{1:k})\approx {\mathcal {N}}({\hat {\mathbf {x} }}_{k|k-1},\mathbf {P} _{k|k-1}),

จากนั้นเมื่อพิจารณาการสังเกตใหม่แล้วจึงสรุปได้ว่า^[⁷⁴^] $\mathbf {z} _{k}$

p(\mathbf {x} _{k+1}\mid \mathbf {z} _{1:k+1})\approx {\mathcal {N}}({\hat {\mathbf {x} }}_{k+1|k},\mathbf {P} _{k+1|k})

ที่ไหน

{\begin{aligned}\mathbf {M} _{k+1}&=\mathbf {F} \mathbf {P} _{k|k-1}\mathbf {F} ^{\intercal }+\mathbf {C} ,\\\mathbf {P} _{k+1|k}&=(\mathbf {M} _{k+1}^{-1}+Q(\mathbf {z} _{k})^{-1}-\mathbf {T} ^{-1})^{-1},\\{\hat {\mathbf {x} }}_{k+1|k}&=\mathbf {P} _{k+1|k}(\mathbf {M} _{k+1}^{-1}\mathbf {F} {\hat {\mathbf {x} }}_{k|k-1}+\mathbf {P} _{k+1|k}^{-1}g(\mathbf {z} _{k})).\end{aligned}}

โปรดทราบว่าการประมาณค่านี้จำเป็นต้องใช้เมทริกซ์บวกแน่นอน (positive-definite matrix) หากไม่ใช่เช่นนั้น $Q(\mathbf {z} _{k})^{-1}-\mathbf {T} ^{-1}$

\mathbf {P} _{k+1|k}=(\mathbf {M} _{k+1}^{-1}+Q(\mathbf {z} _{k})^{-1})^{-1}

ถูกนำมาใช้แทน วิธีการดังกล่าวพิสูจน์แล้วว่ามีประโยชน์อย่างยิ่งเมื่อมิติของการสังเกตมีขนาดใหญ่กว่ามิติของสถานะแฝงมาก^{[ 75 ]}และสามารถใช้สร้างตัวกรองที่มีความทนทานต่อความไม่เสถียรในแบบจำลองการสังเกตเป็นพิเศษ^{[ 76 ]}

ตัวกรอง Kalman แบบปรับได้

ตัวกรอง Kalman แบบปรับได้ช่วยให้สามารถปรับให้เข้ากับพลวัตของกระบวนการซึ่งไม่ได้จำลองไว้ในแบบจำลองกระบวนการซึ่งเกิดขึ้นตัวอย่างเช่นในบริบทของเป้าหมายที่เคลื่อนที่เมื่อใช้ตัวกรอง Kalman ความเร็วคงที่ (ลำดับลดลง) สำหรับการติดตาม^[⁷⁷^] $\mathbf {F} (t)$

ตัวกรอง Kalman–Bucy

การกรอง Kalman–Bucy (ตั้งชื่อตาม Richard Snowden Bucy) เป็นการกรอง Kalman เวอร์ชันเวลาต่อเนื่อง^{[ 78 ]}^{[ 79 ]}

มันตั้งอยู่บนพื้นฐานของแบบจำลองปริภูมิสถานะ

{\begin{aligned}{\frac {d}{dt}}\mathbf {x} (t)&=\mathbf {F} (t)\mathbf {x} (t)+\mathbf {B} (t)\mathbf {u} (t)+\mathbf {w} (t)\\\mathbf {z} (t)&=\mathbf {H} (t)\mathbf {x} (t)+\mathbf {v} (t)\end{aligned}}

โดยที่และแทนความเข้มของสัญญาณรบกวนสีขาวสองเทอมคือ และตามลำดับ $\mathbf {Q} (t)$ $\mathbf {R} (t)$ $\mathbf {w} (t)$ $\mathbf {v} (t)$

ตัวกรองประกอบด้วยสมการเชิงอนุพันธ์สองสมการ สมการหนึ่งสำหรับประมาณค่าสถานะ และอีกสมการหนึ่งสำหรับค่าความแปรปรวนร่วม:

{\begin{aligned}{\frac {d}{dt}}{\hat {\mathbf {x} }}(t)&=\mathbf {F} (t){\hat {\mathbf {x} }}(t)+\mathbf {B} (t)\mathbf {u} (t)+\mathbf {K} (t)\left(\mathbf {z} (t)-\mathbf {H} (t){\hat {\mathbf {x} }}(t)\right)\\{\frac {d}{dt}}\mathbf {P} (t)&=\mathbf {F} (t)\mathbf {P} (t)+\mathbf {P} (t)\mathbf {F} ^{\textsf {T}}(t)+\mathbf {Q} (t)-\mathbf {K} (t)\mathbf {R} (t)\mathbf {K} ^{\textsf {T}}(t)\end{aligned}}

โดยที่ค่า Kalman gain กำหนดโดย

\mathbf {K} (t)=\mathbf {P} (t)\mathbf {H} ^{\textsf {T}}(t)\mathbf {R} ^{-1}(t)

โปรดทราบว่าในนิพจน์นี้สำหรับความแปรปรวนร่วมของสัญญาณรบกวนการสังเกต แสดงถึงความแปรปรวนร่วมของข้อผิดพลาดในการทำนาย (หรือ นวัตกรรม ) ในเวลาเดียวกันความแปรปรวนร่วมเหล่านี้จะเท่ากันเฉพาะในกรณีของเวลาต่อเนื่องเท่านั้น^[⁸⁰^] $\mathbf {K} (t)$ $\mathbf {R} (t)$ ${\tilde {\mathbf {y} }}(t)=\mathbf {z} (t)-\mathbf {H} (t){\hat {\mathbf {x} }}(t)$

ในระบบเวลาต่อเนื่องนั้นไม่มีความแตกต่างระหว่างขั้นตอนการทำนายและการปรับปรุงข้อมูลของการกรองคาลมานแบบเวลาไม่ต่อเนื่อง

สมการเชิงอนุพันธ์ที่สองสำหรับค่าความแปรปรวนร่วม เป็นตัวอย่างของสมการ Riccatiการขยายแบบไม่เชิงเส้นของตัวกรอง Kalman–Bucy รวมถึงตัวกรอง Kalman แบบขยายเวลาต่อเนื่อง

ตัวกรอง Kalman แบบไฮบริด

ระบบทางกายภาพส่วนใหญ่แสดงด้วยแบบจำลองเวลาต่อเนื่อง ในขณะที่การวัดเวลาไม่ต่อเนื่องมักทำเพื่อประมาณค่าสถานะผ่านโปรเซสเซอร์ดิจิทัล ดังนั้น แบบจำลองระบบและแบบจำลองการวัดจึงกำหนดโดย

{\begin{aligned}{\dot {\mathbf {x} }}(t)&=\mathbf {F} (t)\mathbf {x} (t)+\mathbf {B} (t)\mathbf {u} (t)+\mathbf {w} (t),&\mathbf {w} (t)&\sim N\left(\mathbf {0} ,\mathbf {Q} (t)\right)\\\mathbf {z} _{k}&=\mathbf {H} _{k}\mathbf {x} _{k}+\mathbf {v} _{k},&\mathbf {v} _{k}&\sim N(\mathbf {0} ,\mathbf {R} _{k})\end{aligned}}

ที่ไหน

\mathbf {x} _{k}=\mathbf {x} (t_{k})

.

เริ่มต้น

{\hat {\mathbf {x} }}_{0\mid 0}=E\left[\mathbf {x} (t_{0})\right],\mathbf {P} _{0\mid 0}=\operatorname {Var} \left[\mathbf {x} \left(t_{0}\right)\right]

ทำนาย

{\begin{aligned}{\dot {\hat {\mathbf {x} }}}(t)&=\mathbf {F} (t){\hat {\mathbf {x} }}(t)+\mathbf {B} (t)\mathbf {u} (t){\text{, with }}{\hat {\mathbf {x} }}\left(t_{k-1}\right)={\hat {\mathbf {x} }}_{k-1\mid k-1}\\\Rightarrow {\hat {\mathbf {x} }}_{k\mid k-1}&={\hat {\mathbf {x} }}\left(t_{k}\right)\\{\dot {\mathbf {P} }}(t)&=\mathbf {F} (t)\mathbf {P} (t)+\mathbf {P} (t)\mathbf {F} (t)^{\textsf {T}}+\mathbf {Q} (t){\text{, with }}\mathbf {P} \left(t_{k-1}\right)=\mathbf {P} _{k-1\mid k-1}\\\Rightarrow \mathbf {P} _{k\mid k-1}&=\mathbf {P} \left(t_{k}\right)\end{aligned}}

สมการการทำนายได้มาจากสมการของตัวกรอง Kalman แบบต่อเนื่องโดยไม่ต้องปรับปรุงจากการวัด กล่าวคือสถานะที่ทำนายได้และความแปรปรวนร่วมจะคำนวณได้จากการแก้ชุดสมการเชิงอนุพันธ์โดยมีค่าเริ่มต้นเท่ากับค่าประมาณในขั้นตอนก่อนหน้า $\mathbf {K} (t)=0$

สำหรับกรณีของ ระบบเชิง เส้นที่ไม่เปลี่ยนแปลงตามเวลา พลวัตในเวลาต่อเนื่องสามารถแปลงเป็นระบบเวลาไม่ต่อเนื่องได้อย่างแม่นยำโดยใช้เมทริกซ์เอกซ์โพเนนเชียล

อัปเดต

{\begin{aligned}\mathbf {K} _{k}&=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\left(\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}+\mathbf {R} _{k}\right)^{-1}\\{\hat {\mathbf {x} }}_{k\mid k}&={\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\left(\mathbf {z} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}\right)\\\mathbf {P} _{k\mid k}&=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}\end{aligned}}

สมการการปรับปรุงนั้นเหมือนกับสมการของตัวกรอง Kalman แบบเวลาไม่ต่อเนื่องทุกประการ

รูปแบบต่างๆ สำหรับการกู้คืนสัญญาณที่กระจัดกระจาย

ตัวกรอง Kalman แบบดั้งเดิมยังถูกนำมาใช้สำหรับการกู้คืน สัญญาณ ที่เบาบางซึ่งอาจเป็นสัญญาณไดนามิก จากการสังเกตที่มีสัญญาณรบกวน งานล่าสุด^{[ 81 ]}^{[ 82 ]}^{[ 83 ]}ใช้แนวคิดจากทฤษฎีการตรวจจับ/การสุ่มตัวอย่างแบบบีบอัดเช่น คุณสมบัติไอโซเมตรีที่จำกัดและข้อโต้แย้งการกู้คืนความน่าจะเป็นที่เกี่ยวข้อง เพื่อประมาณสถานะที่เบาบางในระบบที่มีมิติต่ำโดยเนื้อแท้ตามลำดับ

ความสัมพันธ์กับกระบวนการเกาส์เซียน

^{เนื่องจากแบบจำลองสถานะเชิงเส้นแบบเกาส์เซียนนำไปสู่กระบวนการเกาส์เซียน ตัวกรอง Kalman จึง}สามารถมองได้ว่าเป็นตัวแก้ปัญหาแบบลำดับสำหรับการถดถอยกระบวนการเกาส์เซียน [ ^{84 ]}

แอปพลิเคชัน

ระบบอ้างอิงทัศนคติและทิศทาง
ระบบขับเคลื่อนอัตโนมัติ
การประมาณ สถานะการชาร์จ แบตเตอรี่ไฟฟ้า (SoC) ^{[ 85 ]}^{[ 86 ]}
อินเทอร์เฟซระหว่างสมองกับคอมพิวเตอร์^{[ 74 ]}^{[ 76 ]}^{[ 75 ]}
การติดตามและการปรับจุดยอดของอนุภาคประจุในเครื่องตรวจจับอนุภาค^{[ 87 ]}
การติดตามวัตถุในระบบคอมพิวเตอร์วิชั่น
การกำหนดตำแหน่งแบบไดนามิกในการขนส่งทางเรือ
เศรษฐศาสตร์โดยเฉพาะเศรษฐศาสตร์มหภาคการวิเคราะห์อนุกรมเวลาและเศรษฐศาสตร์เชิงปริมาณ^{[ 88 ]}
ระบบนำทางเฉื่อย
เวชศาสตร์นิวเคลียร์ – การฟื้นฟูภาพเอกซเรย์คอมพิวเตอร์แบบปล่อยโฟตอนเดี่ยว^{[ 89 ]}
การกำหนดวงโคจร
การประมาณสถานะระบบไฟฟ้า
เครื่องติดตามเรดาร์
ระบบนำทางด้วยดาวเทียม
แผ่นดินไหววิทยา^{[ 90 ]}
การควบคุมมอเตอร์กระแสสลับแบบปรับความถี่ ได้โดยไม่ต้องใช้เซ็นเซอร์
การระบุตำแหน่งและการสร้างแผนที่พร้อมกัน
การปรับปรุงคุณภาพเสียงพูด
การวัดระยะทางด้วยภาพ
การพยากรณ์อากาศ
ระบบนำทาง
การสร้างแบบจำลอง 3 มิติ
การตรวจสอบสุขภาพโครงสร้าง
การประมวลผลประสาทสัมผัสและการเคลื่อนไหวของมนุษย์^{[ 91 ]}

ดูเพิ่มเติม

อ่านเพิ่มเติม

Bar-Shalom, Yaakov ; Li, X. Rong; Kirubarajan, Thiagalingam (2004). การประมาณค่าพร้อมการประยุกต์ใช้ในการติดตามและการนำทาง: ทฤษฎี อัลกอริทึม และซอฟต์แวร์ไวลีย์
Bierman, GJ (1977). วิธีการแยกตัวประกอบสำหรับการประมาณค่าลำดับแบบไม่ต่อเนื่องคณิตศาสตร์ในวิทยาศาสตร์และวิศวกรรมศาสตร์ เล่มที่ 128 ไมเนโอลา รัฐนิวยอร์ก: สำนักพิมพ์โดเวอร์ISBN 978-0-486-44981-4.
Bozic, SM (1994). การกรองแบบดิจิทัลและแบบ Kalman . Butterworth–Heinemann.
ชุย, ชาร์ลส์ เค.; เฉิน, กวนหรง (2009). การกรองคาลมานกับแอปพลิเคชันแบบเรียลไทม์ . ชุดหนังสือวิทยาศาสตร์สารสนเทศของสปริงเกอร์. เล่มที่ 17 (ฉบับที่ 4). นิวยอร์ก: สปริงเกอร์ . หน้า 229. ISBN 978-3-540-87848-3.
Gelb, A. (1974). การประมาณค่าที่เหมาะสมเชิงประยุกต์ . สำนักพิมพ์ MIT.
Harvey, AC (1990). การพยากรณ์, แบบจำลองอนุกรมเวลาเชิงโครงสร้าง และตัวกรอง Kalman . สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์. ISBN 978-0-521-40573-7.
เฮย์คิน, เอส. (2002). ทฤษฎีตัวกรองแบบปรับตัวได้ . เพรนติส ฮอลล์. ISBN 978-0-13-090126-2.
Jazwinski , Andrew H. (1970). กระบวนการสุ่มและการกรอง . คณิตศาสตร์ในวิทยาศาสตร์และวิศวกรรม. นิวยอร์ก: Academic Press . หน้า 376. ISBN 978-0-12-381550-7.
Kailath, Thomas ; Sayed, Ali H. ; Hassibi, Babak (2000). การประมาณค่าเชิงเส้น . NJ: Prentice–Hall. ISBN 978-0-13-022464-4.
Kalman, RE (1960). "แนวทางใหม่สำหรับปัญหาการกรองเชิงเส้นและการทำนาย" (PDF) . วารสารวิศวกรรมพื้นฐาน . 82 (1): 35– 45. doi : 10.1115/1.3662552 . S2CID 1242324 . เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 2008-05-29 . สืบค้นเมื่อ2008-05-03 .
Kalman, RE; Bucy, RS (1961). "ผลลัพธ์ใหม่ในการกรองเชิงเส้นและทฤษฎีการทำนาย". Journal of Basic Engineering . 83 : 95–108 . CiteSeerX 10.1.1.361.6851 . doi : 10.1115/1.3658902 . S2CID 8141345 .
Liu, W.; Principe, JC; Haykin, S. (2010). การกรองแบบปรับตัวตามเคอร์เนล: บทนำที่ครอบคลุม . John Wiley.
Maybeck, Peter S. (1979). "บทที่ 1" (PDF) . แบบจำลองเชิงสุ่ม การประมาณค่า และการควบคุม . คณิตศาสตร์ในวิทยาศาสตร์และวิศวกรรม. เล่มที่ 141–1 . นิวยอร์ก: Academic Press . ISBN 978-0-12-480701-3.
มาโนลาคิส, ดีจี (1999). การประมวลผลสัญญาณเชิงสถิติและเชิงปรับตัว . อาร์เทค เฮาส์.
Simon, D. (2006). การประมาณค่าสถานะที่เหมาะสมที่สุด: Kalman, H Infinity และวิธีการแบบไม่เชิงเส้น . Wiley-Interscience. เก็บถาวรจากต้นฉบับเมื่อ 30 ธันวาคม 2010. สืบค้นเมื่อ 5 กรกฎาคม 2006 .
Sayed, Ali H. (2008). ตัวกรองแบบปรับได้ . นิวเจอร์ซีย์: Wiley. ISBN 978-0-470-25388-5.
Roweis, S.; Ghahramani, Z. (1999). "การทบทวนแบบรวมของแบบจำลองเกาส์เซียนเชิงเส้น" (PDF)การคำนวณประสาท11 (2): 305– 345. Bibcode : 1999NeCom..11..305R . doi : 10.1162/089976699300016674 . PMID 9950734 . S2CID 2590898 .
Warwick, Kevin (1987). "ผู้สังเกตการณ์ที่เหมาะสมที่สุดสำหรับแบบจำลอง ARMA" วารสารการควบคุมระหว่างประเทศ 46 ( 5): 1493– 1503. doi : 10.1080/00207178708933989 .

ลิงก์ภายนอก

แนวทางใหม่ในการแก้ปัญหาการกรองเชิงเส้นและการทำนายโดย RE Kalman, 1960
ตัวกรอง Kalman และ Bayesian ใน Pythonตำราเรียนแบบโอเพนซอร์สเกี่ยวกับการกรอง Kalman
วิธีการทำงานของตัวกรอง Kalman ในรูปภาพอธิบายตัวกรอง Kalman ด้วยภาพและสี

[ 1 ]

2 ] นอกจาก

[ 3 ]

[ 4 ]

5 ] การ

[ 6 ]

[ 7 ]

ได้

[

ข้อมูล

[

[

[

[

[

[

17

18

19

20

[

และ

[ 23 ]

[ 24 ]

[

[

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[

[

42

[ 43 ]

[

[

[ 46 ]

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

[ 52 ]

[ 53 ]

[

[

[ 56 ]

ค่า

[ 58 ]

[ 59 ]

[

[ 61 ]

[ 62 ]

[ 63 ]

[ 64 ]

[

[ 66 ]

[

[

[

[

[

[

[

[

[ 75 ]

[ 76 ]

[

[ 78 ]

[ 79 ]

[

[ 81 ]

[ 82 ]

[ 83 ]

เนื่องจากแบบจำลองสถานะเชิงเส้นแบบเกาส์เซียนนำไปสู่กระบวนการเกาส์เซียน ตัวกรอง Kalman จึง

[ 85 ]

[ 86 ]

[ 87 ]

[ 88 ]

[ 89 ]

[ 90 ]

[ 91 ]

ตัวกรองคาลมาน

ประวัติศาสตร์

ภาพรวมของการคำนวณ

ตัวอย่างการใช้งาน

คำอธิบายทางเทคนิคและบริบท

แบบจำลองระบบพลวัตพื้นฐาน

รายละเอียด

ทำนาย

อัปเดต

ตัวแปรคงที่

การประมาณค่าความแปรปรวนร่วมของสัญญาณรบกวน Q kและ R k

ความเหมาะสมและประสิทธิภาพ

ตัวอย่างการใช้งานทางเทคนิค

รูปแบบเชิงเส้นกำกับ

อนุพันธ์

การหาเมทริกซ์ความแปรปรวนร่วมของการประมาณค่าภายหลัง

การหาค่ากำไรของ Kalman

การลดรูปสูตรความแปรปรวนร่วมของข้อผิดพลาดภายหลัง

การวิเคราะห์ความไว

รูปแบบตัวประกอบ

รูปแบบขนาน

ความสัมพันธ์กับการประมาณค่าแบบเบย์เซียนแบบวนซ้ำ

ความน่าจะเป็นแบบมาร์จินัล

ตัวกรองข้อมูล

ตัวปรับความเรียบแบบหน่วงคงที่

ตัวปรับเรียบช่วงเวลาคงที่

ราวช์-ตุง-สตรีเบล

เครื่องปรับผิวเรียบแบบ Bryson–Frazier ดัดแปลง

ตัวปรับเรียบความแปรปรวนต่ำสุด

ตัวกรอง Kalman แบบถ่วงน้ำหนักความถี่

ตัวกรองแบบไม่เชิงเส้น

ตัวกรอง Kalman แบบขยาย

ไส้กรอง Kalman ไร้กลิ่น

คะแนนซิกมา

ทำนาย

อัปเดต

ตัวกรอง Kalman แบบจำแนก

ตัวกรอง Kalman แบบปรับได้

ตัวกรอง Kalman–Bucy

ตัวกรอง Kalman แบบไฮบริด

เริ่มต้น

ทำนาย

อัปเดต

รูปแบบต่างๆ สำหรับการกู้คืนสัญญาณที่กระจัดกระจาย

ความสัมพันธ์กับกระบวนการเกาส์เซียน

แอปพลิเคชัน

ดูเพิ่มเติม

อ่านเพิ่มเติม

ลิงก์ภายนอก

ข้อมูลสำคัญจากบทความ

การประมาณค่าความแปรปรวนร่วมของสัญญาณรบกวน Q _kและ R _k