กลับไปหน้าบทความ

อ่าน 2 นาที

การประมาณความหนาแน่นเคอร์เนลแบบแปรผัน

ใน ทางสถิติ การประมาณความหนาแน่นเคอร์เนล แบบปรับได้ หรือ" แบนด์วิดท์แปรผัน" เป็นรูปแบบหนึ่งของ การประมาณความหนาแน่นเคอร์เนล...

การประมาณความหนาแน่นเคอร์เนลแบบแปรผัน

ในทางสถิติ การประมาณความหนาแน่นเคอร์เนล แบบปรับได้หรือ" แบนด์วิดท์แปรผัน"เป็นรูปแบบหนึ่งของการประมาณความหนาแน่นเคอร์เนลซึ่งขนาดของเคอร์เนลที่ใช้ในการประมาณจะแตกต่างกันไปตามตำแหน่งของตัวอย่างหรือตำแหน่งของจุดทดสอบ เป็นเทคนิคที่มีประสิทธิภาพเป็นพิเศษเมื่อปริภูมิของตัวอย่างมีหลายมิติ [ 1 ]

เหตุผล

เมื่อกำหนดชุดตัวอย่างเราต้องการประมาณค่าความหนาแน่นที่จุดทดสอบ:

โดยที่nคือจำนวนตัวอย่าง, Kคือ "เคอร์เนล" , hคือความกว้างของเคอร์เนล และDคือจำนวนมิติในเคอร์เนลสามารถมองได้ว่าเป็นตัวกรองเชิงเส้นแบบง่ายๆ

การใช้ความกว้างของตัวกรองคงที่อาจหมายความว่าในบริเวณที่มีความหนาแน่นต่ำ ตัวอย่างทั้งหมดจะตกอยู่ที่ส่วนหางของตัวกรองโดยมีน้ำหนักต่ำมาก ในขณะที่บริเวณที่มีความหนาแน่นสูงจะพบตัวอย่างจำนวนมากเกินไปในบริเวณตรงกลางโดยมีน้ำหนักใกล้เคียงกับหนึ่ง เพื่อแก้ไขปัญหานี้ เราจึงปรับความกว้างของเคอร์เนลในบริเวณต่างๆ ของพื้นที่ตัวอย่าง มีสองวิธีในการทำเช่นนี้ ได้แก่ การประมาณค่าแบบบอลลูนและการประมาณค่าแบบจุดต่อจุด ในตัวประมาณค่าแบบบอลลูน ความกว้างของเคอร์เนลจะแตกต่างกันไปตามตำแหน่งของจุดทดสอบ ในตัวประมาณค่าแบบจุดต่อจุด ความกว้างของเคอร์เนลจะแตกต่างกันไปตามตำแหน่งของตัวอย่าง[ 1 ]

สำหรับตัวประมาณค่าแบบหลายตัวแปร พารามิเตอร์hสามารถขยายให้ครอบคลุมถึงการเปลี่ยนแปลงไม่เพียงแค่ขนาด แต่ยังรวมถึงรูปร่างของเคอร์เนลด้วย อย่างไรก็ตาม วิธีการที่ซับซ้อนกว่านี้จะไม่กล่าวถึงในที่นี้

ผู้ประเมินลูกโป่ง

วิธีการทั่วไปในการปรับความกว้างของเคอร์เนลคือการทำให้ความกว้างแปรผกผันกับความหนาแน่น ณ จุดทดสอบ:

โดยที่kเป็นค่าคงที่ ถ้าเราแทนค่า PDF ที่ประมาณไว้กลับเข้าไป และสมมติว่าฟังก์ชันเคอร์เนล เป็นแบบเกาส์เซียน เราสามารถแสดงได้ว่าWเป็นค่าคงที่: [ 2 ]

การพิสูจน์ที่คล้ายกันนี้ใช้ได้กับเคอร์เนลใดๆ ที่ฟังก์ชันการทำให้เป็นมาตรฐานมีลำดับh Dแม้ว่าจะมีปัจจัยคงที่ที่แตกต่างกันแทนที่เทอม(2 π) D/2ก็ตาม ซึ่งทำให้ได้การวางนัยทั่วไปของอัลกอริทึมเพื่อนบ้านใกล้ที่สุด kตัว นั่นคือฟังก์ชันเคอร์เนล แบบสม่ำเสมอ จะส่งคืนเทคนิค KNN [ 2 ]

ข้อผิดพลาดประกอบด้วยสองส่วน คือ ส่วนความแปรปรวนและส่วนความเอนเอียง ส่วนความแปรปรวนกำหนดไว้ดังนี้: [ 1 ]

.

ค่าความเอนเอียงจะพบได้จากการประเมินฟังก์ชันโดยประมาณในลิมิตเมื่อความกว้างของเคอร์เนลมีขนาดใหญ่กว่าระยะห่างของตัวอย่างมาก โดยการใช้การกระจายอนุกรมเทย์เลอร์สำหรับฟังก์ชันจริง ค่าความเอนเอียงจะหายไป:

ด้วยวิธีนี้ จึงสามารถหาความกว้างของเคอร์เนลที่เหมาะสมที่สุด ซึ่งจะช่วยลดข้อผิดพลาดของการประมาณค่าแต่ละครั้งได้

ใช้สำหรับการจำแนกประเภททางสถิติ

วิธีการนี้มีประสิทธิภาพเป็นพิเศษเมื่อนำไปใช้กับการจำแนกประเภททางสถิติเราสามารถดำเนินการได้สองวิธี วิธีแรกคือการคำนวณ PDF ของแต่ละคลาสแยกกัน โดยใช้พารามิเตอร์แบนด์วิดท์ที่แตกต่างกัน แล้วเปรียบเทียบกันดังเช่นในเทย์เลอร์[ 3 ] หรืออีกวิธีหนึ่ง เราสามารถแบ่งผลรวมตามคลาสของแต่ละตัวอย่างได้

โดยที่c iคือคลาสของ ตัวอย่างที่ iคลาสของจุดทดสอบสามารถประมาณได้โดยใช้วิธีความ น่าจะเป็นสูงสุด

  • akde1d.m - ไฟล์ Matlab m สำหรับการประมาณความหนาแน่นเคอร์เนลแบบปรับได้หนึ่งมิติ
  • libAGF - ไลบรารี C++สำหรับการประมาณความหนาแน่นเคอร์เนลแบบปรับได้หลายตัวแปร
  • akde.m ถูกเก็บถาวรเมื่อวันที่ 9 กุมภาพันธ์ 2017 ที่Wayback Machine - ฟังก์ชัน Matlabสำหรับการประมาณความหนาแน่นเคอร์เนลของตัวแปรหลายตัว (มิติสูง)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Variable_kernel_density_estimation&oldid=1327111547 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การประมาณความหนาแน่นเคอร์เนลแบบแปรผัน

ใน ทางสถิติ การประมาณความหนาแน่นเคอร์เนล แบบปรับได้ หรือ" แบนด์วิดท์แปรผัน" เป็นรูปแบบหนึ่งของ การประมาณความหนาแน่นเคอร์เนล...

เหตุผล

เมื่อกำหนดชุดตัวอย่างเราต้องการประมาณค่าความหนาแน่นที่จุดทดสอบ: { x → ฉัน } {\displaystyle \lbrace {\vec {x}__{i}\rbrace } พี ( x → ) {\displaystyle P({\vec {x}})} x → {\displaystyle {\vec {x}}}

ผู้ประเมินลูกโป่ง

วิธีการทั่วไปในการปรับความกว้างของเคอร์เนลคือการทำให้ความกว้างแปรผกผันกับความหนาแน่น ณ จุดทดสอบ:

ใช้สำหรับการจำแนกประเภททางสถิติ

วิธีการนี้มีประสิทธิภาพเป็นพิเศษเมื่อนำไปใช้กับ การจำแนกประเภททางสถิติ เราสามารถดำเนินการได้สองวิธี วิธีแรกคือการคำนวณ PDF ของแต่ละคลาสแยกกัน โดยใช้พารามิเตอร์แบนด์วิดท์ที่แตกต่างกัน แล้วเปรียบเทียบกันดังเช่นในเทย์เลอร์ [ 3 ] หรืออีกวิธีหนึ่ง...