อ่าน 4 นาที
เพอร์เซปตรอนเคอร์เนล
ในการเรียนรู้ของเครื่อง เพ อร์เซปตรอนเคอร์เนลเป็นรูปแบบหนึ่งของ อัลกอริ ธึมการเรียนรู้เพอร์เซปตรอนยอดนิยมที่สามารถเรียนรู้เครื่องเคอร์เนล ได้ กล่าวคือ
เพอร์เซปตรอนเคอร์เนล
| ส่วนหนึ่งของชุดบทความเกี่ยวกับ |
| การเรียนรู้ของเครื่องจักรและการขุดข้อมูล |
|---|
ในการเรียนรู้ของเครื่อง เพ อร์เซปตรอนเคอร์เนลเป็นรูปแบบหนึ่งของ อัลกอริ ธึมการเรียนรู้เพอร์เซปตรอนยอดนิยมที่สามารถเรียนรู้เครื่องเคอร์เนล ได้ กล่าวคือ ตัวจำแนกแบบไม่เชิงเส้นที่ใช้ฟังก์ชันเคอร์เนลในการคำนวณความคล้ายคลึงกันของตัวอย่างที่ไม่เคยเห็นมาก่อนกับตัวอย่างการฝึกอบรม อัลกอริธึมนี้ถูกคิดค้นขึ้นในปี พ.ศ. 2507 [ 1 ]ทำให้เป็นตัวเรียนรู้การจำแนกประเภทเคอร์เนลตัวแรก[ 2 ]
เบื้องต้น
อัลกอริทึมเพอร์เซปตรอน
อัลกอริทึมเพอร์เซปตรอนเป็น อัลกอริทึม การเรียนรู้แบบออนไลน์ที่ทำงานโดยหลักการที่เรียกว่า "การเรียนรู้ที่ขับเคลื่อนด้วยข้อผิดพลาด" มันปรับปรุงโมเดลอย่างต่อเนื่องโดยการรันโมเดลกับตัวอย่างการฝึกอบรม จากนั้นอัปเดตโมเดลเมื่อใดก็ตามที่พบว่าได้จำแนกประเภทผิดพลาดเมื่อเทียบกับ สัญญาณ ที่ได้รับการกำกับดูแลโมเดลที่เรียนรู้โดยอัลกอริทึมเพอร์เซปตรอนมาตรฐานคือตัว จำแนกไบนารี เชิงเส้น : เวกเตอร์ของน้ำหนักw (และอาจมีเทอมค่าคงที่bซึ่งละไว้ในที่นี้เพื่อความง่าย) ที่ใช้ในการจำแนกเวกเตอร์ตัวอย่างxเป็นคลาส "หนึ่ง" หรือคลาส "ลบหนึ่ง" ตาม
โดยที่ค่าศูนย์จะถูกแปลงเป็นค่าหนึ่งหรือลบหนึ่งโดยพลการ (เครื่องหมาย " หมวก " บนŷหมายถึงค่าประมาณ)
ในรูปแบบรหัสเทียมอัลกอริทึมเพอร์เซปตรอนแสดงได้ดังนี้:
- กำหนดค่าเริ่มต้นให้wเป็นเวกเตอร์ที่มีค่าเป็นศูนย์ทั้งหมด และมีความยาวเท่ากับpซึ่งเป็นจำนวนตัวแปรทำนาย (คุณลักษณะ)
- ทำซ้ำเป็นจำนวนครั้งที่กำหนดไว้ หรือจนกว่าจะถึงเกณฑ์การหยุดทำงานที่กำหนดไว้:
- สำหรับตัวอย่างการฝึกอบรมแต่ละตัวอย่างx iที่มีป้ายกำกับความจริงพื้นฐานy i ∈ {-1, 1 }:
- ให้ŷ = sgn( w T x i ) .
- ถ้าŷ ≠ y iให้ทำการอัปเดตw ← w + y i x i
- สำหรับตัวอย่างการฝึกอบรมแต่ละตัวอย่างx iที่มีป้ายกำกับความจริงพื้นฐานy i ∈ {-1, 1 }:
วิธีการเคอร์เนล
เมื่อเปรียบเทียบกับแบบจำลองเชิงเส้นที่เรียนรู้โดยเพอร์เซปตรอน วิธีเคอร์เนล[ 3 ]เป็นตัวจำแนกประเภทที่จัดเก็บชุดย่อยของตัวอย่างการฝึกอบรมx iเชื่อมโยงน้ำหนักα i กับแต่ละ ตัวอย่าง และทำการตัดสินใจสำหรับตัวอย่างใหม่x'โดยการประเมิน
- .
ในที่นี้Kคือฟังก์ชันเคอร์เนล ตามหลักการแล้ว ฟังก์ชันเคอร์เนลคือเคอร์เนลกึ่งบวกที่ไม่เป็นลบ (ดูเงื่อนไขของเมอร์เซอร์ ) ซึ่งแสดงถึงผลคูณภายในระหว่างตัวอย่างในพื้นที่มิติสูง ราวกับว่าตัวอย่างเหล่านั้นได้รับการขยายเพื่อรวมคุณลักษณะเพิ่มเติมโดยฟังก์ชันΦ : K ( x , x' ) = Φ( x ) · Φ( x' )โดยสัญชาตญาณแล้ว เราอาจคิดว่ามันเป็นฟังก์ชันความคล้ายคลึงกันระหว่างตัวอย่าง ดังนั้นเครื่องจักรเคอร์เนลจึงกำหนดคลาสของตัวอย่างใหม่โดยการเปรียบเทียบแบบถ่วงน้ำหนักกับชุดข้อมูลฝึกฝน แต่ละฟังก์ชันx' ↦ K ( x i , x' )ทำหน้าที่เป็นฟังก์ชันพื้นฐานในการจำแนกประเภท
อัลกอริทึม
เพื่อให้ได้เวอร์ชันเคอร์เนลของอัลกอริทึมเพอร์เซปตรอน เราต้องกำหนดสูตรในรูปแบบคู่ ก่อน โดยเริ่มจากการสังเกตว่าเวกเตอร์น้ำหนักwสามารถแสดงได้ในรูปผลรวมเชิงเส้นของ ตัวอย่างการฝึกอบรม nตัวอย่าง สมการสำหรับเวกเตอร์น้ำหนักคือ
โดยที่α iคือจำนวนครั้งที่x iถูกจำแนกผิด ทำให้ต้องมีการอัปเดตw ← w + y i x iโดยใช้ผลลัพธ์นี้ เราสามารถสร้างอัลกอริทึมเพอร์เซปตรอนคู่ ซึ่งวนลูปผ่านตัวอย่างเหมือนเดิม ทำการทำนาย แต่แทนที่จะจัดเก็บและอัปเดตเวกเตอร์น้ำหนักwมันจะอัปเดตเวกเตอร์ "ตัวนับความผิดพลาด" α แทน เราต้องเขียนสูตรการทำนายใหม่เพื่อกำจัดw ออก ไป ด้วย
เมื่อนำสมการทั้งสองนี้ไปใส่ในลูปการฝึกฝน ก็จะได้อัลกอริ ทึม เพอร์เซปตรอนคู่ (dual perceptron algorithm)
สุดท้ายนี้ เราสามารถแทนที่ผลคูณดอทในเพอร์เซปตรอนคู่ด้วยฟังก์ชันเคอร์เนลแบบใดก็ได้ เพื่อให้ได้ผลของแผนที่ฟีเจอร์Φโดยไม่ต้องคำนวณΦ( x )อย่างชัดเจนสำหรับตัวอย่างใดๆ การทำเช่นนี้จะทำให้ได้อัลกอริทึมเพอร์เซปตรอนเคอร์เนล: [ 4 ]
- กำหนดค่าเริ่มต้นให้αเป็นเวกเตอร์ที่มีค่าเป็นศูนย์ทั้งหมด และมีความยาวnซึ่งเป็นจำนวนตัวอย่างการฝึกฝน
- ทำซ้ำเป็นจำนวนครั้งที่กำหนดไว้ หรือจนกว่าจะถึงเกณฑ์การหยุดทำงานที่กำหนดไว้:
- สำหรับตัวอย่างการฝึกอบรมแต่ละตัวอย่างx j , y j :
- อนุญาต
- ถ้าŷ ≠ y jให้ทำการอัปเดตโดยเพิ่มค่าตัวนับข้อผิดพลาด:
- α j ← α j + 1
- สำหรับตัวอย่างการฝึกอบรมแต่ละตัวอย่างx j , y j :
รูปแบบต่างๆ และส่วนขยาย
ปัญหาหนึ่งของเพอร์เซปตรอนแบบเคอร์เนล ดังที่กล่าวมาข้างต้น คือ มันไม่เรียนรู้เครื่องจักรเคอร์เนลแบบเบาบาง ในตอนเริ่มต้น ค่า α i ทั้งหมด เป็นศูนย์ ดังนั้นการประเมินฟังก์ชันการตัดสินใจเพื่อให้ได้ŷจึงไม่จำเป็นต้องมีการประเมินเคอร์เนลเลย แต่การอัปเดตแต่ละครั้งจะเพิ่มค่าα i ขึ้นหนึ่งค่า ทำให้การประเมินมีค่าใช้จ่ายสูงขึ้นเรื่อยๆ ยิ่งไปกว่านั้น เมื่อใช้เพอร์เซปตรอนแบบเคอร์เนลใน สภาพแวดล้อม แบบออนไลน์จำนวนα i ที่ไม่เป็นศูนย์ และด้วยเหตุนี้ ค่าใช้จ่ายในการประเมินจะเพิ่มขึ้นเป็นเส้นตรงตามจำนวนตัวอย่างที่นำเสนอให้กับอัลกอริทึม
มีการเสนอให้ใช้รูปแบบ forgetron ของ kernel perceptron เพื่อจัดการกับปัญหานี้ โดยจะรักษา ชุด ตัวอย่างที่ใช้งานอยู่ ซึ่งมี ค่า α i ไม่เป็นศูนย์ และลบ ("ลืม") ตัวอย่างออกจากชุดที่ใช้งานอยู่เมื่อเกินงบประมาณที่กำหนดไว้ล่วงหน้า และ "ลดขนาด" (ลดน้ำหนักของ) ตัวอย่างเก่าเมื่อตัวอย่างใหม่ได้รับการเลื่อนระดับให้มี ค่าα iไม่เป็นศูนย์[ 5 ]
ปัญหาอีกประการหนึ่งของเคอร์เนลเพอร์เซปตรอนคือมันไม่ได้ทำการปรับค่าทำให้เสี่ยงต่อการเกิดโอเวอร์ฟิตติ้ง อัลกอริทึมการเรียนรู้เคอร์เนลออนไลน์ NORMA สามารถถือได้ว่าเป็นการขยายผลของอัลกอริทึมเคอร์เนลเพอร์เซปตรอนด้วยการปรับค่า[ 6 ]อั ลกอริทึม การปรับค่าขั้นต่ำแบบลำดับ (SMO) ที่ใช้ในการเรียนรู้เครื่องเวกเตอร์สนับสนุนก็สามารถถือได้ว่าเป็นการขยายผลของเคอร์เนลเพอร์เซปตรอนเช่นกัน[ 6 ]
อัลกอริทึมเพอร์เซปตรอนแบบโหวตของ Freund และ Schapire ยังขยายไปถึงกรณีเคอร์เนลไลซ์ด้วย[ 7 ]ทำให้ขอบเขตการวางนัยทั่วไปเทียบได้กับ SVM เคอร์เนล[ 2 ]
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ เพอร์เซปตรอนเคอร์เนล
ในการเรียนรู้ของเครื่อง เพ อร์เซปตรอนเคอร์เนลเป็นรูปแบบหนึ่งของ อัลกอริ ธึมการเรียนรู้เพอร์เซปตรอนยอดนิยมที่สามารถเรียนรู้เครื่องเคอร์เนล ได้ กล่าวคือ
อัลกอริทึมเพอร์เซปตรอน
อัลกอริทึมเพอร์เซปตรอนเป็น อัลกอริทึม การเรียนรู้แบบออนไลน์ ที่ทำงานโดยหลักการที่เรียกว่า "การเรียนรู้ที่ขับเคลื่อนด้วยข้อผิดพลาด" มันปรับปรุงโมเดลอย่างต่อเนื่องโดยการรันโมเดลกับตัวอย่างการฝึกอบรม...
วิธีการเคอร์เนล
เมื่อเปรียบเทียบกับแบบจำลองเชิงเส้นที่เรียนรู้โดยเพอร์เซปตรอน วิธีเคอร์เนล [ 3 ] เป็นตัวจำแนกประเภทที่จัดเก็บชุดย่อยของตัวอย่างการฝึกอบรม x i เชื่อมโยงน้ำหนัก α i กับแต่ละ ตัวอย่าง และทำการตัดสินใจสำหรับตัวอย่างใหม่ x' โดยการประเมิน
อัลกอริทึม
เพื่อให้ได้เวอร์ชันเคอร์เนลของอัลกอริทึมเพอร์เซปตรอน เราต้องกำหนดสูตรใน รูปแบบคู่ ก่อน โดยเริ่มจากการสังเกตว่าเวกเตอร์น้ำหนัก w สามารถแสดงได้ในรูป ผลรวมเชิงเส้น ของ ตัวอย่างการฝึกอบรม n ตัวอย่าง สมการสำหรับเวกเตอร์น้ำหนักคือ