การเรียนรู้เชิงแข่งขัน

Q: หลักการ

กฎการเรียนรู้ เชิงแข่งขันมีองค์ประกอบพื้นฐาน 3 ประการได้แก่ [ 3 ] [ 4 ]

การเรียนรู้แบบแข่งขันเป็นรูปแบบหนึ่งของการเรียนรู้แบบไม่มีผู้กำกับดูแลในเครือข่ายประสาทเทียมซึ่งโหนดต่างๆ จะแข่งขันกันเพื่อสิทธิ์ในการตอบสนองต่อชุดย่อยของข้อมูลอินพุต^{[ 1 ]}^{[ 2 ]} การเรียนรู้แบบแข่งขัน เป็นรูปแบบหนึ่งของ การเรียนรู้แบบ Hebbianโดยทำงานโดยการเพิ่มความเชี่ยวชาญของแต่ละโหนดในเครือข่าย เหมาะอย่างยิ่งสำหรับการค้นหาคลัสเตอร์ภายในข้อมูล

แบบจำลองและอัลกอริธึมที่อิงตามหลักการเรียนรู้แบบแข่งขัน ได้แก่การหาปริมาณเวกเตอร์และแผนที่จัดระเบียบตนเอง (แผนที่โคโฮเน็น)

หลักการ

กฎการเรียนรู้เชิงแข่งขันมีองค์ประกอบพื้นฐาน 3 ประการได้แก่^{[ 3 ]}^{[ 4 ]}

กลุ่มของเซลล์ประสาทที่มีลักษณะเหมือนกันทุกประการ ยกเว้นน้ำหนักการเชื่อมต่อระหว่างเซลล์ประสาทที่กระจายตัวแบบสุ่ม ดังนั้นจึงตอบสนองต่อรูปแบบอินพุตชุดเดียวกันแตกต่างกัน
ข้อจำกัดที่กำหนดไว้สำหรับ "ความแข็งแรง" ของเซลล์ประสาทแต่ละเซลล์
กลไกที่อนุญาตให้เซลล์ประสาทแข่งขันกันเพื่อสิทธิ์ในการตอบสนองต่อชุดย่อยของอินพุตที่กำหนด โดยจะมีเพียงเซลล์ประสาทส่งออกเพียงเซลล์เดียว (หรือเพียงเซลล์ประสาทเดียวต่อกลุ่ม) ที่ทำงาน (กล่าวคือ "เปิด") ในแต่ละครั้ง เซลล์ประสาทที่ชนะการแข่งขันเรียกว่าเซลล์ประสาท "ผู้ชนะได้ทั้งหมด "

ด้วยเหตุนี้ เซลล์ประสาทแต่ละเซลล์ในเครือข่ายจึงเรียนรู้ที่จะเชี่ยวชาญในการประมวลผลกลุ่มของรูปแบบที่คล้ายคลึงกัน และด้วยเหตุนี้จึงกลายเป็น 'ตัวตรวจจับคุณลักษณะ' สำหรับรูปแบบอินพุตประเภทต่างๆ

ข้อเท็จจริงที่ว่าเครือข่ายการแข่งขันจะเข้ารหัสชุดอินพุตที่สัมพันธ์กันไปยังเซลล์ประสาทเอาต์พุตเพียงไม่กี่เซลล์นั้น จะช่วยขจัดความซ้ำซ้อนในการแสดงผล ซึ่งเป็นส่วนสำคัญของการประมวลผลในระบบประสาทสัมผัส ทาง ชีวภาพ^{[ 5 ]}^{[ 6 ]}

สถาปัตยกรรมและการนำไปใช้

การเรียนรู้เชิงแข่งขันมักจะถูกนำไปใช้กับโครงข่ายประสาทเทียมที่มีเลเยอร์ซ่อนอยู่ซึ่งโดยทั่วไปเรียกว่า “เลเยอร์เชิงแข่งขัน” ^{[ 7 ]}นิวรอนเชิงแข่งขันแต่ละตัวจะถูกอธิบายด้วยเวกเตอร์ของน้ำหนักและคำนวณการวัดความคล้ายคลึงกันระหว่างข้อมูลอินพุต และเวกเตอร์น้ำหนัก ${\mathbf {w} }_{i}=\left({w_{i1},..,w_{id}}\right)^{T},i=1,..,M$ ${\mathbf {x} }^{n}=\left({x_{n1},..,x_{nd}}\right)^{T}\in \mathbb {R} ^{d}$ ${\mathbf {w} _{i}$

สำหรับเวกเตอร์อินพุตแต่ละตัว นิวรอนที่แข่งขันกันจะ "แข่งขัน" กันเองเพื่อดูว่านิวรอนใดมีความคล้ายคลึงกับเวกเตอร์อินพุตนั้นมากที่สุด นิวรอนที่ชนะ m จะกำหนดค่าเอาต์พุตของมันและนิวรอนที่แข่งขันกันตัวอื่นๆ จะกำหนดค่าเอาต์พุตของมันเช่น กัน $o_{m}=1$ $o_{i}=0,i=1,..,M,i\neq m$

โดยปกติแล้ว การวัดความคล้ายคลึงจะใช้ ค่าผกผันของ ระยะทางแบบยุคลิดระหว่างเวกเตอร์อินพุตและเวกเตอร์น้ำหนัก $\left\|{{\mathbf {x} }-{\mathbf {w} }_{i}}\right\|$ ${\mathbf {x} }^{n}$ ${\mathbf {w} _{i}$

ตัวอย่างอัลกอริธึม

นี่คืออัลกอริธึมการเรียนรู้เชิงแข่งขันแบบง่ายๆ เพื่อค้นหาคลัสเตอร์สามกลุ่มภายในข้อมูลอินพุตบางส่วน

1. (การตั้งค่า) สมมติว่ามีชุดเซ็นเซอร์ทั้งหมดเชื่อมต่อกับโหนดสามโหนดที่แตกต่างกัน โดยที่ทุกโหนดเชื่อมต่อกับทุกเซ็นเซอร์ กำหนดค่าน้ำหนักที่แต่ละโหนดส่งให้กับเซ็นเซอร์แบบสุ่มระหว่าง 0.0 ถึง 1.0 และให้เอาต์พุตของแต่ละโหนดเป็นผลรวมของเซ็นเซอร์ทั้งหมด โดยความแรงของสัญญาณของแต่ละเซ็นเซอร์จะถูกคูณด้วยค่าน้ำหนักของมัน

2. เมื่อเครือข่ายได้รับข้อมูลป้อนเข้า โหนดที่มีผลลัพธ์สูงสุดจะถือเป็นผู้ชนะ ข้อมูลป้อนเข้านั้นจะถูกจัดอยู่ในกลุ่มที่สอดคล้องกับโหนดนั้น

3. ผู้ชนะจะอัปเดตค่าน้ำหนักของแต่ละการเชื่อมต่อ โดยย้ายค่าน้ำหนักจากจุดเชื่อมต่อที่ให้สัญญาณอ่อนกว่าไปยังจุดเชื่อมต่อที่ให้สัญญาณแรงกว่า

ดังนั้น เมื่อได้รับข้อมูลมากขึ้น โหนดแต่ละโหนดจะเคลื่อนเข้าหาจุดศูนย์กลางของกลุ่มที่มันเป็นตัวแทน และจะทำงานอย่างแข็งขันมากขึ้นสำหรับข้อมูลนำเข้าในกลุ่มนี้ และทำงานอย่างอ่อนลงสำหรับข้อมูลนำเข้าในกลุ่มอื่น ๆ

ดูเพิ่มเติม

ข้อมูลเพิ่มเติมและซอฟต์แวร์

ร่างรายงาน "วิธีการเรียนรู้เชิงแข่งขันบางประการ" ( ไฟล์ PDFประกอบด้วยคำอธิบายของอัลกอริทึมที่เกี่ยวข้องหลายรายการ)
DemoGNG - โปรแกรมจำลอง Java สำหรับวิธีการเรียนรู้เชิงแข่งขัน

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]