กลับไปหน้าบทความ

อ่าน 2 นาที

การเรียนรู้เชิงแข่งขัน

การเรียนรู้แบบแข่งขันเป็นรูปแบบหนึ่งของการเรียนรู้แบบไม่มีผู้กำกับดูแลในเครือข่ายประสาทเทียมซึ่งโหนดต่างๆ จะแข่งขันกันเพื่อสิทธิ์ในการตอบสนองต่อชุดย่อยของข้อมูลอินพุต...

การเรียนรู้เชิงแข่งขัน

การเรียนรู้แบบแข่งขันเป็นรูปแบบหนึ่งของการเรียนรู้แบบไม่มีผู้กำกับดูแลในเครือข่ายประสาทเทียมซึ่งโหนดต่างๆ จะแข่งขันกันเพื่อสิทธิ์ในการตอบสนองต่อชุดย่อยของข้อมูลอินพุต[ 1 ] [ 2 ] การเรียนรู้แบบแข่งขัน เป็นรูปแบบหนึ่งของ การเรียนรู้แบบ Hebbianโดยทำงานโดยการเพิ่มความเชี่ยวชาญของแต่ละโหนดในเครือข่าย เหมาะอย่างยิ่งสำหรับการค้นหาคลัสเตอร์ภายในข้อมูล

แบบจำลองและอัลกอริธึมที่อิงตามหลักการเรียนรู้แบบแข่งขัน ได้แก่การหาปริมาณเวกเตอร์และแผนที่จัดระเบียบตนเอง (แผนที่โคโฮเน็น)

หลักการ

กฎการเรียนรู้เชิงแข่งขันมีองค์ประกอบพื้นฐาน 3 ประการได้แก่[ 3 ] [ 4 ]

  • กลุ่มของเซลล์ประสาทที่มีลักษณะเหมือนกันทุกประการ ยกเว้นน้ำหนักการเชื่อมต่อระหว่างเซลล์ประสาทที่กระจายตัวแบบสุ่ม ดังนั้นจึงตอบสนองต่อรูปแบบอินพุตชุดเดียวกันแตกต่างกัน
  • ข้อจำกัดที่กำหนดไว้สำหรับ "ความแข็งแรง" ของเซลล์ประสาทแต่ละเซลล์
  • กลไกที่อนุญาตให้เซลล์ประสาทแข่งขันกันเพื่อสิทธิ์ในการตอบสนองต่อชุดย่อยของอินพุตที่กำหนด โดยจะมีเพียงเซลล์ประสาทส่งออกเพียงเซลล์เดียว (หรือเพียงเซลล์ประสาทเดียวต่อกลุ่ม) ที่ทำงาน (กล่าวคือ "เปิด") ในแต่ละครั้ง เซลล์ประสาทที่ชนะการแข่งขันเรียกว่าเซลล์ประสาท "ผู้ชนะได้ทั้งหมด "

ด้วยเหตุนี้ เซลล์ประสาทแต่ละเซลล์ในเครือข่ายจึงเรียนรู้ที่จะเชี่ยวชาญในการประมวลผลกลุ่มของรูปแบบที่คล้ายคลึงกัน และด้วยเหตุนี้จึงกลายเป็น 'ตัวตรวจจับคุณลักษณะ' สำหรับรูปแบบอินพุตประเภทต่างๆ

ข้อเท็จจริงที่ว่าเครือข่ายการแข่งขันจะเข้ารหัสชุดอินพุตที่สัมพันธ์กันไปยังเซลล์ประสาทเอาต์พุตเพียงไม่กี่เซลล์นั้น จะช่วยขจัดความซ้ำซ้อนในการแสดงผล ซึ่งเป็นส่วนสำคัญของการประมวลผลในระบบประสาทสัมผัส ทาง ชีวภาพ[ 5 ] [ 6 ]

สถาปัตยกรรมและการนำไปใช้

สถาปัตยกรรมเครือข่ายประสาทเทียมเชิงแข่งขัน

การเรียนรู้เชิงแข่งขันมักจะถูกนำไปใช้กับโครงข่ายประสาทเทียมที่มีเลเยอร์ซ่อนอยู่ซึ่งโดยทั่วไปเรียกว่า “เลเยอร์เชิงแข่งขัน” [ 7 ]นิวรอนเชิงแข่งขันแต่ละตัวจะถูกอธิบายด้วยเวกเตอร์ของน้ำหนักและคำนวณการวัดความคล้ายคลึงกันระหว่างข้อมูลอินพุต และเวกเตอร์น้ำหนัก

สำหรับเวกเตอร์อินพุตแต่ละตัว นิวรอนที่แข่งขันกันจะ "แข่งขัน" กันเองเพื่อดูว่านิวรอนใดมีความคล้ายคลึงกับเวกเตอร์อินพุตนั้นมากที่สุด นิวรอนที่ชนะ m จะกำหนดค่าเอาต์พุตของมันและนิวรอนที่แข่งขันกันตัวอื่นๆ จะกำหนดค่าเอาต์พุตของมันเช่น กัน

โดยปกติแล้ว การวัดความคล้ายคลึงจะใช้ ค่าผกผันของ ระยะทางแบบยุคลิดระหว่างเวกเตอร์อินพุตและเวกเตอร์น้ำหนัก

ตัวอย่างอัลกอริธึม

นี่คืออัลกอริธึมการเรียนรู้เชิงแข่งขันแบบง่ายๆ เพื่อค้นหาคลัสเตอร์สามกลุ่มภายในข้อมูลอินพุตบางส่วน

1. (การตั้งค่า) สมมติว่ามีชุดเซ็นเซอร์ทั้งหมดเชื่อมต่อกับโหนดสามโหนดที่แตกต่างกัน โดยที่ทุกโหนดเชื่อมต่อกับทุกเซ็นเซอร์ กำหนดค่าน้ำหนักที่แต่ละโหนดส่งให้กับเซ็นเซอร์แบบสุ่มระหว่าง 0.0 ถึง 1.0 และให้เอาต์พุตของแต่ละโหนดเป็นผลรวมของเซ็นเซอร์ทั้งหมด โดยความแรงของสัญญาณของแต่ละเซ็นเซอร์จะถูกคูณด้วยค่าน้ำหนักของมัน

2. เมื่อเครือข่ายได้รับข้อมูลป้อนเข้า โหนดที่มีผลลัพธ์สูงสุดจะถือเป็นผู้ชนะ ข้อมูลป้อนเข้านั้นจะถูกจัดอยู่ในกลุ่มที่สอดคล้องกับโหนดนั้น

3. ผู้ชนะจะอัปเดตค่าน้ำหนักของแต่ละการเชื่อมต่อ โดยย้ายค่าน้ำหนักจากจุดเชื่อมต่อที่ให้สัญญาณอ่อนกว่าไปยังจุดเชื่อมต่อที่ให้สัญญาณแรงกว่า

ดังนั้น เมื่อได้รับข้อมูลมากขึ้น โหนดแต่ละโหนดจะเคลื่อนเข้าหาจุดศูนย์กลางของกลุ่มที่มันเป็นตัวแทน และจะทำงานอย่างแข็งขันมากขึ้นสำหรับข้อมูลนำเข้าในกลุ่มนี้ และทำงานอย่างอ่อนลงสำหรับข้อมูลนำเข้าในกลุ่มอื่น ๆ

ดูเพิ่มเติม

ข้อมูลเพิ่มเติมและซอฟต์แวร์

  • ร่างรายงาน "วิธีการเรียนรู้เชิงแข่งขันบางประการ" ( ไฟล์ PDFประกอบด้วยคำอธิบายของอัลกอริทึมที่เกี่ยวข้องหลายรายการ)
  • DemoGNG - โปรแกรมจำลอง Java สำหรับวิธีการเรียนรู้เชิงแข่งขัน
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Competitive_learning&oldid=1355139545 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การเรียนรู้เชิงแข่งขัน

การเรียนรู้แบบแข่งขันเป็นรูปแบบหนึ่งของการเรียนรู้แบบไม่มีผู้กำกับดูแลในเครือข่ายประสาทเทียมซึ่งโหนดต่างๆ จะแข่งขันกันเพื่อสิทธิ์ในการตอบสนองต่อชุดย่อยของข้อมูลอินพุต...

หลักการ

กฎการเรียนรู้ เชิงแข่งขันมีองค์ประกอบพื้นฐาน 3 ประการได้แก่ [ 3 ] [ 4 ]

สถาปัตยกรรมและการนำไปใช้

การเรียนรู้เชิงแข่งขันมักจะถูกนำไปใช้กับโครงข่ายประสาทเทียมที่มีเลเยอร์ซ่อนอยู่ซึ่งโดยทั่วไปเรียกว่า “เลเยอร์เชิงแข่งขัน” [ 7 ] นิวรอนเชิงแข่งขันแต่ละตัวจะถูกอธิบายด้วยเวกเตอร์ของน้ำหนักและคำนวณ การวัดความคล้ายคลึงกัน ระหว่างข้อมูลอินพุต และเวกเตอร์น้ำหนัก ว...

ตัวอย่างอัลกอริธึม

นี่คืออัลกอริธึมการเรียนรู้เชิงแข่งขันแบบง่ายๆ เพื่อค้นหาคลัสเตอร์สามกลุ่มภายในข้อมูลอินพุตบางส่วน