กลับไปหน้าบทความ

อ่าน 6 นาที

กลไกการเปิดปิด

ในโครงข่ายประสาทเทียมกลไกการควบคุมการไหล (gating mechanism)เป็นโครงสร้างทางสถาปัตยกรรมที่ใช้ควบคุมการไหลของสัญญาณกระตุ้นและสัญญาณไล่ระดับ (gradient signals )...

กลไกการเปิดปิด

ในโครงข่ายประสาทเทียมกลไกการควบคุมการไหล (gating mechanism)เป็นโครงสร้างทางสถาปัตยกรรมที่ใช้ควบคุมการไหลของสัญญาณกระตุ้นและสัญญาณไล่ระดับ (gradient signals ) โดยส่วนใหญ่จะใช้ในโครงข่ายประสาทเทียมแบบวนซ้ำ (RNNs) แต่ก็มีการนำไปประยุกต์ใช้ในสถาปัตยกรรมอื่นๆ ด้วยเช่นกัน

RNNs

กลไกเกตติ้งเป็นหัวใจสำคัญของหน่วยความจำระยะสั้นแบบยาว (LSTM) [ 1 ]กลไกเหล่านี้ได้รับการเสนอเพื่อลดปัญหาการลดลงของเกรเดียนต์ที่มักพบใน RNN ทั่วไป

หน่วย LSTM ประกอบด้วยเกตสามตัว:

  • ประตูอินพุตซึ่งควบคุมการไหลของข้อมูลใหม่เข้าสู่เซลล์หน่วยความจำ
  • ประตูแห่งการลืม (Forget Gate)ซึ่งควบคุมปริมาณข้อมูลที่จะถูกเก็บรักษาไว้จากช่วงเวลาก่อนหน้า
  • เกตเอาต์พุตทำหน้าที่ควบคุมปริมาณข้อมูลที่จะส่งไปยังเลเยอร์ถัดไป

สมการสำหรับ LSTM คือ: [ 2 ]

ในที่นี้หมายถึงการคูณแบบทีละองค์ประกอบ

หน่วยวนซ้ำแบบมีเกต (GRU) ช่วยลดความซับซ้อนของ LSTM [ 3 ]เมื่อเปรียบเทียบกับ LSTM แล้ว GRU มีเพียงสองเกต ได้แก่เกตรีเซ็ตและเกตอัปเดต GRU ยังรวมสถานะเซลล์และสถานะที่ซ่อนอยู่เข้าด้วยกัน เกตรีเซ็ตโดยประมาณจะสอดคล้องกับเกตลืม และเกตอัปเดตโดยประมาณจะสอดคล้องกับเกตอินพุต เกตเอาต์พุตถูกลบออก

GRU มีหลายรูปแบบ รูปแบบหนึ่งโดยเฉพาะมีสมการดังต่อไปนี้: [ 4 ]

หน่วยเชิงเส้นแบบมีประตู

หน่วยเชิงเส้นแบบมีเกต (GLUs) [ 5 ]ปรับกลไกเกตเพื่อใช้ในเครือข่ายประสาทแบบฟีดฟอร์เวิร์ดซึ่งมักจะอยู่ใน สถาปัตยกรรมแบบทราน ส์ฟอร์เมอร์โดยกำหนดไว้ดังนี้:

โดยที่อินพุตแรกและอินพุตที่สองคือค่าใดตามลำดับ และแทนฟังก์ชันการกระตุ้นแบบซิกมอยด์

การแทนที่ด้วยฟังก์ชันการกระตุ้นอื่นๆ จะนำไปสู่รูปแบบต่างๆ ของ GLU:

โดยที่ReLU , GELUและSwishเป็นฟังก์ชันการกระตุ้นที่แตกต่างกัน

ในแบบจำลองหม้อแปลง หน่วยเกตติ้งดังกล่าวมักใช้ในโมดูลฟีดฟอร์เวิร์ดสำหรับอินพุตเวกเตอร์เดียว ผลลัพธ์ที่ได้คือ: [ 6 ]

สถาปัตยกรรมอื่นๆ

กลไกการควบคุมการเข้าออกถูกนำมาใช้ในเครือข่ายทางหลวงซึ่งได้รับการออกแบบโดยการคลี่ LSTM ออกมา

การควบคุมช่องทาง[ 7 ]ใช้เกตเพื่อควบคุมการไหลของข้อมูลผ่านช่องทางต่างๆ ภายในเครือข่ายประสาทเทียมแบบคอนโวลูชัน (CNN)

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Zhang, Aston; Lipton, Zachary; Li, Mu; Smola, Alexander J. (2024). "10.1. หน่วยความจำระยะยาวและระยะสั้น (LSTM)" . เจาะลึกการเรียนรู้เชิงลึก . เคมบริดจ์ นิวยอร์ก พอร์ตเมลเบิร์น นิวเดลี สิงคโปร์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ISBN 978-1-009-38943-3.
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Gating_mechanism&oldid=1306012461#Gated_Linear_Unit "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ กลไกการเปิดปิด

ในโครงข่ายประสาทเทียมกลไกการควบคุมการไหล (gating mechanism)เป็นโครงสร้างทางสถาปัตยกรรมที่ใช้ควบคุมการไหลของสัญญาณกระตุ้นและสัญญาณไล่ระดับ (gradient signals )...

RNNs

กลไกเกตติ้งเป็นหัวใจสำคัญของ หน่วยความจำระยะสั้นแบบยาว (LSTM) [ 1 ] กลไกเหล่านี้ได้รับการเสนอเพื่อลด ปัญหาการลดลงของเกรเดียนต์ ที่มักพบใน RNN ทั่วไป

สถาปัตยกรรมอื่นๆ

กลไกการควบคุมการเข้าออกถูกนำมาใช้ใน เครือข่ายทางหลวง ซึ่งได้รับการออกแบบโดยการคลี่ LSTM ออกมา

ดูเพิ่มเติม

โครงข่ายประสาทเทียมแบบวนซ้ำ หน่วยความจำระยะสั้นระยะยาว หน่วยวนซ้ำแบบมีประตู หม้อแปลง ฟังก์ชันการเปิดใช้งาน