อ่าน 6 นาที
กลไกการเปิดปิด
ในโครงข่ายประสาทเทียมกลไกการควบคุมการไหล (gating mechanism)เป็นโครงสร้างทางสถาปัตยกรรมที่ใช้ควบคุมการไหลของสัญญาณกระตุ้นและสัญญาณไล่ระดับ (gradient signals )...
กลไกการเปิดปิด
ในโครงข่ายประสาทเทียมกลไกการควบคุมการไหล (gating mechanism)เป็นโครงสร้างทางสถาปัตยกรรมที่ใช้ควบคุมการไหลของสัญญาณกระตุ้นและสัญญาณไล่ระดับ (gradient signals ) โดยส่วนใหญ่จะใช้ในโครงข่ายประสาทเทียมแบบวนซ้ำ (RNNs) แต่ก็มีการนำไปประยุกต์ใช้ในสถาปัตยกรรมอื่นๆ ด้วยเช่นกัน
RNNs
กลไกเกตติ้งเป็นหัวใจสำคัญของหน่วยความจำระยะสั้นแบบยาว (LSTM) [ 1 ]กลไกเหล่านี้ได้รับการเสนอเพื่อลดปัญหาการลดลงของเกรเดียนต์ที่มักพบใน RNN ทั่วไป
หน่วย LSTM ประกอบด้วยเกตสามตัว:
- ประตูอินพุตซึ่งควบคุมการไหลของข้อมูลใหม่เข้าสู่เซลล์หน่วยความจำ
- ประตูแห่งการลืม (Forget Gate)ซึ่งควบคุมปริมาณข้อมูลที่จะถูกเก็บรักษาไว้จากช่วงเวลาก่อนหน้า
- เกตเอาต์พุตทำหน้าที่ควบคุมปริมาณข้อมูลที่จะส่งไปยังเลเยอร์ถัดไป
สมการสำหรับ LSTM คือ: [ 2 ]
ในที่นี้หมายถึงการคูณแบบทีละองค์ประกอบ
- สถาปัตยกรรม LSTM พร้อมเกต
หน่วยวนซ้ำแบบมีเกต (GRU) ช่วยลดความซับซ้อนของ LSTM [ 3 ]เมื่อเปรียบเทียบกับ LSTM แล้ว GRU มีเพียงสองเกต ได้แก่เกตรีเซ็ตและเกตอัปเดต GRU ยังรวมสถานะเซลล์และสถานะที่ซ่อนอยู่เข้าด้วยกัน เกตรีเซ็ตโดยประมาณจะสอดคล้องกับเกตลืม และเกตอัปเดตโดยประมาณจะสอดคล้องกับเกตอินพุต เกตเอาต์พุตถูกลบออก
GRU มีหลายรูปแบบ รูปแบบหนึ่งโดยเฉพาะมีสมการดังต่อไปนี้: [ 4 ]
- สถาปัตยกรรม Gated Recurrent Unit พร้อมเกต
หน่วยเชิงเส้นแบบมีประตู
หน่วยเชิงเส้นแบบมีเกต (GLUs) [ 5 ]ปรับกลไกเกตเพื่อใช้ในเครือข่ายประสาทแบบฟีดฟอร์เวิร์ดซึ่งมักจะอยู่ใน สถาปัตยกรรมแบบทราน ส์ฟอร์เมอร์โดยกำหนดไว้ดังนี้:
โดยที่อินพุตแรกและอินพุตที่สองคือค่าใดตามลำดับ และแทนฟังก์ชันการกระตุ้นแบบซิกมอยด์
การแทนที่ด้วยฟังก์ชันการกระตุ้นอื่นๆ จะนำไปสู่รูปแบบต่างๆ ของ GLU:
โดยที่ReLU , GELUและSwishเป็นฟังก์ชันการกระตุ้นที่แตกต่างกัน
ในแบบจำลองหม้อแปลง หน่วยเกตติ้งดังกล่าวมักใช้ในโมดูลฟีดฟอร์เวิร์ดสำหรับอินพุตเวกเตอร์เดียว ผลลัพธ์ที่ได้คือ: [ 6 ]
สถาปัตยกรรมอื่นๆ
กลไกการควบคุมการเข้าออกถูกนำมาใช้ในเครือข่ายทางหลวงซึ่งได้รับการออกแบบโดยการคลี่ LSTM ออกมา
การควบคุมช่องทาง[ 7 ]ใช้เกตเพื่อควบคุมการไหลของข้อมูลผ่านช่องทางต่างๆ ภายในเครือข่ายประสาทเทียมแบบคอนโวลูชัน (CNN)
ดูเพิ่มเติม
- โครงข่ายประสาทเทียมแบบวนซ้ำ
- หน่วยความจำระยะสั้นระยะยาว
- หน่วยวนซ้ำแบบมีประตู
- หม้อแปลง
- ฟังก์ชันการเปิดใช้งาน
อ่านเพิ่มเติม
- Zhang, Aston; Lipton, Zachary; Li, Mu; Smola, Alexander J. (2024). "10.1. หน่วยความจำระยะยาวและระยะสั้น (LSTM)" . เจาะลึกการเรียนรู้เชิงลึก . เคมบริดจ์ นิวยอร์ก พอร์ตเมลเบิร์น นิวเดลี สิงคโปร์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ISBN 978-1-009-38943-3.
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ กลไกการเปิดปิด
ในโครงข่ายประสาทเทียมกลไกการควบคุมการไหล (gating mechanism)เป็นโครงสร้างทางสถาปัตยกรรมที่ใช้ควบคุมการไหลของสัญญาณกระตุ้นและสัญญาณไล่ระดับ (gradient signals )...
RNNs
กลไกเกตติ้งเป็นหัวใจสำคัญของ หน่วยความจำระยะสั้นแบบยาว (LSTM) [ 1 ] กลไกเหล่านี้ได้รับการเสนอเพื่อลด ปัญหาการลดลงของเกรเดียนต์ ที่มักพบใน RNN ทั่วไป
สถาปัตยกรรมอื่นๆ
กลไกการควบคุมการเข้าออกถูกนำมาใช้ใน เครือข่ายทางหลวง ซึ่งได้รับการออกแบบโดยการคลี่ LSTM ออกมา
ดูเพิ่มเติม
โครงข่ายประสาทเทียมแบบวนซ้ำ หน่วยความจำระยะสั้นระยะยาว หน่วยวนซ้ำแบบมีประตู หม้อแปลง ฟังก์ชันการเปิดใช้งาน