กลับไปหน้าบทความ

อ่าน 1 นาที

การฝังข้อมูล (การเรียนรู้ของเครื่อง)

ใน การเรียนรู้ ของเครื่องการฝังข้อมูลเป็น เทคนิค การเรียนรู้การแสดงผลที่แมปข้อมูลที่ซับซ้อนและมีมิติสูงไปยังพื้นที่เวกเตอร์ ที่มีมิติต่ำกว่า ของเวกเตอร์ตัวเลข

การฝังข้อมูล (การเรียนรู้ของเครื่อง)

ใน การเรียนรู้ ของเครื่องการฝังข้อมูลเป็น เทคนิค การเรียนรู้การแสดงผลที่แมปข้อมูลที่ซับซ้อนและมีมิติสูงไปยังพื้นที่เวกเตอร์ ที่มีมิติต่ำกว่า ของเวกเตอร์ตัวเลข[ 1 ]

เทคนิค

นอกจากนี้ยังหมายถึงการแสดงผลที่ได้ผลลัพธ์ซึ่งรูปแบบหรือความสัมพันธ์ที่มีความหมายจะได้รับการรักษาไว้ ในฐานะเทคนิค มันเรียนรู้เวกเตอร์เหล่านี้จากข้อมูลเช่นคำ รูปภาพ หรือการโต้ตอบของผู้ใช้ ซึ่งแตกต่างจากวิธีการที่ออกแบบด้วยตนเอง เช่นการเข้ารหัสแบบวันฮอต[ 2 ]กระบวนการนี้ช่วยลดความซับซ้อนและจับคุณลักษณะสำคัญโดยไม่จำเป็นต้องมีความรู้เกี่ยวกับโดเมนมาก่อน

ความคล้ายคลึงกัน

ในการประมวลผลภาษาธรรมชาติคำหรือแนวคิดอาจถูกแทนด้วยเวกเตอร์คุณลักษณะโดยที่แนวคิดที่คล้ายกันจะถูกแมปไปยังเวกเตอร์ที่อยู่ใกล้เคียง การฝังที่ได้จะแตกต่างกันไปตามประเภท รวมถึงการฝังคำสำหรับข้อความ (เช่นWord2Vec ) การฝังภาพสำหรับข้อมูลภาพ และการฝังกราฟความรู้สำหรับกราฟความรู้ซึ่งแต่ละแบบได้รับการปรับแต่งให้เหมาะกับงานต่างๆ เช่น NLP คอมพิวเตอร์วิชั่นหรือระบบแนะนำ [ 3 ] บทบาทคู่ขนานนี้ช่วยเพิ่มประสิทธิภาพและความแม่นยำของโมเดลโดยการทำให้การสกัดคุณลักษณะเป็นไปโดยอัตโนมัติและเปิดเผยความคล้ายคลึงที่แฝงอยู่ในการใช้งานที่หลากหลาย

ในการวัดระยะห่างระหว่างการฝังข้อมูลสองรายการ สามารถใช้ การวัดความคล้ายคลึงกันเพื่อหาความคล้ายคลึงกันโดยรวมของแนวคิดที่แสดงโดยการฝังข้อมูล หากเวกเตอร์ได้รับการทำให้เป็นมาตรฐานให้มีขนาดเท่ากับ 1 การวัดความคล้ายคลึงกันจะเป็นสัดส่วนกับ[ 4 ]

การวัดความคล้ายคลึง
ชื่อความหมายสูตรสูตร (สเกลาร์)ความสัมพันธ์ความคล้ายคลึง
ระยะทางแบบยูคลิดระยะห่างระหว่างปลายของเวกเตอร์ความสัมพันธ์เชิงลบ
ความคล้ายคลึงโคไซน์โคไซน์ของมุมระหว่างเวกเตอร์ความสัมพันธ์เชิงบวก
ผลิตภัณฑ์ดอทค่าความคล้ายคลึงโคไซน์คูณด้วยความยาวของเวกเตอร์ทั้งสองความสัมพันธ์เชิงบวก

ความคล้ายคลึงแบบโคไซน์ไม่คำนึงถึงขนาดของเวกเตอร์เมื่อพิจารณาความคล้ายคลึง ดังนั้นจึงมีอคติน้อยกว่าต่อข้อมูลการฝึกอบรมที่ปรากฏบ่อยมาก ผลคูณดอทจะรวมขนาดไว้โดยธรรมชาติ ดังนั้นจึงมีแนวโน้มที่จะให้คุณค่ากับข้อมูลที่เป็นที่นิยมมากกว่า[ 4 ]โดยทั่วไป สำหรับปริภูมิเวกเตอร์มิติสูง เวกเตอร์มักจะลู่เข้าหากันในระยะทาง ดังนั้นระยะทางแบบยุคลิดจึงมีความน่าเชื่อถือน้อยลงสำหรับเวกเตอร์ฝังตัวขนาดใหญ่[ 5 ]

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Embedding_(machine_learning)&oldid=1335771762 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การฝังข้อมูล (การเรียนรู้ของเครื่อง)

ใน การเรียนรู้ ของเครื่องการฝังข้อมูลเป็น เทคนิค การเรียนรู้การแสดงผลที่แมปข้อมูลที่ซับซ้อนและมีมิติสูงไปยังพื้นที่เวกเตอร์ ที่มีมิติต่ำกว่า ของเวกเตอร์ตัวเลข

เทคนิค

นอกจากนี้ยังหมายถึงการแสดงผลที่ได้ผลลัพธ์ซึ่งรูปแบบหรือความสัมพันธ์ที่มีความหมายจะได้รับการรักษาไว้ ในฐานะเทคนิค มันเรียนรู้เวกเตอร์เหล่านี้จากข้อมูลเช่นคำ รูปภาพ หรือการโต้ตอบของผู้ใช้ ซึ่งแตกต่างจากวิธีการที่ออกแบบด้วยตนเอง เช่นการ เข้ารหัสแบบวันฮอต [ 2 ]...

ความคล้ายคลึงกัน

ใน การประมวลผลภาษาธรรมชาติ คำหรือแนวคิดอาจถูกแทนด้วย เวกเตอร์คุณลักษณะ โดยที่แนวคิดที่คล้ายกันจะถูกแมปไปยังเวกเตอร์ที่อยู่ใกล้เคียง การฝังที่ได้จะแตกต่างกันไปตามประเภท รวมถึง การฝังคำ สำหรับข้อความ (เช่น Word2Vec ) การฝังภาพ สำหรับข้อมูลภาพ และ...

ดูเพิ่มเติม

พื้นที่แฝง การสกัดคุณลักษณะ การลดมิติ การฝังคำ เครือข่ายประสาทเทียม การเรียนรู้แบบเสริมแรง ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Embedding_(machine_learning)&oldid=1335771762 "