กลับไปหน้าบทความ

อ่าน 7 นาที

ฐานข้อมูลเวกเตอร์

ฐาน ข้อมูลเวกเตอร์ , ที่เก็บเวกเตอร์ หรือ เครื่องมือค้นหาเวกเตอร์ คือ ฐานข้อมูล ที่จัดเก็บและเรียก ค้น ข้อมูล ฝังตัว ใน พื้นที่เวกเตอร์ [ 1 ] โดย ทั่วไปแล้ว ฐานข้อมูลเวกเตอร์จะใช้...

ฐานข้อมูลเวกเตอร์

ฐานข้อมูลเวกเตอร์ , ที่เก็บเวกเตอร์หรือเครื่องมือค้นหาเวกเตอร์คือฐานข้อมูลที่จัดเก็บและเรียก ค้น ข้อมูลฝังตัว ใน พื้นที่เวกเตอร์ [ 1 ] โดย ทั่วไปแล้ว ฐานข้อมูลเวกเตอร์จะใช้ อัลกอริทึม เพื่อนบ้านที่ใกล้ที่สุดโดยประมาณเพื่อให้ผู้ใช้สามารถค้นหาบันทึกที่มีความหมายคล้ายคลึงกับข้อมูลป้อนเข้าที่กำหนด ซึ่งแตกต่างจากฐานข้อมูลแบบดั้งเดิมที่ส่วนใหญ่จะค้นหาบันทึกโดยการจับคู่ที่ตรงกันทุกประการ[ 2 ] [ 3 ] กรณีการใช้งานสำหรับฐานข้อมูลเวกเตอร์ ได้แก่ การค้นหา ความคล้ายคลึงการค้นหา เชิงความหมาย การค้นหาแบบหลายโมด อล เครื่องมือแนะนำการตรวจจับวัตถุและการสร้างผลลัพธ์ที่เพิ่มประสิทธิภาพการค้นหา (RAG) [ 1 ]

เวกเตอร์ฝังตัว (Vector embeddings) คือการแสดงข้อมูลทางคณิตศาสตร์ในพื้นที่มิติสูง ในพื้นที่นี้ แต่ละมิติจะสอดคล้องกับคุณลักษณะของข้อมูล โดยจำนวนมิติมีตั้งแต่ไม่กี่ร้อยไปจนถึงหลายหมื่น ขึ้นอยู่กับความซับซ้อนของข้อมูลที่แสดง ข้อมูลแต่ละรายการจะถูกแทนด้วยเวกเตอร์หนึ่งตัวในพื้นที่นี้ คำ วลี หรือเอกสารทั้งหมด รวมถึงรูปภาพ เสียง และข้อมูลประเภทอื่นๆ สามารถแปลงเป็นเวกเตอร์ได้[ 1 ]

เวกเตอร์คุณลักษณะเหล่านี้อาจคำนวณจากข้อมูลดิบโดยใช้ วิธี การเรียนรู้ของเครื่องเช่นอัลกอริทึมการสกัดคุณลักษณะการฝังคำ[ 4 ]หรือ เครือข่าย การเรียนรู้เชิงลึกเป้าหมายคือรายการข้อมูลที่มีความหมายคล้ายกันจะได้รับเวกเตอร์คุณลักษณะที่ใกล้เคียงกัน

การดึงเวกเตอร์สามารถรวมเข้ากับการกรองเมตาเดตาหรือการค้นหาตามคำศัพท์เพื่อรองรับเวิร์กโฟลว์การดึงข้อมูลแบบกรองและแบบผสม[ 5 ] [ 6 ]

เทคนิค

เทคนิคทั่วไปสำหรับการค้นหาความคล้ายคลึงกันบนเวกเตอร์ที่มีมิติสูง ได้แก่:

เทคนิคเหล่านี้อาจนำมาใช้ร่วมกันในระบบค้นหาเวกเตอร์ได้เช่นกัน[ 7 ]

ในการทดสอบประสิทธิภาพล่าสุด การใช้งานตาม HNSW ถือเป็นผลลัพธ์ที่ดีที่สุด[ 8 ] [ 9 ]การประชุมต่างๆ เช่น การประชุมนานาชาติว่าด้วยการค้นหาความคล้ายคลึงและการประยุกต์ใช้ (SISAP) [ 10 ]และการประชุมว่าด้วยระบบประมวลผลข้อมูลประสาท (NeurIPS) [ 11 ]ได้จัดการแข่งขันการค้นหาเวกเตอร์ในฐานข้อมูลขนาดใหญ่

แอปพลิเคชัน

ฐานข้อมูลเวกเตอร์ถูกใช้ในแอปพลิเคชันการเรียนรู้ของเครื่อง ที่หลากหลาย รวมถึงการค้นหาความคล้ายคลึงการค้นหาเชิงความหมายการค้นหาแบบหลายรูปแบบเครื่องมือแนะนำการตรวจจับวัตถุและการสร้างผลลัพธ์ที่เพิ่มประสิทธิภาพการค้นหา[ 1 ]

การสร้างที่เสริมด้วยการดึงข้อมูล

กรณีการใช้งานฐานข้อมูลเวกเตอร์ที่พบได้บ่อยเป็นพิเศษคือการสร้างข้อความเสริมการค้นหา (RAG) ซึ่งเป็นวิธีการปรับปรุงการตอบสนองเฉพาะโดเมนของแบบจำลองภาษาขนาดใหญ่ส่วนประกอบการค้นหาของ RAG สามารถเป็นระบบการค้นหาใดก็ได้ แต่ส่วนใหญ่มักถูกนำไปใช้เป็นฐานข้อมูลเวกเตอร์ เอกสารข้อความที่อธิบายโดเมนที่สนใจจะถูกรวบรวม และสำหรับแต่ละเอกสารหรือส่วนของเอกสาร เวกเตอร์คุณลักษณะ (ที่เรียกว่า " การฝัง ") จะถูกคำนวณ โดยทั่วไปจะใช้เครือข่ายการเรียนรู้เชิงลึก และจัดเก็บไว้ในฐานข้อมูลเวกเตอร์พร้อมกับลิงก์ไปยังเอกสาร เมื่อได้รับข้อความแจ้งจากผู้ใช้ เวกเตอร์คุณลักษณะของข้อความแจ้งจะถูกคำนวณ และฐานข้อมูลจะถูกสอบถามเพื่อดึงเอกสารที่เกี่ยวข้องมากที่สุด จากนั้นเอกสารเหล่านี้จะถูกเพิ่มเข้าไปในหน้าต่างบริบทของแบบจำลองภาษาขนาดใหญ่โดยอัตโนมัติ และแบบจำลองภาษาขนาดใหญ่จะดำเนินการสร้างการตอบสนองต่อข้อความแจ้งโดยใช้บริบทนี้[ 12 ]

การนำไปใช้

ชื่อใบอนุญาต
แอโรสไปค์[ 13 ] [ 14 ]กรรมสิทธิ์
AllegroGraph [ 15 ] [ 16 ]บริการเฉพาะ (บริการจัดการ)
AlloyDB AI [ 17 ]บริการเฉพาะ (บริการจัดการ)
Apache Cassandra [ 18 ] [ 19 ]ใบอนุญาต Apache 2.0
Azure Cosmos DB [ 20 ]บริการเฉพาะ (บริการจัดการ)
โครมา[ 21 ] [ 22 ]ใบอนุญาต Apache 2.0 [ 23 ]
คลิกเฮาส์[ 24 ]ใบอนุญาต Apache 2.0
Couchbase [ 25 ] [ 26 ]BSL 1.1 [ 27 ]
CrateDB [ 28 ]ใบอนุญาต Apache 2.0
DataStax [ 29 ]บริการเฉพาะ (บริการจัดการ)
อีลาสทีคเสิร์ช[ 30 ]ใบอนุญาตสาธารณะฝั่งเซิร์ฟเวอร์ใบอนุญาตยืดหยุ่น[ 31 ]
JaguarDB [ 32 ] [ 33 ]กรรมสิทธิ์
LanceDB [ 34 ] [ 35 ]ใบอนุญาต Apache 2.0 [ 36 ]
LlamaIndex [ 37 ]ใบอนุญาต MIT [ 38 ]
MariaDB [ 39 ] [ 40 ]GPL v2 [ 41 ]
มาร์โก[ 42 ]ใบอนุญาต Apache 2.0 [ 43 ]
Meilisearch [ 44 ] [ 45 ]ใบอนุญาต MIT [ 46 ]
มิลวุส[ 47 ]ใบอนุญาต Apache 2.0 [ 48 ]
MongoDB Atlas [ 49 ]ใบอนุญาตใช้งานสาธารณะฝั่งเซิร์ฟเวอร์ (บริการจัดการ)
MyScaleDB [ 50 ]ใบอนุญาต Apache 2.0
Neo4j [ 51 ] [ 52 ]GPL v3 (Community Edition) [ 53 ]
ObjectBox [ 54 ]ใบอนุญาต Apache 2.0 [ 55 ]
OpenSearch [ 56 ] [ 57 ]ใบอนุญาต Apache 2.0 [ 58 ]
ฐานข้อมูล Oracle [ 59 ]กรรมสิทธิ์ (บริการจัดการหรือใบอนุญาต)
กรวยสน[ 60 ]บริการเฉพาะ (บริการจัดการ)
Pixeltable (การฝังแบบเพิ่มทีละน้อย) [ 61 ]ใบอนุญาต Apache 2.0 [ 58 ]
Postgresกับ pgvector [ 62 ]ใบอนุญาต PostgreSQL [ 63 ]
Qdrant [ 64 ]ใบอนุญาต Apache 2.0 [ 65 ]
Redis Stack [ 66 ] [ 67 ]Redis Source Available License เก็บถาวรเมื่อ 2024-01-31 ที่Wayback Machine [ 68 ]
ScyllaDB [ 69 ] [ 70 ]มีซอร์สโค้ดที่เป็นกรรมสิทธิ์ให้ใช้งานได้
เกล็ดหิมะ[ 71 ]บริการเฉพาะ (บริการจัดการ)
SurrealDB [ 72 ]BSL 1.1 [ 73 ]
TiDB [ 74 ]ใบอนุญาต Apache 2.0 [ 75 ]
ไทป์เซนส์[ 76 ]GPL v3 (Community Edition) [ 77 ]
เวสปา[ 78 ]ใบอนุญาต Apache 2.0 [ 79 ]
วีเวียต BSD 3-Clause [ 80 ]
YDB [ 81 ] [ 82 ]ใบอนุญาต Apache 2.0 [ 83 ]

ดูเพิ่มเติม

  • Sawers, Paul (2024-04-20). "เหตุใดฐานข้อมูลเวกเตอร์จึงกำลังได้รับความนิยมในช่วงที่กระแสความนิยม AI พุ่งถึงจุดสูงสุด" . TechCrunch . สืบค้นเมื่อ2024-04-23 .
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Vector_database&oldid=1356350517 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ฐานข้อมูลเวกเตอร์

ฐาน ข้อมูลเวกเตอร์ , ที่เก็บเวกเตอร์ หรือ เครื่องมือค้นหาเวกเตอร์ คือ ฐานข้อมูล ที่จัดเก็บและเรียก ค้น ข้อมูล ฝังตัว ใน พื้นที่เวกเตอร์ [ 1 ] โดย ทั่วไปแล้ว ฐานข้อมูลเวกเตอร์จะใช้...

เทคนิค

เทคนิคทั่วไปสำหรับการค้นหาความคล้ายคลึงกันบนเวกเตอร์ที่มีมิติสูง ได้แก่:

แอปพลิเคชัน

ฐานข้อมูลเวกเตอร์ถูกใช้ในแอปพลิเคชันการเรียนรู้ของเครื่อง ที่หลากหลาย รวมถึง การค้นหาความคล้ายคลึง การค้นหาเชิงความหมาย การ ค้นหาแบบหลายรูป แบบ เครื่องมือแนะนำ การตรวจจับวัตถุ และ การสร้างผลลัพธ์ที่เพิ่มประสิทธิภาพ การค้นหา [ 1 ]

การสร้างที่เสริมด้วยการดึงข้อมูล

กรณีการใช้งานฐานข้อมูลเวกเตอร์ที่พบได้บ่อยเป็นพิเศษคือ การสร้างข้อความเสริมการค้นหา (RAG) ซึ่งเป็นวิธีการปรับปรุงการตอบสนองเฉพาะโดเมนของ แบบจำลองภาษาขนาดใหญ่ ส่วนประกอบการค้นหาของ RAG สามารถเป็นระบบการค้นหาใดก็ได้ แต่ส่วนใหญ่มักถูกนำไปใช้เป็นฐานข้อมูลเวกเตอร์...