กลับไปหน้าบทความ

อ่าน 3 นาที

สเปซี่

spaCy ( / s p eɪ ˈ s iː / spay- SEE ) เป็น ไลบรารี ซอฟต์แวร์โอเพนซอร์สสำหรับ การประมวลผลภาษาธรรมชาติ ขั้นสูง เขียนด้วยภาษาโปรแกรม Python และ Cython [ 3 ] [ 4 ]...

สเปซี่

สเปซี่
ผู้เขียนต้นฉบับแมทธิว ฮอนนิบาล
นักพัฒนาปัญญาประดิษฐ์เกี่ยวกับการระเบิด หลากหลาย
ปล่อยกุมภาพันธ์ 2558 [ 1 ] ( 2015-02 )
เวอร์ชันเสถียร
3.8.4 [ 2 ] แก้ไขข้อมูลนี้บนวิกิดาต้า / 14 มกราคม 2025 ( 14 มกราคม 2568 )
เขียนเป็นไพธอน , ไซธอน
ระบบปฏิบัติการลินุกซ์ , วินโดวส์ , macOS , OS X
แพลตฟอร์มข้ามแพลตฟอร์ม
พิมพ์การประมวลผลภาษาธรรมชาติ
ใบอนุญาตใบอนุญาต MIT
เว็บไซต์spacy .ioแก้ไขข้อมูลนี้ได้ที่วิกิดาต้า
ที่เก็บข้อมูล
  • github.com/explosion/spaCy

spaCy ( / s p ˈ s / spay- SEE ) เป็นไลบรารีซอฟต์แวร์โอเพนซอร์สสำหรับการประมวลผลภาษาธรรมชาติ ขั้นสูง เขียนด้วยภาษาโปรแกรมPythonและCython [ 3 ] [ 4 ]ไลบรารีนี้เผยแพร่ภายใต้ใบอนุญาต MIT และนัก พัฒนาหลักคือMatthew HonnibalและInes Montaniผู้ก่อตั้งบริษัทซอฟต์แวร์ Explosion

แตกต่างจากNLTKซึ่งใช้กันอย่างแพร่หลายในการสอนและการวิจัย spaCy มุ่งเน้นที่การจัดหาซอฟต์แวร์สำหรับการใช้งานจริง[ 5 ] [ 6 ] spaCy ยังรองรับ เวิร์กโฟลว์ การเรียนรู้เชิงลึกที่อนุญาตให้เชื่อมต่อโมเดลทางสถิติที่ฝึกฝนโดย ไลบรารี การเรียนรู้ของเครื่อง ยอดนิยม เช่นTensorFlow , PyTorchหรือMXNetผ่านไลบรารีการเรียนรู้ของเครื่อง Thinc ของตนเอง[ 7 ] [ 8 ]โดยใช้ Thinc เป็นแบ็กเอนด์ spaCy มีโมเดลเครือข่ายประสาทแบบ Convolutional สำหรับ การติดแท็กส่วนของคำพูดการวิเคราะห์ความสัมพันธ์ การจัดหมวด หมู่ข้อความและการรู้จำเอนทิตีที่มีชื่อ (NER) มีโมเดล เครือข่ายประสาททางสถิติที่สร้างไว้ล่วงหน้าเพื่อดำเนินการเหล่านี้สำหรับ 23 ภาษา รวมถึงภาษาอังกฤษ โปรตุเกส สเปน รัสเซีย และจีน และยังมีโมเดล NER หลายภาษาอีก ด้วย การสนับสนุนเพิ่มเติมสำหรับการแบ่งคำสำหรับมากกว่า 65 ภาษาช่วยให้ผู้ใช้สามารถฝึกฝนโมเดลที่กำหนดเองบนชุดข้อมูลของตนเองได้เช่นกัน[ 9 ]

ประวัติศาสตร์

  • เวอร์ชัน 1.0 เปิดตัวเมื่อวันที่ 19 ตุลาคม 2559 และรวมถึงการสนับสนุนเบื้องต้นสำหรับเวิร์กโฟลว์การเรียนรู้เชิงลึกโดยการสนับสนุนไปป์ไลน์การประมวลผลแบบกำหนดเอง[ 10 ]นอกจากนี้ยังรวมถึงตัวจับคู่กฎที่รองรับ คำอธิบายประกอบ เอนทิตีและ API การฝึกอบรมที่มีเอกสารอย่างเป็นทางการ
  • เวอร์ชัน 2.0 เปิดตัวเมื่อวันที่ 7 พฤศจิกายน 2017 และแนะนำโมเดลเครือข่ายประสาทเทียมแบบคอนโวลูชันสำหรับ 7 ภาษาที่แตกต่างกัน[ 11 ] นอกจากนี้ยังรองรับส่วนประกอบไปป์ไลน์การประมวลผลแบบกำหนดเองและคุณลักษณะส่วนขยาย และมี ส่วนประกอบการจำแนกประเภทข้อความที่สามารถฝึกฝนได้ในตัว
  • เวอร์ชัน 3.0 เปิดตัวเมื่อวันที่ 1 กุมภาพันธ์ 2021 และนำเสนอ ไปป์ไลน์ที่ทันสมัย ซึ่งใช้ Transformer [ 12 ]นอกจากนี้ยังนำเสนอระบบการกำหนดค่าและเวิร์กโฟลว์การฝึกอบรมใหม่ รวมถึงคำแนะนำประเภทและเทมเพลตโครงการ เวอร์ชันนี้ยกเลิกการสนับสนุนPython 2

คุณสมบัติหลัก

ส่วนขยายและเครื่องมือแสดงภาพ

ภาพแสดงแผนผังการแยกความสัมพันธ์ที่สร้างขึ้นด้วยโปรแกรมแสดงภาพ displaCy
ภาพแสดงแผนผังการ แยกความสัมพันธ์ที่สร้างขึ้นด้วยโปรแกรมแสดงภาพ displaCy

spaCy มาพร้อมกับส่วนเสริมและเครื่องมือแสดงภาพข้อมูลหลายอย่างที่สามารถใช้งานได้ฟรีในรูปแบบไลบรารีโอเพนซอร์ส :

ดูเพิ่มเติม

  • เว็บไซต์อย่างเป็นทางการแก้ไขข้อมูลนี้ได้ที่วิกิดาต้า
  • การใช้งานไลบรารี Spacy
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=SpaCy&oldid=1359790575 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ สเปซี่

spaCy ( / s p eɪ ˈ s iː / spay- SEE ) เป็น ไลบรารี ซอฟต์แวร์โอเพนซอร์สสำหรับ การประมวลผลภาษาธรรมชาติ ขั้นสูง เขียนด้วยภาษาโปรแกรม Python และ Cython [ 3 ] [ 4 ]...

ประวัติศาสตร์

เวอร์ชัน 1.0 เปิดตัวเมื่อวันที่ 19 ตุลาคม 2559 และรวมถึงการสนับสนุนเบื้องต้นสำหรับเวิร์กโฟลว์การเรียนรู้เชิงลึกโดยการสนับสนุนไปป์ไลน์การประมวลผลแบบกำหนดเอง [ 10 ] นอกจากนี้ยังรวมถึงตัวจับคู่กฎที่รองรับ คำอธิบายประกอบ เอนทิตี และ API...

คุณสมบัติหลัก

การแปลงข้อมูลเป็นโทเค็นโดย ไม่ทำลายข้อมูลเดิม รองรับ "การแยกคำตามตัวอักษร" มากกว่า 65 ภาษา [ 13 ] มีระบบรองรับการทำงานกับส่วนประกอบของไปป์ไลน์ที่สามารถฝึกฝนได้ เช่น การระบุชื่อเอนทิตี (Named entity recognition) , การ ระบุส่วนของคำพูด (Part-of-speech tagging)...

ส่วนขยายและเครื่องมือแสดงภาพ

spaCy มาพร้อมกับส่วนเสริมและเครื่องมือแสดงภาพข้อมูลหลายอย่างที่สามารถใช้งานได้ฟรีใน รูปแบบไลบรารีโอเพนซอร์ส :