Large language models
โมเดลภาษาขนาดใหญ่
แชทจีพีที
2022 in artificial intelligenceChatGPTเป็นแชทบอทปัญญาประดิษฐ์เชิงสร้างสรรค์ ที่พัฒนาโดยOpenAIเปิดตัวครั้งแรกในเดือนพฤศจิกายน 2022 ผลิตภัณฑ์นี้ใช้โมเดลภาษาขนาดใหญ่โดยเฉพาะอย่างยิ่งโมเดล Transformer...
เนโมตรอน
Large language modelsNemotronคือตระกูลโมเดลพื้นฐานที่พัฒนาโดยNvidiaโดยส่วนใหญ่เป็นโมเดลภาษาขนาดใหญ่และโมเดลการให้เหตุผล ที่เกี่ยวข้อง Nvidia ยังใช้ชื่อนี้ในวงกว้างขึ้นสำหรับชุดข้อมูลสูตรการฝึกอบรม...
อ่าน 1 นาทียูคอม
CS1 maint: url-statusบริษัทนี้ก่อตั้งขึ้นในปี 2020 โดยRichard Socherอดีตหัวหน้านักวิทยาศาสตร์ของSalesforceและ Bryan McCann อดีต นักวิจัย NLPของ Salesforce
โอเพ่นไอโอ3
2024 softwareOpenAI o3เป็นโมเดล Transformer (GPT) ที่ได้รับการฝึกฝนล่วงหน้าแบบ สะท้อนกลับ ( reflective generative) ซึ่งพัฒนาโดย OpenAIเพื่อเป็นรุ่นต่อจากOpenAI
จีพีที-3
2020 in artificial intelligenceGenerative Pre-trained Transformer 3 ( GPT-3 ) เป็นโมเดลภาษาขนาดใหญ่ ที่ OpenAIเปิดตัวในปี 2020
ตรวจจับไม่ได้.ai
Artificial intelligence companiesAI ที่ตรวจจับไม่ได้ (หรือเรียกอีกอย่างว่าUndetectable.ai ) เป็น ซอฟต์แวร์ ปัญญาประดิษฐ์สำหรับการตรวจจับและแก้ไขเนื้อหา ออกแบบมาเพื่อระบุและแก้ไขข้อความที่สร้างขึ้นโดยเทียม เช่น...
BERT (แบบจำลองภาษา)
2018 in artificial intelligenceBERT ( Bidirectional Encoder Representations from Transformers ) เป็นโมเดลภาษา ที่นักวิจัยจาก Google เปิด ตัวในเดือนตุลาคม 2018...
ลังเชน
2022 softwareLangChainเป็นเฟรมเวิร์กซอฟต์แวร์ที่ช่วยอำนวยความสะดวกในการบูรณาการโมเดลภาษาขนาดใหญ่ (LLM) เข้ากับแอปพลิเคชัน ในฐานะเฟรมเวิร์กการบูรณาการโมเดลภาษา กรณีการใช้งานของ LangChain...
ทรานส์ฟอร์เมอร์ที่ได้รับการฝึกฝนล่วงหน้าแบบสร้างภาพ
2018 in artificial intelligenceท รานส์ฟอร์เมอร์แบบฝึกฝนล่วงหน้าเชิงกำเนิด ( GPT ) เป็น โมเดลภาษาขนาดใหญ่ (LLM) ประเภทหนึ่ง ซึ่งใช้กันอย่างแพร่หลายในแชทบอทปัญญาประดิษฐ์เชิงกำเนิด GPTs...
การค้นหาสนุกๆ
Applications of artificial intelligenceFunSearch (ย่อมาจากsearching in the function space ) เป็น วิธี การปัญญาประดิษฐ์ที่พัฒนาโดยGoogle DeepMindเพื่อค้นหาโปรแกรมคอมพิวเตอร์ที่แก้ ปัญหา
การสร้างที่เสริมด้วยการดึงข้อมูล
Generative AIการสร้างข้อความเสริมด้วยการดึงข้อมูล ( RAG ) เป็นเทคนิคที่ช่วยให้โมเดลภาษาขนาดใหญ่ (LLM) สามารถดึงและรวมข้อมูลใหม่จากแหล่งข้อมูลภายนอกได้ด้วย RAG นั้น LLM...
จีพีที-1
2018 in artificial intelligenceGenerative Pre-trained Transformer 1 ( GPT-1 ) เป็น โมเดลภาษาขนาดใหญ่ตัวแรกของOpenAIหลังจากที่Googleคิดค้น สถาปัตยกรรม Transformerในปี 2017 ในเดือนมิถุนายน 2018...
จีพีที-4
2023 in artificial intelligenceGenerative Pre-trained Transformer 4 ( GPT-4 ) เป็นโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยOpenAIและเป็นโมเดลลำดับที่สี่ในซีรีส์โมเดลพื้นฐาน GPT
แบบจำลองภาษาขนาดใหญ่
All pages needing factual verificationแบบจำลองภาษาขนาดใหญ่ ( LLM )คือเครือข่ายประสาทเทียมที่ได้รับการฝึกฝนด้วยข้อความจำนวนมหาศาลสำหรับงานประมวลผลภาษาธรรมชาติ โดยเฉพาะอย่างยิ่ง การสร้างภาษา LLM สามารถสร้าง สรุป แปล...
ศูนย์ข้อมูล AI
Artificial intelligenceศูนย์ข้อมูล AI คือ ศูนย์ข้อมูลเฉพาะทางที่ออกแบบมาเพื่อรองรับงานที่ต้องใช้การคำนวณอย่างหนัก เช่น การฝึกฝนและการประมวลผลแบบอนุมานสำหรับ โมเดล ปัญญาประดิษฐ์ (AI)...
อ่าน 1 นาทีการฉีดทันที
AI safetyการโจมตี แบบ Prompt injectionเป็น ช่องโหว่ ด้านความปลอดภัยทางไซเบอร์และเป็นเวกเตอร์การโจมตี ที่ ออกแบบมาเพื่อสร้างอินพุตที่ดูไม่เป็นอันตราย (เช่นprompts )...
กร็อก (แชทบอท)
2023 establishments in the United StatesGrokคือแชทบอทปัญญาประดิษฐ์เชิงสร้างสรรค์ ที่พัฒนาโดยxAIเปิดตัวในเดือนพฤศจิกายน 2023 โดยอีลอน มัสก์ในฐานะโครงการริเริ่มบนพื้นฐานของแบบจำลองภาษาขนาดใหญ่ (LLM) ที่มีชื่อเดียวกัน Grok
เกว็น
2023 in artificial intelligenceQwen (หรือที่รู้จักกันในชื่อTongyi Qianwenภาษาจีน :通义千问; พินอิน: Tōngyì Qiānwèn ) เป็นตระกูลของโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยAlibaba Cloudโมเดล Qwen...
แบบจำลองการให้เหตุผล
Artificial intelligenceแบบจำลองการให้เหตุผลหรือที่รู้จักกันในชื่อแบบจำลองภาษาการให้เหตุผล ( RLM ) หรือแบบจำลองการให้เหตุผลขนาดใหญ่ ( LRM ) เป็น แบบจำลองภาษาขนาดใหญ่ (LLM)
จีพีที-2
2019 in artificial intelligenceGenerative Pre-trained Transformer 2 ( GPT-2 ) เป็นโมเดลภาษาขนาดใหญ่ (LLM) จากOpenAIและเป็น โมเดล GPT รุ่นที่สองในซีรีส์พื้นฐานของพวกเขา GPT-2...
จีพีที-5
2025 in artificial intelligenceGPT-5เป็นโมเดลภาษาขนาดใหญ่แบบมัลติโมดอล ที่พัฒนาโดยOpenAIและเป็นรุ่นที่ห้าในชุดโมเดลพื้นฐาน Generative Pre-Trained Transformer (GPT) โดยมี GPT-4เป็นรุ่นก่อนหน้า และ...
อ่าน 1 นาทีหน้าต่างบริบท
Large language modelsหน้าต่างบริบทของแบบจำลองภาษาขนาดใหญ่ (LLM) คือปริมาณสูงสุดของข้อความหรืออินพุตที่ถูกแยกเป็นโทเค็นอื่นๆ ที่แบบจำลองสามารถเข้าถึงได้ในคราวเดียวเมื่อสร้างเอาต์พุต
llama.cpp
Free computer librariesllama.cppเป็นไลบรารีซอฟต์แวร์โอเพน ซอร์ส ที่ทำการอนุมานบนโมเดลภาษาขนาดใหญ่ ต่างๆ เช่นLlama ได้รับการพัฒนาร่วมกับ โครงการ GGML ซึ่ง เป็นไลบรารี เทน เซอร์อเนกประสงค์
คล็อด (AI)
2023 in artificial intelligenceClaudeคือชุดโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยบริษัทซอฟต์แวร์สัญชาติอเมริกันAnthropic Claude เปิดตัวในฐานะแชทบอท ที่ใช้ AI ในเดือนมีนาคม 2023 และ ยังถูกนำไปใช้ในการพัฒนาซอฟต์แวร์โดยใช้..