Large language models

โมเดลภาษาขนาดใหญ่

แชทจีพีทีอ่าน 1 นาที

แชทจีพีที

2022 in artificial intelligence

ChatGPTเป็นแชทบอทปัญญาประดิษฐ์เชิงสร้างสรรค์ ที่พัฒนาโดยOpenAIเปิดตัวครั้งแรกในเดือนพฤศจิกายน 2022 ผลิตภัณฑ์นี้ใช้โมเดลภาษาขนาดใหญ่โดยเฉพาะอย่างยิ่งโมเดล Transformer...

เนโมตรอนอ่าน 1 นาที

เนโมตรอน

Large language models

Nemotronคือตระกูลโมเดลพื้นฐานที่พัฒนาโดยNvidiaโดยส่วนใหญ่เป็นโมเดลภาษาขนาดใหญ่และโมเดลการให้เหตุผล ที่เกี่ยวข้อง Nvidia ยังใช้ชื่อนี้ในวงกว้างขึ้นสำหรับชุดข้อมูลสูตรการฝึกอบรม...

อ่าน 1 นาที

ยูคอม

CS1 maint: url-status

บริษัทนี้ก่อตั้งขึ้นในปี 2020 โดยRichard Socherอดีตหัวหน้านักวิทยาศาสตร์ของSalesforceและ Bryan McCann อดีต นักวิจัย NLPของ Salesforce

โอเพ่นไอโอ3อ่าน 1 นาที

โอเพ่นไอโอ3

2024 software

OpenAI o3เป็นโมเดล Transformer (GPT) ที่ได้รับการฝึกฝนล่วงหน้าแบบ สะท้อนกลับ ( reflective generative) ซึ่งพัฒนาโดย OpenAIเพื่อเป็นรุ่นต่อจากOpenAI

จีพีที-3อ่าน 1 นาที

จีพีที-3

2020 in artificial intelligence

Generative Pre-trained Transformer 3 ( GPT-3 ) เป็นโมเดลภาษาขนาดใหญ่ ที่ OpenAIเปิดตัวในปี 2020

ตรวจจับไม่ได้.aiอ่าน 1 นาที

ตรวจจับไม่ได้.ai

Artificial intelligence companies

AI ที่ตรวจจับไม่ได้ (หรือเรียกอีกอย่างว่าUndetectable.ai ) เป็น ซอฟต์แวร์ ปัญญาประดิษฐ์สำหรับการตรวจจับและแก้ไขเนื้อหา ออกแบบมาเพื่อระบุและแก้ไขข้อความที่สร้างขึ้นโดยเทียม เช่น...

BERT (แบบจำลองภาษา)อ่าน 1 นาที

BERT (แบบจำลองภาษา)

2018 in artificial intelligence

BERT ( Bidirectional Encoder Representations from Transformers ) เป็นโมเดลภาษา ที่นักวิจัยจาก Google เปิด ตัวในเดือนตุลาคม 2018...

ลังเชนอ่าน 1 นาที

ลังเชน

2022 software

LangChainเป็นเฟรมเวิร์กซอฟต์แวร์ที่ช่วยอำนวยความสะดวกในการบูรณาการโมเดลภาษาขนาดใหญ่ (LLM) เข้ากับแอปพลิเคชัน ในฐานะเฟรมเวิร์กการบูรณาการโมเดลภาษา กรณีการใช้งานของ LangChain...

ทรานส์ฟอร์เมอร์ที่ได้รับการฝึกฝนล่วงหน้าแบบสร้างภาพอ่าน 1 นาที

ทรานส์ฟอร์เมอร์ที่ได้รับการฝึกฝนล่วงหน้าแบบสร้างภาพ

2018 in artificial intelligence

ท รานส์ฟอร์เมอร์แบบฝึกฝนล่วงหน้าเชิงกำเนิด ( GPT ) เป็น โมเดลภาษาขนาดใหญ่ (LLM) ประเภทหนึ่ง ซึ่งใช้กันอย่างแพร่หลายในแชทบอทปัญญาประดิษฐ์เชิงกำเนิด GPTs...

การค้นหาสนุกๆอ่าน 1 นาที

การค้นหาสนุกๆ

Applications of artificial intelligence

FunSearch (ย่อมาจากsearching in the function space ) เป็น วิธี การปัญญาประดิษฐ์ที่พัฒนาโดยGoogle DeepMindเพื่อค้นหาโปรแกรมคอมพิวเตอร์ที่แก้ ปัญหา

การสร้างที่เสริมด้วยการดึงข้อมูลอ่าน 1 นาที

การสร้างที่เสริมด้วยการดึงข้อมูล

Generative AI

การสร้างข้อความเสริมด้วยการดึงข้อมูล ( RAG ) เป็นเทคนิคที่ช่วยให้โมเดลภาษาขนาดใหญ่ (LLM) สามารถดึงและรวมข้อมูลใหม่จากแหล่งข้อมูลภายนอกได้ด้วย RAG นั้น LLM...

จีพีที-1อ่าน 1 นาที

จีพีที-1

2018 in artificial intelligence

Generative Pre-trained Transformer 1 ( GPT-1 ) เป็น โมเดลภาษาขนาดใหญ่ตัวแรกของOpenAIหลังจากที่Googleคิดค้น สถาปัตยกรรม Transformerในปี 2017 ในเดือนมิถุนายน 2018...

จีพีที-4อ่าน 1 นาที

จีพีที-4

2023 in artificial intelligence

Generative Pre-trained Transformer 4 ( GPT-4 ) เป็นโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยOpenAIและเป็นโมเดลลำดับที่สี่ในซีรีส์โมเดลพื้นฐาน GPT

แบบจำลองภาษาขนาดใหญ่อ่าน 1 นาที

แบบจำลองภาษาขนาดใหญ่

All pages needing factual verification

แบบจำลองภาษาขนาดใหญ่ ( LLM )คือเครือข่ายประสาทเทียมที่ได้รับการฝึกฝนด้วยข้อความจำนวนมหาศาลสำหรับงานประมวลผลภาษาธรรมชาติ โดยเฉพาะอย่างยิ่ง การสร้างภาษา LLM สามารถสร้าง สรุป แปล...

ศูนย์ข้อมูล AIอ่าน 1 นาที

ศูนย์ข้อมูล AI

Artificial intelligence

ศูนย์ข้อมูล AI คือ ศูนย์ข้อมูลเฉพาะทางที่ออกแบบมาเพื่อรองรับงานที่ต้องใช้การคำนวณอย่างหนัก เช่น การฝึกฝนและการประมวลผลแบบอนุมานสำหรับ โมเดล ปัญญาประดิษฐ์ (AI)...

อ่าน 1 นาที

การฉีดทันที

AI safety

การโจมตี แบบ Prompt injectionเป็น ช่องโหว่ ด้านความปลอดภัยทางไซเบอร์และเป็นเวกเตอร์การโจมตี ที่ ออกแบบมาเพื่อสร้างอินพุตที่ดูไม่เป็นอันตราย (เช่นprompts )...

กร็อก (แชทบอท)อ่าน 1 นาที

กร็อก (แชทบอท)

2023 establishments in the United States

Grokคือแชทบอทปัญญาประดิษฐ์เชิงสร้างสรรค์ ที่พัฒนาโดยxAIเปิดตัวในเดือนพฤศจิกายน 2023 โดยอีลอน มัสก์ในฐานะโครงการริเริ่มบนพื้นฐานของแบบจำลองภาษาขนาดใหญ่ (LLM) ที่มีชื่อเดียวกัน Grok

เกว็นอ่าน 1 นาที

เกว็น

2023 in artificial intelligence

Qwen (หรือที่รู้จักกันในชื่อTongyi Qianwenภาษาจีน :通义千问; พินอิน: Tōngyì Qiānwèn ) เป็นตระกูลของโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยAlibaba Cloudโมเดล Qwen...

แบบจำลองการให้เหตุผลอ่าน 1 นาที

แบบจำลองการให้เหตุผล

Artificial intelligence

แบบจำลองการให้เหตุผลหรือที่รู้จักกันในชื่อแบบจำลองภาษาการให้เหตุผล ( RLM ) หรือแบบจำลองการให้เหตุผลขนาดใหญ่ ( LRM ) เป็น แบบจำลองภาษาขนาดใหญ่ (LLM)

จีพีที-2อ่าน 1 นาที

จีพีที-2

2019 in artificial intelligence

Generative Pre-trained Transformer 2 ( GPT-2 ) เป็นโมเดลภาษาขนาดใหญ่ (LLM) จากOpenAIและเป็น โมเดล GPT รุ่นที่สองในซีรีส์พื้นฐานของพวกเขา GPT-2...

จีพีที-5อ่าน 1 นาที

จีพีที-5

2025 in artificial intelligence

GPT-5เป็นโมเดลภาษาขนาดใหญ่แบบมัลติโมดอล ที่พัฒนาโดยOpenAIและเป็นรุ่นที่ห้าในชุดโมเดลพื้นฐาน Generative Pre-Trained Transformer (GPT) โดยมี GPT-4เป็นรุ่นก่อนหน้า และ...

อ่าน 1 นาที

หน้าต่างบริบท

Large language models

หน้าต่างบริบทของแบบจำลองภาษาขนาดใหญ่ (LLM) คือปริมาณสูงสุดของข้อความหรืออินพุตที่ถูกแยกเป็นโทเค็นอื่นๆ ที่แบบจำลองสามารถเข้าถึงได้ในคราวเดียวเมื่อสร้างเอาต์พุต

llama.cppอ่าน 1 นาที

llama.cpp

Free computer libraries

llama.cppเป็นไลบรารีซอฟต์แวร์โอเพน ซอร์ส ที่ทำการอนุมานบนโมเดลภาษาขนาดใหญ่ ต่างๆ เช่นLlama ได้รับการพัฒนาร่วมกับ โครงการ GGML ซึ่ง เป็นไลบรารี เทน เซอร์อเนกประสงค์

คล็อด (AI)อ่าน 1 นาที

คล็อด (AI)

2023 in artificial intelligence

Claudeคือชุดโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยบริษัทซอฟต์แวร์สัญชาติอเมริกันAnthropic Claude เปิดตัวในฐานะแชทบอท ที่ใช้ AI ในเดือนมีนาคม 2023 และ ยังถูกนำไปใช้ในการพัฒนาซอฟต์แวร์โดยใช้..