อ่าน 27 นาที
ผลิตภัณฑ์และแอปพลิเคชันของ OpenAI
องค์กร ปัญญาประดิษฐ์ (AI) สัญชาติอเมริกัน OpenAI ได้เปิดตัวผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนับตั้งแต่ก่อตั้งขึ้นในปี 2015
ผลิตภัณฑ์และแอปพลิเคชันของ OpenAI
| ส่วนหนึ่งของชุดบทความเกี่ยวกับ |
| โอเพ่นไอ |
|---|
| สินค้า |
| นางแบบ |
| ประชากร |
| แนวคิด |
องค์กร ปัญญาประดิษฐ์ (AI) สัญชาติอเมริกันOpenAIได้เปิดตัวผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนับตั้งแต่ก่อตั้งขึ้นในปี 2015
การเรียนรู้แบบเสริมแรง
ในช่วงเริ่มต้น การวิจัยของ OpenAI ครอบคลุมโครงการจำนวนมากที่มุ่งเน้นการเรียนรู้แบบเสริมแรง (RL) [ 1 ] OpenAI ถูกมองว่าเป็นคู่แข่งที่สำคัญของDeepMind [ 2 ]
โรงยิม
Gym ซึ่งประกาศในปี 2016 เป็นไลบรารี Pythonแบบโอเพนซอร์สที่ออกแบบมาเพื่ออำนวยความสะดวกในการพัฒนาอัลกอริธึมการเรียนรู้แบบเสริมแรง โดยมีเป้าหมายเพื่อสร้างมาตรฐานวิธีการกำหนดสภาพแวดล้อมในการวิจัย AI ทำให้การวิจัยที่เผยแพร่สามารถทำซ้ำได้ง่ายขึ้น[ 3 ] [ 4 ]ในขณะเดียวกันก็มอบอินเทอร์เฟซที่เรียบง่ายให้ผู้ใช้ในการโต้ตอบกับสภาพแวดล้อมเหล่านี้ ในปี 2022 การพัฒนาใหม่ของ Gym ได้ถูกย้ายไปยังไลบรารี Gymnasium [ 5 ] [ 6 ]
ยิมเรโทร
Gym Retro ซึ่งเปิดตัวในปี 2018 เป็นแพลตฟอร์มสำหรับการวิจัยการเรียนรู้แบบเสริมแรง (RL) ในวิดีโอเกม[ 7 ]โดยใช้อัลกอริธึม RL และศึกษาการวางนัยทั่วไป การวิจัย RL ก่อนหน้านี้มุ่งเน้นไปที่การเพิ่มประสิทธิภาพเอเจนต์เพื่อแก้ปัญหางานเดียวเป็นหลัก Gym Retro ให้ความสามารถในการวางนัยทั่วไประหว่างเกมที่มีแนวคิดคล้ายกันแต่มีลักษณะที่แตกต่างกัน
โรโบซูโม
RoboSumo ซึ่งเปิดตัวในปี 2017 เป็นโลกเสมือนจริงที่หุ่นยนต์ตัวแทนแบบ มนุษย์เรียนรู้ด้วยโลหะในตอนแรกขาดความรู้แม้กระทั่งวิธีการเดิน แต่ได้รับเป้าหมายในการเรียนรู้การเคลื่อนไหวและผลักตัวแทนฝ่ายตรงข้ามออกจากวงแหวน [ 8 ]ผ่านกระบวนการเรียนรู้แบบแข่งขันนี้ ตัวแทนจะเรียนรู้วิธีปรับตัวให้เข้ากับสภาวะที่เปลี่ยนแปลง เมื่อตัวแทนถูกนำออกจากสภาพแวดล้อมเสมือนจริงนี้และวางไว้ในสภาพแวดล้อมเสมือนจริงใหม่ที่มีลมแรง ตัวแทนจะทรงตัวเพื่อยืนตรง ซึ่งแสดงให้เห็นว่ามันได้เรียนรู้วิธีการทรงตัวในแบบทั่วไป[ 8 ] [ 9 ] Igor Mordatch จาก OpenAI โต้แย้งว่าการแข่งขันระหว่างตัวแทนอาจสร้าง "การแข่งขันด้านอาวุธ" ทางปัญญาที่สามารถเพิ่มความสามารถของตัวแทนในการทำงานได้แม้กระทั่งนอกบริบทของการแข่งขัน[ 8 ]
โอเพ่นไอไฟว์
OpenAI Five คือทีมบอท ที่ OpenAI คัดสรรมา 5 ตัว ซึ่งใช้ในการแข่งขันวิดีโอเกม Dota 2แบบ 5 ต่อ 5 โดย บอทเหล่านี้เรียนรู้ที่จะเล่นกับผู้เล่นที่เป็นมนุษย์ที่มีทักษะสูงผ่านอัลกอริธึมแบบลองผิดลองถูก ก่อนที่จะกลายเป็นทีม 5 ตัว การสาธิตต่อสาธารณะครั้งแรกเกิดขึ้นที่The International 2017ซึ่งเป็นการแข่งขันชิงแชมป์ประจำปีของเกม โดยDendiผู้เล่นมืออาชีพชาวยูเครน แพ้บอทในการแข่งขันแบบตัวต่อตัว[ 10 ] [ 11 ]หลังจากการแข่งขัน Greg Brockman ซีทีโอ อธิบายว่าบอทเรียนรู้โดยการเล่นกับตัวเองเป็นเวลา 2 สัปดาห์ในเวลาจริงและซอฟต์แวร์การเรียนรู้นี้เป็นก้าวหนึ่งในการสร้างซอฟต์แวร์ที่สามารถจัดการงานที่ซับซ้อนได้เหมือนศัลยแพทย์[ 12 ] [ 13 ]ระบบนี้ใช้รูปแบบการเรียนรู้แบบเสริมแรงโดยบอทจะเรียนรู้ไปเรื่อยๆ โดยการเล่นกับตัวเองหลายร้อยครั้งต่อวันเป็นเวลาหลายเดือน และจะได้รับรางวัลสำหรับการกระทำต่างๆ เช่น การฆ่าศัตรูและการยึดเป้าหมายในแผนที่[ 14 ] [ 15 ] [ 16 ]
ภายในเดือนมิถุนายน 2018 ความสามารถของบอทได้ขยายออกไปจนสามารถเล่นร่วมกันเป็นทีมเต็มรูปแบบ 5 ตัว และสามารถเอาชนะทีมผู้เล่นสมัครเล่นและกึ่งมืออาชีพได้[ 17 ] [ 14 ] [ 18 ] [ 19 ]ในงานThe International 2018 OpenAI Five ได้ลงเล่นในแมตช์โชว์ 2 นัดกับผู้เล่นมืออาชีพ แต่สุดท้ายก็แพ้ทั้งสองเกม[ 20 ] [ 21 ] [ 22 ]ในเดือนเมษายน 2019 OpenAI Five เอาชนะOGแชมป์โลกในขณะนั้น ด้วยคะแนน 2:0 ในแมตช์โชว์สดที่ซานฟรานซิสโก[ 23 ] [ 24 ]การปรากฏตัวต่อสาธารณะครั้งสุดท้ายของบอทเกิดขึ้นในปลายเดือนนั้น โดยพวกเขาลงเล่นทั้งหมด 42,729 เกมในการแข่งขันออนไลน์แบบเปิดเป็นเวลา 4 วัน และชนะ 99.4% ของเกมเหล่านั้น[ 25 ]
กลไกของ OpenAI Five ในบอทผู้เล่นของ Dota 2 แสดงให้เห็นถึงความท้าทายของระบบ AI ในเกม MOBA (Multiplayer Online Battle Arena) และวิธีที่ OpenAI Five ได้แสดงให้เห็นถึงการใช้ตัวแทนการเรียนรู้แบบเสริมแรงเชิงลึก (DRL) เพื่อให้บรรลุความสามารถเหนือมนุษย์ในการแข่งขัน Dota 2 [ 26 ]
แด็กทิล
Dactyl ซึ่งพัฒนาขึ้นในปี 2018 ใช้การเรียนรู้ของเครื่องเพื่อฝึกShadow Handซึ่งเป็นหุ่นยนต์มือคล้ายมนุษย์ให้สามารถจัดการกับวัตถุทางกายภาพได้[ 27 ]มันเรียนรู้ทั้งหมดในการจำลองโดยใช้อัลกอริธึม RL และรหัสการฝึกอบรมเดียวกันกับOpenAI Five OpenAI แก้ปัญหาการวางแนวของวัตถุโดยใช้การสุ่มโดเมนซึ่งเป็นวิธีการจำลองที่เปิดเผยผู้เรียนให้ได้รับประสบการณ์ที่หลากหลายแทนที่จะพยายามปรับให้เข้ากับความเป็นจริง การตั้งค่าสำหรับ Dactyl นอกเหนือจากการมีกล้องติดตามการเคลื่อนไหวแล้ว ยังมี กล้อง RGBเพื่อให้หุ่นยนต์สามารถจัดการกับวัตถุใดๆ ก็ได้โดยการมองเห็น ในปี 2018 OpenAI แสดงให้เห็นว่าระบบสามารถจัดการกับลูกบาศก์และปริซึมแปดเหลี่ยมได้[ 28 ]
ในปี 2019 OpenAI ได้แสดงให้เห็นว่า Dactyl สามารถแก้ลูกบาศก์รูบิกได้ หุ่นยนต์สามารถแก้ปริศนาได้ 60% ของเวลา วัตถุอย่างลูกบาศก์รูบิกมีฟิสิกส์ที่ซับซ้อนซึ่งยากต่อการสร้างแบบจำลอง OpenAI ทำเช่นนี้โดยการปรับปรุงความทนทานของ Dactyl ต่อการรบกวนโดยใช้ Automatic Domain Randomization (ADR) ซึ่งเป็นวิธีการจำลองในการสร้างสภาพแวดล้อมที่ยากขึ้นเรื่อยๆ ADR แตกต่างจากการสุ่มโดเมนด้วยตนเองตรงที่ไม่จำเป็นต้องมีมนุษย์ระบุช่วงการสุ่ม[ 29 ]
API
ในเดือนมิถุนายน พ.ศ. 2563 OpenAI ได้ประกาศ APIอเนกประสงค์ซึ่งระบุว่า "ใช้สำหรับเข้าถึงโมเดล AI ใหม่ที่พัฒนาโดย OpenAI" เพื่อให้นักพัฒนาสามารถเรียกใช้สำหรับ "งาน AI ภาษาอังกฤษใดๆ" [ 30 ] [ 31 ]
ชุดตัวแทน
เมื่อวันที่ 6 ตุลาคม 2025 แซม อัลท์แมน ได้ประกาศเปิดตัว AgentKit ใหม่ของ OpenAI ในงานกล่าวเปิดงาน Dev Day 2025 AgentKit เป็นชุดเครื่องมือแบบบูรณาการใหม่สำหรับการสร้าง การใช้งาน และการเพิ่มประสิทธิภาพของเอเจนต์ AI
ตามข้อมูลของ OpenAI AgentKit สร้างขึ้นบนพื้นฐานของ Responses API ที่เปิดตัวในเดือนมีนาคม โดยนำเสนอแนวทางที่คล่องตัวยิ่งขึ้นสำหรับการสร้างเอเจนต์ ผู้ใช้งานกลุ่มแรกหลายรายรายงานว่าสามารถประหยัดเวลาและเพิ่มประสิทธิภาพได้อย่างมากเมื่อใช้เครื่องมือเอเจนต์ใหม่[ 32 ]
| ความสามารถ | คำอธิบาย |
|---|---|
| ผู้สร้างเอเจนต์ | พื้นที่ทำงานแบบกราฟิกสำหรับการสร้างและจัดการเวอร์ชันของเวิร์กโฟลว์แบบหลายเอเจนต์ |
| แชทคิท | ชุดเครื่องมือสำหรับฝังประสบการณ์การใช้งานเอเจนต์แบบแชทที่ปรับแต่งได้ในผลิตภัณฑ์ของคุณ |
| การลงทะเบียนตัวเชื่อมต่อ | แผงควบคุมส่วนกลางสำหรับจัดการแหล่งข้อมูลต่างๆ ในผลิตภัณฑ์ของ OpenAI |
| การประเมินที่ได้รับการปรับปรุง | ความสามารถใหม่ของ Evals รวมถึงชุดข้อมูล การให้คะแนนการติดตาม การเพิ่มประสิทธิภาพการแจ้งเตือนอัตโนมัติ และการรองรับโมเดลจากบุคคลที่สาม |
| ราวกั้น | การกำหนดค่าราวกันตกแบบกำหนดเอง |
| การปรับแต่งการเสริมแรงอย่างละเอียด | ความสามารถในการปรับแต่งโมเดลการให้เหตุผลของ OpenAI รวมถึงการเรียกใช้เครื่องมือแบบกำหนดเองและตัวให้คะแนนแบบกำหนดเอง |
การสร้างข้อความ
บริษัทได้ทำให้ทรานส์ฟอร์เมอร์ที่ฝึกฝนล่วงหน้าแบบสร้างสรรค์ (GPT) เป็นที่นิยม [ 33 ]
| แบบอย่าง | สถาปัตยกรรม | จำนวนพารามิเตอร์ | ข้อมูลการฝึกอบรม | วันที่วางจำหน่าย | ค่าใช้จ่ายในการฝึกอบรม | พารามิเตอร์ที่ใช้งานอยู่ |
|---|---|---|---|---|---|---|
| จีพีที-1 | ตัวถอดรหัส Transformer 12 ระดับ 12 หัว (ไม่มีตัวเข้ารหัส) ตามด้วย linear-softmax | 117 ล้าน[ 34 ] | BookCorpus : [ 35 ]ข้อความขนาด 4.5 GB จากหนังสือที่ยังไม่ได้รับการตีพิมพ์จำนวน 7,000 เล่มในหลากหลายประเภท | 11 มิถุนายน 2561 [ 36 ] | 30 วันบน การ์ดกราฟิก P600 จำนวน 8 ใบ หรือ 1 เพตาฟล็อปต่อวัน[ 36 ] | 117 ล้าน |
| จีพีที-2 | GPT-1 แต่มีการปรับค่ามาตรฐานใหม่ | 1.5 พันล้าน[ 37 ] | WebText: ข้อความขนาด 40 GB จากเอกสาร 8 ล้านฉบับ มาจากเว็บเพจ 45 ล้านหน้าที่ได้ รับการโหวตเห็นด้วยบนReddit | 14 กุมภาพันธ์ 2019 (เวอร์ชันเริ่มต้น/จำกัด) และ5 พฤศจิกายน 2019 (เวอร์ชันเต็ม) [ 38 ] | "หลายสิบเพตาฟลอปส์-วัน" [ 39 ]หรือ 1.5 × 10 21ฟลอปส์[ 40 ] | 1.5 พันล้าน |
| จีพีที-3 | GPT-2 แต่มีการปรับเปลี่ยนเพื่อให้รองรับการขยายขนาดที่ใหญ่ขึ้น | 175 พันล้าน[ 37 ] | โทเค็นจำนวน 499 พันล้านโทเค็น ประกอบด้วยCommonCrawl (570 GB), WebText, วิกิพีเดียภาษาอังกฤษ และคลังข้อมูลหนังสือสองชุด (Books1 และ Books2) | 28 พฤษภาคม 2020 [ 39 ] | 3640 เพตาฟลอปส์-วัน (ตาราง D.1 [ 39 ] ) หรือ 3.1 × 10 23ฟลอปส์[ 40 ] | 175 พันล้าน |
| จีพีที-3.5 | ไม่เปิดเผยข้อมูล | 175 พันล้าน[ 37 ] | ไม่เปิดเผยข้อมูล | 15 มีนาคม 2565 | ไม่เปิดเผยข้อมูล | |
| จีพีที-4 | นอกจากนี้ยังได้รับการฝึกฝนด้วยทั้งการทำนายข้อความและRLHF ; รับทั้งข้อความและรูปภาพเป็นอินพุต รายละเอียดเพิ่มเติมไม่ได้เปิดเผยต่อสาธารณะ[ 41 ] | ไม่เปิดเผย ประมาณการไว้ที่ 1.76 ล้านล้าน[ 42 ] [ 34 ] | ไม่เปิดเผยข้อมูล | 14 มีนาคม 2566 | ไม่เปิดเผย ประมาณการที่ 2.1 × 10 25 FLOPS [ 40 ] | 175 พันล้าน |
| จีพีที-4โอ | ? | ? | ? | 13 พฤษภาคม 2567 | ? | |
| จีพีที-4.5 | ? | ? | ? | 27 กุมภาพันธ์ 2568 | ? | |
| จีพีที-4.1 | ? | ไม่เปิดเผย ประมาณการไว้ที่ 1.5 ถึง 1.8 ล้านล้าน | ? | 14 เมษายน 2568 | ? | |
| จีพีที-5 | ? | ไม่เปิดเผย ประมาณการไว้ที่ 1.8-2 ล้านล้าน | ? | 7 สิงหาคม 2568 | ? |
โมเดล GPT ดั้งเดิมของ OpenAI ("GPT-1")

เอกสารต้นฉบับเกี่ยวกับการฝึกอบรมล่วงหน้าแบบสร้างสรรค์ของ แบบจำลองภาษาที่ใช้ TransformerเขียนโดยAlec Radfordและเพื่อนร่วมงานของเขา และเผยแพร่เป็นเอกสารก่อนตีพิมพ์บนเว็บไซต์ OpenAI เมื่อวันที่ 11 มิถุนายน 2018 [ 43 ]แสดงให้เห็นว่าแบบจำลองภาษาแบบสร้างสรรค์สามารถรับความรู้เกี่ยวกับโลกและประมวลผลการพึ่งพาในระยะยาวได้อย่างไรโดยการฝึกอบรมล่วงหน้าบนคลังข้อมูลที่หลากหลายซึ่งมีข้อความต่อเนื่องยาว
จีพีที-2

Generative Pre-trained Transformer 2 ("GPT-2") เป็นโมเดลภาษาTransformer แบบ ไม่ใช้การกำกับดูแล และเป็นรุ่นต่อจากโมเดล GPT ดั้งเดิมของ OpenAI ("GPT-1") GPT-2 ได้รับการประกาศในเดือนกุมภาพันธ์ 2019 โดยในตอนแรกมีเพียงเวอร์ชันสาธิตที่จำกัดเท่านั้นที่เผยแพร่สู่สาธารณะ เวอร์ชันเต็มของ GPT-2 ไม่ได้ถูกเผยแพร่ทันทีเนื่องจากความกังวลเกี่ยวกับการนำไปใช้ในทางที่ผิด รวมถึงการนำไปใช้เขียนข่าวปลอม [ 44 ] ผู้เชี่ยวชาญบางคนแสดงความสงสัยว่า GPT-2 ก่อให้เกิดภัยคุกคามอย่างมีนัยสำคัญ
เพื่อตอบสนองต่อ GPT-2 สถาบัน Allen Institute for Artificial Intelligence ได้พัฒนาเครื่องมือตรวจจับ "ข่าวปลอมทางประสาท" [ 45 ]นักวิจัยคนอื่นๆ เช่น Jeremy Howard ได้เตือนถึง "เทคโนโลยีที่จะเติมเต็ม Twitter อีเมล และเว็บด้วยข้อความที่ฟังดูสมเหตุสมผลและเหมาะสมกับบริบท ซึ่งจะกลบเสียงพูดอื่นๆ และไม่สามารถกรองได้" [ 46 ]ในเดือนพฤศจิกายน 2019 OpenAI ได้เผยแพร่โมเดลภาษา GPT-2 เวอร์ชันสมบูรณ์[ 47 ]เว็บไซต์หลายแห่งได้นำเสนอการสาธิตแบบโต้ตอบของ GPT-2 และโมเดล Transformer อื่นๆ ในรูปแบบต่างๆ[ 48 ] [ 49 ] [ 50 ]
ผู้เขียน GPT-2 โต้แย้งว่าแบบจำลองภาษาแบบไม่ใช้การกำกับดูแลเป็นแบบเรียนรู้ทั่วไป โดยแสดงให้เห็นจากผลลัพธ์ที่ GPT-2 บรรลุความแม่นยำและความซับซ้อนที่ อยู่ในระดับแนวหน้า ใน 7 จาก 8 งาน แบบ zero-shot (กล่าวคือ แบบจำลองไม่ได้ถูกฝึกฝนเพิ่มเติมด้วยตัวอย่างอินพุต-เอาต์พุตเฉพาะงานใดๆ)
ชุดข้อมูลที่ใช้ในการฝึกฝนเรียกว่า WebText ประกอบด้วยข้อความประมาณ 40 กิกะไบต์จากURLที่แชร์ใน โพสต์ Redditที่มีอย่างน้อย 3 โหวตขึ้นไป โดย หลีกเลี่ยงปัญหาบางอย่างในการเข้ารหัสคำศัพท์ด้วยโทเค็นคำโดยใช้การเข้ารหัสคู่ไบต์ซึ่งช่วยให้สามารถแสดงสตริงของอักขระใดๆ ได้โดยการเข้ารหัสทั้งอักขระแต่ละตัวและโทเค็นที่มีอักขระหลายตัว[ 51 ]
จีพีที-3
Generative Pre - trained Transformer 3 (GPT-3) ได้รับการอธิบายครั้งแรกในเดือนพฤษภาคม 2020 เป็นโมเดลภาษา Transformer แบบไม่ใช้การกำกับดูแล และเป็นรุ่นต่อจากGPT -2 [ 52 ] [ 53 ] [ 54 ] OpenAIระบุว่า GPT-3 เวอร์ชันเต็มมีพารามิเตอร์ 175 พันล้านตัว [ 54 ]ซึ่งมากกว่า 1.5 พันล้านตัว[ 51 ] ใน GPT-2 เวอร์ชัน เต็มถึง สองเท่า(แม้ว่าโมเดล GPT-3 ที่มีพารามิเตอร์เพียง 125 ล้านตัวก็ได้รับการฝึกฝนเช่นกัน) [ 55 ]
OpenAI ระบุว่า GPT-3 ประสบความสำเร็จในงาน " meta-learning " บางอย่าง และสามารถสรุปวัตถุประสงค์ของคู่ข้อมูลเข้า-ออกเพียงคู่เดียวได้ เอกสารเผยแพร่ GPT-3 ยกตัวอย่างการแปลและการเรียนรู้การถ่ายโอน ข้ามภาษา ระหว่างภาษาอังกฤษและภาษาโรมาเนีย และระหว่างภาษาอังกฤษและภาษาเยอรมัน[ 54 ]
GPT-3 ปรับปรุงผลลัพธ์มาตรฐานได้อย่างมากเมื่อเทียบกับ GPT-2 OpenAI เตือนว่าการขยายขนาดของโมเดลภาษาดังกล่าวอาจเข้าใกล้หรือเผชิญกับข้อจำกัดความสามารถพื้นฐานของโมเดลภาษาเชิงทำนาย[ 56 ]การฝึกอบรม GPT-3 ล่วงหน้าต้องใช้การคำนวณหลายพันเพตาฟลอป/วินาที-วัน[ b ]เมื่อเทียบกับหลายสิบเพตาฟลอป/วินาที-วันสำหรับโมเดล GPT-2 เต็มรูปแบบ[ 54 ]เช่นเดียวกับรุ่นก่อนหน้า[ 44 ]โมเดล GPT-3 ที่ได้รับการฝึกฝนแล้วไม่ได้ถูกเผยแพร่สู่สาธารณะในทันทีเนื่องจากความกังวลเกี่ยวกับการนำไปใช้ในทางที่ผิด แม้ว่า OpenAI จะวางแผนที่จะอนุญาตให้เข้าถึงผ่านAPI คลาวด์แบบชำระเงิน หลังจากเบต้าส่วนตัวฟรีสองเดือนซึ่งเริ่มต้นในเดือนมิถุนายน 2020 [ 30 ] [ 58 ]
เมื่อวันที่ 23 กันยายน พ.ศ. 2563 GPT-3 ได้รับการอนุญาตให้ใช้งานเฉพาะกับ Microsoft เท่านั้น[ 59 ] [ 60 ]
โคเด็กซ์
Codex ซึ่งประกาศในช่วงกลางปี 2021 เป็นรุ่นที่พัฒนาต่อยอดมาจาก GPT-3 โดยได้รับการฝึกฝนเพิ่มเติมด้วยโค้ดจากคลังเก็บข้อมูล GitHub กว่า 54 ล้านรายการ[ 61 ] [ 62 ]และเป็น AI ที่ขับเคลื่อนเครื่องมือ เติมโค้ด อัตโนมัติGitHub Copilot [ 62 ] ในเดือนสิงหาคม 2021 มีการเปิดตัว API ในเวอร์ชันเบต้าส่วนตัว[ 63 ]ตามข้อมูลของ OpenAI โมเดลนี้สามารถสร้างโค้ดที่ใช้งานได้ในภาษาโปรแกรมมากกว่าสิบภาษา โดยมีประสิทธิภาพมากที่สุดใน Python [ 61 ]
มีการกล่าวถึงปัญหาหลายประการเกี่ยวกับความผิดพลาด ข้อบกพร่องในการออกแบบ และช่องโหว่ด้านความปลอดภัย[ 64 ] [ 65 ]
OpenAI ประกาศว่าจะยุติการสนับสนุน API Codex ในวันที่ 23 มีนาคม 2023 [ 66 ]
จีพีที-4
เมื่อวันที่ 14 มีนาคม 2023 OpenAI ประกาศเปิดตัว Generative Pre-trained Transformer 4 (GPT-4) ซึ่งสามารถรับข้อมูลป้อนเข้าเป็นข้อความหรือรูปภาพได้[ 67 ]พวกเขาประกาศว่าเทคโนโลยีที่ได้รับการอัปเดตนี้ผ่านการทดสอบจำลองการสอบเนติบัณฑิตของโรงเรียนกฎหมายด้วยคะแนนอยู่ในกลุ่ม 10% แรกของผู้เข้าสอบ (ในทางตรงกันข้าม GPT-3.5 ได้คะแนนอยู่ในกลุ่ม 10% ล่างสุด) พวกเขากล่าวว่า GPT-4 ยังสามารถอ่าน วิเคราะห์ หรือสร้างข้อความได้มากถึง 25,000 คำ และเขียนโค้ดในภาษาโปรแกรมหลักทั้งหมดได้[ 68 ]
ผู้สังเกตการณ์รายงานว่า ChatGPT เวอร์ชันที่ใช้ GPT-4 นั้นดีขึ้นกว่าเวอร์ชันก่อนหน้าที่ใช้ GPT-3.5 โดยมีข้อแม้ว่า GPT-4 ยังคงมีปัญหาบางอย่างจากเวอร์ชันก่อนหน้า[ 69 ] GPT-4 ยังสามารถรับภาพเป็นอินพุตใน ChatGPT ได้อีกด้วย[ 70 ] OpenAI ปฏิเสธที่จะเปิดเผยรายละเอียดทางเทคนิคและสถิติต่างๆ เกี่ยวกับ GPT-4 เช่น ขนาดที่แน่นอนของโมเดล[ 71 ]
จีพีที-4โอ
เมื่อวันที่ 13 พฤษภาคม 2024 OpenAI ได้ประกาศและเผยแพร่GPT-4oซึ่งสามารถประมวลผลและสร้างข้อความ รูปภาพ และเสียงได้[ 72 ] GPT-4o บรรลุผลลัพธ์ที่ล้ำสมัยในเกณฑ์มาตรฐานด้านเสียง หลายภาษา และภาพ โดยสร้างสถิติใหม่ในการจดจำและแปลคำพูด[ 73 ] [ 74 ]โดยทำคะแนนได้ 88.7% ในเกณฑ์มาตรฐาน Massive Multitask Language Understanding ( MMLU ) เมื่อเทียบกับ 86.5% ของ GPT-4 [ 75 ]
เมื่อวันที่ 18 กรกฎาคม 2024 OpenAI ได้เปิดตัว GPT-4o mini ซึ่งเป็นเวอร์ชันที่เล็กกว่าของ GPT-4o โดยจะมาแทนที่ GPT-3.5 Turbo บนอินเทอร์เฟซ ChatGPT API ของมัน มีค่าใช้จ่าย 0.15 ดอลลาร์ต่อโทเค็นขาเข้าหนึ่งล้านโทเค็น และ 0.60 ดอลลาร์ต่อโทเค็นขาออกหนึ่งล้านโทเค็น เมื่อเทียบกับ 5 ดอลลาร์และ 15 ดอลลาร์ตามลำดับสำหรับ GPT-4o OpenAI คาดว่าจะเป็นประโยชน์อย่างยิ่งสำหรับองค์กร สตาร์ทอัพ และนักพัฒนาที่ต้องการทำให้บริการเป็นไปโดยอัตโนมัติด้วยเอเจนต์ AI [ 76 ]
ในเดือนมีนาคม พ.ศ. 2568 OpenAI ได้ปล่อยฟีเจอร์การสร้างภาพดั้งเดิมของ GPT-4o ออกมา ซึ่งเป็นทางเลือกแทน DALL-E 3 [ 77 ]
จีพีที-4.5
เมื่อวันที่ 27 กุมภาพันธ์ พ.ศ. 2568 OpenAI ได้ปล่อยGPT-4.5ซึ่งมีชื่อรหัสว่า Orion Sam Altman อ้างว่า GPT-4.5 จะนำเสนอข้อมูลที่ไม่ถูกต้องน้อยกว่ารุ่นก่อนหน้า และอธิบายว่าเป็น "โมเดลขนาดใหญ่และราคาแพง" [ 78 ]
จีพีที-4.1
เมื่อวันที่ 14 เมษายน พ.ศ. 2568 OpenAI ได้เปิดตัว โมเดล GPT-4.1นอกจากนี้ยังได้เปิดตัวโมเดลที่ "เล็กกว่า เร็วกว่า และถูกกว่า" อีกสองรุ่น ได้แก่ GPT-4.1 mini และ GPT-4.1 nano [ 79 ] [ 80 ] [ 81 ]
จีพีที-5
GPT-5 เป็นโมเดลเรือธงของOpenAI ที่เปิดตัวเมื่อวันที่ 7 สิงหาคม 2025 โดย เข้ามาแทนที่โมเดลรุ่นก่อนหน้า เช่น GPT-4o , GPT-4.5และo3
GPT-5 ใช้เราเตอร์แบบไดนามิกที่เลือกระหว่างการตอบสนองอย่างรวดเร็วและการ "คิด" ที่ลึกซึ้งยิ่งขึ้นเมื่อจำเป็น สามารถทำงานได้ในระดับปริญญาเอกในโดเมนต่างๆ เช่น คณิตศาสตร์ การเขียนโค้ด สุขภาพ และงานมัลติโมดอล นอกจากนี้ยังได้รับคะแนน 74.9% ใน SWE-bench Verified และ 88% ใน Aider polyglot [ 82 ]
นักข่าวบรรยายการเปิดตัว GPT-5 ว่าเป็นก้าวสำคัญในการก้าวไปสู่ AGI โดยยกย่องความฉลาด การเข้าถึง และราคาที่เหมาะสม[ 83 ] [ 84 ]แต่ผลตอบรับในช่วงแรกบางส่วนเรียกมันว่า "เป็นการพัฒนาแบบค่อยเป็นค่อยไปมากกว่าการปฏิวัติ" โดยสังเกตเห็นผลลัพธ์ที่หลากหลายในการเขียนเชิงสร้างสรรค์ และชี้ให้เห็นถึงการแข่งขันจากรุ่นต่างๆ เช่นGrok 4 Heavy [ 85 ]
o1
เมื่อวันที่ 12 กันยายน 2024 OpenAI ได้เปิดตัวโมเดล o1-preview และ o1-mini ซึ่งได้รับการออกแบบมาให้ใช้เวลาคิดเกี่ยวกับการตอบสนองมากขึ้น ส่งผลให้มีความแม่นยำสูงขึ้น โมเดลเหล่านี้มีประสิทธิภาพเป็นพิเศษในงานด้านวิทยาศาสตร์ การเขียนโค้ด และการให้เหตุผล และได้เปิดให้ใช้งานสำหรับสมาชิก ChatGPT Plus และ Team [ 86 ] [ 87 ]ในเดือนธันวาคม 2024 o1-preview ถูกแทนที่ด้วย o1 [ 88 ]ในเดือนมีนาคม 2025 โมเดล o1-Pro ได้เปิดให้ใช้งานผ่าน API สำหรับนักพัฒนาของ OpenAI ซึ่งก่อนหน้านี้เปิดให้ใช้งานสำหรับผู้ใช้ ChatGPT Pro ตั้งแต่เดือนธันวาคม 2024 โดยมีราคา 150 ดอลลาร์ต่อโทเค็นอินพุตหนึ่งล้านโทเค็น และ 600 ดอลลาร์ต่อโทเค็นเอาต์พุตหนึ่งล้านโทเค็น[ 89 ]
โอ3
เมื่อวันที่ 20 ธันวาคม 2024 OpenAI ได้เปิดตัว o3 ซึ่งเป็นรุ่นต่อจากโมเดลการให้เหตุผล o1 นอกจากนี้ OpenAI ยังได้เปิดตัว o3-mini ซึ่งเป็นเวอร์ชันที่เบากว่าและเร็วกว่าของ OpenAI o3 ณ วันที่ 21 ธันวาคม 2024 โมเดลนี้ยังไม่เปิดให้ใช้งานสำหรับบุคคลทั่วไป ตามที่ OpenAI ระบุ พวกเขากำลังทดสอบ o3 และ o3-mini อยู่[ 90 ] [ 91 ]จนถึงวันที่ 10 มกราคม 2025 นักวิจัยด้านความปลอดภัยและการรักษาความปลอดภัยมีโอกาสสมัครขอเข้าถึงโมเดลเหล่านี้ก่อนใคร[ 92 ]โมเดลนี้เรียกว่า o3 แทนที่จะเป็น o2 เพื่อหลีกเลี่ยงความสับสนกับผู้ให้บริการโทรคมนาคมO2 [ 90 ] ในเดือนเมษายน 2025 OpenAI ได้เปิดตัว o3 ให้กับผู้ใช้ที่ชำระเงินทั้งหมด o3 มีความสามารถในการให้เหตุผลและการแก้ปัญหาที่ดีกว่า o1 [ 93 ]
การวิจัยเชิงลึก
Deep Research เป็นเอเจนต์ AIที่พัฒนาโดย OpenAI เปิดตัวเมื่อวันที่ 2 กุมภาพันธ์ 2025 โดยใช้ประโยชน์จากความสามารถของโมเดล o3 ของ OpenAI เพื่อทำการท่องเว็บ วิเคราะห์ข้อมูล และสังเคราะห์ข้อมูลอย่างละเอียด และสร้างรายงานที่ครอบคลุมภายในเวลา 5 ถึง 30 นาที[ 94 ]เมื่อเปิดใช้งานการท่องเว็บและ เครื่องมือ Pythonแล้ว จะมีความแม่นยำถึง 26.6 เปอร์เซ็นต์ในเกณฑ์มาตรฐานHLE (Humanity's Last Exam) [ 95 ]ในเดือนเมษายน 2025 OpenAI เริ่มเปิดตัว Deep Research เวอร์ชันน้ำหนักเบาให้กับผู้ใช้ ChatGPT ฟรีทั้งหมด[ 96 ] [ 97 ]
จีพีที-โอเอส
GPT-OSS (เขียนแบบมีสไตล์ว่า gpt-oss) คือชุดของโมเดลการให้เหตุผลแบบน้ำหนักเปิดที่ OpenAI เผยแพร่เมื่อวันที่ 5 สิงหาคม 2025 [ 98 ] [ 99 ] [ 100 ]มีสองเวอร์ชัน ได้แก่ โมเดลขนาดใหญ่ที่มีพารามิเตอร์ 117 พันล้านตัว เรียกว่าgpt-oss-120bและโมเดลขนาดเล็กที่มีพารามิเตอร์ 21 พันล้านตัว เรียกว่าgpt-oss-20b [ 99 ] [ 101 ] ทั้งสองโมเดลเผยแพร่ภายใต้ใบอนุญาต Apache 2.0ซึ่งอนุญาตให้ใช้งานเชิงพาณิชย์และไม่เชิงพาณิชย์ได้ ในแง่ของประสิทธิภาพ พวกมันเทียบได้กับo4-miniและo3-miniตามลำดับ ตามข้อมูลของ OpenAI [ 101 ] [ 99 ] gpt-oss-20b มีขนาดเล็กพอที่จะทำงานบนอุปกรณ์ที่ มีหน่วยความจำเข้าถึงแบบสุ่มมากกว่า16 กิกะไบต์[ 99 ]
การจำแนกภาพ
คลิป
CLIP (Contrastive Language–Image Pre-training) ซึ่งเปิดตัวในปี 2021 เป็นโมเดลที่ได้รับการฝึกฝนเพื่อวิเคราะห์ความคล้ายคลึงทางความหมายระหว่างข้อความและรูปภาพ โดยเฉพาะอย่างยิ่งสามารถใช้สำหรับการจำแนกประเภทรูปภาพได้[ 102 ]
แปลงข้อความเป็นรูปภาพ
ดัลล์-อี

DALL-E เปิดตัวในปี 2021 เป็นโมเดล Transformer ที่สร้างภาพจากคำอธิบายข้อความ[ 103 ] DALL-E ใช้ GPT-3 เวอร์ชัน 12 พันล้านพารามิเตอร์เพื่อตีความอินพุตภาษาธรรมชาติ (เช่น "กระเป๋าหนังสีเขียวรูปทรงห้าเหลี่ยม" หรือ "มุมมองไอโซเมตริกของคาปิบาร่าเศร้า") และสร้างภาพที่สอดคล้องกัน สามารถสร้างภาพของวัตถุที่สมจริง ("หน้าต่างกระจกสีที่มีภาพสตรอว์เบอร์รีสีฟ้า") เช่นเดียวกับวัตถุที่ไม่มีอยู่จริง ("ลูกบาศก์ที่มีพื้นผิวของเม่น") ณ เดือนมีนาคม 2021 ยังไม่มี API หรือโค้ดให้ใช้งาน
ดัลล์-อี 2
ในเดือนเมษายน พ.ศ. 2565 OpenAI ได้ประกาศ DALL-E 2 ซึ่งเป็นเวอร์ชันอัปเดตของโมเดลที่มีผลลัพธ์ที่สมจริงยิ่งขึ้น[ 104 ]ในเดือนธันวาคม พ.ศ. 2565 OpenAI ได้เผยแพร่ซอฟต์แวร์ Point-E บน GitHub ซึ่งเป็นระบบพื้นฐานใหม่สำหรับการแปลงคำอธิบายข้อความให้เป็นโมเดล 3 มิติ[ 105 ]
ดัลล์-อี 3
ในเดือนกันยายน พ.ศ. 2566 OpenAI ได้ประกาศ DALL-E 3 ซึ่งเป็นโมเดลที่มีประสิทธิภาพมากขึ้นและสามารถสร้างภาพจากคำอธิบายที่ซับซ้อนได้ดีกว่า โดยไม่ต้องมีการออกแบบข้อความแจ้งเตือนด้วยตนเอง และแสดงรายละเอียดที่ซับซ้อน เช่น มือและข้อความ[ 106 ]โดยได้เปิดให้ใช้งานแก่สาธารณะในฐานะฟีเจอร์ ChatGPT Plus ในเดือนตุลาคม[ 107 ]
แปลงข้อความเป็นวิดีโอ
โซระ
Sora เป็น โมเดล ข้อความสู่วิดีโอที่สามารถสร้างวิดีโอตามข้อความอธิบายสั้นๆ[ 108 ]รวมถึงขยายวิดีโอที่มีอยู่ไปข้างหน้าหรือถอยหลังในเวลา[ 109 ]สามารถสร้างวิดีโอที่มีความละเอียดสูงสุด 1920x1080 หรือ 1080x1920 ความยาวสูงสุดของวิดีโอที่สร้างขึ้นยังไม่ทราบแน่ชัด
ทีมพัฒนาของ Sora ตั้งชื่อตาม คำภาษา ญี่ปุ่นที่แปลว่า "ท้องฟ้า" เพื่อสื่อถึง "ศักยภาพในการสร้างสรรค์ที่ไร้ขีดจำกัด" [ 108 ]เทคโนโลยีของ Sora เป็นการดัดแปลงเทคโนโลยีที่อยู่เบื้องหลังโมเดลแปลงข้อความเป็นภาพDALL·E 3 [ 109 ] OpenAI ฝึกฝนระบบโดยใช้วิดีโอที่เผยแพร่สู่สาธารณะ รวมถึงวิดีโอที่มีลิขสิทธิ์ซึ่งได้รับอนุญาต ให้ใช้เพื่อวัตถุประสงค์ดังกล่าว แต่ไม่ได้เปิดเผยจำนวนหรือแหล่งที่มาที่แน่นอนของวิดีโอ[ 108 ]
เมื่อวันที่ 15 กุมภาพันธ์ 2024 OpenAI ได้สาธิตวิดีโอความละเอียดสูง ที่สร้างโดย Sora ให้กับสาธารณชน โดยระบุว่าสามารถสร้างวิดีโอได้ยาวถึงหนึ่งนาที นอกจากนี้ยังได้เผยแพร่รายงานทางเทคนิคที่เน้นวิธีการที่ใช้ในการฝึกฝนโมเดลและความสามารถของโมเดล[ 109 ]และยอมรับข้อบกพร่องบางประการ รวมถึงปัญหาในการจำลองฟิสิกส์ที่ซับซ้อน[ 110 ] Will Douglas Heaven จากMIT Technology Reviewเรียกวิดีโอสาธิตว่า "น่าประทับใจ" แต่ตั้งข้อสังเกตว่าวิดีโอเหล่านั้นอาจถูกคัดเลือกมาและอาจไม่ได้แสดงถึงผลลัพธ์ทั่วไปของ Sora [ 109 ]
แม้จะมีข้อสงสัยจากผู้นำทางวิชาการบางส่วนหลังจากการสาธิต Sora ต่อสาธารณะ แต่บุคคลสำคัญในอุตสาหกรรมบันเทิงหลายคนแสดงความสนใจอย่างมากในศักยภาพของเทคโนโลยีนี้ ในการสัมภาษณ์ นักแสดง/ผู้กำกับภาพยนตร์ไทเลอร์ เพอร์รีแสดงความประหลาดใจกับความสามารถของเทคโนโลยีในการสร้างวิดีโอที่สมจริงจากคำอธิบายข้อความ โดยอ้างถึงศักยภาพในการปฏิวัติการเล่าเรื่องและการสร้างเนื้อหา เขากล่าวว่าความตื่นเต้นของเขาเกี่ยวกับความเป็นไปได้ของ Sora นั้นมากจนเขาตัดสินใจระงับแผนการขยายสตูดิโอภาพยนตร์ของเขาในแอตแลนตา[ 111 ]
Sora 2 เปิดตัวเมื่อวันที่ 30 กันยายน พ.ศ. 2568 พร้อมกับ แอป iOSในเวลาเดียวกัน[ 112 ]
แปลงเสียงเป็นข้อความ
กระซิบ
Whisper ซึ่งเปิดตัวในปี 2022 เป็นโมเดลการรู้จำเสียงพูดอเนกประสงค์[ 113 ]ได้รับการฝึกฝนบนชุดข้อมูลเสียงที่หลากหลายขนาดใหญ่ และยังเป็นโมเดลแบบมัลติทาสก์ที่สามารถทำการรู้จำเสียงพูดหลายภาษา รวมถึงการแปลเสียงพูดและการระบุภาษาได้[ 114 ]
คนรุ่นดนตรี
มิวส์เน็ต
MuseNet ซึ่งเปิดตัวในปี 2019 เป็นโครงข่ายประสาทเทียมเชิงลึกที่ได้รับการฝึกฝนให้ทำนายโน้ตดนตรีถัดไปใน ไฟล์เพลง MIDIสามารถสร้างเพลงที่มีเครื่องดนตรี 10 ชิ้นใน 15 สไตล์ ตามรายงานของThe Vergeเพลงที่สร้างโดย MuseNet มักจะเริ่มต้นได้ค่อนข้างดี แต่หลังจากนั้นก็จะกลายเป็นความวุ่นวายเมื่อเล่นไปนานขึ้น[ 115 ] [ 116 ]ในวัฒนธรรมป๊อป การประยุกต์ใช้เครื่องมือนี้ครั้งแรกถูกนำมาใช้ตั้งแต่ปี 2020 สำหรับภาพยนตร์ระทึกขวัญทางจิตวิทยาออนไลน์เรื่องBen Drownedเพื่อสร้างเพลงประกอบตัวละครเอก[ 117 ] [ 118 ]
ตู้เพลง
Jukebox ซึ่งเปิดตัวในปี 2020 เป็นอัลกอริทึมโอเพนซอร์สสำหรับสร้างเพลงที่มีเสียงร้อง หลังจากฝึกฝนด้วยตัวอย่าง 1.2 ล้านตัวอย่าง ระบบจะรับประเภทเพลง ศิลปิน และเนื้อเพลงบางส่วน แล้วส่งออกตัวอย่างเพลง OpenAI ระบุว่าเพลงเหล่านั้น "แสดงให้เห็นถึงความสอดคล้องทางดนตรีในระดับท้องถิ่น [และ] เป็นไปตามรูปแบบคอร์ดแบบดั้งเดิม" แต่ยอมรับว่าเพลงเหล่านั้นขาด "โครงสร้างทางดนตรีขนาดใหญ่ที่คุ้นเคย เช่น ท่อนฮุคที่ซ้ำกัน" และ "มีช่องว่างที่สำคัญ" ระหว่าง Jukebox กับเพลงที่สร้างโดยมนุษย์The Vergeกล่าวว่า "มันน่าประทับใจทางเทคโนโลยี แม้ว่าผลลัพธ์จะฟังดูเหมือนเพลงเวอร์ชันที่ฟังดูคุ้นเคยแต่ไม่ชัดเจน" ในขณะที่Business Insiderกล่าวว่า "น่าประหลาดใจที่เพลงบางเพลงที่ได้นั้นติดหูและฟังดูสมจริง" [ 119 ] [ 120 ] [ 121 ]
ส่วนติดต่อผู้ใช้
เกมโต้วาที
ในปี 2018 OpenAI ได้เปิดตัวเกมโต้วาที (Debate Game) ซึ่งสอนให้เครื่องจักรโต้วาทีปัญหา จำลอง ต่อหน้าผู้ตัดสินที่เป็นมนุษย์ จุดประสงค์คือเพื่อวิจัยว่าแนวทางดังกล่าวสามารถช่วยในการตรวจสอบการตัดสินใจของ AI และในการพัฒนาAI ที่อธิบายได้ หรือ ไม่[ 122 ] [ 123 ]
กล้องจุลทรรศน์
Microscope [ 124 ]ซึ่งเปิดตัวในปี 2020 เป็นชุดการแสดงภาพของทุกชั้นและเซลล์ประสาทที่สำคัญของแบบจำลองเครือข่ายประสาทแปดแบบ ซึ่งมักได้รับการศึกษาในด้านความสามารถในการตีความ[ 125 ] Microscope ถูกสร้างขึ้นเพื่อวิเคราะห์คุณลักษณะที่เกิดขึ้นภายในเครือข่ายประสาทเหล่านี้ได้อย่างง่ายดาย แบบจำลองที่รวมอยู่ ได้แก่AlexNet , VGG -19 , Inceptionเวอร์ชันต่างๆและCLIP Resnet เวอร์ชันต่างๆ [ 126 ]
แชทจีพีที

ChatGPT เปิดตัวในเดือนพฤศจิกายน 2022 เป็นแชทบอทAI เชิงสร้างสรรค์ ที่ใช้โมเดล GPT ของ OpenAI ในการสร้างเนื้อหา ผู้ใช้สามารถโต้ตอบกับแชทบอทได้ผ่านการสนทนาด้วยข้อความหรือเสียง นอกจากนี้ยังสามารถสร้างภาพโดยใช้GPT-4oซึ่งมาแทนที่DALL-E 3 [ 77 ] ChatGPTมีผู้ใช้งานถึง 100 ล้านคนในช่วงสองเดือนหลังจากการเปิดตัว[ 127 ]
OpenAI เปิดตัวแผนการสมัครสมาชิกหลายแบบ ได้แก่ Plus, Pro, Team และ Enterprise ผู้ใช้ในระดับฟรีของ ChatGPT สามารถเข้าถึงGPT-4o ได้ แต่มีข้อจำกัดที่ลดลง การสมัครสมาชิก ChatGPT ระดับ "Plus", "Pro", "Team" และ "Enterprise" จะให้ขีดจำกัดการใช้งานที่เพิ่มขึ้นและการเข้าถึงคุณสมบัติหรือโมเดลเพิ่มเติม[ 128 ]
ในเดือนพฤษภาคม 2023 OpenAI ได้เปิดตัวอินเทอร์เฟซผู้ใช้สำหรับ ChatGPT สำหรับApp Storeบน iOS และในเดือนกรกฎาคม 2023 สำหรับPlay Storeบน Android [ 129 ]ในเดือนธันวาคม 2024 OpenAI ได้เปิดตัวฟีเจอร์ใหม่ที่อนุญาตให้ผู้ใช้โทรหา ChatGPT ได้ฟรีสูงสุด 15 นาทีต่อเดือน[ 130 ] [ 131 ]
ค้นหาGPT
SearchGPT ซึ่งเป็น เครื่องมือค้นหาต้นแบบที่พัฒนาโดย OpenAI ได้เปิดตัวเมื่อวันที่ 25 กรกฎาคม 2024 โดยเริ่มแรกเปิดให้ผู้ใช้ทดสอบจำนวนจำกัดเพียง 10,000 รายเท่านั้น โดยผสานรวมคุณสมบัติของเครื่องมือค้นหาแบบดั้งเดิมเข้ากับความสามารถของ AI เชิงสร้างสรรค์[ 132 ] [ 133 ]
แชทจีพีที แอตลาส
ในเดือนตุลาคม พ.ศ. 2568 OpenAI ได้เปิดตัวเว็บเบราว์เซอร์ชื่อ ChatGPT Atlas [ 134 ] [ 135 ]
ปริซึม
เมื่อวันที่ 27 มกราคม พ.ศ. 2569 OpenAI ได้เปิดตัว Prism ซึ่งเป็น พื้นที่ทำงานแบบเนทีฟ ของ LaTeXที่ออกแบบมาเพื่อช่วยเหลือนักวิทยาศาสตร์ในการวิจัยและการเขียน เช่น การร่างเอกสารทางวิทยาศาสตร์ การจัดการการอ้างอิง และการจัดรูปแบบสมการ[ 136 ] [ 137 ]
สตาร์เกตและซูเปอร์คอมพิวเตอร์อื่นๆ
โครงการ Stargate เปิดตัวในปี 2024 โดยเริ่มต้นจากการเป็นโครงการมูลค่า 100 พันล้านดอลลาร์ระหว่าง OpenAI และMicrosoftเพื่อสร้างศูนย์ข้อมูล[ 138 ]ชื่อ "Stargate" เป็นการยกย่องภาพยนตร์ไซไฟเรื่อง Stargate ในปี 1994 [ 139 ]ในที่สุดก็กลายเป็นบริษัทStargate LLCซึ่งก่อตั้งขึ้นในเดือนมกราคม 2025 โดยเป็นการร่วมมือกันระหว่าง OpenAI , Oracle , SoftBankและMGX [ 140 ] [ 138 ]
การพัฒนาฮาร์ดแวร์
เมื่อวันที่ 21 พฤษภาคม 2025 OpenAI ประกาศการเข้าซื้อกิจการ io ซึ่งเป็นบริษัทสตาร์ทอัพด้านฮาร์ดแวร์ AI ที่ก่อตั้งโดยJony Iveอดีต นักออกแบบของ Apple [ 141 ]ข้อตกลงนี้มีมูลค่าประมาณ 6.5 พันล้านดอลลาร์สหรัฐ ซึ่งถือเป็นการเข้าสู่ตลาดฮาร์ดแวร์สำหรับผู้บริโภคอย่างมีกลยุทธ์ของ OpenAI [ 142 ] Ive ซึ่งเป็นที่รู้จักจากการออกแบบiPhone , iPadและiMacจะเป็นผู้นำด้านฮาร์ดแวร์และการออกแบบสำหรับ OpenAI [ 143 ]
Sam Altman ซีอีโอของ OpenAI และ Ive ได้แสดงวิสัยทัศน์ร่วมกันในการพัฒนาอุปกรณ์ AI ดั้งเดิมที่ก้าวข้ามหน้าจอและอินเทอร์เฟซแบบเดิม แม้ว่าจะยังไม่มีการเปิดเผยรายละเอียดผลิตภัณฑ์ที่เฉพาะเจาะจง แต่ Washington Post รายงานว่า Ive และ Altman ได้เริ่มทำงานกับผลิตภัณฑ์ใหม่แล้ว “ผลิตภัณฑ์แรกที่ผมกำลังพัฒนาอยู่นั้นดึงดูดจินตนาการของผมได้อย่างสมบูรณ์” Jony Ive กล่าว Altman เสริมว่า “ผมคิดว่ามันเป็นเทคโนโลยีที่เจ๋งที่สุดเท่าที่โลกเคยเห็นมา” [ 144 ] [ 141 ]
บริษัทยังเริ่มทำงานในด้านหุ่นยนต์โดยมีเป้าหมายในการสร้างหุ่นยนต์อเนกประสงค์[ 145 ]
บรรณานุกรมที่คัดเลือก
ส่วนนี้แสดงรายการเอกสารเผยแพร่อย่างเป็นทางการหลัก ๆ จาก OpenAI เกี่ยวกับโมเดล GPT ของ OpenAI
- GPT-1: รายงาน, การเผยแพร่บน GitHub [ 146 ]
- GPT-2: ประกาศในบล็อก[ 147 ]รายงานเกี่ยวกับการตัดสินใจ "การเผยแพร่แบบแบ่งขั้นตอน" [ 148 ]การเผยแพร่บน GitHub [ 149 ]
- GPT-3: รายงาน[ 39 ]จะไม่มีการเผยแพร่โค้ดผ่าน GitHub หรือรูปแบบอื่นใดอีกต่อไป
- WebGPT: ประกาศในบล็อก[ 150 ]รายงาน[ 151 ]
- InstructGPT: ประกาศในบล็อก[ 152 ]รายงาน[ 153 ]
- ChatGPT: ประกาศในบล็อก[ 154 ] (ไม่มีรายงาน)
- GPT-4: ประกาศในบล็อก[ 155 ]รายงาน[ 156 ] [ 157 ]การ์ดแบบจำลอง[ 158 ]
- GPT-4o: ประกาศบล็อก[ 75 ]
- GPT-4.5: ประกาศในบล็อก[ 159 ]
- GPT-4.1: ประกาศในบล็อก[ 80 ]
- GPT-OSS: ประกาศในบล็อก[ 98 ]การ์ดโมเดล[ 101 ]
- GPT-5: ประกาศในบล็อก[ 160 ]
ดูเพิ่มเติม
หมายเหตุ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ผลิตภัณฑ์และแอปพลิเคชันของ OpenAI
องค์กร ปัญญาประดิษฐ์ (AI) สัญชาติอเมริกัน OpenAI ได้เปิดตัวผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนับตั้งแต่ก่อตั้งขึ้นในปี 2015
การเรียนรู้แบบเสริมแรง
ในช่วงเริ่มต้น การวิจัยของ OpenAI ครอบคลุมโครงการจำนวนมากที่มุ่งเน้น การเรียนรู้แบบเสริมแรง (RL) [ 1 ] OpenAI ถูกมองว่าเป็นคู่แข่งที่สำคัญของ DeepMind [ 2 ]
โรงยิม
Gym ซึ่งประกาศในปี 2016 เป็นไลบรารี Python แบบโอเพนซอร์สที่ออกแบบมาเพื่ออำนวยความสะดวกในการพัฒนาอัลกอริธึมการเรียนรู้แบบเสริมแรง โดยมีเป้าหมายเพื่อสร้างมาตรฐานวิธีการกำหนดสภาพแวดล้อมในการวิจัย AI ทำให้การวิจัยที่เผยแพร่สามารถทำซ้ำได้ง่ายขึ้น [ 3 ] [ 4 ]...
โรโบซูโม
RoboSumo ซึ่งเปิดตัวในปี 2017 เป็น โลกเสมือนจริง ที่หุ่นยนต์ตัวแทน แบบ มนุษย์เรียนรู้ด้วยโลหะในตอนแรกขาดความรู้แม้กระทั่งวิธีการเดิน แต่ได้รับเป้าหมายในการเรียนรู้การเคลื่อนไหวและผลักตัวแทนฝ่ายตรงข้ามออกจากวงแหวน [ 8 ] ผ่านกระบวนการเรียนรู้แบบแข่งขันนี้...