ผลิตภัณฑ์และแอปพลิเคชันของ OpenAI

Q: ข้อมูลสำคัญเกี่ยวกับ ผลิตภัณฑ์และแอปพลิเคชันของ OpenAI

องค์กร ปัญญาประดิษฐ์ (AI) สัญชาติอเมริกัน OpenAI ได้เปิดตัวผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนับตั้งแต่ก่อตั้งขึ้นในปี 2015

องค์กร ปัญญาประดิษฐ์ (AI) สัญชาติอเมริกันOpenAIได้เปิดตัวผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนับตั้งแต่ก่อตั้งขึ้นในปี 2015

การเรียนรู้แบบเสริมแรง

ในช่วงเริ่มต้น การวิจัยของ OpenAI ครอบคลุมโครงการจำนวนมากที่มุ่งเน้นการเรียนรู้แบบเสริมแรง (RL) ^{[ 1 ]} OpenAI ถูกมองว่าเป็นคู่แข่งที่สำคัญของDeepMind ^{[ 2 ]}

โรงยิม

Gym ซึ่งประกาศในปี 2016 เป็นไลบรารี Pythonแบบโอเพนซอร์สที่ออกแบบมาเพื่ออำนวยความสะดวกในการพัฒนาอัลกอริธึมการเรียนรู้แบบเสริมแรง โดยมีเป้าหมายเพื่อสร้างมาตรฐานวิธีการกำหนดสภาพแวดล้อมในการวิจัย AI ทำให้การวิจัยที่เผยแพร่สามารถทำซ้ำได้ง่ายขึ้น^{[ 3 ]}^{[ 4 ]}ในขณะเดียวกันก็มอบอินเทอร์เฟซที่เรียบง่ายให้ผู้ใช้ในการโต้ตอบกับสภาพแวดล้อมเหล่านี้ ในปี 2022 การพัฒนาใหม่ของ Gym ได้ถูกย้ายไปยังไลบรารี Gymnasium ^{[ 5 ]}^{[ 6 ]}

ยิมเรโทร

Gym Retro ซึ่งเปิดตัวในปี 2018 เป็นแพลตฟอร์มสำหรับการวิจัยการเรียนรู้แบบเสริมแรง (RL) ในวิดีโอเกม^{[ 7 ]}โดยใช้อัลกอริธึม RL และศึกษาการวางนัยทั่วไป การวิจัย RL ก่อนหน้านี้มุ่งเน้นไปที่การเพิ่มประสิทธิภาพเอเจนต์เพื่อแก้ปัญหางานเดียวเป็นหลัก Gym Retro ให้ความสามารถในการวางนัยทั่วไประหว่างเกมที่มีแนวคิดคล้ายกันแต่มีลักษณะที่แตกต่างกัน

โรโบซูโม

RoboSumo ซึ่งเปิดตัวในปี 2017 เป็นโลกเสมือนจริงที่หุ่นยนต์ตัวแทนแบบ มนุษย์เรียนรู้ด้วยโลหะในตอนแรกขาดความรู้แม้กระทั่งวิธีการเดิน แต่ได้รับเป้าหมายในการเรียนรู้การเคลื่อนไหวและผลักตัวแทนฝ่ายตรงข้ามออกจากวงแหวน ^{[ 8 ]}ผ่านกระบวนการเรียนรู้แบบแข่งขันนี้ ตัวแทนจะเรียนรู้วิธีปรับตัวให้เข้ากับสภาวะที่เปลี่ยนแปลง เมื่อตัวแทนถูกนำออกจากสภาพแวดล้อมเสมือนจริงนี้และวางไว้ในสภาพแวดล้อมเสมือนจริงใหม่ที่มีลมแรง ตัวแทนจะทรงตัวเพื่อยืนตรง ซึ่งแสดงให้เห็นว่ามันได้เรียนรู้วิธีการทรงตัวในแบบทั่วไป^{[ 8 ]}^{[ 9 ]} Igor Mordatch จาก OpenAI โต้แย้งว่าการแข่งขันระหว่างตัวแทนอาจสร้าง "การแข่งขันด้านอาวุธ" ทางปัญญาที่สามารถเพิ่มความสามารถของตัวแทนในการทำงานได้แม้กระทั่งนอกบริบทของการแข่งขัน^{[ 8 ]}

โอเพ่นไอไฟว์

OpenAI Five คือทีมบอท ที่ OpenAI คัดสรรมา 5 ตัว ซึ่งใช้ในการแข่งขันวิดีโอเกม Dota 2แบบ 5 ต่อ 5 โดย บอทเหล่านี้เรียนรู้ที่จะเล่นกับผู้เล่นที่เป็นมนุษย์ที่มีทักษะสูงผ่านอัลกอริธึมแบบลองผิดลองถูก ก่อนที่จะกลายเป็นทีม 5 ตัว การสาธิตต่อสาธารณะครั้งแรกเกิดขึ้นที่The International 2017ซึ่งเป็นการแข่งขันชิงแชมป์ประจำปีของเกม โดยDendiผู้เล่นมืออาชีพชาวยูเครน แพ้บอทในการแข่งขันแบบตัวต่อตัว^{[ 10 ]}^{[ 11 ]}หลังจากการแข่งขัน Greg Brockman ซีทีโอ อธิบายว่าบอทเรียนรู้โดยการเล่นกับตัวเองเป็นเวลา 2 สัปดาห์ในเวลาจริงและซอฟต์แวร์การเรียนรู้นี้เป็นก้าวหนึ่งในการสร้างซอฟต์แวร์ที่สามารถจัดการงานที่ซับซ้อนได้เหมือนศัลยแพทย์^{[ 12 ]}^{[ 13 ]}ระบบนี้ใช้รูปแบบการเรียนรู้แบบเสริมแรงโดยบอทจะเรียนรู้ไปเรื่อยๆ โดยการเล่นกับตัวเองหลายร้อยครั้งต่อวันเป็นเวลาหลายเดือน และจะได้รับรางวัลสำหรับการกระทำต่างๆ เช่น การฆ่าศัตรูและการยึดเป้าหมายในแผนที่^{[ 14 ]}^{[ 15 ]}^{[ 16 ]}

ภายในเดือนมิถุนายน 2018 ความสามารถของบอทได้ขยายออกไปจนสามารถเล่นร่วมกันเป็นทีมเต็มรูปแบบ 5 ตัว และสามารถเอาชนะทีมผู้เล่นสมัครเล่นและกึ่งมืออาชีพได้^{[ 17 ]}^{[ 14 ]}^{[ 18 ]}^{[ 19 ]}ในงานThe International 2018 OpenAI Five ได้ลงเล่นในแมตช์โชว์ 2 นัดกับผู้เล่นมืออาชีพ แต่สุดท้ายก็แพ้ทั้งสองเกม^{[ 20 ]}^{[ 21 ]}^{[ 22 ]}ในเดือนเมษายน 2019 OpenAI Five เอาชนะOGแชมป์โลกในขณะนั้น ด้วยคะแนน 2:0 ในแมตช์โชว์สดที่ซานฟรานซิสโก^{[ 23 ]}^{[ 24 ]}การปรากฏตัวต่อสาธารณะครั้งสุดท้ายของบอทเกิดขึ้นในปลายเดือนนั้น โดยพวกเขาลงเล่นทั้งหมด 42,729 เกมในการแข่งขันออนไลน์แบบเปิดเป็นเวลา 4 วัน และชนะ 99.4% ของเกมเหล่านั้น^{[ 25 ]}

กลไกของ OpenAI Five ในบอทผู้เล่นของ Dota 2 แสดงให้เห็นถึงความท้าทายของระบบ AI ในเกม MOBA (Multiplayer Online Battle Arena) และวิธีที่ OpenAI Five ได้แสดงให้เห็นถึงการใช้ตัวแทนการเรียนรู้แบบเสริมแรงเชิงลึก (DRL) เพื่อให้บรรลุความสามารถเหนือมนุษย์ในการแข่งขัน Dota 2 ^{[ 26 ]}

แด็กทิล

Dactyl ซึ่งพัฒนาขึ้นในปี 2018 ใช้การเรียนรู้ของเครื่องเพื่อฝึกShadow Handซึ่งเป็นหุ่นยนต์มือคล้ายมนุษย์ให้สามารถจัดการกับวัตถุทางกายภาพได้^{[ 27 ]}มันเรียนรู้ทั้งหมดในการจำลองโดยใช้อัลกอริธึม RL และรหัสการฝึกอบรมเดียวกันกับOpenAI Five OpenAI แก้ปัญหาการวางแนวของวัตถุโดยใช้การสุ่มโดเมนซึ่งเป็นวิธีการจำลองที่เปิดเผยผู้เรียนให้ได้รับประสบการณ์ที่หลากหลายแทนที่จะพยายามปรับให้เข้ากับความเป็นจริง การตั้งค่าสำหรับ Dactyl นอกเหนือจากการมีกล้องติดตามการเคลื่อนไหวแล้ว ยังมี กล้อง RGBเพื่อให้หุ่นยนต์สามารถจัดการกับวัตถุใดๆ ก็ได้โดยการมองเห็น ในปี 2018 OpenAI แสดงให้เห็นว่าระบบสามารถจัดการกับลูกบาศก์และปริซึมแปดเหลี่ยมได้^{[ 28 ]}

ในปี 2019 OpenAI ได้แสดงให้เห็นว่า Dactyl สามารถแก้ลูกบาศก์รูบิกได้ หุ่นยนต์สามารถแก้ปริศนาได้ 60% ของเวลา วัตถุอย่างลูกบาศก์รูบิกมีฟิสิกส์ที่ซับซ้อนซึ่งยากต่อการสร้างแบบจำลอง OpenAI ทำเช่นนี้โดยการปรับปรุงความทนทานของ Dactyl ต่อการรบกวนโดยใช้ Automatic Domain Randomization (ADR) ซึ่งเป็นวิธีการจำลองในการสร้างสภาพแวดล้อมที่ยากขึ้นเรื่อยๆ ADR แตกต่างจากการสุ่มโดเมนด้วยตนเองตรงที่ไม่จำเป็นต้องมีมนุษย์ระบุช่วงการสุ่ม^{[ 29 ]}

API

ในเดือนมิถุนายน พ.ศ. 2563 OpenAI ได้ประกาศ APIอเนกประสงค์ซึ่งระบุว่า "ใช้สำหรับเข้าถึงโมเดล AI ใหม่ที่พัฒนาโดย OpenAI" เพื่อให้นักพัฒนาสามารถเรียกใช้สำหรับ "งาน AI ภาษาอังกฤษใดๆ" ^{[ 30 ]}^{[ 31 ]}

ชุดตัวแทน

เมื่อวันที่ 6 ตุลาคม 2025 แซม อัลท์แมน ได้ประกาศเปิดตัว AgentKit ใหม่ของ OpenAI ในงานกล่าวเปิดงาน Dev Day 2025 AgentKit เป็นชุดเครื่องมือแบบบูรณาการใหม่สำหรับการสร้าง การใช้งาน และการเพิ่มประสิทธิภาพของเอเจนต์ AI

ตามข้อมูลของ OpenAI AgentKit สร้างขึ้นบนพื้นฐานของ Responses API ที่เปิดตัวในเดือนมีนาคม โดยนำเสนอแนวทางที่คล่องตัวยิ่งขึ้นสำหรับการสร้างเอเจนต์ ผู้ใช้งานกลุ่มแรกหลายรายรายงานว่าสามารถประหยัดเวลาและเพิ่มประสิทธิภาพได้อย่างมากเมื่อใช้เครื่องมือเอเจนต์ใหม่^{[ 32 ]}


ความสามารถ	คำอธิบาย
ผู้สร้างเอเจนต์	พื้นที่ทำงานแบบกราฟิกสำหรับการสร้างและจัดการเวอร์ชันของเวิร์กโฟลว์แบบหลายเอเจนต์
แชทคิท	ชุดเครื่องมือสำหรับฝังประสบการณ์การใช้งานเอเจนต์แบบแชทที่ปรับแต่งได้ในผลิตภัณฑ์ของคุณ
การลงทะเบียนตัวเชื่อมต่อ	แผงควบคุมส่วนกลางสำหรับจัดการแหล่งข้อมูลต่างๆ ในผลิตภัณฑ์ของ OpenAI
การประเมินที่ได้รับการปรับปรุง	ความสามารถใหม่ของ Evals รวมถึงชุดข้อมูล การให้คะแนนการติดตาม การเพิ่มประสิทธิภาพการแจ้งเตือนอัตโนมัติ และการรองรับโมเดลจากบุคคลที่สาม
ราวกั้น	การกำหนดค่าราวกันตกแบบกำหนดเอง
การปรับแต่งการเสริมแรงอย่างละเอียด	ความสามารถในการปรับแต่งโมเดลการให้เหตุผลของ OpenAI รวมถึงการเรียกใช้เครื่องมือแบบกำหนดเองและตัวให้คะแนนแบบกำหนดเอง

การสร้างข้อความ

บริษัทได้ทำให้ทรานส์ฟอร์เมอร์ที่ฝึกฝนล่วงหน้าแบบสร้างสรรค์ (GPT) เป็นที่นิยม ^{[ 33 ]}

ซีรี่ส์ *GPT-n*ของ OpenAI
แบบอย่าง	สถาปัตยกรรม	จำนวนพารามิเตอร์	ข้อมูลการฝึกอบรม	วันที่วางจำหน่าย	ค่าใช้จ่ายในการฝึกอบรม	พารามิเตอร์ที่ใช้งานอยู่
จีพีที-1	ตัวถอดรหัส Transformer 12 ระดับ 12 หัว (ไม่มีตัวเข้ารหัส) ตามด้วย linear-softmax	117 ล้าน^{[ 34 ]}	BookCorpus : ^{[ 35 ]}ข้อความขนาด 4.5 GB จากหนังสือที่ยังไม่ได้รับการตีพิมพ์จำนวน 7,000 เล่มในหลากหลายประเภท	11 มิถุนายน 2561 ^{[ 36 ]}	30 วันบน การ์ดกราฟิก P600 จำนวน 8 ใบ หรือ 1 เพตาฟล็อปต่อวัน^{[ 36 ]}	117 ล้าน
จีพีที-2	GPT-1 แต่มีการปรับค่ามาตรฐานใหม่	1.5 พันล้าน^{[ 37 ]}	WebText: ข้อความขนาด 40 GB จากเอกสาร 8 ล้านฉบับ มาจากเว็บเพจ 45 ล้านหน้าที่ได้ รับการโหวตเห็นด้วยบนReddit	14 กุมภาพันธ์ 2019 (เวอร์ชันเริ่มต้น/จำกัด) และ5 พฤศจิกายน 2019 (เวอร์ชันเต็ม) ^{[ 38 ]}	"หลายสิบเพตาฟลอปส์-วัน" ^{[ 39 ]}หรือ 1.5 × 10 ²¹ฟลอปส์^{[ 40 ]}	1.5 พันล้าน
จีพีที-3	GPT-2 แต่มีการปรับเปลี่ยนเพื่อให้รองรับการขยายขนาดที่ใหญ่ขึ้น	175 พันล้าน^{[ 37 ]}	โทเค็นจำนวน 499 พันล้านโทเค็น ประกอบด้วยCommonCrawl (570 GB), WebText, วิกิพีเดียภาษาอังกฤษ และคลังข้อมูลหนังสือสองชุด (Books1 และ Books2)	28 พฤษภาคม 2020 ^{[ 39 ]}	3640 เพตาฟลอปส์-วัน (ตาราง D.1 ^{[ 39 ]} ) หรือ 3.1 × 10 ²³ฟลอปส์^{[ 40 ]}	175 พันล้าน
จีพีที-3.5	ไม่เปิดเผยข้อมูล	175 พันล้าน^{[ 37 ]}	ไม่เปิดเผยข้อมูล	15 มีนาคม 2565	ไม่เปิดเผยข้อมูล
จีพีที-4	นอกจากนี้ยังได้รับการฝึกฝนด้วยทั้งการทำนายข้อความและRLHF ; รับทั้งข้อความและรูปภาพเป็นอินพุต รายละเอียดเพิ่มเติมไม่ได้เปิดเผยต่อสาธารณะ^{[ 41 ]}	ไม่เปิดเผย ประมาณการไว้ที่ 1.76 ล้านล้าน^{[ 42 ]}^{[ 34 ]}	ไม่เปิดเผยข้อมูล	14 มีนาคม 2566	ไม่เปิดเผย ประมาณการที่ 2.1 × 10 ²⁵ FLOPS ^{[ 40 ]}	175 พันล้าน
จีพีที-4โอ	?	?	?	13 พฤษภาคม 2567	?
จีพีที-4.5	?	?	?	27 กุมภาพันธ์ 2568	?
จีพีที-4.1	?	ไม่เปิดเผย ประมาณการไว้ที่ 1.5 ถึง 1.8 ล้านล้าน	?	14 เมษายน 2568	?
จีพีที-5	?	ไม่เปิดเผย ประมาณการไว้ที่ 1.8-2 ล้านล้าน	?	7 สิงหาคม 2568	?

โมเดล GPT ดั้งเดิมของ OpenAI ("GPT-1")

เอกสารต้นฉบับเกี่ยวกับการฝึกอบรมล่วงหน้าแบบสร้างสรรค์ของ แบบจำลองภาษาที่ใช้ TransformerเขียนโดยAlec Radfordและเพื่อนร่วมงานของเขา และเผยแพร่เป็นเอกสารก่อนตีพิมพ์บนเว็บไซต์ OpenAI เมื่อวันที่ 11 มิถุนายน 2018 ^{[ 43 ]}แสดงให้เห็นว่าแบบจำลองภาษาแบบสร้างสรรค์สามารถรับความรู้เกี่ยวกับโลกและประมวลผลการพึ่งพาในระยะยาวได้อย่างไรโดยการฝึกอบรมล่วงหน้าบนคลังข้อมูลที่หลากหลายซึ่งมีข้อความต่อเนื่องยาว

จีพีที-2

ตัวอย่างการใช้งาน GPT-2 ในการเขียนย่อหน้าโดยอิงจากข้อความในบทความวิกิพีเดียของตนเอง ในเดือนกุมภาพันธ์ 2021

Generative Pre-trained Transformer 2 ("GPT-2") เป็นโมเดลภาษา Transformer แบบ ไม่ใช้การกำกับดูแล และเป็นรุ่นต่อจากโมเดล GPT ดั้งเดิมของ OpenAI ("GPT-1") GPT-2 ได้รับการประกาศในเดือนกุมภาพันธ์ 2019 โดยในตอนแรกมีเพียงเวอร์ชันสาธิตที่จำกัดเท่านั้นที่เผยแพร่สู่สาธารณะ เวอร์ชันเต็มของ GPT-2 ไม่ได้ถูกเผยแพร่ทันทีเนื่องจากความกังวลเกี่ยวกับการนำไปใช้ในทางที่ผิด รวมถึงการนำไปใช้เขียนข่าวปลอม [ ⁴⁴^]^{ผู้เชี่ยวชาญ}บางคนแสดงความสงสัยว่า GPT-2 ก่อให้เกิดภัยคุกคามอย่างมีนัยสำคัญ

เพื่อตอบสนองต่อ GPT-2 สถาบัน Allen Institute for Artificial Intelligence ได้พัฒนาเครื่องมือตรวจจับ "ข่าวปลอมทางประสาท" ^{[ 45 ]}นักวิจัยคนอื่นๆ เช่น Jeremy Howard ได้เตือนถึง "เทคโนโลยีที่จะเติมเต็ม Twitter อีเมล และเว็บด้วยข้อความที่ฟังดูสมเหตุสมผลและเหมาะสมกับบริบท ซึ่งจะกลบเสียงพูดอื่นๆ และไม่สามารถกรองได้" ^{[ 46 ]}ในเดือนพฤศจิกายน 2019 OpenAI ได้เผยแพร่โมเดลภาษา GPT-2 เวอร์ชันสมบูรณ์^{[ 47 ]}เว็บไซต์หลายแห่งได้นำเสนอการสาธิตแบบโต้ตอบของ GPT-2 และโมเดล Transformer อื่นๆ ในรูปแบบต่างๆ^{[ 48 ]}^{[ 49 ]}^{[ 50 ]}

ผู้เขียน GPT-2 โต้แย้งว่าแบบจำลองภาษาแบบไม่ใช้การกำกับดูแลเป็นแบบเรียนรู้ทั่วไป โดยแสดงให้เห็นจากผลลัพธ์ที่ GPT-2 บรรลุความแม่นยำและความซับซ้อนที่ อยู่ในระดับแนวหน้า ใน 7 จาก 8 งาน แบบ zero-shot (กล่าวคือ แบบจำลองไม่ได้ถูกฝึกฝนเพิ่มเติมด้วยตัวอย่างอินพุต-เอาต์พุตเฉพาะงานใดๆ)

ชุดข้อมูลที่ใช้ในการฝึกฝนเรียกว่า WebText ประกอบด้วยข้อความประมาณ 40 กิกะไบต์จากURLที่แชร์ใน โพสต์ Redditที่มีอย่างน้อย 3 โหวตขึ้นไป โดย หลีกเลี่ยงปัญหาบางอย่างในการเข้ารหัสคำศัพท์ด้วยโทเค็นคำโดยใช้การเข้ารหัสคู่ไบต์ซึ่งช่วยให้สามารถแสดงสตริงของอักขระใดๆ ได้โดยการเข้ารหัสทั้งอักขระแต่ละตัวและโทเค็นที่มีอักขระหลายตัว^{[ 51 ]}

จีพีที-3

^{Generative Pre - trained Transformer} 3 (GPT-3) ได้รับการอธิบายครั้งแรกในเดือนพฤษภาคม 2020 เป็นโมเดลภาษา Transformer แบบไม่ใช้การกำกับดูแล และเป็นรุ่นต่อจาก^GPT -2 [ ^{52 ] [}^{53 ] [}^{54 ] OpenAI}ระบุว่า GPT-3 เวอร์ชันเต็มมีพารามิเตอร์ 175 พันล้านตัว [ ^{54 ]}ซึ่งมากกว่า 1.5 พันล้านตัว^[⁵¹^] ใน GPT-2 เวอร์ชัน เต็มถึง สองเท่า(แม้ว่าโมเดล GPT-3 ที่มีพารามิเตอร์เพียง 125 ล้านตัวก็ได้รับการฝึกฝนเช่นกัน) ^[⁵⁵^]

OpenAI ระบุว่า GPT-3 ประสบความสำเร็จในงาน " meta-learning " บางอย่าง และสามารถสรุปวัตถุประสงค์ของคู่ข้อมูลเข้า-ออกเพียงคู่เดียวได้ เอกสารเผยแพร่ GPT-3 ยกตัวอย่างการแปลและการเรียนรู้การถ่ายโอน ข้ามภาษา ระหว่างภาษาอังกฤษและภาษาโรมาเนีย และระหว่างภาษาอังกฤษและภาษาเยอรมัน^{[ 54 ]}

GPT-3 ปรับปรุงผลลัพธ์มาตรฐานได้อย่างมากเมื่อเทียบกับ GPT-2 OpenAI เตือนว่าการขยายขนาดของโมเดลภาษาดังกล่าวอาจเข้าใกล้หรือเผชิญกับข้อจำกัดความสามารถพื้นฐานของโมเดลภาษาเชิงทำนาย^{[ 56 ]}การฝึกอบรม GPT-3 ล่วงหน้าต้องใช้การคำนวณหลายพันเพตาฟลอป/วินาที-วัน^{[ b ]}เมื่อเทียบกับหลายสิบเพตาฟลอป/วินาที-วันสำหรับโมเดล GPT-2 เต็มรูปแบบ^{[ 54 ]}เช่นเดียวกับรุ่นก่อนหน้า^{[ 44 ]}โมเดล GPT-3 ที่ได้รับการฝึกฝนแล้วไม่ได้ถูกเผยแพร่สู่สาธารณะในทันทีเนื่องจากความกังวลเกี่ยวกับการนำไปใช้ในทางที่ผิด แม้ว่า OpenAI จะวางแผนที่จะอนุญาตให้เข้าถึงผ่านAPI คลาวด์แบบชำระเงิน หลังจากเบต้าส่วนตัวฟรีสองเดือนซึ่งเริ่มต้นในเดือนมิถุนายน 2020 ^{[ 30 ]}^{[ 58 ]}

เมื่อวันที่ 23 กันยายน พ.ศ. 2563 GPT-3 ได้รับการอนุญาตให้ใช้งานเฉพาะกับ Microsoft เท่านั้น^{[ 59 ]}^{[ 60 ]}

โคเด็กซ์

Codex ซึ่งประกาศในช่วงกลางปี 2021 เป็นรุ่นที่พัฒนาต่อยอดมาจาก GPT-3 โดยได้รับการฝึกฝนเพิ่มเติมด้วยโค้ดจากคลังเก็บข้อมูล GitHub กว่า 54 ล้านรายการ^{[ 61 ]}^{[ 62 ]}และเป็น AI ที่ขับเคลื่อนเครื่องมือ เติมโค้ด อัตโนมัติ GitHub Copilot [ ^{62 ] ใน}เดือนสิงหาคม 2021 มีการเปิดตัว API ในเวอร์ชันเบต้าส่วนตัว^{[ 63 ]}ตามข้อมูลของ OpenAI โมเดลนี้สามารถสร้างโค้ดที่ใช้งานได้ในภาษาโปรแกรมมากกว่าสิบภาษา โดยมีประสิทธิภาพมากที่สุดใน Python ^{[ 61 ]}

มีการกล่าวถึงปัญหาหลายประการเกี่ยวกับความผิดพลาด ข้อบกพร่องในการออกแบบ และช่องโหว่ด้านความปลอดภัย^{[ 64 ]}^{[ 65 ]}

OpenAI ประกาศว่าจะยุติการสนับสนุน API Codex ในวันที่ 23 มีนาคม 2023 ^{[ 66 ]}

จีพีที-4

เมื่อวันที่ 14 มีนาคม 2023 OpenAI ประกาศเปิดตัว Generative Pre-trained Transformer 4 (GPT-4) ซึ่งสามารถรับข้อมูลป้อนเข้าเป็นข้อความหรือรูปภาพได้^{[ 67 ]}พวกเขาประกาศว่าเทคโนโลยีที่ได้รับการอัปเดตนี้ผ่านการทดสอบจำลองการสอบเนติบัณฑิตของโรงเรียนกฎหมายด้วยคะแนนอยู่ในกลุ่ม 10% แรกของผู้เข้าสอบ (ในทางตรงกันข้าม GPT-3.5 ได้คะแนนอยู่ในกลุ่ม 10% ล่างสุด) พวกเขากล่าวว่า GPT-4 ยังสามารถอ่าน วิเคราะห์ หรือสร้างข้อความได้มากถึง 25,000 คำ และเขียนโค้ดในภาษาโปรแกรมหลักทั้งหมดได้^{[ 68 ]}

ผู้สังเกตการณ์รายงานว่า ChatGPT เวอร์ชันที่ใช้ GPT-4 นั้นดีขึ้นกว่าเวอร์ชันก่อนหน้าที่ใช้ GPT-3.5 โดยมีข้อแม้ว่า GPT-4 ยังคงมีปัญหาบางอย่างจากเวอร์ชันก่อนหน้า^{[ 69 ]} GPT-4 ยังสามารถรับภาพเป็นอินพุตใน ChatGPT ได้อีกด้วย^{[ 70 ]} OpenAI ปฏิเสธที่จะเปิดเผยรายละเอียดทางเทคนิคและสถิติต่างๆ เกี่ยวกับ GPT-4 เช่น ขนาดที่แน่นอนของโมเดล^{[ 71 ]}

จีพีที-4โอ

เมื่อวันที่ 13 พฤษภาคม 2024 OpenAI ได้ประกาศและเผยแพร่GPT-4oซึ่งสามารถประมวลผลและสร้างข้อความ รูปภาพ และเสียงได้^{[ 72 ]} GPT-4o บรรลุผลลัพธ์ที่ล้ำสมัยในเกณฑ์มาตรฐานด้านเสียง หลายภาษา และภาพ โดยสร้างสถิติใหม่ในการจดจำและแปลคำพูด^{[ 73 ]}^{[ 74 ]}โดยทำคะแนนได้ 88.7% ในเกณฑ์มาตรฐาน Massive Multitask Language Understanding ( MMLU ) เมื่อเทียบกับ 86.5% ของ GPT-4 ^{[ 75 ]}

เมื่อวันที่ 18 กรกฎาคม 2024 OpenAI ได้เปิดตัว GPT-4o mini ซึ่งเป็นเวอร์ชันที่เล็กกว่าของ GPT-4o โดยจะมาแทนที่ GPT-3.5 Turbo บนอินเทอร์เฟซ ChatGPT API ของมัน มีค่าใช้จ่าย 0.15 ดอลลาร์ต่อโทเค็นขาเข้าหนึ่งล้านโทเค็น และ 0.60 ดอลลาร์ต่อโทเค็นขาออกหนึ่งล้านโทเค็น เมื่อเทียบกับ 5 ดอลลาร์และ 15 ดอลลาร์ตามลำดับสำหรับ GPT-4o OpenAI คาดว่าจะเป็นประโยชน์อย่างยิ่งสำหรับองค์กร สตาร์ทอัพ และนักพัฒนาที่ต้องการทำให้บริการเป็นไปโดยอัตโนมัติด้วยเอเจนต์ AI ^{[ 76 ]}

ในเดือนมีนาคม พ.ศ. 2568 OpenAI ได้ปล่อยฟีเจอร์การสร้างภาพดั้งเดิมของ GPT-4o ออกมา ซึ่งเป็นทางเลือกแทน DALL-E 3 ^{[ 77 ]}

จีพีที-4.5

เมื่อวันที่ 27 กุมภาพันธ์ พ.ศ. 2568 OpenAI ได้ปล่อยGPT-4.5ซึ่งมีชื่อรหัสว่า Orion Sam Altman อ้างว่า GPT-4.5 จะนำเสนอข้อมูลที่ไม่ถูกต้องน้อยกว่ารุ่นก่อนหน้า และอธิบายว่าเป็น "โมเดลขนาดใหญ่และราคาแพง" ^{[ 78 ]}

จีพีที-4.1

เมื่อวันที่ 14 เมษายน พ.ศ. 2568 OpenAI ได้เปิดตัว โมเดล GPT-4.1นอกจากนี้ยังได้เปิดตัวโมเดลที่ "เล็กกว่า เร็วกว่า และถูกกว่า" อีกสองรุ่น ได้แก่ GPT-4.1 mini และ GPT-4.1 nano ^{[ 79 ]}^{[ 80 ]}^{[ 81 ]}

จีพีที-5

GPT-5 เป็นโมเดลเรือธงของOpenAI ที่เปิดตัวเมื่อวันที่ 7 สิงหาคม 2025 โดย เข้ามาแทนที่โมเดลรุ่นก่อนหน้า เช่น GPT-4o , GPT-4.5และo3

GPT-5 ใช้เราเตอร์แบบไดนามิกที่เลือกระหว่างการตอบสนองอย่างรวดเร็วและการ "คิด" ที่ลึกซึ้งยิ่งขึ้นเมื่อจำเป็น สามารถทำงานได้ในระดับปริญญาเอกในโดเมนต่างๆ เช่น คณิตศาสตร์ การเขียนโค้ด สุขภาพ และงานมัลติโมดอล นอกจากนี้ยังได้รับคะแนน 74.9% ใน SWE-bench Verified และ 88% ใน Aider polyglot ^{[ 82 ]}

นักข่าวบรรยายการเปิดตัว GPT-5 ว่าเป็นก้าวสำคัญในการก้าวไปสู่ AGI โดยยกย่องความฉลาด การเข้าถึง และราคาที่เหมาะสม^{[ 83 ]}^{[ 84 ]}แต่ผลตอบรับในช่วงแรกบางส่วนเรียกมันว่า "เป็นการพัฒนาแบบค่อยเป็นค่อยไปมากกว่าการปฏิวัติ" โดยสังเกตเห็นผลลัพธ์ที่หลากหลายในการเขียนเชิงสร้างสรรค์ และชี้ให้เห็นถึงการแข่งขันจากรุ่นต่างๆ เช่นGrok 4 Heavy ^{[ 85 ]}

o1

เมื่อวันที่ 12 กันยายน 2024 OpenAI ได้เปิดตัวโมเดล o1-preview และ o1-mini ซึ่งได้รับการออกแบบมาให้ใช้เวลาคิดเกี่ยวกับการตอบสนองมากขึ้น ส่งผลให้มีความแม่นยำสูงขึ้น โมเดลเหล่านี้มีประสิทธิภาพเป็นพิเศษในงานด้านวิทยาศาสตร์ การเขียนโค้ด และการให้เหตุผล และได้เปิดให้ใช้งานสำหรับสมาชิก ChatGPT Plus และ Team ^{[ 86 ]}^{[ 87 ]}ในเดือนธันวาคม 2024 o1-preview ถูกแทนที่ด้วย o1 ^{[ 88 ]}ในเดือนมีนาคม 2025 โมเดล o1-Pro ได้เปิดให้ใช้งานผ่าน API สำหรับนักพัฒนาของ OpenAI ซึ่งก่อนหน้านี้เปิดให้ใช้งานสำหรับผู้ใช้ ChatGPT Pro ตั้งแต่เดือนธันวาคม 2024 โดยมีราคา 150 ดอลลาร์ต่อโทเค็นอินพุตหนึ่งล้านโทเค็น และ 600 ดอลลาร์ต่อโทเค็นเอาต์พุตหนึ่งล้านโทเค็น^{[ 89 ]}

โอ3

เมื่อวันที่ 20 ธันวาคม 2024 OpenAI ได้เปิดตัว o3 ซึ่งเป็นรุ่นต่อจากโมเดลการให้เหตุผล o1 นอกจากนี้ OpenAI ยังได้เปิดตัว o3-mini ซึ่งเป็นเวอร์ชันที่เบากว่าและเร็วกว่าของ OpenAI o3 ณ วันที่ 21 ธันวาคม 2024 โมเดลนี้ยังไม่เปิดให้ใช้งานสำหรับบุคคลทั่วไป ตามที่ OpenAI ระบุ พวกเขากำลังทดสอบ o3 และ o3-mini อยู่^{[ 90 ]}^{[ 91 ]}จนถึงวันที่ 10 มกราคม 2025 นักวิจัยด้านความปลอดภัยและการรักษาความปลอดภัยมีโอกาสสมัครขอเข้าถึงโมเดลเหล่านี้ก่อนใคร^{[ 92 ]}โมเดลนี้เรียกว่า o3 แทนที่จะเป็น o2 เพื่อหลีกเลี่ยงความสับสนกับผู้ให้บริการโทรคมนาคมO2 ^{[ 90 ]} ในเดือนเมษายน 2025 OpenAI ได้เปิดตัว o3 ให้กับผู้ใช้ที่ชำระเงินทั้งหมด o3 มีความสามารถในการให้เหตุผลและการแก้ปัญหาที่ดีกว่า o1 ^{[ 93 ]}

การวิจัยเชิงลึก

Deep Research เป็นเอเจนต์ AIที่พัฒนาโดย OpenAI เปิดตัวเมื่อวันที่ 2 กุมภาพันธ์ 2025 โดยใช้ประโยชน์จากความสามารถของโมเดล o3 ของ OpenAI เพื่อทำการท่องเว็บ วิเคราะห์ข้อมูล และสังเคราะห์ข้อมูลอย่างละเอียด และสร้างรายงานที่ครอบคลุมภายในเวลา 5 ถึง 30 นาที^{[ 94 ]}เมื่อเปิดใช้งานการท่องเว็บและ เครื่องมือ Pythonแล้ว จะมีความแม่นยำถึง 26.6 เปอร์เซ็นต์ในเกณฑ์มาตรฐานHLE (Humanity's Last Exam) ^{[ 95 ]}ในเดือนเมษายน 2025 OpenAI เริ่มเปิดตัว Deep Research เวอร์ชันน้ำหนักเบาให้กับผู้ใช้ ChatGPT ฟรีทั้งหมด^{[ 96 ]}^{[ 97 ]}

จีพีที-โอเอส

GPT-OSS (เขียนแบบมีสไตล์ว่า gpt-oss) คือชุดของโมเดลการให้เหตุผลแบบน้ำหนักเปิดที่ OpenAI เผยแพร่เมื่อวันที่ 5 สิงหาคม 2025 ^{[ 98 ]}^{[ 99 ]}^{[ 100 ]}มีสองเวอร์ชัน ได้แก่ โมเดลขนาดใหญ่ที่มีพารามิเตอร์ 117 พันล้านตัว เรียกว่าgpt-oss-120bและโมเดลขนาดเล็กที่มีพารามิเตอร์ 21 พันล้านตัว เรียกว่าgpt-oss-20b [ ^{99 ] [}^{101 ] ทั้ง}สองโมเดลเผยแพร่ภายใต้ใบอนุญาต Apache 2.0ซึ่งอนุญาตให้ใช้งานเชิงพาณิชย์และไม่เชิงพาณิชย์ได้ ในแง่ของประสิทธิภาพ พวกมันเทียบได้กับo4-miniและo3-miniตามลำดับ ตามข้อมูลของ OpenAI ^{[ 101 ]}^{[ 99 ]} gpt-oss-20b มีขนาดเล็กพอที่จะทำงานบนอุปกรณ์ที่ มีหน่วยความจำเข้าถึงแบบสุ่มมากกว่า16 กิกะไบต์^[⁹⁹^]

การจำแนกภาพ

คลิป

CLIP (Contrastive Language–Image Pre-training) ซึ่งเปิดตัวในปี 2021 เป็นโมเดลที่ได้รับการฝึกฝนเพื่อวิเคราะห์ความคล้ายคลึงทางความหมายระหว่างข้อความและรูปภาพ โดยเฉพาะอย่างยิ่งสามารถใช้สำหรับการจำแนกประเภทรูปภาพได้^{[ 102 ]}

แปลงข้อความเป็นรูปภาพ

ดัลล์-อี

DALL-E เปิดตัวในปี 2021 เป็นโมเดล Transformer ที่สร้างภาพจากคำอธิบายข้อความ^{[ 103 ]} DALL-E ใช้ GPT-3 เวอร์ชัน 12 พันล้านพารามิเตอร์เพื่อตีความอินพุตภาษาธรรมชาติ (เช่น "กระเป๋าหนังสีเขียวรูปทรงห้าเหลี่ยม" หรือ "มุมมองไอโซเมตริกของคาปิบาร่าเศร้า") และสร้างภาพที่สอดคล้องกัน สามารถสร้างภาพของวัตถุที่สมจริง ("หน้าต่างกระจกสีที่มีภาพสตรอว์เบอร์รีสีฟ้า") เช่นเดียวกับวัตถุที่ไม่มีอยู่จริง ("ลูกบาศก์ที่มีพื้นผิวของเม่น") ณ เดือนมีนาคม 2021 ยังไม่มี API หรือโค้ดให้ใช้งาน

ดัลล์-อี 2

ในเดือนเมษายน พ.ศ. 2565 OpenAI ได้ประกาศ DALL-E 2 ซึ่งเป็นเวอร์ชันอัปเดตของโมเดลที่มีผลลัพธ์ที่สมจริงยิ่งขึ้น^{[ 104 ]}ในเดือนธันวาคม พ.ศ. 2565 OpenAI ได้เผยแพร่ซอฟต์แวร์ Point-E บน GitHub ซึ่งเป็นระบบพื้นฐานใหม่สำหรับการแปลงคำอธิบายข้อความให้เป็นโมเดล 3 มิติ^{[ 105 ]}

ดัลล์-อี 3

ในเดือนกันยายน พ.ศ. 2566 OpenAI ได้ประกาศ DALL-E 3 ซึ่งเป็นโมเดลที่มีประสิทธิภาพมากขึ้นและสามารถสร้างภาพจากคำอธิบายที่ซับซ้อนได้ดีกว่า โดยไม่ต้องมีการออกแบบข้อความแจ้งเตือนด้วยตนเอง และแสดงรายละเอียดที่ซับซ้อน เช่น มือและข้อความ^{[ 106 ]}โดยได้เปิดให้ใช้งานแก่สาธารณะในฐานะฟีเจอร์ ChatGPT Plus ในเดือนตุลาคม^{[ 107 ]}

แปลงข้อความเป็นวิดีโอ

โซระ

Sora เป็น โมเดล ข้อความสู่วิดีโอที่สามารถสร้างวิดีโอตามข้อความอธิบายสั้นๆ^{[ 108 ]}รวมถึงขยายวิดีโอที่มีอยู่ไปข้างหน้าหรือถอยหลังในเวลา^{[ 109 ]}สามารถสร้างวิดีโอที่มีความละเอียดสูงสุด 1920x1080 หรือ 1080x1920 ความยาวสูงสุดของวิดีโอที่สร้างขึ้นยังไม่ทราบแน่ชัด

ทีมพัฒนาของ Sora ตั้งชื่อตาม คำภาษา ญี่ปุ่นที่แปลว่า "ท้องฟ้า" เพื่อสื่อถึง "ศักยภาพในการสร้างสรรค์ที่ไร้ขีดจำกัด" ^{[ 108 ]}เทคโนโลยีของ Sora เป็นการดัดแปลงเทคโนโลยีที่อยู่เบื้องหลังโมเดลแปลงข้อความเป็นภาพ DALL·E 3 ^[ 109 ^]^{OpenAI ฝึกฝนระบบโดยใช้วิดีโอที่เผยแพร่สู่สาธารณะ รวมถึงวิดีโอที่มีลิขสิทธิ์ซึ่งได้รับอนุญาต ให้}ใช้เพื่อวัตถุประสงค์ดังกล่าว แต่ไม่ได้เปิดเผยจำนวนหรือแหล่งที่มาที่แน่นอนของวิดีโอ^[¹⁰⁸^]

เมื่อวันที่ 15 กุมภาพันธ์ 2024 OpenAI ได้สาธิตวิดีโอความละเอียดสูง ที่สร้างโดย Sora ให้กับสาธารณชน โดยระบุว่าสามารถสร้างวิดีโอได้ยาวถึงหนึ่งนาที นอกจากนี้ยังได้เผยแพร่รายงานทางเทคนิคที่เน้นวิธีการที่ใช้ในการฝึกฝนโมเดลและความสามารถของโมเดล^{[ 109 ]}และยอมรับข้อบกพร่องบางประการ รวมถึงปัญหาในการจำลองฟิสิกส์ที่ซับซ้อน^{[ 110 ]} Will Douglas Heaven จากMIT Technology Reviewเรียกวิดีโอสาธิตว่า "น่าประทับใจ" แต่ตั้งข้อสังเกตว่าวิดีโอเหล่านั้นอาจถูกคัดเลือกมาและอาจไม่ได้แสดงถึงผลลัพธ์ทั่วไปของ Sora ^{[ 109 ]}

แม้จะมีข้อสงสัยจากผู้นำทางวิชาการบางส่วนหลังจากการสาธิต Sora ต่อสาธารณะ แต่บุคคลสำคัญในอุตสาหกรรมบันเทิงหลายคนแสดงความสนใจอย่างมากในศักยภาพของเทคโนโลยีนี้ ในการสัมภาษณ์ นักแสดง/ผู้กำกับภาพยนตร์ไทเลอร์ เพอร์รีแสดงความประหลาดใจกับความสามารถของเทคโนโลยีในการสร้างวิดีโอที่สมจริงจากคำอธิบายข้อความ โดยอ้างถึงศักยภาพในการปฏิวัติการเล่าเรื่องและการสร้างเนื้อหา เขากล่าวว่าความตื่นเต้นของเขาเกี่ยวกับความเป็นไปได้ของ Sora นั้นมากจนเขาตัดสินใจระงับแผนการขยายสตูดิโอภาพยนตร์ของเขาในแอตแลนตา^{[ 111 ]}

Sora 2 เปิดตัวเมื่อวันที่ 30 กันยายน พ.ศ. 2568 พร้อมกับ แอป iOSในเวลาเดียวกัน^{[ 112 ]}

แปลงเสียงเป็นข้อความ

กระซิบ

Whisper ซึ่งเปิดตัวในปี 2022 เป็นโมเดลการรู้จำเสียงพูดอเนกประสงค์^{[ 113 ]}ได้รับการฝึกฝนบนชุดข้อมูลเสียงที่หลากหลายขนาดใหญ่ และยังเป็นโมเดลแบบมัลติทาสก์ที่สามารถทำการรู้จำเสียงพูดหลายภาษา รวมถึงการแปลเสียงพูดและการระบุภาษาได้^{[ 114 ]}

คนรุ่นดนตรี

มิวส์เน็ต

MuseNet ซึ่งเปิดตัวในปี 2019 เป็นโครงข่ายประสาทเทียมเชิงลึกที่ได้รับการฝึกฝนให้ทำนายโน้ตดนตรีถัดไปใน ไฟล์เพลง MIDIสามารถสร้างเพลงที่มีเครื่องดนตรี 10 ชิ้นใน 15 สไตล์ ตามรายงานของThe Vergeเพลงที่สร้างโดย MuseNet มักจะเริ่มต้นได้ค่อนข้างดี แต่หลังจากนั้นก็จะกลายเป็นความวุ่นวายเมื่อเล่นไปนานขึ้น^{[ 115 ]}^{[ 116 ]}ในวัฒนธรรมป๊อป การประยุกต์ใช้เครื่องมือนี้ครั้งแรกถูกนำมาใช้ตั้งแต่ปี 2020 สำหรับภาพยนตร์ระทึกขวัญทางจิตวิทยาออนไลน์เรื่องBen Drownedเพื่อสร้างเพลงประกอบตัวละครเอก^{[ 117 ]}^{[ 118 ]}

ตู้เพลง

Jukebox ซึ่งเปิดตัวในปี 2020 เป็นอัลกอริทึมโอเพนซอร์สสำหรับสร้างเพลงที่มีเสียงร้อง หลังจากฝึกฝนด้วยตัวอย่าง 1.2 ล้านตัวอย่าง ระบบจะรับประเภทเพลง ศิลปิน และเนื้อเพลงบางส่วน แล้วส่งออกตัวอย่างเพลง OpenAI ระบุว่าเพลงเหล่านั้น "แสดงให้เห็นถึงความสอดคล้องทางดนตรีในระดับท้องถิ่น [และ] เป็นไปตามรูปแบบคอร์ดแบบดั้งเดิม" แต่ยอมรับว่าเพลงเหล่านั้นขาด "โครงสร้างทางดนตรีขนาดใหญ่ที่คุ้นเคย เช่น ท่อนฮุคที่ซ้ำกัน" และ "มีช่องว่างที่สำคัญ" ระหว่าง Jukebox กับเพลงที่สร้างโดยมนุษย์The Vergeกล่าวว่า "มันน่าประทับใจทางเทคโนโลยี แม้ว่าผลลัพธ์จะฟังดูเหมือนเพลงเวอร์ชันที่ฟังดูคุ้นเคยแต่ไม่ชัดเจน" ในขณะที่Business Insiderกล่าวว่า "น่าประหลาดใจที่เพลงบางเพลงที่ได้นั้นติดหูและฟังดูสมจริง" ^{[ 119 ]}^{[ 120 ]}^{[ 121 ]}

ส่วนติดต่อผู้ใช้

เกมโต้วาที

ในปี 2018 OpenAI ได้เปิดตัวเกมโต้วาที (Debate Game) ซึ่งสอนให้เครื่องจักรโต้วาทีปัญหา จำลอง ต่อหน้าผู้ตัดสินที่เป็นมนุษย์ จุดประสงค์คือเพื่อวิจัยว่าแนวทางดังกล่าวสามารถช่วยในการตรวจสอบการตัดสินใจของ AI และในการพัฒนาAI ที่อธิบายได้ หรือ ไม่^{[ 122 ]}^{[ 123 ]}

กล้องจุลทรรศน์

^{Microscope [ 124 ]}ซึ่งเปิดตัวในปี 2020 เป็นชุดการแสดงภาพของทุกชั้นและเซลล์ประสาทที่สำคัญของแบบจำลองเครือข่ายประสาทแปดแบบ ซึ่งมักได้รับการศึกษาในด้านความสามารถในการตีความ^{[ 125 ]} Microscope ถูกสร้างขึ้นเพื่อวิเคราะห์คุณลักษณะที่เกิดขึ้นภายในเครือข่ายประสาทเหล่านี้ได้อย่างง่ายดาย แบบจำลองที่รวมอยู่ ได้แก่^AlexNet , VGG -19 , Inceptionเวอร์ชันต่างๆและCLIP Resnet เวอร์ชันต่างๆ [ ^{126 ]}

แชทจีพีที

ChatGPT เปิดตัวในเดือนพฤศจิกายน 2022 เป็นแชทบอท AI เชิงสร้างสรรค์ ที่ใช้โมเดล GPT ของ OpenAI ในการสร้างเนื้อหา ผู้ใช้สามารถโต้ตอบกับแชทบอทได้ผ่านการสนทนาด้วยข้อความหรือเสียง นอกจากนี้ยังสามารถสร้างภาพโดยใช้GPT-4oซึ่งมาแทนที่DALL-E 3 [ ⁷⁷^]^ChatGPTมีผู้ใช้งานถึง 100 ล้านคนในช่วงสองเดือนหลังจากการเปิดตัว^[¹²⁷^]

OpenAI เปิดตัวแผนการสมัครสมาชิกหลายแบบ ได้แก่ Plus, Pro, Team และ Enterprise ผู้ใช้ในระดับฟรีของ ChatGPT สามารถเข้าถึงGPT-4o ได้ แต่มีข้อจำกัดที่ลดลง การสมัครสมาชิก ChatGPT ระดับ "Plus", "Pro", "Team" และ "Enterprise" จะให้ขีดจำกัดการใช้งานที่เพิ่มขึ้นและการเข้าถึงคุณสมบัติหรือโมเดลเพิ่มเติม^{[ 128 ]}

ในเดือนพฤษภาคม 2023 OpenAI ได้เปิดตัวอินเทอร์เฟซผู้ใช้สำหรับ ChatGPT สำหรับApp Storeบน iOS และในเดือนกรกฎาคม 2023 สำหรับPlay Storeบน Android ^{[ 129 ]}ในเดือนธันวาคม 2024 OpenAI ได้เปิดตัวฟีเจอร์ใหม่ที่อนุญาตให้ผู้ใช้โทรหา ChatGPT ได้ฟรีสูงสุด 15 นาทีต่อเดือน^{[ 130 ]}^{[ 131 ]}

ค้นหาGPT

SearchGPT ซึ่งเป็น เครื่องมือค้นหาต้นแบบที่พัฒนาโดย OpenAI ได้เปิดตัวเมื่อวันที่ 25 กรกฎาคม 2024 โดยเริ่มแรกเปิดให้ผู้ใช้ทดสอบจำนวนจำกัดเพียง 10,000 รายเท่านั้น โดยผสานรวมคุณสมบัติของเครื่องมือค้นหาแบบดั้งเดิมเข้ากับความสามารถของ AI เชิงสร้างสรรค์^{[ 132 ]}^{[ 133 ]}

แชทจีพีที แอตลาส

ในเดือนตุลาคม พ.ศ. 2568 OpenAI ได้เปิดตัวเว็บเบราว์เซอร์ชื่อ ChatGPT Atlas ^{[ 134 ]}^{[ 135 ]}

ปริซึม

เมื่อวันที่ 27 มกราคม พ.ศ. 2569 OpenAI ได้เปิดตัว Prism ซึ่งเป็น พื้นที่ทำงานแบบเนทีฟ ของ LaTeXที่ออกแบบมาเพื่อช่วยเหลือนักวิทยาศาสตร์ในการวิจัยและการเขียน เช่น การร่างเอกสารทางวิทยาศาสตร์ การจัดการการอ้างอิง และการจัดรูปแบบสมการ^{[ 136 ]}^{[ 137 ]}

สตาร์เกตและซูเปอร์คอมพิวเตอร์อื่นๆ

โครงการ Stargate เปิดตัวในปี 2024 โดยเริ่มต้นจากการเป็นโครงการมูลค่า 100 พันล้านดอลลาร์ระหว่าง OpenAI และMicrosoftเพื่อสร้างศูนย์ข้อมูล^{[ 138 ]}ชื่อ "Stargate" เป็นการยกย่องภาพยนตร์ไซไฟเรื่อง Stargate ในปี 1994 [ 139 ^{]ในที่สุด}ก็กลายเป็นบริษัทStargate LLCซึ่งก่อตั้งขึ้นในเดือนมกราคม 2025 โดยเป็นการร่วมมือกันระหว่าง OpenAI ^, Oracle , SoftBankและMGX [ ¹⁴⁰^]^[^{138 ]}

การพัฒนาฮาร์ดแวร์

เมื่อวันที่ 21 พฤษภาคม 2025 OpenAI ประกาศการเข้าซื้อกิจการ io ซึ่งเป็นบริษัทสตาร์ทอัพด้านฮาร์ดแวร์ AI ที่ก่อตั้งโดยJony Iveอดีต นักออกแบบของ Apple ^{[ 141 ]}ข้อตกลงนี้มีมูลค่าประมาณ 6.5 พันล้านดอลลาร์สหรัฐ ซึ่งถือเป็นการเข้าสู่ตลาดฮาร์ดแวร์สำหรับผู้บริโภคอย่างมีกลยุทธ์ของ OpenAI ^{[ 142 ]} Ive ซึ่งเป็นที่รู้จักจากการออกแบบiPhone , iPadและiMacจะเป็นผู้นำด้านฮาร์ดแวร์และการออกแบบสำหรับ OpenAI ^{[ 143 ]}

Sam Altman ซีอีโอของ OpenAI และ Ive ได้แสดงวิสัยทัศน์ร่วมกันในการพัฒนาอุปกรณ์ AI ดั้งเดิมที่ก้าวข้ามหน้าจอและอินเทอร์เฟซแบบเดิม แม้ว่าจะยังไม่มีการเปิดเผยรายละเอียดผลิตภัณฑ์ที่เฉพาะเจาะจง แต่ Washington Post รายงานว่า Ive และ Altman ได้เริ่มทำงานกับผลิตภัณฑ์ใหม่แล้ว “ผลิตภัณฑ์แรกที่ผมกำลังพัฒนาอยู่นั้นดึงดูดจินตนาการของผมได้อย่างสมบูรณ์” Jony Ive กล่าว Altman เสริมว่า “ผมคิดว่ามันเป็นเทคโนโลยีที่เจ๋งที่สุดเท่าที่โลกเคยเห็นมา” ^{[ 144 ]}^{[ 141 ]}

บริษัทยังเริ่มทำงานในด้านหุ่นยนต์โดยมีเป้าหมายในการสร้างหุ่นยนต์อเนกประสงค์^{[ 145 ]}

บรรณานุกรมที่คัดเลือก

ส่วนนี้แสดงรายการเอกสารเผยแพร่อย่างเป็นทางการหลัก ๆ จาก OpenAI เกี่ยวกับโมเดล GPT ของ OpenAI

GPT-1: รายงาน, การเผยแพร่บน GitHub ^{[ 146 ]}
GPT-2: ประกาศในบล็อก^{[ 147 ]}รายงานเกี่ยวกับการตัดสินใจ "การเผยแพร่แบบแบ่งขั้นตอน" ^{[ 148 ]}การเผยแพร่บน GitHub ^{[ 149 ]}
GPT-3: รายงาน^{[ 39 ]}จะไม่มีการเผยแพร่โค้ดผ่าน GitHub หรือรูปแบบอื่นใดอีกต่อไป
WebGPT: ประกาศในบล็อก^{[ 150 ]}รายงาน^{[ 151 ]}
InstructGPT: ประกาศในบล็อก^{[ 152 ]}รายงาน^{[ 153 ]}
ChatGPT: ประกาศในบล็อก^{[ 154 ]} (ไม่มีรายงาน)
GPT-4: ประกาศในบล็อก^{[ 155 ]}รายงาน^{[ 156 ]}^{[ 157 ]}การ์ดแบบจำลอง^{[ 158 ]}
GPT-4o: ประกาศบล็อก^{[ 75 ]}
GPT-4.5: ประกาศในบล็อก^{[ 159 ]}
GPT-4.1: ประกาศในบล็อก^{[ 80 ]}
GPT-OSS: ประกาศในบล็อก^{[ 98 ]}การ์ดโมเดล^{[ 101 ]}
GPT-5: ประกาศในบล็อก^{[ 160 ]}

ดูเพิ่มเติม

รายชื่อโมเดลภาษาขนาดใหญ่

หมายเหตุ

^คำว่า "การเตรียมความพร้อมก่อนการฝึกอบรม" หมายถึงการฝึกอบรมภาษาทั่วไป ซึ่งแตกต่างจากการปรับแต่งอย่างละเอียดสำหรับงานเฉพาะด้าน
^หนึ่งเพตาฟลอป/วินาที-วัน เทียบเท่ากับการดำเนินการเครือข่ายประสาท^{ประมาณ 10 20 ครั้ง}^{[ 57 ]}

[52] คำว่า "การเตรียมความพร้อมก่อนการฝึกอบรม" หมายถึงการฝึกอบรมภาษาทั่วไป ซึ่งแตกต่างจากการปรับแต่งอย่างละเอียดสำหรับงานเฉพาะด้าน

[59] หนึ่งเพตาฟลอป/วินาที-วัน เทียบเท่ากับการดำเนินการเครือข่ายประสาท^{ประมาณ 10 20 ครั้ง}^{[ 57 ]}

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 35 ]

[ 36 ]

[ 38 ]

[ 39 ]

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

44

[ 45 ]

[ 46 ]

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

Generative Pre - trained Transformer

GPT

52 ] [

53 ] [

[

[ 56 ]

[ b ]

[ 58 ]

[ 59 ]

[ 60 ]

[ 61 ]

[ 62 ]

[ 63 ]

[ 64 ]

[ 65 ]

[ 66 ]

[ 67 ]

[ 68 ]

[ 69 ]

[ 70 ]

[ 71 ]

[ 72 ]

[ 73 ]

[ 74 ]

[ 75 ]

[ 76 ]

[ 77 ]

[ 78 ]

[ 79 ]

[ 80 ]

[ 81 ]

[ 82 ]

[ 83 ]

[ 84 ]

[ 85 ]

[ 86 ]

[ 87 ]

[ 88 ]

[ 89 ]

[ 90 ]

[ 91 ]

[ 92 ]

[ 93 ]

[ 94 ]

[ 95 ]

[ 96 ]

[ 97 ]

[ 99 ]

[ 100 ]

[ 102 ]

[ 103 ]