กลับไปหน้าบทความ

อ่าน 27 นาที

ผลิตภัณฑ์และแอปพลิเคชันของ OpenAI

องค์กร ปัญญาประดิษฐ์ (AI) สัญชาติอเมริกัน OpenAI ได้เปิดตัวผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนับตั้งแต่ก่อตั้งขึ้นในปี 2015

ผลิตภัณฑ์และแอปพลิเคชันของ OpenAI

องค์กร ปัญญาประดิษฐ์ (AI) สัญชาติอเมริกันOpenAIได้เปิดตัวผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนับตั้งแต่ก่อตั้งขึ้นในปี 2015

การเรียนรู้แบบเสริมแรง

ในช่วงเริ่มต้น การวิจัยของ OpenAI ครอบคลุมโครงการจำนวนมากที่มุ่งเน้นการเรียนรู้แบบเสริมแรง (RL) [ 1 ] OpenAI ถูกมองว่าเป็นคู่แข่งที่สำคัญของDeepMind [ 2 ]

โรงยิม

Gym ซึ่งประกาศในปี 2016 เป็นไลบรารี Pythonแบบโอเพนซอร์สที่ออกแบบมาเพื่ออำนวยความสะดวกในการพัฒนาอัลกอริธึมการเรียนรู้แบบเสริมแรง โดยมีเป้าหมายเพื่อสร้างมาตรฐานวิธีการกำหนดสภาพแวดล้อมในการวิจัย AI ทำให้การวิจัยที่เผยแพร่สามารถทำซ้ำได้ง่ายขึ้น[ 3 ] [ 4 ]ในขณะเดียวกันก็มอบอินเทอร์เฟซที่เรียบง่ายให้ผู้ใช้ในการโต้ตอบกับสภาพแวดล้อมเหล่านี้ ในปี 2022 การพัฒนาใหม่ของ Gym ได้ถูกย้ายไปยังไลบรารี Gymnasium [ 5 ] [ 6 ]

ยิมเรโทร

Gym Retro ซึ่งเปิดตัวในปี 2018 เป็นแพลตฟอร์มสำหรับการวิจัยการเรียนรู้แบบเสริมแรง (RL) ในวิดีโอเกม[ 7 ]โดยใช้อัลกอริธึม RL และศึกษาการวางนัยทั่วไป การวิจัย RL ก่อนหน้านี้มุ่งเน้นไปที่การเพิ่มประสิทธิภาพเอเจนต์เพื่อแก้ปัญหางานเดียวเป็นหลัก Gym Retro ให้ความสามารถในการวางนัยทั่วไประหว่างเกมที่มีแนวคิดคล้ายกันแต่มีลักษณะที่แตกต่างกัน

โรโบซูโม

RoboSumo ซึ่งเปิดตัวในปี 2017 เป็นโลกเสมือนจริงที่หุ่นยนต์ตัวแทนแบบ มนุษย์เรียนรู้ด้วยโลหะในตอนแรกขาดความรู้แม้กระทั่งวิธีการเดิน แต่ได้รับเป้าหมายในการเรียนรู้การเคลื่อนไหวและผลักตัวแทนฝ่ายตรงข้ามออกจากวงแหวน [ 8 ]ผ่านกระบวนการเรียนรู้แบบแข่งขันนี้ ตัวแทนจะเรียนรู้วิธีปรับตัวให้เข้ากับสภาวะที่เปลี่ยนแปลง เมื่อตัวแทนถูกนำออกจากสภาพแวดล้อมเสมือนจริงนี้และวางไว้ในสภาพแวดล้อมเสมือนจริงใหม่ที่มีลมแรง ตัวแทนจะทรงตัวเพื่อยืนตรง ซึ่งแสดงให้เห็นว่ามันได้เรียนรู้วิธีการทรงตัวในแบบทั่วไป[ 8 ] [ 9 ] Igor Mordatch จาก OpenAI โต้แย้งว่าการแข่งขันระหว่างตัวแทนอาจสร้าง "การแข่งขันด้านอาวุธ" ทางปัญญาที่สามารถเพิ่มความสามารถของตัวแทนในการทำงานได้แม้กระทั่งนอกบริบทของการแข่งขัน[ 8 ]

โอเพ่นไอไฟว์

OpenAI Five คือทีมบอท ที่ OpenAI คัดสรรมา 5 ตัว ซึ่งใช้ในการแข่งขันวิดีโอเกม Dota 2แบบ 5 ต่อ 5 โดย บอทเหล่านี้เรียนรู้ที่จะเล่นกับผู้เล่นที่เป็นมนุษย์ที่มีทักษะสูงผ่านอัลกอริธึมแบบลองผิดลองถูก ก่อนที่จะกลายเป็นทีม 5 ตัว การสาธิตต่อสาธารณะครั้งแรกเกิดขึ้นที่The International 2017ซึ่งเป็นการแข่งขันชิงแชมป์ประจำปีของเกม โดยDendiผู้เล่นมืออาชีพชาวยูเครน แพ้บอทในการแข่งขันแบบตัวต่อตัว[ 10 ] [ 11 ]หลังจากการแข่งขัน Greg Brockman ซีทีโอ อธิบายว่าบอทเรียนรู้โดยการเล่นกับตัวเองเป็นเวลา 2 สัปดาห์ในเวลาจริงและซอฟต์แวร์การเรียนรู้นี้เป็นก้าวหนึ่งในการสร้างซอฟต์แวร์ที่สามารถจัดการงานที่ซับซ้อนได้เหมือนศัลยแพทย์[ 12 ] [ 13 ]ระบบนี้ใช้รูปแบบการเรียนรู้แบบเสริมแรงโดยบอทจะเรียนรู้ไปเรื่อยๆ โดยการเล่นกับตัวเองหลายร้อยครั้งต่อวันเป็นเวลาหลายเดือน และจะได้รับรางวัลสำหรับการกระทำต่างๆ เช่น การฆ่าศัตรูและการยึดเป้าหมายในแผนที่[ 14 ] [ 15 ] [ 16 ]

ภายในเดือนมิถุนายน 2018 ความสามารถของบอทได้ขยายออกไปจนสามารถเล่นร่วมกันเป็นทีมเต็มรูปแบบ 5 ตัว และสามารถเอาชนะทีมผู้เล่นสมัครเล่นและกึ่งมืออาชีพได้[ 17 ] [ 14 ] [ 18 ] [ 19 ]ในงานThe International 2018 OpenAI Five ได้ลงเล่นในแมตช์โชว์ 2 นัดกับผู้เล่นมืออาชีพ แต่สุดท้ายก็แพ้ทั้งสองเกม[ 20 ] [ 21 ] [ 22 ]ในเดือนเมษายน 2019 OpenAI Five เอาชนะOGแชมป์โลกในขณะนั้น ด้วยคะแนน 2:0 ในแมตช์โชว์สดที่ซานฟรานซิสโก[ 23 ] [ 24 ]การปรากฏตัวต่อสาธารณะครั้งสุดท้ายของบอทเกิดขึ้นในปลายเดือนนั้น โดยพวกเขาลงเล่นทั้งหมด 42,729 เกมในการแข่งขันออนไลน์แบบเปิดเป็นเวลา 4 วัน และชนะ 99.4% ของเกมเหล่านั้น[ 25 ]

กลไกของ OpenAI Five ในบอทผู้เล่นของ Dota 2 แสดงให้เห็นถึงความท้าทายของระบบ AI ในเกม MOBA (Multiplayer Online Battle Arena) และวิธีที่ OpenAI Five ได้แสดงให้เห็นถึงการใช้ตัวแทนการเรียนรู้แบบเสริมแรงเชิงลึก (DRL) เพื่อให้บรรลุความสามารถเหนือมนุษย์ในการแข่งขัน Dota 2 [ 26 ]

แด็กทิล

Dactyl ซึ่งพัฒนาขึ้นในปี 2018 ใช้การเรียนรู้ของเครื่องเพื่อฝึกShadow Handซึ่งเป็นหุ่นยนต์มือคล้ายมนุษย์ให้สามารถจัดการกับวัตถุทางกายภาพได้[ 27 ]มันเรียนรู้ทั้งหมดในการจำลองโดยใช้อัลกอริธึม RL และรหัสการฝึกอบรมเดียวกันกับOpenAI Five OpenAI แก้ปัญหาการวางแนวของวัตถุโดยใช้การสุ่มโดเมนซึ่งเป็นวิธีการจำลองที่เปิดเผยผู้เรียนให้ได้รับประสบการณ์ที่หลากหลายแทนที่จะพยายามปรับให้เข้ากับความเป็นจริง การตั้งค่าสำหรับ Dactyl นอกเหนือจากการมีกล้องติดตามการเคลื่อนไหวแล้ว ยังมี กล้อง RGBเพื่อให้หุ่นยนต์สามารถจัดการกับวัตถุใดๆ ก็ได้โดยการมองเห็น ในปี 2018 OpenAI แสดงให้เห็นว่าระบบสามารถจัดการกับลูกบาศก์และปริซึมแปดเหลี่ยมได้[ 28 ]

ในปี 2019 OpenAI ได้แสดงให้เห็นว่า Dactyl สามารถแก้ลูกบาศก์รูบิกได้ หุ่นยนต์สามารถแก้ปริศนาได้ 60% ของเวลา วัตถุอย่างลูกบาศก์รูบิกมีฟิสิกส์ที่ซับซ้อนซึ่งยากต่อการสร้างแบบจำลอง OpenAI ทำเช่นนี้โดยการปรับปรุงความทนทานของ Dactyl ต่อการรบกวนโดยใช้ Automatic Domain Randomization (ADR) ซึ่งเป็นวิธีการจำลองในการสร้างสภาพแวดล้อมที่ยากขึ้นเรื่อยๆ ADR แตกต่างจากการสุ่มโดเมนด้วยตนเองตรงที่ไม่จำเป็นต้องมีมนุษย์ระบุช่วงการสุ่ม[ 29 ]

API

ในเดือนมิถุนายน พ.ศ. 2563 OpenAI ได้ประกาศ APIอเนกประสงค์ซึ่งระบุว่า "ใช้สำหรับเข้าถึงโมเดล AI ใหม่ที่พัฒนาโดย OpenAI" เพื่อให้นักพัฒนาสามารถเรียกใช้สำหรับ "งาน AI ภาษาอังกฤษใดๆ" [ 30 ] [ 31 ]

ชุดตัวแทน

เมื่อวันที่ 6 ตุลาคม 2025 แซม อัลท์แมน ได้ประกาศเปิดตัว AgentKit ใหม่ของ OpenAI ในงานกล่าวเปิดงาน Dev Day 2025 AgentKit เป็นชุดเครื่องมือแบบบูรณาการใหม่สำหรับการสร้าง การใช้งาน และการเพิ่มประสิทธิภาพของเอเจนต์ AI

ตามข้อมูลของ OpenAI AgentKit สร้างขึ้นบนพื้นฐานของ Responses API ที่เปิดตัวในเดือนมีนาคม โดยนำเสนอแนวทางที่คล่องตัวยิ่งขึ้นสำหรับการสร้างเอเจนต์ ผู้ใช้งานกลุ่มแรกหลายรายรายงานว่าสามารถประหยัดเวลาและเพิ่มประสิทธิภาพได้อย่างมากเมื่อใช้เครื่องมือเอเจนต์ใหม่[ 32 ]

ความสามารถ คำอธิบาย
ผู้สร้างเอเจนต์ พื้นที่ทำงานแบบกราฟิกสำหรับการสร้างและจัดการเวอร์ชันของเวิร์กโฟลว์แบบหลายเอเจนต์
แชทคิท ชุดเครื่องมือสำหรับฝังประสบการณ์การใช้งานเอเจนต์แบบแชทที่ปรับแต่งได้ในผลิตภัณฑ์ของคุณ
การลงทะเบียนตัวเชื่อมต่อ แผงควบคุมส่วนกลางสำหรับจัดการแหล่งข้อมูลต่างๆ ในผลิตภัณฑ์ของ OpenAI
การประเมินที่ได้รับการปรับปรุง ความสามารถใหม่ของ Evals รวมถึงชุดข้อมูล การให้คะแนนการติดตาม การเพิ่มประสิทธิภาพการแจ้งเตือนอัตโนมัติ และการรองรับโมเดลจากบุคคลที่สาม
ราวกั้น การกำหนดค่าราวกันตกแบบกำหนดเอง
การปรับแต่งการเสริมแรงอย่างละเอียด ความสามารถในการปรับแต่งโมเดลการให้เหตุผลของ OpenAI รวมถึงการเรียกใช้เครื่องมือแบบกำหนดเองและตัวให้คะแนนแบบกำหนดเอง

การสร้างข้อความ

บริษัทได้ทำให้ทรานส์ฟอร์เมอร์ที่ฝึกฝนล่วงหน้าแบบสร้างสรรค์ (GPT) เป็นที่นิยม [ 33 ]

ซีรี่ส์ GPT-nของ OpenAI
แบบอย่าง สถาปัตยกรรม จำนวนพารามิเตอร์ ข้อมูลการฝึกอบรม วันที่วางจำหน่าย ค่าใช้จ่ายในการฝึกอบรม พารามิเตอร์ที่ใช้งานอยู่
จีพีที-1ตัวถอดรหัส Transformer 12 ระดับ 12 หัว (ไม่มีตัวเข้ารหัส) ตามด้วย linear-softmax 117 ล้าน[ 34 ]BookCorpus : [ 35 ]ข้อความขนาด 4.5 GB จากหนังสือที่ยังไม่ได้รับการตีพิมพ์จำนวน 7,000 เล่มในหลากหลายประเภท 11 มิถุนายน 2561 [ 36 ]30 วันบน การ์ดกราฟิก P600 จำนวน 8 ใบ หรือ 1 เพตาฟล็อปต่อวัน[ 36 ]117 ล้าน
จีพีที-2GPT-1 แต่มีการปรับค่ามาตรฐานใหม่ 1.5 พันล้าน[ 37 ]WebText: ข้อความขนาด 40 GB จากเอกสาร 8 ล้านฉบับ มาจากเว็บเพจ 45 ล้านหน้าที่ได้ รับการโหวตเห็นด้วยบนReddit14 กุมภาพันธ์ 2019 (เวอร์ชันเริ่มต้น/จำกัด) และ5 พฤศจิกายน 2019 (เวอร์ชันเต็ม) [ 38 ]"หลายสิบเพตาฟลอปส์-วัน" [ 39 ]หรือ 1.5 × 10 21ฟลอปส์[ 40 ]1.5 พันล้าน
จีพีที-3GPT-2 แต่มีการปรับเปลี่ยนเพื่อให้รองรับการขยายขนาดที่ใหญ่ขึ้น 175 พันล้าน[ 37 ]โทเค็นจำนวน 499 พันล้านโทเค็น ประกอบด้วยCommonCrawl (570 GB), WebText, วิกิพีเดียภาษาอังกฤษ และคลังข้อมูลหนังสือสองชุด (Books1 และ Books2) 28 พฤษภาคม 2020 [ 39 ]3640 เพตาฟลอปส์-วัน (ตาราง D.1 [ 39 ] ) หรือ 3.1 × 10 23ฟลอปส์[ 40 ]175 พันล้าน
จีพีที-3.5ไม่เปิดเผยข้อมูล 175 พันล้าน[ 37 ]ไม่เปิดเผยข้อมูล 15 มีนาคม 2565 ไม่เปิดเผยข้อมูล
จีพีที-4นอกจากนี้ยังได้รับการฝึกฝนด้วยทั้งการทำนายข้อความและRLHF ; รับทั้งข้อความและรูปภาพเป็นอินพุต รายละเอียดเพิ่มเติมไม่ได้เปิดเผยต่อสาธารณะ[ 41 ]ไม่เปิดเผย ประมาณการไว้ที่ 1.76 ล้านล้าน[ 42 ] [ 34 ]ไม่เปิดเผยข้อมูล 14 มีนาคม 2566ไม่เปิดเผย ประมาณการที่ 2.1 × 10 25 FLOPS [ 40 ]175 พันล้าน
จีพีที-4โอ? ? ? 13 พฤษภาคม 2567?
จีพีที-4.5? ? ? 27 กุมภาพันธ์ 2568?
จีพีที-4.1? ไม่เปิดเผย ประมาณการไว้ที่ 1.5 ถึง 1.8 ล้านล้าน ? 14 เมษายน 2568?
จีพีที-5? ไม่เปิดเผย ประมาณการไว้ที่ 1.8-2 ล้านล้าน ? 7 สิงหาคม 2568 ?

โมเดล GPT ดั้งเดิมของ OpenAI ("GPT-1")

โมเดล GPT ดั้งเดิม

เอกสารต้นฉบับเกี่ยวกับการฝึกอบรมล่วงหน้าแบบสร้างสรรค์ของ แบบจำลองภาษาที่ใช้ TransformerเขียนโดยAlec Radfordและเพื่อนร่วมงานของเขา และเผยแพร่เป็นเอกสารก่อนตีพิมพ์บนเว็บไซต์ OpenAI เมื่อวันที่ 11 มิถุนายน 2018 [ 43 ]แสดงให้เห็นว่าแบบจำลองภาษาแบบสร้างสรรค์สามารถรับความรู้เกี่ยวกับโลกและประมวลผลการพึ่งพาในระยะยาวได้อย่างไรโดยการฝึกอบรมล่วงหน้าบนคลังข้อมูลที่หลากหลายซึ่งมีข้อความต่อเนื่องยาว

จีพีที-2

ตัวอย่างการใช้งาน GPT-2 ในการเขียนย่อหน้าโดยอิงจากข้อความในบทความวิกิพีเดียของตนเอง ในเดือนกุมภาพันธ์ 2021

Generative Pre-trained Transformer 2 ("GPT-2") เป็นโมเดลภาษาTransformer แบบ ไม่ใช้การกำกับดูแล และเป็นรุ่นต่อจากโมเดล GPT ดั้งเดิมของ OpenAI ("GPT-1") GPT-2 ได้รับการประกาศในเดือนกุมภาพันธ์ 2019 โดยในตอนแรกมีเพียงเวอร์ชันสาธิตที่จำกัดเท่านั้นที่เผยแพร่สู่สาธารณะ เวอร์ชันเต็มของ GPT-2 ไม่ได้ถูกเผยแพร่ทันทีเนื่องจากความกังวลเกี่ยวกับการนำไปใช้ในทางที่ผิด รวมถึงการนำไปใช้เขียนข่าวปลอม [ 44 ] ผู้เชี่ยวชาญบางคนแสดงความสงสัยว่า GPT-2 ก่อให้เกิดภัยคุกคามอย่างมีนัยสำคัญ

เพื่อตอบสนองต่อ GPT-2 สถาบัน Allen Institute for Artificial Intelligence ได้พัฒนาเครื่องมือตรวจจับ "ข่าวปลอมทางประสาท" [ 45 ]นักวิจัยคนอื่นๆ เช่น Jeremy Howard ได้เตือนถึง "เทคโนโลยีที่จะเติมเต็ม Twitter อีเมล และเว็บด้วยข้อความที่ฟังดูสมเหตุสมผลและเหมาะสมกับบริบท ซึ่งจะกลบเสียงพูดอื่นๆ และไม่สามารถกรองได้" [ 46 ]ในเดือนพฤศจิกายน 2019 OpenAI ได้เผยแพร่โมเดลภาษา GPT-2 เวอร์ชันสมบูรณ์[ 47 ]เว็บไซต์หลายแห่งได้นำเสนอการสาธิตแบบโต้ตอบของ GPT-2 และโมเดล Transformer อื่นๆ ในรูปแบบต่างๆ[ 48 ] [ 49 ] [ 50 ]

ผู้เขียน GPT-2 โต้แย้งว่าแบบจำลองภาษาแบบไม่ใช้การกำกับดูแลเป็นแบบเรียนรู้ทั่วไป โดยแสดงให้เห็นจากผลลัพธ์ที่ GPT-2 บรรลุความแม่นยำและความซับซ้อนที่ อยู่ในระดับแนวหน้า ใน 7 จาก 8 งาน แบบ zero-shot (กล่าวคือ แบบจำลองไม่ได้ถูกฝึกฝนเพิ่มเติมด้วยตัวอย่างอินพุต-เอาต์พุตเฉพาะงานใดๆ)

ชุดข้อมูลที่ใช้ในการฝึกฝนเรียกว่า WebText ประกอบด้วยข้อความประมาณ 40 กิกะไบต์จากURLที่แชร์ใน โพสต์ Redditที่มีอย่างน้อย 3 โหวตขึ้นไป โดย หลีกเลี่ยงปัญหาบางอย่างในการเข้ารหัสคำศัพท์ด้วยโทเค็นคำโดยใช้การเข้ารหัสคู่ไบต์ซึ่งช่วยให้สามารถแสดงสตริงของอักขระใดๆ ได้โดยการเข้ารหัสทั้งอักขระแต่ละตัวและโทเค็นที่มีอักขระหลายตัว[ 51 ]

จีพีที-3

Generative Pre - trained Transformer 3 (GPT-3) ได้รับการอธิบายครั้งแรกในเดือนพฤษภาคม 2020 เป็นโมเดลภาษา Transformer แบบไม่ใช้การกำกับดูแล และเป็นรุ่นต่อจากGPT -2 [ 52 ] [ 53 ] [ 54 ] OpenAIระบุว่า GPT-3 เวอร์ชันเต็มมีพารามิเตอร์ 175 พันล้านตัว [ 54 ]ซึ่งมากกว่า 1.5 พันล้านตัว[ 51 ] ใน GPT-2 เวอร์ชัน เต็มถึง สองเท่า(แม้ว่าโมเดล GPT-3 ที่มีพารามิเตอร์เพียง 125 ล้านตัวก็ได้รับการฝึกฝนเช่นกัน) [ 55 ]

OpenAI ระบุว่า GPT-3 ประสบความสำเร็จในงาน " meta-learning " บางอย่าง และสามารถสรุปวัตถุประสงค์ของคู่ข้อมูลเข้า-ออกเพียงคู่เดียวได้ เอกสารเผยแพร่ GPT-3 ยกตัวอย่างการแปลและการเรียนรู้การถ่ายโอน ข้ามภาษา ระหว่างภาษาอังกฤษและภาษาโรมาเนีย และระหว่างภาษาอังกฤษและภาษาเยอรมัน[ 54 ]

GPT-3 ปรับปรุงผลลัพธ์มาตรฐานได้อย่างมากเมื่อเทียบกับ GPT-2 OpenAI เตือนว่าการขยายขนาดของโมเดลภาษาดังกล่าวอาจเข้าใกล้หรือเผชิญกับข้อจำกัดความสามารถพื้นฐานของโมเดลภาษาเชิงทำนาย[ 56 ]การฝึกอบรม GPT-3 ล่วงหน้าต้องใช้การคำนวณหลายพันเพตาฟลอป/วินาที-วัน[ b ]เมื่อเทียบกับหลายสิบเพตาฟลอป/วินาที-วันสำหรับโมเดล GPT-2 เต็มรูปแบบ[ 54 ]เช่นเดียวกับรุ่นก่อนหน้า[ 44 ]โมเดล GPT-3 ที่ได้รับการฝึกฝนแล้วไม่ได้ถูกเผยแพร่สู่สาธารณะในทันทีเนื่องจากความกังวลเกี่ยวกับการนำไปใช้ในทางที่ผิด แม้ว่า OpenAI จะวางแผนที่จะอนุญาตให้เข้าถึงผ่านAPI คลาวด์แบบชำระเงิน หลังจากเบต้าส่วนตัวฟรีสองเดือนซึ่งเริ่มต้นในเดือนมิถุนายน 2020 [ 30 ] [ 58 ]

เมื่อวันที่ 23 กันยายน พ.ศ. 2563 GPT-3 ได้รับการอนุญาตให้ใช้งานเฉพาะกับ Microsoft เท่านั้น[ 59 ] [ 60 ]

โคเด็กซ์

Codex ซึ่งประกาศในช่วงกลางปี ​​2021 เป็นรุ่นที่พัฒนาต่อยอดมาจาก GPT-3 โดยได้รับการฝึกฝนเพิ่มเติมด้วยโค้ดจากคลังเก็บข้อมูล GitHub กว่า 54 ล้านรายการ[ 61 ] [ 62 ]และเป็น AI ที่ขับเคลื่อนเครื่องมือ เติมโค้ด อัตโนมัติGitHub Copilot [ 62 ] ในเดือนสิงหาคม 2021 มีการเปิดตัว API ในเวอร์ชันเบต้าส่วนตัว[ 63 ]ตามข้อมูลของ OpenAI โมเดลนี้สามารถสร้างโค้ดที่ใช้งานได้ในภาษาโปรแกรมมากกว่าสิบภาษา โดยมีประสิทธิภาพมากที่สุดใน Python [ 61 ]

มีการกล่าวถึงปัญหาหลายประการเกี่ยวกับความผิดพลาด ข้อบกพร่องในการออกแบบ และช่องโหว่ด้านความปลอดภัย[ 64 ] [ 65 ]

OpenAI ประกาศว่าจะยุติการสนับสนุน API Codex ในวันที่ 23 มีนาคม 2023 [ 66 ]

จีพีที-4

เมื่อวันที่ 14 มีนาคม 2023 OpenAI ประกาศเปิดตัว Generative Pre-trained Transformer 4 (GPT-4) ซึ่งสามารถรับข้อมูลป้อนเข้าเป็นข้อความหรือรูปภาพได้[ 67 ]พวกเขาประกาศว่าเทคโนโลยีที่ได้รับการอัปเดตนี้ผ่านการทดสอบจำลองการสอบเนติบัณฑิตของโรงเรียนกฎหมายด้วยคะแนนอยู่ในกลุ่ม 10% แรกของผู้เข้าสอบ (ในทางตรงกันข้าม GPT-3.5 ได้คะแนนอยู่ในกลุ่ม 10% ล่างสุด) พวกเขากล่าวว่า GPT-4 ยังสามารถอ่าน วิเคราะห์ หรือสร้างข้อความได้มากถึง 25,000 คำ และเขียนโค้ดในภาษาโปรแกรมหลักทั้งหมดได้[ 68 ]

ผู้สังเกตการณ์รายงานว่า ChatGPT เวอร์ชันที่ใช้ GPT-4 นั้นดีขึ้นกว่าเวอร์ชันก่อนหน้าที่ใช้ GPT-3.5 โดยมีข้อแม้ว่า GPT-4 ยังคงมีปัญหาบางอย่างจากเวอร์ชันก่อนหน้า[ 69 ] GPT-4 ยังสามารถรับภาพเป็นอินพุตใน ChatGPT ได้อีกด้วย[ 70 ] OpenAI ปฏิเสธที่จะเปิดเผยรายละเอียดทางเทคนิคและสถิติต่างๆ เกี่ยวกับ GPT-4 เช่น ขนาดที่แน่นอนของโมเดล[ 71 ]

จีพีที-4โอ

เมื่อวันที่ 13 พฤษภาคม 2024 OpenAI ได้ประกาศและเผยแพร่GPT-4oซึ่งสามารถประมวลผลและสร้างข้อความ รูปภาพ และเสียงได้[ 72 ] GPT-4o บรรลุผลลัพธ์ที่ล้ำสมัยในเกณฑ์มาตรฐานด้านเสียง หลายภาษา และภาพ โดยสร้างสถิติใหม่ในการจดจำและแปลคำพูด[ 73 ] [ 74 ]โดยทำคะแนนได้ 88.7% ในเกณฑ์มาตรฐาน Massive Multitask Language Understanding ( MMLU ) เมื่อเทียบกับ 86.5% ของ GPT-4 [ 75 ]

เมื่อวันที่ 18 กรกฎาคม 2024 OpenAI ได้เปิดตัว GPT-4o mini ซึ่งเป็นเวอร์ชันที่เล็กกว่าของ GPT-4o โดยจะมาแทนที่ GPT-3.5 Turbo บนอินเทอร์เฟซ ChatGPT API ของมัน มีค่าใช้จ่าย 0.15 ดอลลาร์ต่อโทเค็นขาเข้าหนึ่งล้านโทเค็น และ 0.60 ดอลลาร์ต่อโทเค็นขาออกหนึ่งล้านโทเค็น เมื่อเทียบกับ 5 ดอลลาร์และ 15 ดอลลาร์ตามลำดับสำหรับ GPT-4o OpenAI คาดว่าจะเป็นประโยชน์อย่างยิ่งสำหรับองค์กร สตาร์ทอัพ และนักพัฒนาที่ต้องการทำให้บริการเป็นไปโดยอัตโนมัติด้วยเอเจนต์ AI [ 76 ]

ในเดือนมีนาคม พ.ศ. 2568 OpenAI ได้ปล่อยฟีเจอร์การสร้างภาพดั้งเดิมของ GPT-4o ออกมา ซึ่งเป็นทางเลือกแทน DALL-E 3 [ 77 ]

จีพีที-4.5

เมื่อวันที่ 27 กุมภาพันธ์ พ.ศ. 2568 OpenAI ได้ปล่อยGPT-4.5ซึ่งมีชื่อรหัสว่า Orion Sam Altman อ้างว่า GPT-4.5 จะนำเสนอข้อมูลที่ไม่ถูกต้องน้อยกว่ารุ่นก่อนหน้า และอธิบายว่าเป็น "โมเดลขนาดใหญ่และราคาแพง" [ 78 ]

จีพีที-4.1

เมื่อวันที่ 14 เมษายน พ.ศ. 2568 OpenAI ได้เปิดตัว โมเดล GPT-4.1นอกจากนี้ยังได้เปิดตัวโมเดลที่ "เล็กกว่า เร็วกว่า และถูกกว่า" อีกสองรุ่น ได้แก่ GPT-4.1 mini และ GPT-4.1 nano [ 79 ] [ 80 ] [ 81 ]

จีพีที-5

GPT-5 เป็นโมเดลเรือธงของOpenAI ที่เปิดตัวเมื่อวันที่ 7 สิงหาคม 2025 โดย เข้ามาแทนที่โมเดลรุ่นก่อนหน้า เช่น GPT-4o , GPT-4.5และo3

GPT-5 ใช้เราเตอร์แบบไดนามิกที่เลือกระหว่างการตอบสนองอย่างรวดเร็วและการ "คิด" ที่ลึกซึ้งยิ่งขึ้นเมื่อจำเป็น สามารถทำงานได้ในระดับปริญญาเอกในโดเมนต่างๆ เช่น คณิตศาสตร์ การเขียนโค้ด สุขภาพ และงานมัลติโมดอล นอกจากนี้ยังได้รับคะแนน 74.9% ใน SWE-bench Verified และ 88% ใน Aider polyglot [ 82 ]

นักข่าวบรรยายการเปิดตัว GPT-5 ว่าเป็นก้าวสำคัญในการก้าวไปสู่ ​​AGI โดยยกย่องความฉลาด การเข้าถึง และราคาที่เหมาะสม[ 83 ] [ 84 ]แต่ผลตอบรับในช่วงแรกบางส่วนเรียกมันว่า "เป็นการพัฒนาแบบค่อยเป็นค่อยไปมากกว่าการปฏิวัติ" โดยสังเกตเห็นผลลัพธ์ที่หลากหลายในการเขียนเชิงสร้างสรรค์ และชี้ให้เห็นถึงการแข่งขันจากรุ่นต่างๆ เช่นGrok 4 Heavy [ 85 ]

o1

เมื่อวันที่ 12 กันยายน 2024 OpenAI ได้เปิดตัวโมเดล o1-preview และ o1-mini ซึ่งได้รับการออกแบบมาให้ใช้เวลาคิดเกี่ยวกับการตอบสนองมากขึ้น ส่งผลให้มีความแม่นยำสูงขึ้น โมเดลเหล่านี้มีประสิทธิภาพเป็นพิเศษในงานด้านวิทยาศาสตร์ การเขียนโค้ด และการให้เหตุผล และได้เปิดให้ใช้งานสำหรับสมาชิก ChatGPT Plus และ Team [ 86 ] [ 87 ]ในเดือนธันวาคม 2024 o1-preview ถูกแทนที่ด้วย o1 [ 88 ]ในเดือนมีนาคม 2025 โมเดล o1-Pro ได้เปิดให้ใช้งานผ่าน API สำหรับนักพัฒนาของ OpenAI ซึ่งก่อนหน้านี้เปิดให้ใช้งานสำหรับผู้ใช้ ChatGPT Pro ตั้งแต่เดือนธันวาคม 2024 โดยมีราคา 150 ดอลลาร์ต่อโทเค็นอินพุตหนึ่งล้านโทเค็น และ 600 ดอลลาร์ต่อโทเค็นเอาต์พุตหนึ่งล้านโทเค็น[ 89 ]

โอ3

เมื่อวันที่ 20 ธันวาคม 2024 OpenAI ได้เปิดตัว o3 ซึ่งเป็นรุ่นต่อจากโมเดลการให้เหตุผล o1 นอกจากนี้ OpenAI ยังได้เปิดตัว o3-mini ซึ่งเป็นเวอร์ชันที่เบากว่าและเร็วกว่าของ OpenAI o3 ณ วันที่ 21 ธันวาคม 2024 โมเดลนี้ยังไม่เปิดให้ใช้งานสำหรับบุคคลทั่วไป ตามที่ OpenAI ระบุ พวกเขากำลังทดสอบ o3 และ o3-mini อยู่[ 90 ] [ 91 ]จนถึงวันที่ 10 มกราคม 2025 นักวิจัยด้านความปลอดภัยและการรักษาความปลอดภัยมีโอกาสสมัครขอเข้าถึงโมเดลเหล่านี้ก่อนใคร[ 92 ]โมเดลนี้เรียกว่า o3 แทนที่จะเป็น o2 เพื่อหลีกเลี่ยงความสับสนกับผู้ให้บริการโทรคมนาคมO2 [ 90 ] ในเดือนเมษายน 2025 OpenAI ได้เปิดตัว o3 ให้กับผู้ใช้ที่ชำระเงินทั้งหมด o3 มีความสามารถในการให้เหตุผลและการแก้ปัญหาที่ดีกว่า o1 [ 93 ]

การวิจัยเชิงลึก

Deep Research เป็นเอเจนต์ AIที่พัฒนาโดย OpenAI เปิดตัวเมื่อวันที่ 2 กุมภาพันธ์ 2025 โดยใช้ประโยชน์จากความสามารถของโมเดล o3 ของ OpenAI เพื่อทำการท่องเว็บ วิเคราะห์ข้อมูล และสังเคราะห์ข้อมูลอย่างละเอียด และสร้างรายงานที่ครอบคลุมภายในเวลา 5 ถึง 30 นาที[ 94 ]เมื่อเปิดใช้งานการท่องเว็บและ เครื่องมือ Pythonแล้ว จะมีความแม่นยำถึง 26.6 เปอร์เซ็นต์ในเกณฑ์มาตรฐานHLE (Humanity's Last Exam) [ 95 ]ในเดือนเมษายน 2025 OpenAI เริ่มเปิดตัว Deep Research เวอร์ชันน้ำหนักเบาให้กับผู้ใช้ ChatGPT ฟรีทั้งหมด[ 96 ] [ 97 ]

จีพีที-โอเอส

GPT-OSS (เขียนแบบมีสไตล์ว่า gpt-oss) คือชุดของโมเดลการให้เหตุผลแบบน้ำหนักเปิดที่ OpenAI เผยแพร่เมื่อวันที่ 5 สิงหาคม 2025 [ 98 ] [ 99 ] [ 100 ]มีสองเวอร์ชัน ได้แก่ โมเดลขนาดใหญ่ที่มีพารามิเตอร์ 117 พันล้านตัว เรียกว่าgpt-oss-120bและโมเดลขนาดเล็กที่มีพารามิเตอร์ 21 พันล้านตัว เรียกว่าgpt-oss-20b [ 99 ] [ 101 ] ทั้งสองโมเดลเผยแพร่ภายใต้ใบอนุญาต Apache 2.0ซึ่งอนุญาตให้ใช้งานเชิงพาณิชย์และไม่เชิงพาณิชย์ได้ ในแง่ของประสิทธิภาพ พวกมันเทียบได้กับo4-miniและo3-miniตามลำดับ ตามข้อมูลของ OpenAI [ 101 ] [ 99 ] gpt-oss-20b มีขนาดเล็กพอที่จะทำงานบนอุปกรณ์ที่ มีหน่วยความจำเข้าถึงแบบสุ่มมากกว่า16 กิกะไบต์[ 99 ]

การจำแนกภาพ

คลิป

CLIP (Contrastive Language–Image Pre-training) ซึ่งเปิดตัวในปี 2021 เป็นโมเดลที่ได้รับการฝึกฝนเพื่อวิเคราะห์ความคล้ายคลึงทางความหมายระหว่างข้อความและรูปภาพ โดยเฉพาะอย่างยิ่งสามารถใช้สำหรับการจำแนกประเภทรูปภาพได้[ 102 ]

แปลงข้อความเป็นรูปภาพ

ดัลล์-อี

ภาพเหล่านี้สร้างสรรค์ขึ้นในปี 2021 โดย DALL-E เมื่อได้รับข้อความกำกับว่า "ภาพประกอบคุณภาพสูงระดับมืออาชีพของยีราฟมังกรไคเมรา ยีราฟที่เลียนแบบมังกร ยีราฟที่ทำจากมังกร"

DALL-E เปิดตัวในปี 2021 เป็นโมเดล Transformer ที่สร้างภาพจากคำอธิบายข้อความ[ 103 ] DALL-E ใช้ GPT-3 เวอร์ชัน 12 พันล้านพารามิเตอร์เพื่อตีความอินพุตภาษาธรรมชาติ (เช่น "กระเป๋าหนังสีเขียวรูปทรงห้าเหลี่ยม" หรือ "มุมมองไอโซเมตริกของคาปิบาร่าเศร้า") และสร้างภาพที่สอดคล้องกัน สามารถสร้างภาพของวัตถุที่สมจริง ("หน้าต่างกระจกสีที่มีภาพสตรอว์เบอร์รีสีฟ้า") เช่นเดียวกับวัตถุที่ไม่มีอยู่จริง ("ลูกบาศก์ที่มีพื้นผิวของเม่น") ณ เดือนมีนาคม 2021 ยังไม่มี API หรือโค้ดให้ใช้งาน

ดัลล์-อี 2

ในเดือนเมษายน พ.ศ. 2565 OpenAI ได้ประกาศ DALL-E 2 ซึ่งเป็นเวอร์ชันอัปเดตของโมเดลที่มีผลลัพธ์ที่สมจริงยิ่งขึ้น[ 104 ]ในเดือนธันวาคม พ.ศ. 2565 OpenAI ได้เผยแพร่ซอฟต์แวร์ Point-E บน GitHub ซึ่งเป็นระบบพื้นฐานใหม่สำหรับการแปลงคำอธิบายข้อความให้เป็นโมเดล 3 มิติ[ 105 ]

ดัลล์-อี 3

ในเดือนกันยายน พ.ศ. 2566 OpenAI ได้ประกาศ DALL-E 3 ซึ่งเป็นโมเดลที่มีประสิทธิภาพมากขึ้นและสามารถสร้างภาพจากคำอธิบายที่ซับซ้อนได้ดีกว่า โดยไม่ต้องมีการออกแบบข้อความแจ้งเตือนด้วยตนเอง และแสดงรายละเอียดที่ซับซ้อน เช่น มือและข้อความ[ 106 ]โดยได้เปิดให้ใช้งานแก่สาธารณะในฐานะฟีเจอร์ ChatGPT Plus ในเดือนตุลาคม[ 107 ]

แปลงข้อความเป็นวิดีโอ

โซระ

Sora เป็น โมเดล ข้อความสู่วิดีโอที่สามารถสร้างวิดีโอตามข้อความอธิบายสั้นๆ[ 108 ]รวมถึงขยายวิดีโอที่มีอยู่ไปข้างหน้าหรือถอยหลังในเวลา[ 109 ]สามารถสร้างวิดีโอที่มีความละเอียดสูงสุด 1920x1080 หรือ 1080x1920 ความยาวสูงสุดของวิดีโอที่สร้างขึ้นยังไม่ทราบแน่ชัด

ทีมพัฒนาของ Sora ตั้งชื่อตาม คำภาษา ญี่ปุ่นที่แปลว่า "ท้องฟ้า" เพื่อสื่อถึง "ศักยภาพในการสร้างสรรค์ที่ไร้ขีดจำกัด" [ 108 ]เทคโนโลยีของ Sora เป็นการดัดแปลงเทคโนโลยีที่อยู่เบื้องหลังโมเดลแปลงข้อความเป็นภาพDALL·E 3 [ 109 ] OpenAI ฝึกฝนระบบโดยใช้วิดีโอที่เผยแพร่สู่สาธารณะ รวมถึงวิดีโอที่มีลิขสิทธิ์ซึ่งได้รับอนุญาต ให้ใช้เพื่อวัตถุประสงค์ดังกล่าว แต่ไม่ได้เปิดเผยจำนวนหรือแหล่งที่มาที่แน่นอนของวิดีโอ[ 108 ]

เมื่อวันที่ 15 กุมภาพันธ์ 2024 OpenAI ได้สาธิตวิดีโอความละเอียดสูง ที่สร้างโดย Sora ให้กับสาธารณชน โดยระบุว่าสามารถสร้างวิดีโอได้ยาวถึงหนึ่งนาที นอกจากนี้ยังได้เผยแพร่รายงานทางเทคนิคที่เน้นวิธีการที่ใช้ในการฝึกฝนโมเดลและความสามารถของโมเดล[ 109 ]และยอมรับข้อบกพร่องบางประการ รวมถึงปัญหาในการจำลองฟิสิกส์ที่ซับซ้อน[ 110 ] Will Douglas Heaven จากMIT Technology Reviewเรียกวิดีโอสาธิตว่า "น่าประทับใจ" แต่ตั้งข้อสังเกตว่าวิดีโอเหล่านั้นอาจถูกคัดเลือกมาและอาจไม่ได้แสดงถึงผลลัพธ์ทั่วไปของ Sora [ 109 ]

แม้จะมีข้อสงสัยจากผู้นำทางวิชาการบางส่วนหลังจากการสาธิต Sora ต่อสาธารณะ แต่บุคคลสำคัญในอุตสาหกรรมบันเทิงหลายคนแสดงความสนใจอย่างมากในศักยภาพของเทคโนโลยีนี้ ในการสัมภาษณ์ นักแสดง/ผู้กำกับภาพยนตร์ไทเลอร์ เพอร์รีแสดงความประหลาดใจกับความสามารถของเทคโนโลยีในการสร้างวิดีโอที่สมจริงจากคำอธิบายข้อความ โดยอ้างถึงศักยภาพในการปฏิวัติการเล่าเรื่องและการสร้างเนื้อหา เขากล่าวว่าความตื่นเต้นของเขาเกี่ยวกับความเป็นไปได้ของ Sora นั้นมากจนเขาตัดสินใจระงับแผนการขยายสตูดิโอภาพยนตร์ของเขาในแอตแลนตา[ 111 ]

Sora 2 เปิดตัวเมื่อวันที่ 30 กันยายน พ.ศ. 2568 พร้อมกับ แอป iOSในเวลาเดียวกัน[ 112 ]

แปลงเสียงเป็นข้อความ

กระซิบ

Whisper ซึ่งเปิดตัวในปี 2022 เป็นโมเดลการรู้จำเสียงพูดอเนกประสงค์[ 113 ]ได้รับการฝึกฝนบนชุดข้อมูลเสียงที่หลากหลายขนาดใหญ่ และยังเป็นโมเดลแบบมัลติทาสก์ที่สามารถทำการรู้จำเสียงพูดหลายภาษา รวมถึงการแปลเสียงพูดและการระบุภาษาได้[ 114 ]

คนรุ่นดนตรี

มิวส์เน็ต

MuseNet ซึ่งเปิดตัวในปี 2019 เป็นโครงข่ายประสาทเทียมเชิงลึกที่ได้รับการฝึกฝนให้ทำนายโน้ตดนตรีถัดไปใน ไฟล์เพลง MIDIสามารถสร้างเพลงที่มีเครื่องดนตรี 10 ชิ้นใน 15 สไตล์ ตามรายงานของThe Vergeเพลงที่สร้างโดย MuseNet มักจะเริ่มต้นได้ค่อนข้างดี แต่หลังจากนั้นก็จะกลายเป็นความวุ่นวายเมื่อเล่นไปนานขึ้น[ 115 ] [ 116 ]ในวัฒนธรรมป๊อป การประยุกต์ใช้เครื่องมือนี้ครั้งแรกถูกนำมาใช้ตั้งแต่ปี 2020 สำหรับภาพยนตร์ระทึกขวัญทางจิตวิทยาออนไลน์เรื่องBen Drownedเพื่อสร้างเพลงประกอบตัวละครเอก[ 117 ] [ 118 ]

ตู้เพลง

Jukebox ซึ่งเปิดตัวในปี 2020 เป็นอัลกอริทึมโอเพนซอร์สสำหรับสร้างเพลงที่มีเสียงร้อง หลังจากฝึกฝนด้วยตัวอย่าง 1.2 ล้านตัวอย่าง ระบบจะรับประเภทเพลง ศิลปิน และเนื้อเพลงบางส่วน แล้วส่งออกตัวอย่างเพลง OpenAI ระบุว่าเพลงเหล่านั้น "แสดงให้เห็นถึงความสอดคล้องทางดนตรีในระดับท้องถิ่น [และ] เป็นไปตามรูปแบบคอร์ดแบบดั้งเดิม" แต่ยอมรับว่าเพลงเหล่านั้นขาด "โครงสร้างทางดนตรีขนาดใหญ่ที่คุ้นเคย เช่น ท่อนฮุคที่ซ้ำกัน" และ "มีช่องว่างที่สำคัญ" ระหว่าง Jukebox กับเพลงที่สร้างโดยมนุษย์The Vergeกล่าวว่า "มันน่าประทับใจทางเทคโนโลยี แม้ว่าผลลัพธ์จะฟังดูเหมือนเพลงเวอร์ชันที่ฟังดูคุ้นเคยแต่ไม่ชัดเจน" ในขณะที่Business Insiderกล่าวว่า "น่าประหลาดใจที่เพลงบางเพลงที่ได้นั้นติดหูและฟังดูสมจริง" [ 119 ] [ 120 ] [ 121 ]

ส่วนติดต่อผู้ใช้

เกมโต้วาที

ในปี 2018 OpenAI ได้เปิดตัวเกมโต้วาที (Debate Game) ซึ่งสอนให้เครื่องจักรโต้วาทีปัญหา จำลอง ต่อหน้าผู้ตัดสินที่เป็นมนุษย์ จุดประสงค์คือเพื่อวิจัยว่าแนวทางดังกล่าวสามารถช่วยในการตรวจสอบการตัดสินใจของ AI และในการพัฒนาAI ที่อธิบายได้ หรือ ไม่[ 122 ] [ 123 ]

กล้องจุลทรรศน์

Microscope [ 124 ]ซึ่งเปิดตัวในปี 2020 เป็นชุดการแสดงภาพของทุกชั้นและเซลล์ประสาทที่สำคัญของแบบจำลองเครือข่ายประสาทแปดแบบ ซึ่งมักได้รับการศึกษาในด้านความสามารถในการตีความ[ 125 ] Microscope ถูกสร้างขึ้นเพื่อวิเคราะห์คุณลักษณะที่เกิดขึ้นภายในเครือข่ายประสาทเหล่านี้ได้อย่างง่ายดาย แบบจำลองที่รวมอยู่ ได้แก่AlexNet , VGG -19 , Inceptionเวอร์ชันต่างๆและCLIP Resnet เวอร์ชันต่างๆ [ 126 ]

แชทจีพีที

"Blossom" ของ OpenAI ถูกนำมาใช้เป็นสัญลักษณ์ของ ChatGPT และบริษัท

ChatGPT เปิดตัวในเดือนพฤศจิกายน 2022 เป็นแชทบอทAI เชิงสร้างสรรค์ ที่ใช้โมเดล GPT ของ OpenAI ในการสร้างเนื้อหา ผู้ใช้สามารถโต้ตอบกับแชทบอทได้ผ่านการสนทนาด้วยข้อความหรือเสียง นอกจากนี้ยังสามารถสร้างภาพโดยใช้GPT-4oซึ่งมาแทนที่DALL-E 3 [ 77 ] ChatGPTมีผู้ใช้งานถึง 100 ล้านคนในช่วงสองเดือนหลังจากการเปิดตัว[ 127 ]

OpenAI เปิดตัวแผนการสมัครสมาชิกหลายแบบ ได้แก่ Plus, Pro, Team และ Enterprise ผู้ใช้ในระดับฟรีของ ChatGPT สามารถเข้าถึงGPT-4o ได้ แต่มีข้อจำกัดที่ลดลง การสมัครสมาชิก ChatGPT ระดับ "Plus", "Pro", "Team" และ "Enterprise" จะให้ขีดจำกัดการใช้งานที่เพิ่มขึ้นและการเข้าถึงคุณสมบัติหรือโมเดลเพิ่มเติม[ 128 ]

ในเดือนพฤษภาคม 2023 OpenAI ได้เปิดตัวอินเทอร์เฟซผู้ใช้สำหรับ ChatGPT สำหรับApp Storeบน iOS และในเดือนกรกฎาคม 2023 สำหรับPlay Storeบน Android [ 129 ]ในเดือนธันวาคม 2024 OpenAI ได้เปิดตัวฟีเจอร์ใหม่ที่อนุญาตให้ผู้ใช้โทรหา ChatGPT ได้ฟรีสูงสุด 15 นาทีต่อเดือน[ 130 ] [ 131 ]

ค้นหาGPT

SearchGPT ซึ่งเป็น เครื่องมือค้นหาต้นแบบที่พัฒนาโดย OpenAI ได้เปิดตัวเมื่อวันที่ 25 กรกฎาคม 2024 โดยเริ่มแรกเปิดให้ผู้ใช้ทดสอบจำนวนจำกัดเพียง 10,000 รายเท่านั้น โดยผสานรวมคุณสมบัติของเครื่องมือค้นหาแบบดั้งเดิมเข้ากับความสามารถของ AI เชิงสร้างสรรค์[ 132 ] [ 133 ]

แชทจีพีที แอตลาส

ในเดือนตุลาคม พ.ศ. 2568 OpenAI ได้เปิดตัวเว็บเบราว์เซอร์ชื่อ ChatGPT Atlas [ 134 ] [ 135 ]

ปริซึม

เมื่อวันที่ 27 มกราคม พ.ศ. 2569 OpenAI ได้เปิดตัว Prism ซึ่งเป็น พื้นที่ทำงานแบบเนทีฟ ของ LaTeXที่ออกแบบมาเพื่อช่วยเหลือนักวิทยาศาสตร์ในการวิจัยและการเขียน เช่น การร่างเอกสารทางวิทยาศาสตร์ การจัดการการอ้างอิง และการจัดรูปแบบสมการ[ 136 ] [ 137 ]

สตาร์เกตและซูเปอร์คอมพิวเตอร์อื่นๆ

โครงการ Stargate เปิดตัวในปี 2024 โดยเริ่มต้นจากการเป็นโครงการมูลค่า 100 พันล้านดอลลาร์ระหว่าง OpenAI และMicrosoftเพื่อสร้างศูนย์ข้อมูล[ 138 ]ชื่อ "Stargate" เป็นการยกย่องภาพยนตร์ไซไฟเรื่อง Stargate ในปี 1994 [ 139 ]ในที่สุดก็กลายเป็นบริษัทStargate LLCซึ่งก่อตั้งขึ้นในเดือนมกราคม 2025 โดยเป็นการร่วมมือกันระหว่าง OpenAI , Oracle , SoftBankและMGX [ 140 ] [ 138 ]

การพัฒนาฮาร์ดแวร์

เมื่อวันที่ 21 พฤษภาคม 2025 OpenAI ประกาศการเข้าซื้อกิจการ io ซึ่งเป็นบริษัทสตาร์ทอัพด้านฮาร์ดแวร์ AI ที่ก่อตั้งโดยJony Iveอดีต นักออกแบบของ Apple [ 141 ]ข้อตกลงนี้มีมูลค่าประมาณ 6.5 พันล้านดอลลาร์สหรัฐ ซึ่งถือเป็นการเข้าสู่ตลาดฮาร์ดแวร์สำหรับผู้บริโภคอย่างมีกลยุทธ์ของ OpenAI [ 142 ] Ive ซึ่งเป็นที่รู้จักจากการออกแบบiPhone , iPadและiMacจะเป็นผู้นำด้านฮาร์ดแวร์และการออกแบบสำหรับ OpenAI [ 143 ]

Sam Altman ซีอีโอของ OpenAI และ Ive ได้แสดงวิสัยทัศน์ร่วมกันในการพัฒนาอุปกรณ์ AI ดั้งเดิมที่ก้าวข้ามหน้าจอและอินเทอร์เฟซแบบเดิม แม้ว่าจะยังไม่มีการเปิดเผยรายละเอียดผลิตภัณฑ์ที่เฉพาะเจาะจง แต่ Washington Post รายงานว่า Ive และ Altman ได้เริ่มทำงานกับผลิตภัณฑ์ใหม่แล้ว “ผลิตภัณฑ์แรกที่ผมกำลังพัฒนาอยู่นั้นดึงดูดจินตนาการของผมได้อย่างสมบูรณ์” Jony Ive กล่าว Altman เสริมว่า “ผมคิดว่ามันเป็นเทคโนโลยีที่เจ๋งที่สุดเท่าที่โลกเคยเห็นมา” [ 144 ] [ 141 ]

บริษัทยังเริ่มทำงานในด้านหุ่นยนต์โดยมีเป้าหมายในการสร้างหุ่นยนต์อเนกประสงค์[ 145 ]

บรรณานุกรมที่คัดเลือก

ส่วนนี้แสดงรายการเอกสารเผยแพร่อย่างเป็นทางการหลัก ๆ จาก OpenAI เกี่ยวกับโมเดล GPT ของ OpenAI

  • GPT-1: รายงาน, การเผยแพร่บน GitHub [ 146 ]
  • GPT-2: ประกาศในบล็อก[ 147 ]รายงานเกี่ยวกับการตัดสินใจ "การเผยแพร่แบบแบ่งขั้นตอน" [ 148 ]การเผยแพร่บน GitHub [ 149 ]
  • GPT-3: รายงาน[ 39 ]จะไม่มีการเผยแพร่โค้ดผ่าน GitHub หรือรูปแบบอื่นใดอีกต่อไป
  • WebGPT: ประกาศในบล็อก[ 150 ]รายงาน[ 151 ]
  • InstructGPT: ประกาศในบล็อก[ 152 ]รายงาน[ 153 ]
  • ChatGPT: ประกาศในบล็อก[ 154 ] (ไม่มีรายงาน)
  • GPT-4: ประกาศในบล็อก[ 155 ]รายงาน[ 156 ] [ 157 ]การ์ดแบบจำลอง[ 158 ]
  • GPT-4o: ประกาศบล็อก[ 75 ]
  • GPT-4.5: ประกาศในบล็อก[ 159 ]
  • GPT-4.1: ประกาศในบล็อก[ 80 ]
  • GPT-OSS: ประกาศในบล็อก[ 98 ]การ์ดโมเดล[ 101 ]
  • GPT-5: ประกาศในบล็อก[ 160 ]

ดูเพิ่มเติม

หมายเหตุ

  1. ^คำว่า "การเตรียมความพร้อมก่อนการฝึกอบรม" หมายถึงการฝึกอบรมภาษาทั่วไป ซึ่งแตกต่างจากการปรับแต่งอย่างละเอียดสำหรับงานเฉพาะด้าน
  2. ^หนึ่งเพตาฟลอป/วินาที-วัน เทียบเท่ากับการดำเนินการเครือข่ายประสาท ประมาณ 10 20 ครั้ง[ 57 ]
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Products_and_applications_of_OpenAI&oldid=1357272644#GPT-OSS "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ผลิตภัณฑ์และแอปพลิเคชันของ OpenAI

องค์กร ปัญญาประดิษฐ์ (AI) สัญชาติอเมริกัน OpenAI ได้เปิดตัวผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนับตั้งแต่ก่อตั้งขึ้นในปี 2015

การเรียนรู้แบบเสริมแรง

ในช่วงเริ่มต้น การวิจัยของ OpenAI ครอบคลุมโครงการจำนวนมากที่มุ่งเน้น การเรียนรู้แบบเสริมแรง (RL) [ 1 ] OpenAI ถูกมองว่าเป็นคู่แข่งที่สำคัญของ DeepMind [ 2 ]

โรงยิม

Gym ซึ่งประกาศในปี 2016 เป็นไลบรารี Python แบบโอเพนซอร์สที่ออกแบบมาเพื่ออำนวยความสะดวกในการพัฒนาอัลกอริธึมการเรียนรู้แบบเสริมแรง โดยมีเป้าหมายเพื่อสร้างมาตรฐานวิธีการกำหนดสภาพแวดล้อมในการวิจัย AI ทำให้การวิจัยที่เผยแพร่สามารถทำซ้ำได้ง่ายขึ้น [ 3 ] [ 4 ]...

โรโบซูโม

RoboSumo ซึ่งเปิดตัวในปี 2017 เป็น โลกเสมือนจริง ที่หุ่นยนต์ตัวแทน แบบ มนุษย์เรียนรู้ด้วยโลหะในตอนแรกขาดความรู้แม้กระทั่งวิธีการเดิน แต่ได้รับเป้าหมายในการเรียนรู้การเคลื่อนไหวและผลักตัวแทนฝ่ายตรงข้ามออกจากวงแหวน [ 8 ] ผ่านกระบวนการเรียนรู้แบบแข่งขันนี้...