ความก้าวหน้าในปัญญาประดิษฐ์

ความก้าวหน้าในปัญญาประดิษฐ์ ( AI ) คือความก้าวหน้า ความสำเร็จ และความก้าวหน้าครั้งสำคัญที่เกิดขึ้นในสาขาปัญญาประดิษฐ์ตลอดช่วงเวลาที่ผ่านมา AI เป็นสาขาหนึ่งของวิทยาศาสตร์คอมพิวเตอร์ที่มุ่งสร้างเครื่องจักรและระบบที่สามารถทำงานที่โดยทั่วไปแล้วต้องใช้สติปัญญาของมนุษย์ การประยุกต์ใช้ AI ได้ถูกนำไปใช้ในหลากหลายสาขา รวมถึงการวินิจฉัยทางการแพทย์การเงินหุ่นยนต์กฎหมาย วิดีโอเกมการเกษตร และการ ค้นพบทางวิทยาศาสตร์ สังคมโดยรวมคาดหวังว่าปัญญาประดิษฐ์จะเป็นปัจจัยสำคัญในอีก ไม่กี่ปีข้างหน้าเนื่องจากศักยภาพของมัน อย่างไรก็ตาม การประยุกต์ใช้ AI จำนวนมากไม่ได้ถูกมองว่าเป็น AI: "AI ที่ล้ำสมัยจำนวนมากได้ถูกนำไปใช้ในแอปพลิเคชันทั่วไป โดยมักจะไม่ได้ถูกเรียกว่า AI เพราะเมื่อสิ่งใดสิ่งหนึ่งมีประโยชน์และแพร่หลายมากพอแล้ว ก็จะไม่ถูกเรียกว่า AI อีกต่อไป " ^{[ 1 ]}^{[ 2 ]}

"แอปพลิเคชัน AI หลายพันรายการถูกฝังลึกอยู่ในโครงสร้างพื้นฐานของทุกอุตสาหกรรม" ^{[ 3 ]}ในช่วงปลายทศวรรษ 1990 และต้นทศวรรษ 2000 เทคโนโลยี AI ได้ถูกนำมาใช้กันอย่างแพร่หลายในฐานะองค์ประกอบของระบบขนาดใหญ่^{[ 3 ]}^{[ 4 ]}แต่ในขณะนั้นสาขานี้แทบจะไม่ได้รับการยกย่องสำหรับความสำเร็จเหล่านี้เลย

Kaplanและ Haenlein ได้แบ่งปัญญาประดิษฐ์ออกเป็นสามขั้นตอนวิวัฒนาการ:

ปัญญาประดิษฐ์แบบจำกัดขอบเขต – ปัญญาประดิษฐ์ที่สามารถทำงานได้เฉพาะด้านเท่านั้น;
ปัญญาประดิษฐ์ทั่วไป (Artificial General Intelligence) – ปัญญาประดิษฐ์ที่มีความสามารถในหลายด้าน และสามารถแก้ไขปัญหาได้ด้วยตนเอง แม้ว่าปัญหาเหล่านั้นจะไม่ได้ถูกออกแบบมาเพื่อแก้ไขก็ตาม
ปัญญาประดิษฐ์ขั้นสูง – AI ที่สามารถทำงานทั่วไปได้ รวมถึงความคิดสร้างสรรค์ ทาง วิทยาศาสตร์ทักษะทางสังคมและภูมิปัญญาทั่วไป^{[ 2 ]}

เพื่อให้สามารถเปรียบเทียบกับประสิทธิภาพของมนุษย์ได้ ปัญญาประดิษฐ์สามารถประเมินได้จากปัญหาที่มีข้อจำกัดและกำหนดไว้อย่างชัดเจน การทดสอบดังกล่าวเรียกว่าการทดสอบทัวริงโดยผู้เชี่ยวชาญเฉพาะด้านนอกจากนี้ ปัญหาขนาดเล็กยังให้เป้าหมายที่บรรลุได้ง่ายกว่า และมีผลลัพธ์เชิงบวกเพิ่มมากขึ้นเรื่อยๆ

ในปี 2023 มนุษย์ยังคงมีประสิทธิภาพเหนือกว่าทั้ง GPT-4 และโมเดลอื่นๆ ที่ทดสอบบนเกณฑ์มาตรฐาน ConceptARC อย่างมาก โมเดลเหล่านั้นได้คะแนน 60% ในเกือบทุกด้าน และ 77% ในหนึ่งด้าน ในขณะที่มนุษย์ได้คะแนน 91% ในทุกด้าน และ 97% ในหนึ่งด้าน^{[ 5 ]}อย่างไรก็ตาม การวิจัยในภายหลังในปี 2025 แสดงให้เห็นว่าตารางผลลัพธ์ที่สร้างโดยมนุษย์มีความแม่นยำเพียง 73% เท่านั้น ในขณะที่โมเดล AI ที่มีอยู่ในปีนั้นสามารถทำคะแนนได้สูงกว่า 77% ^{[ 6 ]}

ประวัติศาสตร์

การเพิ่ม การส่งเสริม หรือการจำกัดความก้าวหน้าของ AI มักจะทำได้โดยการควบคุมหรือเพิ่มปริมาณการประมวลผล^{[ 7 ]}^{[ 8 ]}

ผลการปฏิบัติงานในปัจจุบันในด้านต่างๆ

เกม	ปีแชมป์^{[ 9 ]}	สถานะทางกฎหมาย (log ₁₀ ) ^{[ 10 ]}	ความซับซ้อนของต้นไม้เกม (log ₁₀ ) ^{[ 10 ]}	เกมแห่งข้อมูลที่สมบูรณ์แบบ ?	อ้างอิง
หมากรุก (หมากฮอส)	พ.ศ. 2537	21	31	สมบูรณ์แบบ	^{[ 11 ]}
โอเทลโล (กลับด้าน)	พ.ศ. 2540	28	58	สมบูรณ์แบบ	^{[ 12 ]}
หมากรุก	พ.ศ. 2540	46	123	สมบูรณ์แบบ
ดิ้นรน	2006				^{[ 13 ]}
โชงิ	2017	71	226	สมบูรณ์แบบ	^{[ 14 ]}
ไป	2017	172	360	สมบูรณ์แบบ
โป๊กเกอร์โฮลด์เอ็มแบบ ไม่มีลิมิต 2 เพนนี	2017			ไม่สมบูรณ์	^{[ 15 ]}
สตาร์คราฟต์	-	270+		ไม่สมบูรณ์	^{[ 16 ]}
สตาร์คราฟท์ II	2019			ไม่สมบูรณ์	^{[ 17 ]}

มีหลายความสามารถที่มีประโยชน์ซึ่งสามารถอธิบายได้ว่าแสดงให้เห็นถึงรูปแบบหนึ่งของสติปัญญา สิ่งนี้ช่วยให้เข้าใจถึงความสำเร็จเชิงเปรียบเทียบของปัญญาประดิษฐ์ในด้านต่างๆ ได้ดียิ่งขึ้น

AI เช่นเดียวกับไฟฟ้าหรือเครื่องจักรไอน้ำ เป็นเทคโนโลยีอเนกประสงค์ยังไม่มีข้อสรุปที่แน่ชัดว่าจะระบุลักษณะงานใดที่ AI มักจะทำได้ดีกว่า^{[ 18 ]}บางเวอร์ชันของปรากฏการณ์ขัดแย้งของโมราเวคสังเกตว่ามนุษย์มีแนวโน้มที่จะทำได้ดีกว่าเครื่องจักรในด้านต่างๆ เช่น ความคล่องแคล่วทางกายภาพ ซึ่งเป็นเป้าหมายโดยตรงของการคัดเลือกโดยธรรมชาติ^{[ 19 ]}ในขณะที่โครงการต่างๆ เช่นAlphaZeroประสบความสำเร็จในการสร้างความรู้ของตนเองตั้งแต่เริ่มต้น โครงการเรียนรู้ของเครื่องจักรอื่นๆ อีกมากมายต้องการชุดข้อมูลการฝึกอบรมขนาดใหญ่^{[ 20 ]}^{[ 21 ]}นักวิจัยAndrew Ngได้เสนอแนะเป็น "กฎง่ายๆ ที่ไม่สมบูรณ์แบบอย่างยิ่ง" ว่า "เกือบทุกอย่างที่มนุษย์ทั่วไปสามารถทำได้ด้วยความคิดน้อยกว่าหนึ่งวินาที เราอาจสามารถทำให้เป็นอัตโนมัติได้โดยใช้ AI ในตอนนี้หรือในอนาคตอันใกล้นี้" ^{[ 22 ]}

เกมเป็นเกณฑ์มาตรฐานที่มีชื่อเสียงสำหรับการประเมินอัตราความก้าวหน้า เกมหลายเกมมีฐานผู้เล่นมืออาชีพจำนวนมากและระบบการจัดอันดับการแข่งขันที่เป็นที่ยอมรับAlphaGoได้ยุติยุคของเกณฑ์มาตรฐานเกมกระดานแบบคลาสสิกเมื่อปัญญาประดิษฐ์พิสูจน์ให้เห็นถึงความได้เปรียบในการแข่งขันเหนือมนุษย์ในปี 2016 โปรแกรมซอฟต์แวร์ AI AlphaGo ของ Deep Mind เอาชนะ Lee Sedolผู้เล่นโกะมืออาชีพที่ดีที่สุดในโลก^{[ 23 ]}เกมที่มีความรู้ไม่สมบูรณ์สร้างความท้าทายใหม่ให้กับ AI ในด้านทฤษฎีเกมความสำเร็จที่โดดเด่นที่สุดในด้านนี้สิ้นสุดลงด้วย ชัยชนะโป๊กเกอร์ของ Libratusในปี 2017 ^{[ 24 ]}^{[ 25 ]}อีสปอร์ตยังคงเป็นเกณฑ์มาตรฐานเพิ่มเติมFacebook AI, Deepmindและอื่นๆ ได้มีส่วนร่วมกับแฟ รนไชส์ วิดีโอเกมStarCraft ที่ได้รับความนิยม ^{[ 26 ]}^{[ 27 ]}

ผลลัพธ์โดยรวมของการทดสอบ AI สามารถแบ่งออกได้เป็นประเภทกว้างๆ ดังนี้:

ดีที่สุด : ไม่สามารถทำได้ดีกว่านี้อีกแล้ว (หมายเหตุ: คำตอบบางส่วนเหล่านี้ได้มาจากการแก้ปัญหาโดยมนุษย์)
เหนือมนุษย์ : ทำได้ดีกว่ามนุษย์ทุกคน
มนุษย์ชั้นสูง : ทำงานได้ดีกว่ามนุษย์ส่วนใหญ่
พาราฮิวแมน : ทำงานคล้ายกับมนุษย์ส่วนใหญ่
ต่ำกว่ามนุษย์ : ทำงานได้แย่กว่ามนุษย์ส่วนใหญ่

เหมาะสมที่สุด

เกมโอเอ็กซ์
คอนเน็กต์โฟร์ : 1988
หมากรุก (หรือที่เรียกว่าหมากฮอส 8x8): แก้ไขได้ไม่ดี (2007) ^{[ 28 ]}
ลูกบาศก์รูบิก : ส่วนใหญ่แก้ได้แล้ว (2010) ^{[ 29 ]}
โป๊กเกอร์โฮลด์เอ็มแบบเฮดส์อัพลิมิต : เหมาะสมทางสถิติในแง่ที่ว่า "การเล่นตลอดชีวิตของมนุษย์ไม่เพียงพอที่จะสร้างความสำคัญทางสถิติว่ากลยุทธ์นี้ไม่ใช่วิธีแก้ปัญหาที่แน่นอน" (2015) ^{[ 30 ]}

มนุษย์เหนือมนุษย์

โอเธลโล (aka reversi): ค. 2540 ^{[ 12 ]}
สแคร็บเบิล : ^{[ 31 ]}^{[ 32 ]} 2006 ^{[ 13 ]}
แบ็กแกมมอน : ประมาณปี 1995–2002 ^{[ 33 ]}^{[ 34 ]}
หมากรุก : ซูเปอร์คอมพิวเตอร์ (ประมาณปี 1997); คอมพิวเตอร์ส่วนบุคคล (ประมาณปี 2006); ^{[ 35 ]}โทรศัพท์มือถือ (ประมาณปี 2009); ^{[ 36 ]}คอมพิวเตอร์เอาชนะมนุษย์ + คอมพิวเตอร์ (ประมาณปี 2017) ^{[ 37 ]}
Jeopardy! :การตอบคำถามแม้ว่าเครื่องจะไม่ได้ใช้การจดจำเสียงพูด (2011)^{[ 38 ]}^{[ 39 ]}
อาริมา : 2015 ^{[ 40 ]}^{[ 41 ]}
โชกิ : ประมาณปี 2017 ^{[ 14 ]}
โก : 2017 ^{[ 42 ]}
โป๊กเกอร์โฮลเด็มแบบเฮดส์อัพไม่มีลิมิต: 2017 ^{[ 15 ]}
โป๊กเกอร์โฮลเด็มแบบไม่มีลิมิต 6 ผู้เล่น: 2019 ^{[ 43 ]}
แกรน ทัวริสโม สปอร์ต : 2022^{[ 44 ]}

มนุษย์ชั้นสูง

ปริศนาอักษรไขว้ : ประมาณปี 2012 ^{[ 45 ]}^{[ 46 ]}
ฟรีซิฟ : 2016^{[ 47 ]}
Dota 2 : 2018^{[ 48 ]}
การเล่นไพ่ บริดจ์ : จากการตรวจสอบในปี 2009 พบว่า "โปรแกรมที่ดีที่สุดกำลังบรรลุสถานะผู้เชี่ยวชาญในฐานะผู้เล่นไพ่ (บริดจ์)" โดยไม่นับการประมูล^{[ 49 ]}
StarCraft II : 2019^{[ 50 ]}
ไพ่นกกระจอก : 2019^{[ 51 ]}
Stratego : 2022^{[ 52 ]}
การทูตแบบไม่ใช้สื่อ: 2022 ^{[ 53 ]}
ฮานาบิ : 2022^{[ 54 ]}
การประมวลผลภาษาธรรมชาติ^{[ 55 ]}

พาราฮิวแมน

การรู้จำอักขระด้วยแสงสำหรับมาตรฐาน ISO 1073-1:1976และอักขระพิเศษที่คล้ายคลึงกัน
การจำแนกประเภทของภาพ^{[ 56 ]}
การจดจำลายมือ^{[ 57 ]}
การจดจำใบหน้า^{[ 58 ]}
การตอบคำถามด้วยภาพ^{[ 59 ]}
เกณฑ์มาตรฐานการอ่านเพื่อความเข้าใจภาษาอังกฤษ SQuAD 2.0 (2019) ^{[ 60 ]}
เกณฑ์มาตรฐานความเข้าใจภาษาอังกฤษ SuperGLUE (2020) ^{[ 60 ]}
ข้อสอบวิชาวิทยาศาสตร์ของโรงเรียนบางวิชา (2019) ^{[ 61 ]}
งานบางอย่างขึ้นอยู่กับเมทริกซ์ก้าวหน้าของ Raven ^{[ 62 ]}
เกม Atari 2600 จำนวนมาก (2015) ^{[ 63 ]}

ต่ำกว่ามนุษย์

การรู้จำอักขระด้วยแสงสำหรับข้อความที่พิมพ์ (ใกล้เคียงกับมนุษย์สำหรับข้อความที่พิมพ์ด้วยตัวพิมพ์ดีดอักษรละติน) ^{[ 64 ]}
การจดจำวัตถุ^{[ 65 ]}
งานด้านหุ่นยนต์ต่างๆ ที่อาจต้องอาศัยความก้าวหน้าทั้งในด้านฮาร์ดแวร์หุ่นยนต์และปัญญาประดิษฐ์ (AI) ซึ่งรวมถึง:
- การเคลื่อนที่แบบสองขาที่มั่นคง: หุ่นยนต์สองขาสามารถเดินได้ แต่มีความมั่นคงน้อยกว่าคนเดิน (ณ ปี 2017) ^{[ 66 ]}
- ฟุตบอลมนุษย์^{[ 67 ]}
การรู้จำเสียงพูด : "เกือบเทียบเท่าประสิทธิภาพของมนุษย์" (2017) ^{[ 68 ]}
ความสามารถในการอธิบายระบบการแพทย์ในปัจจุบันสามารถวินิจฉัยโรคบางอย่างได้ดี แต่ไม่สามารถอธิบายให้ผู้ใช้ทราบว่าเหตุใดจึงวินิจฉัยเช่นนั้น^{[ 69 ]}
การทดสอบความฉลาดเชิงไหลหลายรายการ (2020) ^{[ 62 ]}
ปัญหาการรับรู้ภาพ ของ Bongardเช่น เกณฑ์มาตรฐาน Bongard-LOGO (2020) ^{[ 62 ]}^{[ 70 ]}
เกณฑ์มาตรฐานการให้เหตุผลสามัญสำนึกเชิงภาพ (VCR) (ณ ปี 2020) ^{[ 71 ]}
การทำนายตลาดหุ้น : การรวบรวมและประมวลผลข้อมูลทางการเงินโดยใช้อัลกอริธึมการเรียนรู้ของเครื่อง^{[ 72 ]}
เกม Angry Birds ณ ปี 2020 ^{[ 73 ]}
งานต่างๆ ที่ยากต่อการแก้ไขหากปราศจากความรู้เชิงบริบท ได้แก่:
- การแปล^{[ 74 ]}
- การแยกความหมายของคำ^{[ 75 ]}

การทดสอบปัญญาประดิษฐ์ที่เสนอ

ในการทดสอบทัวริง อันโด่งดังของเขา อลัน ทัวริงได้เลือกภาษา ซึ่งเป็นคุณลักษณะที่กำหนดความเป็นมนุษย์มาเป็นพื้นฐาน^{[ 76 ]} ปัจจุบัน การทดสอบทัวริงถือว่าสามารถนำไปใช้ในทางที่ผิดได้มากเกินไปจนไม่สามารถใช้เป็นเกณฑ์มาตรฐานที่มีความหมายได้^{[ 77 ]}

การทดสอบ Feigenbaumซึ่งเสนอโดยผู้คิดค้นระบบผู้เชี่ยวชาญทดสอบความรู้และความเชี่ยวชาญของเครื่องจักรเกี่ยวกับเรื่องเฉพาะเรื่อง^{[ 78 ]}บทความโดยJim GrayจากMicrosoftในปี 2003 แนะนำให้ขยายการทดสอบ Turing ไปสู่การเข้าใจคำพูดการพูดและการจดจำวัตถุและพฤติกรรม^{[ 79 ]}

การทดสอบ "ปัญญาสากล" ที่เสนอมีเป้าหมายเพื่อเปรียบเทียบว่าเครื่องจักร มนุษย์ และแม้แต่สัตว์ที่ไม่ใช่มนุษย์ ทำงานได้ดีเพียงใดในชุดปัญหาที่ทั่วไปที่สุดเท่าที่จะเป็นไปได้ ในกรณีที่รุนแรงที่สุด ชุดทดสอบอาจประกอบด้วยปัญหาที่เป็นไปได้ทั้งหมด โดยถ่วงน้ำหนักด้วยความซับซ้อนของ Kolmogorovอย่างไรก็ตาม ชุดปัญหาเหล่านี้มักจะถูกครอบงำด้วยแบบฝึกหัดการจับคู่รูปแบบที่ด้อยคุณภาพ ซึ่ง AI ที่ปรับแต่งแล้วสามารถเหนือกว่าระดับประสิทธิภาพของมนุษย์ได้อย่างง่ายดาย^{[ 80 ]}^{[ 81 ]}^{[ 82 ]}^{[ 83 ]}^{[ 84 ]}

การสอบ

จากข้อมูลของOpenAIในปี 2023 GPT-4ได้คะแนนสูงในการสอบมาตรฐานและการสอบวิชาชีพหลายรายการ รวมถึงคะแนนอยู่ในระดับเปอร์เซ็นไทล์ที่ประมาณ 90 ในการสอบ Uniform Bar Exam , คะแนนระดับเปอร์เซ็นไทล์ที่ 89 ในส่วนคณิตศาสตร์ของการสอบ SAT , คะแนนระดับเปอร์เซ็นไทล์ที่ 93 ในการอ่านและการเขียนของ SAT, คะแนนระดับเปอร์เซ็นไทล์ที่ 54 ในส่วนการเขียนเชิงวิเคราะห์ของการสอบ GRE , คะแนนระดับเปอร์เซ็นไทล์ที่ 88 ในส่วนการให้เหตุผลเชิงปริมาณของ GRE และคะแนนระดับเปอร์เซ็นไทล์ที่ 99 ในส่วนการให้เหตุผลเชิงวาจาของ GRE นอกจากนี้ OpenAI ยังรายงานว่า GPT-4 ได้คะแนนอยู่ในระดับเปอร์เซ็นไทล์ที่ 99 ถึง 100 ใน การสอบรอบรองชนะเลิศของการ แข่งขัน USA Biology Olympiad ปี 2020 และได้คะแนนสูงสุดในการ สอบAPหลาย รายการ ^{[ 85 ]}

นักวิจัยอิสระพบในปี 2023 ว่า ChatGPT ซึ่งใช้GPT-3.5มีประสิทธิภาพ "อยู่ในระดับผ่านหรือใกล้เคียงกับเกณฑ์ผ่าน" ในทั้งสามส่วนของการสอบใบอนุญาตประกอบวิชาชีพแพทย์ของสหรัฐอเมริกา (USMLE) ซึ่งแสดงให้เห็นว่าแบบจำลองภาษาขนาดใหญ่สามารถบรรลุประสิทธิภาพในระดับผ่านเกณฑ์ในการประเมินความรู้ทางการแพทย์บางอย่างได้ แม้ว่าจะไม่มีการปรับแต่งเฉพาะด้านก็ตาม^{[ 86 ]}นอกจากนี้ยังมีรายงานว่า GPT-3.5 ได้รับเกรดต่ำแต่ผ่านเกณฑ์ในการสอบสำหรับหลักสูตรนิติศาสตร์สี่หลักสูตรที่^{มหาวิทยาลัย}มินนิโซตา^[⁸⁵ ]

การศึกษาเพิ่มเติมรายงานว่า GPT-4 ผ่านการสอบบอร์ดรังสีวิทยาแบบใช้ข้อความ^{[ 87 ]}การศึกษารังสีวิทยาในภายหลังในปี 2024–2025 ยังคงพบว่าโมเดลใหม่มีประสิทธิภาพดีในคำถามแบบสอบ รวมถึงการสอบรังสีวิทยาแบบใช้ภาพและการสอบรังสีวิทยาสำหรับนักศึกษา ในขณะเดียวกันก็สังเกตเห็นจุดอ่อนและความแปรปรวนที่ยังคงมีอยู่ตามประเภทของงาน^{[ 88 ]}^{[ 89 ]}

จากการศึกษาเปรียบเทียบในปี 2025 พบว่าประสิทธิภาพในการสอบทางการแพทย์มีความแตกต่างกันอย่างมากในแต่ละโมเดล แทนที่จะเป็นระดับ "ผ่าน" ที่สม่ำเสมอ การศึกษาเปรียบเทียบมาตรฐานในปี 2025 เกี่ยวกับคำถามตัวอย่าง USMLE ที่เผยแพร่สู่สาธารณะรายงานว่าโมเดลใหม่ๆ เช่น ChatGPT และ DeepSeek มีประสิทธิภาพเหนือกว่าคู่แข่งบางรุ่น แต่ก็ยังมีข้อผิดพลาดที่ชัดเจนและยังคงแสดงให้เห็นถึงข้อจำกัดในการให้เหตุผลทางคลินิกและความเข้าใจเฉพาะด้าน^{[ 90 ]}

เกณฑ์มาตรฐานทางกฎหมายฉบับใหม่ที่เผยแพร่ในปี 2025 ชี้ให้เห็นเช่นกันว่าประสิทธิภาพการสอบยังคงไม่สม่ำเสมอ เกณฑ์มาตรฐาน LEXam ซึ่งสร้างขึ้นจากข้อสอบกฎหมาย 340 ชุดในหลักสูตรโรงเรียนกฎหมาย 116 หลักสูตร พบว่าการให้เหตุผลทางกฎหมายแบบยาวๆ ยังคงเป็นเรื่องท้าทายสำหรับแบบจำลองภาษาขนาดใหญ่ในปัจจุบัน โดยเฉพาะอย่างยิ่งในคำถามปลายเปิดที่ต้องใช้การวิเคราะห์แบบมีโครงสร้างหลายขั้นตอน^{[ 91 ]}

ภายในปี 2026 งานวิจัยที่กว้างขึ้นเกี่ยวกับการทดสอบทางวิชาการระดับผู้เชี่ยวชาญเน้นย้ำว่าเกณฑ์มาตรฐานและงานทดสอบรูปแบบเก่าๆ จำนวนมากเริ่มอิ่มตัวแล้ว บทความ ในวารสาร Nature ปี 2026 ที่แนะนำการสอบครั้งสุดท้ายของมนุษยชาติได้โต้แย้งว่าระบบที่ทันสมัยที่สุดได้มีความแม่นยำเกิน 90% ในเกณฑ์มาตรฐานยอดนิยมหลายรายการ ในขณะที่ยังคงแสดงความแม่นยำต่ำในเกณฑ์มาตรฐานที่ยากกว่าซึ่งออกแบบมาเพื่อทดสอบขอบเขตความรู้ของผู้เชี่ยวชาญ^{[ 92 ]} Stanford HAI ยังเตือนในปี 2025 ว่าประสิทธิภาพของเกณฑ์มาตรฐานและการสอบไม่ควรได้รับการปฏิบัติเทียบเท่ากับประสิทธิภาพในโลกแห่งความเป็นจริงที่เชื่อถือได้หรือการตัดสินใจที่น่าเชื่อถือ^{[ 93 ]}

การแข่งขัน

การแข่งขันและรางวัลมากมาย เช่นImagenet Challengeส่งเสริมการวิจัยด้านปัญญาประดิษฐ์ ขอบเขตการแข่งขันที่พบบ่อยที่สุด ได้แก่ ปัญญาประดิษฐ์ทั่วไป พฤติกรรมการสนทนา การขุดข้อมูลรถยนต์หุ่นยนต์และฟุตบอลหุ่นยนต์ รวมถึงเกมทั่วไป^{[ 94 ]}

การคาดการณ์ในอดีตและปัจจุบัน

ผลสำรวจความคิดเห็นของผู้เชี่ยวชาญเมื่อราวปี 2016 ซึ่งจัดทำโดยKatja GraceจากFuture of Humanity Instituteและผู้ร่วมงาน ได้ให้ค่าประมาณมัธยฐานที่ 3 ปีสำหรับการแข่งขันAngry Birds , 4 ปีสำหรับ World Series of Poker และ 6 ปีสำหรับStarCraftสำหรับงานที่เป็นอัตวิสัยมากกว่า ผลสำรวจให้เวลา 6 ปีสำหรับการพับผ้าเช่นเดียวกับคนงานทั่วไป 7-10 ปีสำหรับการตอบคำถามที่ "สามารถค้นหาได้ง่ายๆ ใน Google" อย่างเชี่ยวชาญ 8 ปีสำหรับการถอดเสียงพูดโดยเฉลี่ย 9 ปีสำหรับการทำธุรกรรมธนาคารทางโทรศัพท์โดยเฉลี่ย และ 11 ปีสำหรับการแต่งเพลงอย่างเชี่ยวชาญ แต่มากกว่า 30 ปีสำหรับการเขียน หนังสือขายดี ของ New York Timesหรือการชนะการแข่งขันคณิตศาสตร์ Putnam ^{[ 95 ]}^{[ 96 ]}^{[ 97 ]}

การพัฒนาที่ตามมาในช่วงปลายทศวรรษ 2010 และต้นทศวรรษ 2020 แสดงให้เห็นถึงความก้าวหน้าอย่างรวดเร็วในงานมาตรฐานหลายอย่าง โดยเฉพาะอย่างยิ่งในเกมและโดเมนปัญหาที่มีโครงสร้าง ระบบต่างๆ เช่น AlphaGo, AlphaZero และโมเดลภาษาขนาดใหญ่ในภายหลัง บรรลุหรือเกินประสิทธิภาพระดับมนุษย์ในเกณฑ์มาตรฐานที่กำหนดไว้หลายประการ^{[ 98 ]}^{[ 99 ]}^{[ 100 ]}

ในขณะเดียวกัน นักวิจัยได้ตั้งข้อสังเกตว่าประสิทธิภาพในเกณฑ์มาตรฐานที่แคบสามารถถึงจุดอิ่มตัวได้เมื่อระบบได้รับการปรับให้เหมาะสมสำหรับงานเฉพาะ และความสำเร็จในการประเมินดังกล่าวไม่จำเป็นต้องสามารถนำไปใช้กับสติปัญญาในรูปแบบที่กว้างขึ้นได้^{[ 101 ]}

หมากรุก

AI เอาชนะแกรนด์มาสเตอร์ในการแข่งขันอย่างเป็นทางการเป็นครั้งแรกในปี 1988; ต่อมาเปลี่ยนชื่อเป็นDeep Blueและเอาชนะแชมป์โลกหมากรุกที่เป็นมนุษย์ในปี 1997 (ดูDeep Blue ปะทะ Garry Kasparov ) ^{[ 102 ]}

ในช่วงทศวรรษ 2010 โปรแกรมหมากรุกที่ทำงานบนฮาร์ดแวร์สำหรับผู้บริโภคได้แซงหน้าผู้เล่นระดับสูงสุดของมนุษย์ไปมาก ระบบที่ใช้โครงข่ายประสาทเทียม เช่น AlphaZero แสดงให้เห็นว่าประสิทธิภาพเหนือมนุษย์สามารถทำได้ผ่านการเรียนรู้แบบเสริมแรงจากการเล่นด้วยตนเองโดยไม่ต้องพึ่งพาข้อมูลจากผู้เชี่ยวชาญที่เป็นมนุษย์^{[ 103 ]}โปรแกรมหมากรุกสมัยใหม่ถูกนำมาใช้กันอย่างแพร่หลายในการเตรียมการและการวิเคราะห์ และการเล่นของมนุษย์โดยปราศจากความช่วยเหลือไม่สามารถแข่งขันกับระบบคอมพิวเตอร์ระดับสูงสุดได้อีกต่อไป

การคาดการณ์ว่าเมื่อใดที่คอมพิวเตอร์จะเก่งกว่ามนุษย์ในการเล่นหมากรุก
มีการคาดการณ์ประจำปี	ปีที่คาดการณ์	จำนวนปี	ตัวทำนาย	แหล่งข้อมูลร่วมสมัย
1957	ปี 1967 หรือก่อนหน้านั้น	10 หรือน้อยกว่า	เฮอร์เบิร์ต เอ. ไซมอนนักเศรษฐศาสตร์^{[ 104 ]}
1990	ปี 2000 หรือเร็วกว่านั้น	10 หรือน้อยกว่า	เรย์ เคิร์ซไวล์นักอนาคตศาสตร์	ยุคของเครื่องจักรอัจฉริยะ^{[ 105 ]}

ไป

AlphaGoเอาชนะแชมป์โกะยุโรปในเดือนตุลาคม 2015 และเอาชนะLee Sedolในเดือนมีนาคม 2016 ซึ่งเป็นหนึ่งในผู้เล่นโกะระดับโลก (ดูAlphaGo ปะทะ Lee Sedol ) ตามรายงานของScientific Americanและแหล่งข้อมูลอื่นๆ ผู้สังเกตการณ์ส่วนใหญ่คาดว่าประสิทธิภาพการเล่นโกะของคอมพิวเตอร์ที่เหนือมนุษย์จะเกิดขึ้นในอีกอย่างน้อยหนึ่งทศวรรษ^{[ 106 ]}^{[ 107 ]}^{[ 108 ]}

ระบบต่อมา เช่น AlphaGo Zero และ AlphaZero แสดงให้เห็นว่าประสิทธิภาพเหนือมนุษย์สามารถทำได้โดยไม่ต้องใช้ข้อมูลการฝึกฝนจากมนุษย์ โดยใช้การเรียนรู้แบบเสริมแรงจากการเล่นด้วยตนเอง^{[ 109 ]}ในช่วงปลายทศวรรษ 2010 โปรแกรมโกะคอมพิวเตอร์ได้แซงหน้าแชมป์เปี้ยนของมนุษย์ไปมาก และโกะก็หยุดเป็นมาตรฐานสำคัญสำหรับการวิจัย AI

คาดการณ์ว่าเมื่อใดที่คอมพิวเตอร์จะเหนือกว่ามนุษย์ในการเล่นโกะ
มีการคาดการณ์ประจำปี	ปีที่คาดการณ์	จำนวนปี	ตัวทำนาย	สังกัด	แหล่งข้อมูลร่วมสมัย
พ.ศ. 2540	ปี 2100 หรือหลังจากนั้น	103 หรือมากกว่า	ปีเอต ฮัตต์ นักฟิสิกส์และแฟนเกมโกะ	สถาบันเพื่อการศึกษาขั้นสูง	นิวยอร์กไทมส์^{[ 110 ]}^{[ 111 ]}
2007	ปี 2017 หรือเร็วกว่านั้น	10 หรือน้อยกว่า	เฟิง-ซุง สวี หัวหน้าทีม ดี พบลู	ไมโครซอฟต์ รีเสิร์ช เอเชีย	IEEE Spectrum ^{[ 112 ]}^{[ 113 ]}
2014	2024	10	เรมี คูลอมโปรแกรมเมอร์ Computer Go	เครซี่สโตน	ต่อสาย^{[ 113 ]}^{[ 114 ]}

ปัญญาประดิษฐ์ทั่วไประดับมนุษย์ (AGI)

เฮอร์เบิร์ต เอ. ไซมอนผู้บุกเบิกด้าน AI และนักเศรษฐศาสตร์ได้ทำนายไว้อย่างไม่ถูกต้องในปี 1965 ว่า "ภายในยี่สิบปี เครื่องจักรจะสามารถทำงานใดๆ ก็ตามที่มนุษย์ทำได้" ในทำนองเดียวกัน ในปี 1970 มาร์วิน มินสกีได้เขียนไว้ว่า "ภายในหนึ่งชั่วอายุคน... ปัญหาของการสร้างปัญญาประดิษฐ์จะได้รับการแก้ไขไปมาก" ^{[ 115 ]}

ผลสำรวจสี่ครั้งที่จัดทำขึ้นในปี 2012 และ 2013 ชี้ให้เห็นว่า ค่ามัธยฐานของการ ประมาณการในหมู่ผู้เชี่ยวชาญเกี่ยวกับช่วงเวลาที่ AGI จะมาถึงคือปี 2040 ถึง 2050 ขึ้นอยู่กับผลสำรวจ^{[ 116 ]}^{[ 117 ]}

ผลสำรวจของ Grace ในช่วงประมาณปี 2016 พบว่าผลลัพธ์แตกต่างกันไปขึ้นอยู่กับวิธีการตั้งคำถาม ผู้ตอบแบบสอบถามที่ถูกถามให้ประเมินว่า "เมื่อใดที่เครื่องจักรจะสามารถทำงานทุกอย่างได้ดีกว่าและถูกกว่าคนงาน" ให้คำตอบเฉลี่ยที่ 45 ปี และมีโอกาส 10% ที่จะเกิดขึ้นภายใน 9 ปี ในขณะที่ผู้ตอบแบบสอบถามคนอื่นๆ ที่ถูกถามให้ประเมินว่า "เมื่อใดที่ทุกอาชีพจะสามารถใช้ระบบอัตโนมัติได้อย่างสมบูรณ์ นั่นคือ เมื่อใดที่เครื่องจักรสามารถถูกสร้างขึ้นเพื่อทำงานนั้นได้ดีกว่าและถูกกว่าคนงาน" ให้คำตอบเฉลี่ยที่ 122 ปี และมีโอกาส 10% ที่จะเกิดขึ้นภายใน 20 ปี คำตอบเฉลี่ยสำหรับ "เมื่อใดที่นักวิจัย AI จะสามารถใช้ระบบอัตโนมัติได้อย่างสมบูรณ์" อยู่ที่ประมาณ 90 ปี ไม่พบความเชื่อมโยงระหว่างความอาวุโสและการมองโลกในแง่ดี แต่โดยเฉลี่ยแล้วนักวิจัยชาวเอเชียมีความมองโลกในแง่ดีมากกว่านักวิจัยชาวอเมริกาเหนือ ชาวเอเชียคาดการณ์โดยเฉลี่ยที่ 30 ปีสำหรับ "การทำงานทุกอย่างให้สำเร็จ" เมื่อเทียบกับ 74 ปีที่ชาวอเมริกาเหนือคาดการณ์ไว้^{[ 95 ]}^{[ 96 ]}^{[ 97 ]}

การสำรวจขนาดใหญ่ของนักวิจัย 2,778 คนที่ตีพิมพ์ผลงานในวารสาร AI ชั้นนำ ซึ่งดำเนินการในปี 2023 และเผยแพร่ในปี 2025 พบว่าช่วงเวลาสำหรับสิ่งที่เรียกว่า "ปัญญาประดิษฐ์ระดับสูง" นั้นสั้นกว่า ในการสำรวจนั้น การคาดการณ์โดยรวมระบุว่ามีโอกาส 10% ที่เครื่องจักรจะทำงานได้ดีกว่ามนุษย์โดยปราศจากความช่วยเหลือในทุกงานภายในปี 2027 และมีโอกาส 50% ภายในปี 2047 การสำรวจเดียวกันนี้ประเมินว่าการทำงานอัตโนมัติอย่างเต็มรูปแบบของอาชีพมนุษย์ทั้งหมดจะมีโอกาส 10% ภายในปี 2037 และมีโอกาส 50% ภายในปี 2116 ^{[ 118 ]}

แม้ว่ากรอบเวลาจะสั้นลงเรื่อยๆ ในการสำรวจบางส่วน แต่ก็ยังไม่มีข้อสรุปในช่วงปลายปี 2025 และต้นปี 2026 ว่า AGI จะเกิดขึ้นในเร็วๆ นี้ ในการคาดการณ์ของ Stanford HAI สำหรับปี 2026 ผู้อำนวยการร่วมJames Landayกล่าวว่า "จะไม่มี AGI ในปีนี้" ^{[ 119 ]}

ประมาณการเวลาที่ AGI จะมาถึง
มีการคาดการณ์ประจำปี	ปีที่คาดการณ์	จำนวนปี	ตัวทำนาย	แหล่งข้อมูลร่วมสมัย
พ.ศ. 2508	ปี 1985 หรือก่อนหน้านั้น	20 หรือน้อยกว่า	เฮอร์เบิร์ต เอ. ไซมอน	รูปแบบของระบบอัตโนมัติสำหรับผู้ชายและการจัดการ^{[ 115 ]}^{[ 120 ]}
พ.ศ. 2536	ปี 2023 หรือเร็วกว่านั้น	30 หรือน้อยกว่า	เวอร์เนอร์ วิงจ์นักเขียนนิยายวิทยาศาสตร์	"ภาวะเอกภาพทางเทคโนโลยีที่กำลังจะมาถึง" ^{[ 121 ]}
พ.ศ. 2538	ปี 2040 หรือเร็วกว่านั้น	อายุ 45 ปีหรือน้อยกว่า	ฮันส์ โมราเวคนักวิจัยด้านหุ่นยนต์	ต่อสาย^{[ 122 ]}
2008	ไม่เคย / อนาคตอันไกลโพ้น^{[หมายเหตุ 1 ]}		กอร์ดอน อี. มัวร์ผู้คิดค้นกฎของมัวร์	IEEE Spectrum ^{[ 123 ]}
2017	2029	12	เรย์ เคิร์ซไวล์	การสัมภาษณ์^{[ 124 ]}

ดูเพิ่มเติม

หมายเหตุ

^ IEEE Spectrumระบุว่ามัวร์กล่าวทั้ง "ไม่มีทาง" และ "ฉันไม่เชื่อว่าเรื่องแบบนี้จะเกิดขึ้นได้ อย่างน้อยก็ในอีกนาน"

ลิงก์ภายนอก

ฐานข้อมูล MIRI เกี่ยวกับการคาดการณ์ปัญญาประดิษฐ์ทั่วไป (AGI)

[123] IEEE Spectrumระบุว่ามัวร์กล่าวทั้ง "ไม่มีทาง" และ "ฉันไม่เชื่อว่าเรื่องแบบนี้จะเกิดขึ้นได้ อย่างน้อยก็ในอีกนาน"

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 13 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

[ 44 ]

[ 45 ]

[ 46 ]

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

[ 52 ]

[ 53 ]

[ 54 ]

[ 55 ]

[ 56 ]

[ 57 ]

[ 58 ]

[ 59 ]

[ 60 ]

[ 61 ]

[ 62 ]

[ 63 ]

[ 64 ]

[ 65 ]

[ 66 ]

[ 67 ]

[ 68 ]

[ 69 ]

[ 70 ]

[ 71 ]

[ 72 ]

[ 73 ]

[ 74 ]

[ 75 ]

[ 76 ]

[ 77 ]

[ 78 ]

[ 79 ]

[ 80 ]

[ 81 ]

[ 82 ]

[ 83 ]

[ 84 ]

[ 85 ]

[ 86 ]

[ 87 ]

[ 88 ]

[ 89 ]

[ 90 ]

[ 91 ]

[ 92 ]

[ 93 ]

[ 94 ]

[ 95 ]

[ 96 ]

[ 97 ]

[ 98 ]

[ 99 ]

[ 100 ]

[ 101 ]

[ 102 ]

[ 103 ]

[ 104 ]