อ่าน 20 นาที
ความก้าวหน้าในปัญญาประดิษฐ์
ความก้าวหน้าในปัญญาประดิษฐ์ ( AI ) คือความก้าวหน้า ความสำเร็จ และความก้าวหน้าครั้งสำคัญที่เกิดขึ้นในสาขา ปัญญาประดิษฐ์ ตลอดช่วงเวลาที่ผ่านมา AI เป็นสาขาหนึ่งของ...
ความก้าวหน้าในปัญญาประดิษฐ์
| ส่วนหนึ่งของชุดบทความเกี่ยวกับ |
| ปัญญาประดิษฐ์ (AI) |
|---|

ความก้าวหน้าในปัญญาประดิษฐ์ ( AI ) คือความก้าวหน้า ความสำเร็จ และความก้าวหน้าครั้งสำคัญที่เกิดขึ้นในสาขาปัญญาประดิษฐ์ตลอดช่วงเวลาที่ผ่านมา AI เป็นสาขาหนึ่งของวิทยาศาสตร์คอมพิวเตอร์ที่มุ่งสร้างเครื่องจักรและระบบที่สามารถทำงานที่โดยทั่วไปแล้วต้องใช้สติปัญญาของมนุษย์ การประยุกต์ใช้ AI ได้ถูกนำไปใช้ในหลากหลายสาขา รวมถึงการวินิจฉัยทางการแพทย์การเงินหุ่นยนต์กฎหมายวิดีโอเกมการเกษตรและการ ค้นพบทางวิทยาศาสตร์ สังคมโดยรวมคาดหวังว่าปัญญาประดิษฐ์จะเป็นปัจจัยสำคัญในอีก ไม่กี่ปีข้างหน้าเนื่องจากศักยภาพของมัน อย่างไรก็ตาม การประยุกต์ใช้ AI จำนวนมากไม่ได้ถูกมองว่าเป็น AI: "AI ที่ล้ำสมัยจำนวนมากได้ถูกนำไปใช้ในแอปพลิเคชันทั่วไป โดยมักจะไม่ได้ถูกเรียกว่า AI เพราะเมื่อสิ่งใดสิ่งหนึ่งมีประโยชน์และแพร่หลายมากพอแล้ว ก็จะไม่ถูกเรียกว่า AI อีกต่อไป " [ 1 ] [ 2 ]
"แอปพลิเคชัน AI หลายพันรายการถูกฝังลึกอยู่ในโครงสร้างพื้นฐานของทุกอุตสาหกรรม" [ 3 ]ในช่วงปลายทศวรรษ 1990 และต้นทศวรรษ 2000 เทคโนโลยี AI ได้ถูกนำมาใช้กันอย่างแพร่หลายในฐานะองค์ประกอบของระบบขนาดใหญ่[ 3 ] [ 4 ]แต่ในขณะนั้นสาขานี้แทบจะไม่ได้รับการยกย่องสำหรับความสำเร็จเหล่านี้เลย
Kaplanและ Haenlein ได้แบ่งปัญญาประดิษฐ์ออกเป็นสามขั้นตอนวิวัฒนาการ:
- ปัญญาประดิษฐ์แบบจำกัดขอบเขต – ปัญญาประดิษฐ์ที่สามารถทำงานได้เฉพาะด้านเท่านั้น;
- ปัญญาประดิษฐ์ทั่วไป (Artificial General Intelligence) – ปัญญาประดิษฐ์ที่มีความสามารถในหลายด้าน และสามารถแก้ไขปัญหาได้ด้วยตนเอง แม้ว่าปัญหาเหล่านั้นจะไม่ได้ถูกออกแบบมาเพื่อแก้ไขก็ตาม
- ปัญญาประดิษฐ์ขั้นสูง – AI ที่สามารถทำงานทั่วไปได้ รวมถึงความคิดสร้างสรรค์ ทาง วิทยาศาสตร์ทักษะทางสังคมและภูมิปัญญาทั่วไป[ 2 ]
เพื่อให้สามารถเปรียบเทียบกับประสิทธิภาพของมนุษย์ได้ ปัญญาประดิษฐ์สามารถประเมินได้จากปัญหาที่มีข้อจำกัดและกำหนดไว้อย่างชัดเจน การทดสอบดังกล่าวเรียกว่าการทดสอบทัวริงโดยผู้เชี่ยวชาญเฉพาะด้านนอกจากนี้ ปัญหาขนาดเล็กยังให้เป้าหมายที่บรรลุได้ง่ายกว่า และมีผลลัพธ์เชิงบวกเพิ่มมากขึ้นเรื่อยๆ
ในปี 2023 มนุษย์ยังคงมีประสิทธิภาพเหนือกว่าทั้ง GPT-4 และโมเดลอื่นๆ ที่ทดสอบบนเกณฑ์มาตรฐาน ConceptARC อย่างมาก โมเดลเหล่านั้นได้คะแนน 60% ในเกือบทุกด้าน และ 77% ในหนึ่งด้าน ในขณะที่มนุษย์ได้คะแนน 91% ในทุกด้าน และ 97% ในหนึ่งด้าน[ 5 ]อย่างไรก็ตาม การวิจัยในภายหลังในปี 2025 แสดงให้เห็นว่าตารางผลลัพธ์ที่สร้างโดยมนุษย์มีความแม่นยำเพียง 73% เท่านั้น ในขณะที่โมเดล AI ที่มีอยู่ในปีนั้นสามารถทำคะแนนได้สูงกว่า 77% [ 6 ]
ประวัติศาสตร์
การเพิ่ม การส่งเสริม หรือการจำกัดความก้าวหน้าของ AI มักจะทำได้โดยการควบคุมหรือเพิ่มปริมาณการประมวลผล[ 7 ] [ 8 ]
ผลการปฏิบัติงานในปัจจุบันในด้านต่างๆ
| เกม | ปีแชมป์[ 9 ] | สถานะทางกฎหมาย (log 10 ) [ 10 ] | ความซับซ้อนของต้นไม้เกม (log 10 ) [ 10 ] | เกมแห่งข้อมูลที่สมบูรณ์แบบ ? | อ้างอิง |
|---|---|---|---|---|---|
| หมากรุก (หมากฮอส) | พ.ศ. 2537 | 21 | 31 | สมบูรณ์แบบ | [ 11 ] |
| โอเทลโล (กลับด้าน) | พ.ศ. 2540 | 28 | 58 | สมบูรณ์แบบ | [ 12 ] |
| หมากรุก | พ.ศ. 2540 | 46 | 123 | สมบูรณ์แบบ | |
| ดิ้นรน | 2006 | [ 13 ] | |||
| โชงิ | 2017 | 71 | 226 | สมบูรณ์แบบ | [ 14 ] |
| ไป | 2017 | 172 | 360 | สมบูรณ์แบบ | |
| โป๊กเกอร์โฮลด์เอ็มแบบไม่มีลิมิต 2 เพนนี | 2017 | ไม่สมบูรณ์ | [ 15 ] | ||
| สตาร์คราฟต์ | - | 270+ | ไม่สมบูรณ์ | [ 16 ] | |
| สตาร์คราฟท์ II | 2019 | ไม่สมบูรณ์ | [ 17 ] |
มีหลายความสามารถที่มีประโยชน์ซึ่งสามารถอธิบายได้ว่าแสดงให้เห็นถึงรูปแบบหนึ่งของสติปัญญา สิ่งนี้ช่วยให้เข้าใจถึงความสำเร็จเชิงเปรียบเทียบของปัญญาประดิษฐ์ในด้านต่างๆ ได้ดียิ่งขึ้น
AI เช่นเดียวกับไฟฟ้าหรือเครื่องจักรไอน้ำ เป็นเทคโนโลยีอเนกประสงค์ยังไม่มีข้อสรุปที่แน่ชัดว่าจะระบุลักษณะงานใดที่ AI มักจะทำได้ดีกว่า[ 18 ]บางเวอร์ชันของปรากฏการณ์ขัดแย้งของโมราเวคสังเกตว่ามนุษย์มีแนวโน้มที่จะทำได้ดีกว่าเครื่องจักรในด้านต่างๆ เช่น ความคล่องแคล่วทางกายภาพ ซึ่งเป็นเป้าหมายโดยตรงของการคัดเลือกโดยธรรมชาติ[ 19 ]ในขณะที่โครงการต่างๆ เช่นAlphaZeroประสบความสำเร็จในการสร้างความรู้ของตนเองตั้งแต่เริ่มต้น โครงการเรียนรู้ของเครื่องจักรอื่นๆ อีกมากมายต้องการชุดข้อมูลการฝึกอบรมขนาดใหญ่[ 20 ] [ 21 ]นักวิจัยAndrew Ngได้เสนอแนะเป็น "กฎง่ายๆ ที่ไม่สมบูรณ์แบบอย่างยิ่ง" ว่า "เกือบทุกอย่างที่มนุษย์ทั่วไปสามารถทำได้ด้วยความคิดน้อยกว่าหนึ่งวินาที เราอาจสามารถทำให้เป็นอัตโนมัติได้โดยใช้ AI ในตอนนี้หรือในอนาคตอันใกล้นี้" [ 22 ]
เกมเป็นเกณฑ์มาตรฐานที่มีชื่อเสียงสำหรับการประเมินอัตราความก้าวหน้า เกมหลายเกมมีฐานผู้เล่นมืออาชีพจำนวนมากและระบบการจัดอันดับการแข่งขันที่เป็นที่ยอมรับAlphaGoได้ยุติยุคของเกณฑ์มาตรฐานเกมกระดานแบบคลาสสิกเมื่อปัญญาประดิษฐ์พิสูจน์ให้เห็นถึงความได้เปรียบในการแข่งขันเหนือมนุษย์ในปี 2016 โปรแกรมซอฟต์แวร์ AI AlphaGo ของ Deep Mind เอาชนะ Lee Sedolผู้เล่นโกะมืออาชีพที่ดีที่สุดในโลก[ 23 ]เกมที่มีความรู้ไม่สมบูรณ์สร้างความท้าทายใหม่ให้กับ AI ในด้านทฤษฎีเกมความสำเร็จที่โดดเด่นที่สุดในด้านนี้สิ้นสุดลงด้วย ชัยชนะโป๊กเกอร์ของ Libratusในปี 2017 [ 24 ] [ 25 ]อีสปอร์ตยังคงเป็นเกณฑ์มาตรฐานเพิ่มเติมFacebook AI, Deepmindและอื่นๆ ได้มีส่วนร่วมกับแฟ รนไชส์ วิดีโอเกมStarCraft ที่ได้รับความนิยม [ 26 ] [ 27 ]
ผลลัพธ์โดยรวมของการทดสอบ AI สามารถแบ่งออกได้เป็นประเภทกว้างๆ ดังนี้:
- ดีที่สุด : ไม่สามารถทำได้ดีกว่านี้อีกแล้ว (หมายเหตุ: คำตอบบางส่วนเหล่านี้ได้มาจากการแก้ปัญหาโดยมนุษย์)
- เหนือมนุษย์ : ทำได้ดีกว่ามนุษย์ทุกคน
- มนุษย์ชั้นสูง : ทำงานได้ดีกว่ามนุษย์ส่วนใหญ่
- พาราฮิวแมน : ทำงานคล้ายกับมนุษย์ส่วนใหญ่
- ต่ำกว่ามนุษย์ : ทำงานได้แย่กว่ามนุษย์ส่วนใหญ่
เหมาะสมที่สุด
- เกมโอเอ็กซ์
- คอนเน็กต์โฟร์ : 1988
- หมากรุก (หรือที่เรียกว่าหมากฮอส 8x8): แก้ไขได้ไม่ดี (2007) [ 28 ]
- ลูกบาศก์รูบิก : ส่วนใหญ่แก้ได้แล้ว (2010) [ 29 ]
- โป๊กเกอร์โฮลด์เอ็มแบบเฮดส์อัพลิมิต : เหมาะสมทางสถิติในแง่ที่ว่า "การเล่นตลอดชีวิตของมนุษย์ไม่เพียงพอที่จะสร้างความสำคัญทางสถิติว่ากลยุทธ์นี้ไม่ใช่วิธีแก้ปัญหาที่แน่นอน" (2015) [ 30 ]
มนุษย์เหนือมนุษย์
- โอเธลโล (aka reversi): ค. 2540 [ 12 ]
- สแคร็บเบิล : [ 31 ] [ 32 ] 2006 [ 13 ]
- แบ็กแกมมอน : ประมาณปี 1995–2002 [ 33 ] [ 34 ]
- หมากรุก : ซูเปอร์คอมพิวเตอร์ (ประมาณปี 1997); คอมพิวเตอร์ส่วนบุคคล (ประมาณปี 2006); [ 35 ]โทรศัพท์มือถือ (ประมาณปี 2009); [ 36 ]คอมพิวเตอร์เอาชนะมนุษย์ + คอมพิวเตอร์ (ประมาณปี 2017) [ 37 ]
- Jeopardy! :การตอบคำถามแม้ว่าเครื่องจะไม่ได้ใช้การจดจำเสียงพูด (2011) [ 38 ] [ 39 ]
- อาริมา : 2015 [ 40 ] [ 41 ]
- โชกิ : ประมาณปี 2017 [ 14 ]
- โก : 2017 [ 42 ]
- โป๊กเกอร์โฮลเด็มแบบเฮดส์อัพไม่มีลิมิต: 2017 [ 15 ]
- โป๊กเกอร์โฮลเด็มแบบไม่มีลิมิต 6 ผู้เล่น: 2019 [ 43 ]
- แกรน ทัวริสโม สปอร์ต : 2022 [ 44 ]
มนุษย์ชั้นสูง
- ปริศนาอักษรไขว้ : ประมาณปี 2012 [ 45 ] [ 46 ]
- ฟรีซิฟ : 2016 [ 47 ]
- Dota 2 : 2018 [ 48 ]
- การเล่นไพ่ บริดจ์ : จากการตรวจสอบในปี 2009 พบว่า "โปรแกรมที่ดีที่สุดกำลังบรรลุสถานะผู้เชี่ยวชาญในฐานะผู้เล่นไพ่ (บริดจ์)" โดยไม่นับการประมูล[ 49 ]
- StarCraft II : 2019 [ 50 ]
- ไพ่นกกระจอก : 2019 [ 51 ]
- Stratego : 2022 [ 52 ]
- การทูตแบบไม่ใช้สื่อ: 2022 [ 53 ]
- ฮานาบิ : 2022 [ 54 ]
- การประมวลผลภาษาธรรมชาติ[ 55 ]
พาราฮิวแมน
- การรู้จำอักขระด้วยแสงสำหรับมาตรฐาน ISO 1073-1:1976และอักขระพิเศษที่คล้ายคลึงกัน
- การจำแนกประเภทของภาพ[ 56 ]
- การจดจำลายมือ[ 57 ]
- การจดจำใบหน้า[ 58 ]
- การตอบคำถามด้วยภาพ[ 59 ]
- เกณฑ์มาตรฐานการอ่านเพื่อความเข้าใจภาษาอังกฤษ SQuAD 2.0 (2019) [ 60 ]
- เกณฑ์มาตรฐานความเข้าใจภาษาอังกฤษ SuperGLUE (2020) [ 60 ]
- ข้อสอบวิชาวิทยาศาสตร์ของโรงเรียนบางวิชา (2019) [ 61 ]
- งานบางอย่างขึ้นอยู่กับเมทริกซ์ก้าวหน้าของ Raven [ 62 ]
- เกม Atari 2600 จำนวนมาก (2015) [ 63 ]
ต่ำกว่ามนุษย์
- การรู้จำอักขระด้วยแสงสำหรับข้อความที่พิมพ์ (ใกล้เคียงกับมนุษย์สำหรับข้อความที่พิมพ์ด้วยตัวพิมพ์ดีดอักษรละติน) [ 64 ]
- การจดจำวัตถุ[ 65 ]
- งานด้านหุ่นยนต์ต่างๆ ที่อาจต้องอาศัยความก้าวหน้าทั้งในด้านฮาร์ดแวร์หุ่นยนต์และปัญญาประดิษฐ์ (AI) ซึ่งรวมถึง:
- การเคลื่อนที่แบบสองขาที่มั่นคง: หุ่นยนต์สองขาสามารถเดินได้ แต่มีความมั่นคงน้อยกว่าคนเดิน (ณ ปี 2017) [ 66 ]
- ฟุตบอลมนุษย์[ 67 ]
- การรู้จำเสียงพูด : "เกือบเทียบเท่าประสิทธิภาพของมนุษย์" (2017) [ 68 ]
- ความสามารถในการอธิบายระบบการแพทย์ในปัจจุบันสามารถวินิจฉัยโรคบางอย่างได้ดี แต่ไม่สามารถอธิบายให้ผู้ใช้ทราบว่าเหตุใดจึงวินิจฉัยเช่นนั้น[ 69 ]
- การทดสอบความฉลาดเชิงไหลหลายรายการ (2020) [ 62 ]
- ปัญหาการรับรู้ภาพ ของ Bongardเช่น เกณฑ์มาตรฐาน Bongard-LOGO (2020) [ 62 ] [ 70 ]
- เกณฑ์มาตรฐานการให้เหตุผลสามัญสำนึกเชิงภาพ (VCR) (ณ ปี 2020) [ 71 ]
- การทำนายตลาดหุ้น : การรวบรวมและประมวลผลข้อมูลทางการเงินโดยใช้อัลกอริธึมการเรียนรู้ของเครื่อง[ 72 ]
- เกม Angry Birds ณ ปี 2020 [ 73 ]
- งานต่างๆ ที่ยากต่อการแก้ไขหากปราศจากความรู้เชิงบริบท ได้แก่:
การทดสอบปัญญาประดิษฐ์ที่เสนอ
ในการทดสอบทัวริง อันโด่งดังของเขา อลัน ทัวริงได้เลือกภาษา ซึ่งเป็นคุณลักษณะที่กำหนดความเป็นมนุษย์มาเป็นพื้นฐาน[ 76 ] ปัจจุบัน การทดสอบทัวริงถือว่าสามารถนำไปใช้ในทางที่ผิดได้มากเกินไปจนไม่สามารถใช้เป็นเกณฑ์มาตรฐานที่มีความหมายได้[ 77 ]
การทดสอบ Feigenbaumซึ่งเสนอโดยผู้คิดค้นระบบผู้เชี่ยวชาญทดสอบความรู้และความเชี่ยวชาญของเครื่องจักรเกี่ยวกับเรื่องเฉพาะเรื่อง[ 78 ]บทความโดยJim GrayจากMicrosoftในปี 2003 แนะนำให้ขยายการทดสอบ Turing ไปสู่การเข้าใจคำพูดการพูดและการจดจำวัตถุและพฤติกรรม[ 79 ]
การทดสอบ "ปัญญาสากล" ที่เสนอมีเป้าหมายเพื่อเปรียบเทียบว่าเครื่องจักร มนุษย์ และแม้แต่สัตว์ที่ไม่ใช่มนุษย์ ทำงานได้ดีเพียงใดในชุดปัญหาที่ทั่วไปที่สุดเท่าที่จะเป็นไปได้ ในกรณีที่รุนแรงที่สุด ชุดทดสอบอาจประกอบด้วยปัญหาที่เป็นไปได้ทั้งหมด โดยถ่วงน้ำหนักด้วยความซับซ้อนของ Kolmogorovอย่างไรก็ตาม ชุดปัญหาเหล่านี้มักจะถูกครอบงำด้วยแบบฝึกหัดการจับคู่รูปแบบที่ด้อยคุณภาพ ซึ่ง AI ที่ปรับแต่งแล้วสามารถเหนือกว่าระดับประสิทธิภาพของมนุษย์ได้อย่างง่ายดาย[ 80 ] [ 81 ] [ 82 ] [ 83 ] [ 84 ]
การสอบ
จากข้อมูลของOpenAIในปี 2023 GPT-4ได้คะแนนสูงในการสอบมาตรฐานและการสอบวิชาชีพหลายรายการ รวมถึงคะแนนอยู่ในระดับเปอร์เซ็นไทล์ที่ประมาณ 90 ในการสอบ Uniform Bar Exam , คะแนนระดับเปอร์เซ็นไทล์ที่ 89 ในส่วนคณิตศาสตร์ของการสอบ SAT , คะแนนระดับเปอร์เซ็นไทล์ที่ 93 ในการอ่านและการเขียนของ SAT, คะแนนระดับเปอร์เซ็นไทล์ที่ 54 ในส่วนการเขียนเชิงวิเคราะห์ของการสอบ GRE , คะแนนระดับเปอร์เซ็นไทล์ที่ 88 ในส่วนการให้เหตุผลเชิงปริมาณของ GRE และคะแนนระดับเปอร์เซ็นไทล์ที่ 99 ในส่วนการให้เหตุผลเชิงวาจาของ GRE นอกจากนี้ OpenAI ยังรายงานว่า GPT-4 ได้คะแนนอยู่ในระดับเปอร์เซ็นไทล์ที่ 99 ถึง 100 ใน การสอบรอบรองชนะเลิศของการ แข่งขัน USA Biology Olympiad ปี 2020 และได้คะแนนสูงสุดในการ สอบAPหลาย รายการ [ 85 ]
นักวิจัยอิสระพบในปี 2023 ว่า ChatGPT ซึ่งใช้GPT-3.5มีประสิทธิภาพ "อยู่ในระดับผ่านหรือใกล้เคียงกับเกณฑ์ผ่าน" ในทั้งสามส่วนของการสอบใบอนุญาตประกอบวิชาชีพแพทย์ของสหรัฐอเมริกา (USMLE) ซึ่งแสดงให้เห็นว่าแบบจำลองภาษาขนาดใหญ่สามารถบรรลุประสิทธิภาพในระดับผ่านเกณฑ์ในการประเมินความรู้ทางการแพทย์บางอย่างได้ แม้ว่าจะไม่มีการปรับแต่งเฉพาะด้านก็ตาม[ 86 ]นอกจากนี้ยังมีรายงานว่า GPT-3.5 ได้รับเกรดต่ำแต่ผ่านเกณฑ์ในการสอบสำหรับหลักสูตรนิติศาสตร์สี่หลักสูตรที่มหาวิทยาลัยมินนิโซตา[ 85 ]
การศึกษาเพิ่มเติมรายงานว่า GPT-4 ผ่านการสอบบอร์ดรังสีวิทยาแบบใช้ข้อความ[ 87 ]การศึกษารังสีวิทยาในภายหลังในปี 2024–2025 ยังคงพบว่าโมเดลใหม่มีประสิทธิภาพดีในคำถามแบบสอบ รวมถึงการสอบรังสีวิทยาแบบใช้ภาพและการสอบรังสีวิทยาสำหรับนักศึกษา ในขณะเดียวกันก็สังเกตเห็นจุดอ่อนและความแปรปรวนที่ยังคงมีอยู่ตามประเภทของงาน[ 88 ] [ 89 ]
จากการศึกษาเปรียบเทียบในปี 2025 พบว่าประสิทธิภาพในการสอบทางการแพทย์มีความแตกต่างกันอย่างมากในแต่ละโมเดล แทนที่จะเป็นระดับ "ผ่าน" ที่สม่ำเสมอ การศึกษาเปรียบเทียบมาตรฐานในปี 2025 เกี่ยวกับคำถามตัวอย่าง USMLE ที่เผยแพร่สู่สาธารณะรายงานว่าโมเดลใหม่ๆ เช่น ChatGPT และ DeepSeek มีประสิทธิภาพเหนือกว่าคู่แข่งบางรุ่น แต่ก็ยังมีข้อผิดพลาดที่ชัดเจนและยังคงแสดงให้เห็นถึงข้อจำกัดในการให้เหตุผลทางคลินิกและความเข้าใจเฉพาะด้าน[ 90 ]
เกณฑ์มาตรฐานทางกฎหมายฉบับใหม่ที่เผยแพร่ในปี 2025 ชี้ให้เห็นเช่นกันว่าประสิทธิภาพการสอบยังคงไม่สม่ำเสมอ เกณฑ์มาตรฐาน LEXam ซึ่งสร้างขึ้นจากข้อสอบกฎหมาย 340 ชุดในหลักสูตรโรงเรียนกฎหมาย 116 หลักสูตร พบว่าการให้เหตุผลทางกฎหมายแบบยาวๆ ยังคงเป็นเรื่องท้าทายสำหรับแบบจำลองภาษาขนาดใหญ่ในปัจจุบัน โดยเฉพาะอย่างยิ่งในคำถามปลายเปิดที่ต้องใช้การวิเคราะห์แบบมีโครงสร้างหลายขั้นตอน[ 91 ]
ภายในปี 2026 งานวิจัยที่กว้างขึ้นเกี่ยวกับการทดสอบทางวิชาการระดับผู้เชี่ยวชาญเน้นย้ำว่าเกณฑ์มาตรฐานและงานทดสอบรูปแบบเก่าๆ จำนวนมากเริ่มอิ่มตัวแล้ว บทความ ในวารสาร Nature ปี 2026 ที่แนะนำการสอบครั้งสุดท้ายของมนุษยชาติได้โต้แย้งว่าระบบที่ทันสมัยที่สุดได้มีความแม่นยำเกิน 90% ในเกณฑ์มาตรฐานยอดนิยมหลายรายการ ในขณะที่ยังคงแสดงความแม่นยำต่ำในเกณฑ์มาตรฐานที่ยากกว่าซึ่งออกแบบมาเพื่อทดสอบขอบเขตความรู้ของผู้เชี่ยวชาญ[ 92 ] Stanford HAI ยังเตือนในปี 2025 ว่าประสิทธิภาพของเกณฑ์มาตรฐานและการสอบไม่ควรได้รับการปฏิบัติเทียบเท่ากับประสิทธิภาพในโลกแห่งความเป็นจริงที่เชื่อถือได้หรือการตัดสินใจที่น่าเชื่อถือ[ 93 ]
การแข่งขัน
การแข่งขันและรางวัลมากมาย เช่นImagenet Challengeส่งเสริมการวิจัยด้านปัญญาประดิษฐ์ ขอบเขตการแข่งขันที่พบบ่อยที่สุด ได้แก่ ปัญญาประดิษฐ์ทั่วไป พฤติกรรมการสนทนา การขุดข้อมูลรถยนต์หุ่นยนต์และฟุตบอลหุ่นยนต์ รวมถึงเกมทั่วไป[ 94 ]
การคาดการณ์ในอดีตและปัจจุบัน
ผลสำรวจความคิดเห็นของผู้เชี่ยวชาญเมื่อราวปี 2016 ซึ่งจัดทำโดยKatja GraceจากFuture of Humanity Instituteและผู้ร่วมงาน ได้ให้ค่าประมาณมัธยฐานที่ 3 ปีสำหรับการแข่งขันAngry Birds , 4 ปีสำหรับ World Series of Poker และ 6 ปีสำหรับStarCraftสำหรับงานที่เป็นอัตวิสัยมากกว่า ผลสำรวจให้เวลา 6 ปีสำหรับการพับผ้าเช่นเดียวกับคนงานทั่วไป 7-10 ปีสำหรับการตอบคำถามที่ "สามารถค้นหาได้ง่ายๆ ใน Google" อย่างเชี่ยวชาญ 8 ปีสำหรับการถอดเสียงพูดโดยเฉลี่ย 9 ปีสำหรับการทำธุรกรรมธนาคารทางโทรศัพท์โดยเฉลี่ย และ 11 ปีสำหรับการแต่งเพลงอย่างเชี่ยวชาญ แต่มากกว่า 30 ปีสำหรับการเขียน หนังสือขายดี ของ New York Timesหรือการชนะการแข่งขันคณิตศาสตร์ Putnam [ 95 ] [ 96 ] [ 97 ]
การพัฒนาที่ตามมาในช่วงปลายทศวรรษ 2010 และต้นทศวรรษ 2020 แสดงให้เห็นถึงความก้าวหน้าอย่างรวดเร็วในงานมาตรฐานหลายอย่าง โดยเฉพาะอย่างยิ่งในเกมและโดเมนปัญหาที่มีโครงสร้าง ระบบต่างๆ เช่น AlphaGo, AlphaZero และโมเดลภาษาขนาดใหญ่ในภายหลัง บรรลุหรือเกินประสิทธิภาพระดับมนุษย์ในเกณฑ์มาตรฐานที่กำหนดไว้หลายประการ[ 98 ] [ 99 ] [ 100 ]
ในขณะเดียวกัน นักวิจัยได้ตั้งข้อสังเกตว่าประสิทธิภาพในเกณฑ์มาตรฐานที่แคบสามารถถึงจุดอิ่มตัวได้เมื่อระบบได้รับการปรับให้เหมาะสมสำหรับงานเฉพาะ และความสำเร็จในการประเมินดังกล่าวไม่จำเป็นต้องสามารถนำไปใช้กับสติปัญญาในรูปแบบที่กว้างขึ้นได้[ 101 ]
หมากรุก

AI เอาชนะแกรนด์มาสเตอร์ในการแข่งขันอย่างเป็นทางการเป็นครั้งแรกในปี 1988; ต่อมาเปลี่ยนชื่อเป็นDeep Blueและเอาชนะแชมป์โลกหมากรุกที่เป็นมนุษย์ในปี 1997 (ดูDeep Blue ปะทะ Garry Kasparov ) [ 102 ]
ในช่วงทศวรรษ 2010 โปรแกรมหมากรุกที่ทำงานบนฮาร์ดแวร์สำหรับผู้บริโภคได้แซงหน้าผู้เล่นระดับสูงสุดของมนุษย์ไปมาก ระบบที่ใช้โครงข่ายประสาทเทียม เช่น AlphaZero แสดงให้เห็นว่าประสิทธิภาพเหนือมนุษย์สามารถทำได้ผ่านการเรียนรู้แบบเสริมแรงจากการเล่นด้วยตนเองโดยไม่ต้องพึ่งพาข้อมูลจากผู้เชี่ยวชาญที่เป็นมนุษย์[ 103 ]โปรแกรมหมากรุกสมัยใหม่ถูกนำมาใช้กันอย่างแพร่หลายในการเตรียมการและการวิเคราะห์ และการเล่นของมนุษย์โดยปราศจากความช่วยเหลือไม่สามารถแข่งขันกับระบบคอมพิวเตอร์ระดับสูงสุดได้อีกต่อไป
| มีการคาดการณ์ประจำปี | ปีที่คาดการณ์ | จำนวนปี | ตัวทำนาย | แหล่งข้อมูลร่วมสมัย |
|---|---|---|---|---|
| 1957 | ปี 1967 หรือก่อนหน้านั้น | 10 หรือน้อยกว่า | เฮอร์เบิร์ต เอ. ไซมอนนักเศรษฐศาสตร์[ 104 ] | |
| 1990 | ปี 2000 หรือเร็วกว่านั้น | 10 หรือน้อยกว่า | เรย์ เคิร์ซไวล์นักอนาคตศาสตร์ | ยุคของเครื่องจักรอัจฉริยะ[ 105 ] |
ไป
AlphaGoเอาชนะแชมป์โกะยุโรปในเดือนตุลาคม 2015 และเอาชนะLee Sedolในเดือนมีนาคม 2016 ซึ่งเป็นหนึ่งในผู้เล่นโกะระดับโลก (ดูAlphaGo ปะทะ Lee Sedol ) ตามรายงานของScientific Americanและแหล่งข้อมูลอื่นๆ ผู้สังเกตการณ์ส่วนใหญ่คาดว่าประสิทธิภาพการเล่นโกะของคอมพิวเตอร์ที่เหนือมนุษย์จะเกิดขึ้นในอีกอย่างน้อยหนึ่งทศวรรษ[ 106 ] [ 107 ] [ 108 ]
ระบบต่อมา เช่น AlphaGo Zero และ AlphaZero แสดงให้เห็นว่าประสิทธิภาพเหนือมนุษย์สามารถทำได้โดยไม่ต้องใช้ข้อมูลการฝึกฝนจากมนุษย์ โดยใช้การเรียนรู้แบบเสริมแรงจากการเล่นด้วยตนเอง[ 109 ]ในช่วงปลายทศวรรษ 2010 โปรแกรมโกะคอมพิวเตอร์ได้แซงหน้าแชมป์เปี้ยนของมนุษย์ไปมาก และโกะก็หยุดเป็นมาตรฐานสำคัญสำหรับการวิจัย AI
| มีการคาดการณ์ประจำปี | ปีที่คาดการณ์ | จำนวนปี | ตัวทำนาย | สังกัด | แหล่งข้อมูลร่วมสมัย |
|---|---|---|---|---|---|
| พ.ศ. 2540 | ปี 2100 หรือหลังจากนั้น | 103 หรือมากกว่า | ปีเอต ฮัตต์ นักฟิสิกส์และแฟนเกมโกะ | สถาบันเพื่อการศึกษาขั้นสูง | นิวยอร์กไทมส์[ 110 ] [ 111 ] |
| 2007 | ปี 2017 หรือเร็วกว่านั้น | 10 หรือน้อยกว่า | เฟิง-ซุง สวี หัวหน้าทีม ดี พบลู | ไมโครซอฟต์ รีเสิร์ช เอเชีย | IEEE Spectrum [ 112 ] [ 113 ] |
| 2014 | 2024 | 10 | เรมี คูลอมโปรแกรมเมอร์ Computer Go | เครซี่สโตน | ต่อสาย[ 113 ] [ 114 ] |
ปัญญาประดิษฐ์ทั่วไประดับมนุษย์ (AGI)
เฮอร์เบิร์ต เอ. ไซมอนผู้บุกเบิกด้าน AI และนักเศรษฐศาสตร์ได้ทำนายไว้อย่างไม่ถูกต้องในปี 1965 ว่า "ภายในยี่สิบปี เครื่องจักรจะสามารถทำงานใดๆ ก็ตามที่มนุษย์ทำได้" ในทำนองเดียวกัน ในปี 1970 มาร์วิน มินสกีได้เขียนไว้ว่า "ภายในหนึ่งชั่วอายุคน... ปัญหาของการสร้างปัญญาประดิษฐ์จะได้รับการแก้ไขไปมาก" [ 115 ]
ผลสำรวจสี่ครั้งที่จัดทำขึ้นในปี 2012 และ 2013 ชี้ให้เห็นว่า ค่ามัธยฐานของการ ประมาณการในหมู่ผู้เชี่ยวชาญเกี่ยวกับช่วงเวลาที่ AGI จะมาถึงคือปี 2040 ถึง 2050 ขึ้นอยู่กับผลสำรวจ[ 116 ] [ 117 ]
ผลสำรวจของ Grace ในช่วงประมาณปี 2016 พบว่าผลลัพธ์แตกต่างกันไปขึ้นอยู่กับวิธีการตั้งคำถาม ผู้ตอบแบบสอบถามที่ถูกถามให้ประเมินว่า "เมื่อใดที่เครื่องจักรจะสามารถทำงานทุกอย่างได้ดีกว่าและถูกกว่าคนงาน" ให้คำตอบเฉลี่ยที่ 45 ปี และมีโอกาส 10% ที่จะเกิดขึ้นภายใน 9 ปี ในขณะที่ผู้ตอบแบบสอบถามคนอื่นๆ ที่ถูกถามให้ประเมินว่า "เมื่อใดที่ทุกอาชีพจะสามารถใช้ระบบอัตโนมัติได้อย่างสมบูรณ์ นั่นคือ เมื่อใดที่เครื่องจักรสามารถถูกสร้างขึ้นเพื่อทำงานนั้นได้ดีกว่าและถูกกว่าคนงาน" ให้คำตอบเฉลี่ยที่ 122 ปี และมีโอกาส 10% ที่จะเกิดขึ้นภายใน 20 ปี คำตอบเฉลี่ยสำหรับ "เมื่อใดที่นักวิจัย AI จะสามารถใช้ระบบอัตโนมัติได้อย่างสมบูรณ์" อยู่ที่ประมาณ 90 ปี ไม่พบความเชื่อมโยงระหว่างความอาวุโสและการมองโลกในแง่ดี แต่โดยเฉลี่ยแล้วนักวิจัยชาวเอเชียมีความมองโลกในแง่ดีมากกว่านักวิจัยชาวอเมริกาเหนือ ชาวเอเชียคาดการณ์โดยเฉลี่ยที่ 30 ปีสำหรับ "การทำงานทุกอย่างให้สำเร็จ" เมื่อเทียบกับ 74 ปีที่ชาวอเมริกาเหนือคาดการณ์ไว้[ 95 ] [ 96 ] [ 97 ]
การสำรวจขนาดใหญ่ของนักวิจัย 2,778 คนที่ตีพิมพ์ผลงานในวารสาร AI ชั้นนำ ซึ่งดำเนินการในปี 2023 และเผยแพร่ในปี 2025 พบว่าช่วงเวลาสำหรับสิ่งที่เรียกว่า "ปัญญาประดิษฐ์ระดับสูง" นั้นสั้นกว่า ในการสำรวจนั้น การคาดการณ์โดยรวมระบุว่ามีโอกาส 10% ที่เครื่องจักรจะทำงานได้ดีกว่ามนุษย์โดยปราศจากความช่วยเหลือในทุกงานภายในปี 2027 และมีโอกาส 50% ภายในปี 2047 การสำรวจเดียวกันนี้ประเมินว่าการทำงานอัตโนมัติอย่างเต็มรูปแบบของอาชีพมนุษย์ทั้งหมดจะมีโอกาส 10% ภายในปี 2037 และมีโอกาส 50% ภายในปี 2116 [ 118 ]
แม้ว่ากรอบเวลาจะสั้นลงเรื่อยๆ ในการสำรวจบางส่วน แต่ก็ยังไม่มีข้อสรุปในช่วงปลายปี 2025 และต้นปี 2026 ว่า AGI จะเกิดขึ้นในเร็วๆ นี้ ในการคาดการณ์ของ Stanford HAI สำหรับปี 2026 ผู้อำนวยการร่วมJames Landayกล่าวว่า "จะไม่มี AGI ในปีนี้" [ 119 ]
| มีการคาดการณ์ประจำปี | ปีที่คาดการณ์ | จำนวนปี | ตัวทำนาย | แหล่งข้อมูลร่วมสมัย |
|---|---|---|---|---|
| พ.ศ. 2508 | ปี 1985 หรือก่อนหน้านั้น | 20 หรือน้อยกว่า | เฮอร์เบิร์ต เอ. ไซมอน | รูปแบบของระบบอัตโนมัติสำหรับผู้ชายและการจัดการ[ 115 ] [ 120 ] |
| พ.ศ. 2536 | ปี 2023 หรือเร็วกว่านั้น | 30 หรือน้อยกว่า | เวอร์เนอร์ วิงจ์นักเขียนนิยายวิทยาศาสตร์ | "ภาวะเอกภาพทางเทคโนโลยีที่กำลังจะมาถึง" [ 121 ] |
| พ.ศ. 2538 | ปี 2040 หรือเร็วกว่านั้น | อายุ 45 ปีหรือน้อยกว่า | ฮันส์ โมราเวคนักวิจัยด้านหุ่นยนต์ | ต่อสาย[ 122 ] |
| 2008 | ไม่เคย / อนาคตอันไกลโพ้น[หมายเหตุ 1 ] | กอร์ดอน อี. มัวร์ผู้คิดค้นกฎของมัวร์ | IEEE Spectrum [ 123 ] | |
| 2017 | 2029 | 12 | เรย์ เคิร์ซไวล์ | การสัมภาษณ์[ 124 ] |
ดูเพิ่มเติม
หมายเหตุ
- ^ IEEE Spectrumระบุว่ามัวร์กล่าวทั้ง "ไม่มีทาง" และ "ฉันไม่เชื่อว่าเรื่องแบบนี้จะเกิดขึ้นได้ อย่างน้อยก็ในอีกนาน"
ลิงก์ภายนอก
- ฐานข้อมูล MIRI เกี่ยวกับการคาดการณ์ปัญญาประดิษฐ์ทั่วไป (AGI)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ความก้าวหน้าในปัญญาประดิษฐ์
ความก้าวหน้าในปัญญาประดิษฐ์ ( AI ) คือความก้าวหน้า ความสำเร็จ และความก้าวหน้าครั้งสำคัญที่เกิดขึ้นในสาขา ปัญญาประดิษฐ์ ตลอดช่วงเวลาที่ผ่านมา AI เป็นสาขาหนึ่งของ...
ประวัติศาสตร์
การเพิ่ม การส่งเสริม หรือการจำกัดความก้าวหน้าของ AI มักจะทำได้โดยการควบคุมหรือเพิ่มปริมาณ การประมวล ผล [ 7 ] [ 8 ]
ผลการปฏิบัติงานในปัจจุบันในด้านต่างๆ
มีหลายความสามารถที่มีประโยชน์ซึ่งสามารถอธิบายได้ว่าแสดงให้เห็นถึงรูปแบบหนึ่งของสติปัญญา สิ่งนี้ช่วยให้เข้าใจถึงความสำเร็จเชิงเปรียบเทียบของปัญญาประดิษฐ์ในด้านต่างๆ ได้ดียิ่งขึ้น
เหมาะสมที่สุด
เกมโอเอ็กซ์ คอนเน็กต์โฟร์ : 1988 หมากรุก (หรือที่เรียกว่าหมากฮอส 8x8): แก้ไขได้ไม่ดี (2007) [ 28 ] ลูกบาศก์รูบิก : ส่วนใหญ่แก้ได้แล้ว (2010) [ 29 ] โป๊กเกอร์โฮลด์เอ็มแบบเฮดส์อัพลิมิต : เหมาะสมทางสถิติในแง่ที่ว่า...