หน่วยประมวลผลกราฟิก

หน่วยประมวลผลกราฟิก ( GPU ) คือ วงจรไฟฟ้าเฉพาะทางที่ออกแบบมาสำหรับการประมวลผลภาพดิจิทัลและเร่งความเร็วใน การประมวล ผลกราฟิกคอมพิวเตอร์โดยอาจเป็นส่วนประกอบในกราฟิกการ์ด แบบแยก หรือฝังอยู่ในเมนบอร์ดโทรศัพท์มือถือคอมพิวเตอร์ส่วนบุคคล เวิร์กสเตชันและเครื่องเล่นเกม GPU ยังถูกนำมาใช้ใน การประมวลผล ปัญญาประดิษฐ์ (AI) มากขึ้นเรื่อยๆ เนื่องจากความสามารถในการเร่งความเร็วเชิงพีชคณิตเชิงเส้น ซึ่งถูกนำมาใช้กันอย่างแพร่หลายในการประมวลผลกราฟิกเช่นกัน

ถึงแม้ว่าจะไม่มีคำจำกัดความที่ตายตัวสำหรับคำนี้ และอาจใช้เพื่ออธิบายระบบแสดงผลวิดีโอใดๆ ก็ได้ แต่ในปัจจุบัน GPU หมายถึงความสามารถในการคำนวณภายในที่จำเป็นสำหรับงานกราฟิกต่างๆ เช่น การหมุนและการปรับขนาดภาพ 3 มิติ และมักมีความสามารถเพิ่มเติมในการเรียกใช้โปรแกรมที่กำหนดเองที่เรียกว่าshadersซึ่งแตกต่างจากตัวควบคุมกราฟิกในยุคก่อนๆ ที่เรียกว่าตัวควบคุมการแสดงผลวิดีโอ (video display controllers)ซึ่งไม่มีความสามารถในการคำนวณภายใน หรือblittersซึ่งทำได้เพียงการเคลื่อนย้ายข้อมูลในหน่วยความจำขั้นพื้นฐานเท่านั้น GPU สมัยใหม่ถือกำเนิดขึ้นในช่วงทศวรรษ 1990 โดยเพิ่มความสามารถในการดำเนินการต่างๆ เช่น การวาดเส้นและข้อความโดยไม่ต้อง อาศัย CPUและต่อมาได้เพิ่มฟังก์ชันการทำงาน 3 มิติ

โดยทั่วไปแล้ว ฟังก์ชันด้านกราฟิกจะทำงานแยกจากกัน ทำให้สามารถใช้งานฟังก์ชันเหล่านี้บนหน่วยประมวลผลที่แยกจากกันได้ หน่วยประมวลผลกราฟิก (GPU) สมัยใหม่มีหน่วยประมวลผลหลายร้อยหรือหลายพันหน่วย ทำให้มีประโยชน์สำหรับการคำนวณที่ไม่เกี่ยวข้องกับกราฟิก ซึ่งเกี่ยวข้องกับ ปัญหาที่สามารถประมวลผล แบบขนานได้อย่างง่ายดายเนื่องจากโครงสร้างแบบขนานความสามารถของ GPU ในการคำนวณจำนวนมากได้อย่างรวดเร็ว ทำให้มีการนำไปใช้ในหลากหลายสาขา รวมถึงปัญญาประดิษฐ์ (AI) ซึ่ง GPU มีความสามารถโดดเด่นในการจัดการงานที่ต้องใช้ข้อมูลจำนวนมากและต้องการการคำนวณสูง การใช้งานที่ไม่เกี่ยวข้องกับกราฟิกอื่นๆ ได้แก่ การฝึกโครงข่ายประสาท เทียม และการขุดคริปโตเคอร์เรนซี

บริษัทผู้ผลิต GPU

บริษัทหลายแห่งผลิต GPU ภายใต้ชื่อแบรนด์ต่างๆ มากมาย ในปี 2552 Intel , NvidiaและAMD / ATIเป็นผู้นำตลาด โดยมีส่วนแบ่งการตลาด 49.4%, 27.8% และ 20.6% ตามลำดับ นอกจากนี้Matrox ^{[ 1 ]}ซึ่งเดิมผลิตโซลูชันแบบกำหนดเอง ปัจจุบันได้ปรับแต่ง GPU จาก Intel และ AMD สำหรับการใช้งานเวิร์กสเตชัน บริษัทจีน เช่นJingjia Microก็ได้ผลิต GPU สำหรับตลาดภายในประเทศเช่นกัน แม้ว่าในแง่ของยอดขายทั่วโลก พวกเขาจะตามหลังผู้นำตลาดอยู่ก็ตาม^{[ 2 ]}

ฟังก์ชันการคำนวณ

ปัจจัยหลายประการในการสร้าง GPU ส่งผลต่อประสิทธิภาพของการ์ดสำหรับการเรนเดอร์แบบเรียลไทม์ เช่น ขนาดของเส้นทางเชื่อมต่อในการผลิตอุปกรณ์เซมิคอนดักเตอร์ความถี่ของสัญญาณนาฬิกาและจำนวนและขนาดของแคชหน่วย ความจำบนชิปต่างๆ ประสิทธิภาพยังได้รับผลกระทบจากจำนวนสตรีมมิ่งมัลติโปรเซสเซอร์ (SM) สำหรับ GPU ของ NVidia หรือหน่วยประมวลผล (CU) สำหรับ GPU ของ AMD หรือคอร์ Xe สำหรับ GPU ที่ใช้ Intel Xe ซึ่งอธิบายถึงจำนวนหน่วยประมวลผลหลักบนซิลิคอนภายในชิป GPU ที่ทำการคำนวณหลัก โดยทั่วไปจะทำงานแบบขนานกับ SM/CU อื่นๆ บน GPU ประสิทธิภาพของ GPU โดยทั่วไปจะวัดเป็นจำนวนการดำเนินการจุดลอยตัวต่อวินาที ( FLOPS ) GPU รุ่นใหม่โดยทั่วไปจะให้ประสิทธิภาพที่วัดเป็นเทราฟลอป (TFLOPS) นี่เป็นการวัดประสิทธิภาพโดยประมาณ และไม่ควรนำมาใช้เป็นข้อเท็จจริง เนื่องจากปัจจัยอื่นๆ อาจส่งผลต่อประสิทธิภาพที่แท้จริง^{[ 3 ]}

GPU รุ่นใหม่ๆ ยังมีบล็อกฮาร์ดแวร์เฉพาะสำหรับการเรย์เทรซซิ่งการเข้ารหัสวิดีโอและการเร่งความเร็ว AIอีก ด้วย

รูปแบบของ GPU

ในคอมพิวเตอร์ส่วนบุคคล GPU มีสองรูปแบบหลัก ได้แก่ กราฟิกเฉพาะ (เรียกอีกอย่างว่ากราฟิกแยก) และกราฟิกแบบรวม (เรียกอีกอย่างว่าโซลูชันกราฟิกแบบใช้ร่วมกัน โปรเซสเซอร์กราฟิกแบบรวม (IGP) หรือสถาปัตยกรรมหน่วยความจำแบบรวม (UMA)) ^{[ 4 ]}

หน่วยประมวลผลกราฟิกเฉพาะ

การ์ดจอแยกใช้RAM ในตัว ที่จัดสรรไว้สำหรับ GPU โดยเฉพาะ แทนที่จะใช้หน่วยความจำหลักของระบบคอมพิวเตอร์ โดยปกติแล้ว RAM นี้จะถูกเลือกมาเป็นพิเศษสำหรับปริมาณงานประมวลผลแบบอนุกรมที่คาดหวังของการ์ดจอ เช่นGDDR SDRAMซึ่งมีข้อดีด้านประสิทธิภาพอย่างมาก แต่ก็มีข้อเสียคืออาจเกิดปัญหา "คอขวด" เมื่อหน่วยความจำเฉพาะหมด ทำให้ประสิทธิภาพลดลง

เทคโนโลยีต่างๆ เช่นScalable Link Interface (SLI), NVLinkและCrossFireช่วยให้ GPU หลายตัวสามารถวาดภาพพร้อมกันบนหน้าจอเดียว ซึ่งเพิ่มพลังการประมวลผลสำหรับกราฟิก อย่างไรก็ตาม เทคโนโลยีเหล่านี้เริ่มไม่เป็นที่นิยมมากขึ้น เกมส่วนใหญ่ไม่ได้ใช้ GPU หลายตัวอย่างเต็มที่ เนื่องจากผู้ใช้ส่วนใหญ่ไม่สามารถซื้อได้^{[ 5 ]}^{[ 6 ]}^{[ 7 ]} GPU หลายตัวยังคงถูกใช้ในซูเปอร์คอมพิวเตอร์ (เช่นในSummit ) บนเวิร์กสเตชันเพื่อเร่งความเร็ววิดีโอ (ประมวลผลวิดีโอหลายรายการพร้อมกัน) ^{[ 8 ]}^{[ 4 ]}^{[ 9 ]}และการเรนเดอร์ 3 มิติ^{[ 10 ]}สำหรับเอฟเฟกต์ภาพ (VFX) ^{[ 11 ]} เวิร์กโหลด หน่วยประมวลผลกราฟิกอเนกประสงค์ (GPGPU) และสำหรับการจำลอง^{[ 12 ]}และใน AI เพื่อเร่งการฝึกอบรม เช่นเดียวกับเวิร์กสเตชันและเซิร์ฟเวอร์ DGX ของ Nvidia

หน่วยประมวลผลกราฟิกแบบรวม

เมนบอร์ดASRockที่มีกราฟิกในตัว พร้อมพอร์ต HDMI, VGA และ DVI สำหรับต่อออกสัญญาณ

หน่วยประมวลผลกราฟิกแบบรวม (IGPU) หรือที่เรียกว่ากราฟิกแบบรวมโซลูชันกราฟิกแบบใช้ร่วมกันหน่วยประมวลผลกราฟิกแบบรวม (IGP) หรือสถาปัตยกรรมหน่วยความจำแบบรวม (UMA) ใช้ส่วนหนึ่งของ RAM ของระบบคอมพิวเตอร์แทนที่จะใช้หน่วยความจำกราฟิกเฉพาะ IGP สามารถรวมเข้ากับเมนบอร์ดเป็นส่วนหนึ่งของชิปเซ็ตนอร์ธบริดจ์^{[ 13 ]}หรือบนไดเดียวกัน(วงจรรวม)กับ CPU เช่นหน่วยประมวลผลเร่งความเร็ว (AMD APU) หรือIntel HD Graphics IGPU และ APU มีต้นทุนในการใช้งานต่ำกว่าการประมวลผลกราฟิกเฉพาะ แต่มีแนวโน้มที่จะมีความสามารถน้อยกว่า การประมวลผลกราฟิกแบบรวมถือว่าไม่เหมาะสมสำหรับเกม 3 มิติหรือโปรแกรมที่ใช้กราฟิกสูง แต่สามารถเรียกใช้โปรแกรมที่ใช้กราฟิกน้อยกว่า เช่น Adobe Flash ตัวอย่างของ IGP ดังกล่าว ได้แก่ ผลิตภัณฑ์จาก SiS และ VIA ในช่วงปี 2004 ^{[ 14 ]}อย่างไรก็ตาม หน่วยประมวลผลกราฟิกแบบรวมที่ทันสมัย เช่นหน่วยประมวลผลเร่งความเร็วของ AMDและเทคโนโลยีกราฟิกของ Intelสามารถจัดการเกม AAA ได้ที่การตั้งค่าที่ต่ำกว่า

เนื่องจากการคำนวณ GPU ใช้หน่วยความจำมาก การประมวลผลแบบรวมอาจแข่งขันกับ CPU ในการใช้ RAM ของระบบที่ค่อนข้างช้า เนื่องจากมีหน่วยความจำวิดีโอเฉพาะน้อยมากหรือไม่มีเลย IGPU ใช้หน่วยความจำระบบที่มีแบนด์วิดท์สูงสุดในปัจจุบันที่ 128 กิกะไบต์ต่อวินาที ในขณะที่การ์ดกราฟิกแบบแยกอาจมีแบนด์วิดท์^{[ 15 ]}มากกว่า 1,000 กิกะไบต์ต่อวินาทีระหว่างหน่วยความจำเข้าถึงแบบสุ่มวิดีโอ (VRAM) และแกน GPU แบนด์ วิดท์บัสหน่วยความจำนี้สามารถจำกัดประสิทธิภาพของ IGPU ได้ แม้ว่าหน่วยความจำแบบหลายช่องสัญญาณจะสามารถลดข้อบกพร่องนี้ได้^{[ 16 ]}

ในระบบที่มี "สถาปัตยกรรมหน่วยความจำรวม" (UMA) รวมถึงโปรเซสเซอร์ AMD รุ่นใหม่ที่มีกราฟิกในตัว^{[ 17 ]}โปรเซสเซอร์ Intel รุ่นใหม่ที่มีกราฟิกในตัว^{[ 18 ]}โปรเซสเซอร์ Apple และคอนโซลรุ่นใหม่ แกน CPU และบล็อก GPU จะใช้พื้นที่หน่วยความจำและแอดเดรส RAM ร่วมกัน

การประมวลผลสตรีมและหน่วยประมวลผลกราฟิกอเนกประสงค์ (GPGPU)

เป็นเรื่องปกติที่จะใช้หน่วยประมวลผลกราฟิกอเนกประสงค์ (GPGPU) ในรูปแบบที่ดัดแปลงของตัวประมวลผลสตรีมหรือตัวประมวลผลเวกเตอร์โดยเรียกใช้เคอร์เนลการคำนวณซึ่งจะเปลี่ยนพลังการคำนวณมหาศาลของไปป์ไลน์เชเดอร์ของตัวเร่งกราฟิกสมัยใหม่ให้เป็นพลังการคำนวณอเนกประสงค์ ในบางแอปพลิเคชันที่ต้องการการดำเนินการเวกเตอร์จำนวนมาก สิ่งนี้สามารถให้ประสิทธิภาพสูงกว่า CPU ทั่วไปหลายเท่าตัว ผู้ผลิต GPU แบบแยกส่วนรายใหญ่ที่สุดสองราย ได้แก่AMDและNvidiaกำลังดำเนินการตามแนวทางนี้กับแอปพลิเคชันต่างๆ มากมาย Nvidia และ AMD ร่วมมือกับมหาวิทยาลัยสแตนฟอร์ดเพื่อสร้างไคลเอ็นต์บน GPU สำหรับ โครงการประมวลผลแบบ กระจาย Folding@homeสำหรับการคำนวณการพับโปรตีน ในบางสถานการณ์ GPU คำนวณได้เร็วกว่า CPU ที่ใช้กันทั่วไปในแอปพลิเคชันดังกล่าวถึงสี่สิบเท่า^{[ 19 ]}^{[ 20 ]}

คอมพิวเตอร์ประสิทธิภาพสูงที่ใช้ GPU มีบทบาทสำคัญในการสร้างแบบจำลองขนาดใหญ่ ซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุด 3 ใน 10 เครื่องในโลกใช้ประโยชน์จากการเร่งความเร็ว GPU ^{[ 21 ]}

ตั้งแต่ปี 2005 เป็นต้นมา มีความสนใจในการใช้ประสิทธิภาพที่ GPU นำเสนอสำหรับการคำนวณเชิงวิวัฒนาการโดยทั่วไป และโดยเฉพาะอย่างยิ่งสำหรับการเร่ง การประเมิน ความเหมาะสมในการเขียนโปรแกรมเชิงพันธุกรรมวิธีการส่วนใหญ่จะคอมไพล์โปรแกรม เชิงเส้นหรือ แบบต้นไม้ บนพีซีโฮสต์และถ่ายโอนไฟล์ปฏิบัติการไปยัง GPU เพื่อเรียกใช้ โดยทั่วไปแล้วจะได้เปรียบด้านประสิทธิภาพก็ต่อเมื่อเรียกใช้โปรแกรมที่ใช้งานอยู่เพียงโปรแกรมเดียวพร้อมกันกับปัญหาตัวอย่างจำนวนมากแบบขนาน โดยใช้ สถาปัตยกรรม คำสั่งเดียว ข้อมูลหลายชุด (SIMD) ของ GPU ^[²²^]นอกจากนี้ยังสามารถเร่งความเร็วได้อย่างมากโดยไม่ต้องคอมไพล์โปรแกรม แต่ให้ถ่ายโอนไปยัง GPU เพื่อตีความที่นั่น^[²³^]

การ์ดจอภายนอก (eGPU)

GPU สามารถเชื่อมต่อกับบัสภายนอกของโน้ตบุ๊กได้PCI Expressเป็นบัสเดียวที่ใช้เพื่อจุดประสงค์นี้ พอร์ตอาจเป็น พอร์ต ExpressCardหรือmPCIe (PCIe ×1 สูงสุด 5 หรือ 2.5 กิกะบิตต่อวินาที ตามลำดับ) พอร์ต Thunderbolt 1, 2 หรือ 3 (PCIe ×4 สูงสุด 10, 20 หรือ 40 กิกะบิตต่อวินาที ตามลำดับ) พอร์ตUSB4 ที่รองรับ Thunderboltหรือ พอร์ต OCuLinkพอร์ตเหล่านี้มีเฉพาะในระบบโน้ตบุ๊กบางระบบเท่านั้น^{[ 24 ]}เคส eGPU มีแหล่งจ่ายไฟ (PSU) ของตัวเอง เนื่องจาก GPU ที่ทรงพลังสามารถใช้พลังงานได้หลายร้อยวัตต์^{[ 25 ]}

ประวัติศาสตร์

ทศวรรษ 1960

ฮาร์ดแวร์กราฟิก 3 มิติโดยเฉพาะมีมาตั้งแต่เครื่องเทอร์มินัล กราฟิก เช่นAdage AGT-30 จากปี 1967 ซึ่งใช้โปรเซสเซอร์เมทริกซ์แบบอนาล็อก ในปี 1969 บริษัท Evans & Sutherland (E&S) ได้เปิดตัวLine Drawing System-1 (LDS-1) ซึ่งเป็นระบบดิจิทัลทั้งหมดระบบแรกที่สามารถประมวลผลการคูณเมทริกซ์ได้ นอกจากนี้ ในปีเดียวกันนั้นเอง เครื่องเทอร์มินัลกราฟิกราคาประหยัดIMLAC PDS-1ก็ได้ถูกเปิดตัวขึ้น ต่อมามันถูกนำไปใช้เป็นเครื่องเล่นเกม 3 มิติรุ่นแรกๆ เช่น เกม Maze War

ทศวรรษ 1970

ในทศวรรษ 1970 คำว่า "GPU" เดิมทีหมายถึงหน่วยประมวลผลกราฟิก และอธิบายถึงหน่วยประมวลผลที่ตั้งโปรแกรมได้ซึ่งทำงานอย่างอิสระจาก CPU ซึ่งรับผิดชอบในการจัดการและแสดงผลกราฟิก^{[ 1 ]}^{[ 2 ]}

ในด้านฮาร์ดแวร์ระดับมืออาชีพ ในปี 1972 ระบบ PLATO IVเริ่มใช้งานได้ที่มหาวิทยาลัยอิลลินอยส์ เออร์บานา-แชมเปญระหว่างปี 1973 ถึง 1978 เกม 3 มิติแบบโครงลวดหลายผู้เล่นที่เชื่อมต่อเครือข่ายหลายเกมได้รับการพัฒนาและได้รับความนิยมจากผู้ใช้ระบบ นอกจากนี้ ในปี 1972 ระบบ E&S Continuous Tone 1 (CT1) "Watkins box" (ประกอบด้วย E&S LDS-2 และShaded Picture System ) ได้ถูกส่งมอบให้กับมหาวิทยาลัย Case Western Reserveซึ่งเป็นระบบแรกที่นำเสนอการแรเงาแบบ Gouraud แบบเรียลไทม์ ในปี 1975 ความร่วมมือระหว่างบริษัท Evans & Sutherland Computer Corporation และภาควิชากราฟิกคอมพิวเตอร์ของมหาวิทยาลัยยูทาห์ ส่งผลให้เกิดเฟรมบัฟเฟอร์ วิดีโอ MOSFET ตัวแรกที่สามารถแสดงสีและการแรเงาแบบเรียบเนียนได้ ระบบ E&S Continuous Tone 3 (CT3) ถูกส่งมอบให้กับ Lufthansaในปี 1977 สำหรับการฝึกอบรมนักบินโดยใช้การจำลองด้วยคอมพิวเตอร์ นับเป็นระบบกราฟิกตัวแรกที่สามารถแมปพื้นผิวแบบเรียลไทม์ได้ Ikonas ผลิตระบบกราฟิกที่มีกราฟิก 8 บิตและ 24 บิต และการเร่งความเร็ว 3 มิติในช่วงปลายทศวรรษที่ 70 ^{[ 26 ]}

บอร์ดระบบเกมอาร์เคดใช้วงจรกราฟิก 2 มิติแบบพิเศษมาตั้งแต่ทศวรรษ 1970 ในฮาร์ดแวร์วิดีโอเกมยุคแรกRAMสำหรับบัฟเฟอร์เฟรมมีราคาแพง ดังนั้นชิปวิดีโอจึงรวมข้อมูลเข้าด้วยกันในขณะที่จอแสดงผลถูกสแกนออกบนจอภาพ^{[ 27 ]}

วงจร เปลี่ยนตำแหน่งบาร์เรลแบบพิเศษช่วยให้ CPU สามารถสร้าง ภาพเคลื่อนไหว ของกราฟิกเฟรมบัฟเฟอร์สำหรับวิดีโอเกมอาร์เคด ต่างๆ ในยุค 1970 จากMidwayและTaitoเช่นGun Fight (1975), Sea Wolf (1976) และSpace Invaders (1978) ^{[ 28 ]}ระบบ อาร์เคด Namco Galaxianในปี 1979 ใช้ฮาร์ดแวร์กราฟิก แบบพิเศษ ที่รองรับสี RGBสไปรท์หลากสี และพื้นหลังแบบไทล์แม ป ^{[ 29 ]}ฮาร์ดแวร์ Galaxian ถูกนำมาใช้อย่างแพร่หลายในช่วงยุคทองของวิดีโอเกมอาร์เคดโดยบริษัทเกมต่างๆ เช่นNamco , Centuri , Gremlin , Irem , Konami , Midway ^, Nichibutsu , SegaและTaito ^[³⁰ ]

Atari 2600ในปี 1977 ใช้ตัวแปลงสัญญาณวิดีโอที่เรียกว่าTelevision Interface Adaptor [ ^{31 ] คอมพิวเตอร์} Atari 8 บิต (ปี 1979) มีANTICซึ่งเป็นโปรเซสเซอร์วิดีโอที่ตีความคำสั่งที่อธิบาย " รายการแสดงผล " — วิธีที่เส้นสแกนแมปไปยัง โหมด บิตแมปหรืออักขระเฉพาะ และตำแหน่งที่จัดเก็บหน่วยความจำ (ดังนั้นจึงไม่จำเป็นต้องมีบัฟเฟอร์เฟรมที่ต่อเนื่องกัน) ^{[ 32 ]}รูทีน ย่อยรหัสเครื่อง 6502 สามารถเรียกใช้บนเส้นสแกน ได้ โดยการตั้งค่าบิตบนคำสั่งรายการแสดงผล^[³³^] ANTIC ยังรองรับการเลื่อน แนวตั้งและ แนวนอนที่ราบรื่นโดย ไม่ขึ้นกับ CPU ^[³⁴^]

ทศวรรษ 1980

ในช่วงทศวรรษ 1980 มีความก้าวหน้าอย่างมากในด้านฮาร์ดแวร์กราฟิก 3 มิติระดับมืออาชีพ สิ่งที่ส่งผลกระทบมากที่สุดอาจเป็นการพัฒนาGeometry Engine ในปี 1981 ซึ่งเป็นโปรเซสเซอร์เวกเตอร์VLSI ASICที่ออกแบบโดยJim ClarkและMarc Hannahที่มหาวิทยาลัยสแตนฟอร์ดโปรเซสเซอร์นี้เป็นต้นแบบของtensor core สมัยใหม่และโปรเซสเซอร์อื่นๆ ที่คล้ายกันซึ่งวางจำหน่ายสำหรับกราฟิกและ AI Geometry Engine ถูกนำไปใช้ในเวิร์กสเตชัน ของ Silicon Graphicsเป็นเวลาหลายปี ผลิตภัณฑ์แรกของ Silicon Graphics ที่จัดส่งในเดือนพฤศจิกายน 1983 คือ IRIS 1000 ซึ่งเป็นเทอร์มินัลที่มีกราฟิก 3 มิติแบบเร่งความเร็วด้วยฮาร์ดแวร์โดยใช้ Geometry Engine ^[²⁶^] Geometry Engine สามารถประมวลผลได้ประมาณ 6 ล้านครั้งต่อวินาที^[³⁵^]

NEC μPD7220ในปี 1981 เป็นการนำ โปรเซสเซอร์แสดงผลกราฟิก คอมพิวเตอร์ส่วนบุคคล มาใช้เป็นครั้งแรก ในรูป แบบชิป วงจรรวม ขนาดใหญ่ (LSI) ชิปเดียว ทำให้สามารถออกแบบการ์ดกราฟิกวิดีโอประสิทธิภาพสูงราคาประหยัดได้ เช่น การ์ดจากNumber Nine Visual Technologyและกลายเป็น GPU ที่เป็นที่รู้จักมากที่สุดจนถึงกลางทศวรรษ 1980 ^[³⁶^] เป็นโปรเซสเซอร์แสดงผลกราฟิก แบบ VLSI (very large-scale integration) โลหะ-ออกไซด์-เซมิคอนดักเตอร์ ( NMOS ) ตัวแรกที่รวมวงจรอย่างสมบูรณ์สำหรับพีซี รองรับความละเอียดสูงสุด1024×1024และวางรากฐานสำหรับตลาดกราฟิกพีซี มีการนำไปใช้ในการ์ดกราฟิกหลายรุ่นและได้รับอนุญาตให้ใช้กับรุ่นลอกเลียนแบบ เช่น Intel 82720 ซึ่งเป็นหน่วยประมวลผลกราฟิกตัวแรกของ Intel ^[³⁷^]เกมอาร์เคดของWilliams Electronics Robotron: 2084 , Joust , SinistarและBubblesซึ่งวางจำหน่ายในปี 1982 ทั้งหมดมี ชิป blitter แบบกำหนดเอง สำหรับการทำงานบนบิตแมป 16 สี^[³⁸^]^[³⁹^]

ในปี พ.ศ. 2527 ฮิตาชิได้วางจำหน่าย ARTC HD63484 ซึ่งเป็น โปรเซสเซอร์กราฟิก CMOS หลักตัวแรก สำหรับคอมพิวเตอร์ส่วนบุคคล ARTC สามารถแสดงผลความละเอียดสูงสุด 4Kเมื่ออยู่ใน โหมด ขาวดำมีการใช้งานในกราฟิกการ์ดและเทอร์มินัลจำนวนมากในช่วงปลายทศวรรษ พ.ศ. 2523 ^{[ 40 ]}

ในปี 1985 คอมพิวเตอร์ Amigaได้ถูกวางจำหน่ายพร้อมชิปประมวลผลกราฟิกแบบกำหนดเองที่เรียกว่าAgnusซึ่งมีตัวประมวลผลภาพบิตแมป (blitter) สำหรับการจัดการภาพบิตแมป การวาดเส้น และการเติมพื้นที่ นอกจากนี้ยังรวมถึงตัวประมวลผลร่วม (coprocessor)ที่มีชุดคำสั่งง่ายๆ ของตัวเอง ซึ่งสามารถจัดการรีจิสเตอร์ฮาร์ดแวร์กราฟิกให้สอดคล้องกับลำแสงวิดีโอ (เช่น สำหรับการสลับพาเล็ตต่อเส้นสแกน การมัลติเพล็กซ์ สไปรท์ และการจัดการหน้าต่างด้วยฮาร์ดแวร์) หรือขับเคลื่อนตัวประมวลผลภาพบิตแมป (blitter) ได้

นอกจากนี้ ในปี 1985 IBM ยังได้ออกProfessional Graphics Controller ซึ่งออกแบบโดย Curtis Priemผู้ร่วมก่อตั้ง Nvidia ในเวลาต่อมาโดยเป็นการ์ด 3 มิติแบบพื้นฐานที่มี กราฟิก 640 × 480พิกเซล 256 สี ซึ่งใช้ CPU เฉพาะในการวาดกราฟิกโดยอิสระจากระบบหลัก การ์ดนี้ถูกนำไปใช้เป็นพื้นฐานโดยผู้ผลิตหลายราย (รวมถึงMatrox ) และการส่งสัญญาณ RGB แบบอนาล็อกนำไปสู่มาตรฐานวิดีโอ VGA โดยตรง^{[ 26 ]}ต่อมาในช่วงทศวรรษ 1980 Priem ได้ทำงานเกี่ยวกับการ์ดกราฟิก 2 มิติเร่งความเร็วSun Microsystems GX (หรือที่รู้จักกันในชื่อ cgsix) ที่มีอิทธิพล ^{[ 41 ]}

ในปี พ.ศ. 2529 Texas Instrumentsได้วางจำหน่ายTMS34010ซึ่งเป็นโปรเซสเซอร์กราฟิกแบบโปรแกรมได้เต็มรูปแบบตัวแรก^{[ 42 ]}มันสามารถรันโค้ดทั่วไปได้ แต่ยังมีชุดคำสั่งที่เน้นกราฟิกด้วย ในช่วงปี พ.ศ. 2533–2535 ชิปนี้ได้กลายเป็นพื้นฐานของการ์ด เร่งความเร็ว Windows ของ Texas Instruments Graphics Architecture ("TIGA")

ต่อมาในปี 1987 ระบบกราฟิก IBM 8514ได้ถูกวางจำหน่าย นับเป็นหนึ่งในกราฟิกการ์ดรุ่นแรกๆ สำหรับเครื่องคอมพิวเตอร์ที่เข้ากันได้กับ IBM PCที่ใช้ฟังก์ชันคงที่สำหรับกราฟิก 2 มิติในฮาร์ดแวร์อิเล็กทรอนิกส์Sharp X68000ที่วางจำหน่ายในปี 1987 ใช้ชิปเซ็ตกราฟิกแบบกำหนดเอง^{[ 43 ]}ที่มีจานสี 65,536 สี และรองรับฮาร์ดแวร์สำหรับสไปรท์ การเลื่อน และสนามเล่นหลายสนาม^{[ 44 ]}โดยทำหน้าที่เป็นเครื่องพัฒนาสำหรับ บอร์ดเกมอาร์เคด CP SystemของCapcom คอมพิวเตอร์ FM Townsของ Fujitsu ที่วางจำหน่ายในปี 1989 รองรับจานสี 16,777,216 สี^[⁴⁵^]

เพื่อเป็นข้อมูลประกอบIBMยังได้เปิด ตัวระบบแสดงผล Video Graphics Array (VGA) ในปี 1987 ด้วยความละเอียดสูงสุด640 × 480พิกเซล ซึ่งแตกต่างจาก 8514/A ตรงที่ VGA ไม่มีคุณสมบัติการเร่งความเร็วฮาร์ดแวร์ ในเดือนพฤศจิกายนปี 1988 NEC Home Electronicsได้ประกาศการก่อตั้งVideo Electronics Standards Association (VESA) เพื่อพัฒนาและส่งเสริมมาตรฐานการแสดงผลคอมพิวเตอร์Super VGA (SVGA) ให้เป็นมาตรฐานต่อจาก VGA Super VGA ช่วยให้สามารถแสดงผลกราฟิกด้วยความละเอียดสูงสุดถึง800 × 600พิกเซลซึ่งเพิ่มขึ้น 56% ^[⁴⁶^]

ในปี พ.ศ. 2531 SGI ได้จำหน่ายกราฟิกเวิร์กสเตชัน IRIS ที่มี Geometry Engine จำนวน 10-12 ตัว และได้เปิดตัวบอร์ดเสริมIrisVision สำหรับบัส IBM MicroChannel ( RS/6000 ) ซึ่งใช้ Geometry Engine เช่นกัน^{[ 26 ]}

ในปี พ.ศ. 2531 ได้มีการเปิดตัวบอร์ดกราฟิก 3 มิติแบบโพลีโกนเฉพาะเครื่องแรกในเครื่องเกมอาร์เคด ได้แก่Namco System 21 ^{[ 47 ]}และTaito Air System ^{[ 48 ]}

ทศวรรษ 1990

ในช่วงทศวรรษ 1990 ฮาร์ดแวร์กราฟิก 3 มิติสำหรับเวิร์กสเตชันระดับมืออาชีพจาก Sun Microsystems, SGI และบริษัทอื่นๆ ได้ก้าวหน้าไปอย่างมาก การเปิดตัวOpenGLโดย SGI ในปี 1992 ได้ปูทางไปสู่มาตรฐานอินเทอร์เฟซการเขียนโปรแกรม 3 มิติที่ไม่ขึ้นกับฮาร์ดแวร์^{[ 49 ]}^{[ 50 ]}อย่างไรก็ตาม ในช่วงกลางและปลายทศวรรษ 1990 ฮาร์ดแวร์ระดับมืออาชีพก็ค่อยๆ ถูกบดบังด้วยผลิตภัณฑ์สำหรับผู้บริโภคซึ่งให้ประสิทธิภาพที่คล้ายคลึงกันหรือดีกว่า โดยเฉพาะอย่างยิ่งในด้านการแมปพื้นผิว ในราคาที่ต่ำกว่าและบนแพลตฟอร์มที่ผู้ใช้คุ้นเคย^{[ 50 ]}^{[ 51 ]}

ในปี พ.ศ. 2534 S3 Graphicsได้เปิดตัวS3 86C911ซึ่งนักออกแบบตั้งชื่อตามPorsche 911เพื่อบ่งบอกถึงประสิทธิภาพที่เพิ่มขึ้นตามที่สัญญาไว้^{[ 52 ]} 86C911 ได้ก่อให้เกิดผู้เลียนแบบมากมาย: ภายในปี พ.ศ. 2538 ผู้ผลิตชิปกราฟิกพีซีรายใหญ่ทั้งหมดได้เพิ่ม การรองรับการเร่งความเร็ว 2 มิติลงในชิปของตน^{[ 53 ]}ตัวเร่งความเร็ว Windowsที่มีฟังก์ชันคงที่ได้แซงหน้าตัวประมวลผลกราฟิกทั่วไปที่มีราคาแพงในด้านประสิทธิภาพของ Windows และตัวประมวลผลร่วมดังกล่าวก็ค่อยๆ หายไปจากตลาดพีซี

ในช่วงต้นและกลางทศวรรษ 1990 กราฟิก 3 มิติ แบบเรียลไทม์เริ่มแพร่หลายมากขึ้นในเกมอาร์เคด เกมคอมพิวเตอร์ และเกมคอนโซล ซึ่งนำไปสู่ความต้องการของสาธารณชนที่เพิ่มขึ้นสำหรับกราฟิก 3 มิติที่เร่งความเร็วด้วยฮาร์ดแวร์ ตัวอย่างแรกๆ ของฮาร์ดแวร์กราฟิก 3 มิติสำหรับตลาดมวลชนสามารถพบได้ในบอร์ดระบบอาร์เคด เช่นSega Model 1 , Namco System 22และSega Model 2และคอนโซลวิดีโอเกมรุ่นที่ห้าเช่นSaturn , PlayStationและNintendo 64ระบบอาร์เคดเช่น Sega Model 2 และ Namco Magic Edge Hornet Simulator ที่ใช้ SGI Onyxในปี 1993 สามารถทำการแปลง การตัด และการให้แสง ( transform, clipping, and lighting ) ด้วยฮาร์ดแวร์ได้หลายปีก่อนที่จะปรากฏในกราฟิกการ์ดสำหรับผู้บริโภค^{[ 54 ]}^{[ 55 ]}ในปี 1994 Sony ใช้คำว่า GPU (ซึ่งหมายถึงหน่วยประมวลผลกราฟิก) ในการอ้างอิงถึง GPU ของ Sony ที่ออกแบบโดย Toshiba สำหรับคอนโซล PlayStation ^{[ 3 ]}

อีกตัวอย่างหนึ่งในช่วงแรกคือ ชิป Super FXซึ่งเป็นชิปกราฟิกแบบRISCที่ใช้ในเกมSNES บางเกม โดยเฉพาะ DoomและStar Foxบางระบบใช้DSPเพื่อเร่งการแปลงFujitsuซึ่งทำงานเกี่ยวกับระบบเกมอาร์เคด Sega Model 2 ^[⁵⁶^]เริ่มทำงานเกี่ยวกับการรวม T&L เข้ากับ โซลูชัน LSI เดียว เพื่อใช้ในคอมพิวเตอร์ส่วนบุคคลในปี 1995 ^[⁵⁷^] Fujitsu Pinolite ซึ่งเป็นโปรเซสเซอร์เรขาคณิต 3 มิติเครื่องแรกสำหรับคอมพิวเตอร์ส่วนบุคคล ได้รับการประกาศในปี 1997 ^[⁵⁸^] GPU ฮาร์ดแวร์ T&L เครื่องแรกในคอนโซลวิดีโอเกม ที่บ้านคือReality CoprocessorของNintendo 64ซึ่งวางจำหน่ายในปี 1996 ^[⁵⁹^]ในปี 1997 Mitsubishiได้วางจำหน่าย3Dpro/2MPซึ่งเป็น GPU ที่สามารถแปลงและให้แสงได้ สำหรับเวิร์กสเตชันและเดสก์ท็อปWindows NT ^[⁶⁰^] ATiใช้มันสำหรับการ์ดกราฟิก FireGL 4000ซึ่งวางจำหน่ายในปี 1997 ^[⁶¹^]

คำว่า "GPU" ถูกบัญญัติโดยโซนี่ เพื่ออ้างถึง GPU ของโซนี่แบบ 32 บิต(ออกแบบโดยโตชิบา ) ในเครื่องเล่นวิดีโอเกมPlayStation ซึ่งวางจำหน่ายในปี 1994 ^{[ 62 ]}

ทศวรรษ 2000

ในเดือนตุลาคม พ.ศ. 2545 ด้วยการเปิดตัวATI Radeon 9700 (หรือที่รู้จักกันในชื่อ R300) ซึ่งเป็นตัวเร่งความเร็วDirect3D 9.0 ตัวแรกของโลก พิกเซลและเวอร์เท็กซ์ เชเดอร์สามารถใช้งานการวนซ้ำและการคำนวณเลขทศนิยมที่ยาวนานได้และกำลังกลายเป็นสิ่งที่ยืดหยุ่นได้เร็วเทียบเท่ากับ CPU แต่เร็วกว่าหลายเท่าสำหรับการดำเนินการอาร์เรย์รูปภาพ พิกเซลเชเดอร์มักใช้สำหรับการทำแผนที่พื้นผิวแบบนูนซึ่งเพิ่มพื้นผิวเพื่อให้วัตถุดูมันวาว ด้าน หยาบ หรือแม้กระทั่งกลมหรือนูนออกมา^{[ 63 ]}

ด้วยการเปิดตัว Nvidia GeForce 8 ซีรีส์และหน่วยประมวลผลสตรีมทั่วไปใหม่ GPU จึงกลายเป็นอุปกรณ์ประมวลผลทั่วไปมากขึ้น GPU แบบขนานกำลังก้าวหน้าในการคำนวณแข่งกับ CPU และสาขาย่อยของการวิจัยที่เรียกว่าการประมวลผล GPU หรือGPGPUสำหรับการประมวลผลทั่วไปบน GPUได้ถูกนำไปประยุกต์ใช้ในสาขาที่หลากหลาย เช่น การเรียนรู้ ของเครื่อง^{[ 64 ]}การสำรวจน้ำมัน การประมวลผลภาพทางวิทยาศาสตร์พีชคณิตเชิงเส้น [ ⁶⁵^]สถิติ^[⁶⁶^]การสร้างภาพ 3 มิติ^และการ กำหนดราคา ออปชั่นหุ้น GPGPU เป็นต้นแบบของสิ่งที่เรียกว่า compute shader ในปัจจุบัน (เช่นCUDA , OpenCL , DirectCompute ) และได้ใช้ฮาร์ดแวร์ในทางที่ผิดในระดับหนึ่งโดยการจัดการข้อมูลที่ส่งผ่านไปยังอัลกอริทึมเป็นแผนที่พื้นผิวและดำเนินการอัลกอริทึมโดยการวาดรูปสามเหลี่ยมหรือสี่เหลี่ยมด้วย pixel shader ที่เหมาะสม ซึ่งส่งผลให้เกิดค่าใช้จ่ายเพิ่มเติมบางส่วน เนื่องจากมีการใช้หน่วยประมวลผลต่างๆ เช่น ตัวแปลงสัญญาณสแกนในจุดที่ไม่จำเป็น (และการจัดการรูปสามเหลี่ยมก็ไม่ใช่เรื่องสำคัญ ยกเว้นเพื่อเรียกใช้พิกเซลเชเดอร์)

แพลตฟอร์ม CUDA ของ Nvidia ซึ่งเปิดตัวครั้งแรกในปี 2550 ^{[ 67 ]}เป็นโมเดลการเขียนโปรแกรมที่ได้รับการยอมรับอย่างกว้างขวางเป็นครั้งแรกสำหรับการประมวลผล GPU OpenCL เป็นมาตรฐานเปิดที่กำหนดโดยKhronos Groupซึ่งอนุญาตให้พัฒนาโค้ดสำหรับทั้ง GPU และ CPU โดยเน้นที่ความสามารถในการพกพา^{[ 68 ]}โซลูชัน OpenCL ได้รับการสนับสนุนโดย Intel, AMD, Nvidia และ ARM และตามรายงานในปี 2554 โดยEvans Data OpenCL ได้กลายเป็นเครื่องมือ HPC ที่ได้รับความนิยมเป็นอันดับสอง^{[ 69 ]}

ทศวรรษ 2010

ในปี 2010 Nvidia ได้ร่วมมือกับAudiเพื่อขับเคลื่อนแผงหน้าปัดรถยนต์ โดยใช้ GPU Tegraเพื่อเพิ่มฟังก์ชันการทำงานให้กับระบบนำทางและระบบความบันเทิงของรถยนต์^{[ 70 ]}ความก้าวหน้าในเทคโนโลยี GPU ในรถยนต์ช่วยพัฒนาเทคโนโลยีการขับขี่อัตโนมัติ [ ^{71 ] การ์ด} Radeon HD 6000 seriesของ AMD เปิดตัวในปี 2010 และในปี 2011 AMD ได้เปิดตัว GPU แบบแยกส่วน 6000M Series สำหรับอุปกรณ์พกพา^{[ 72 ]} การ์ดกราฟิก ตระกูล KeplerของNvidia เปิดตัวในปี 2012 และถูกนำมาใช้ในการ์ด Nvidia 600 และ 700 series คุณสมบัติหนึ่งในสถาปัตยกรรมไมโคร GPU นี้รวมถึง GPU boost ซึ่งเป็นเทคโนโลยีที่ปรับความเร็วสัญญาณนาฬิกาของการ์ดวิดีโอให้เพิ่มขึ้นหรือลดลงตามการใช้พลังงาน^{[ 73 ]} Kepler ยังได้แนะนำเทคโนโลยีเร่งความเร็วการเข้ารหัสวิดีโอ NVENC อีกด้วย

PS4 และXbox One วางจำหน่ายในปี 2013 โดยทั้งสองเครื่องใช้ GPU ที่พัฒนามาจากRadeon HD 7850 และ 7790 ของ AMD [ ⁷⁴^]^GPUตระกูล Kepler ของ Nvidia ตามมาด้วย ตระกูล Maxwellซึ่งผลิตด้วยกระบวนการเดียวกัน ชิป 28 นาโนเมตรของ Nvidia ผลิตโดยTSMCในไต้หวันโดยใช้กระบวนการ 28 นาโนเมตร เมื่อเทียบกับเทคโนโลยี 40 นาโนเมตรในอดีต กระบวนการผลิตนี้ช่วยเพิ่มประสิทธิภาพได้ถึง 20 เปอร์เซ็นต์ในขณะที่ใช้พลังงานน้อยลง^[⁷⁵^]^[⁷⁶^]ชุดหูฟังเสมือนจริงมีความต้องการระบบสูง ผู้ผลิตแนะนำให้ใช้ GTX 970 และ R9 290X หรือดีกว่าในขณะที่วางจำหน่าย^[⁷⁷^]^[⁷⁸^]การ์ดที่ใช้ สถาปัตยกรรมไมโคร Pascalวางจำหน่ายในปี 2016 การ์ด GeForce 10 ซีรีส์เป็นการ์ดกราฟิกรุ่นนี้ ผลิตโดยใช้กระบวนการผลิต 16 นาโนเมตร ซึ่งปรับปรุงจากสถาปัตยกรรมไมโครรุ่นก่อนหน้า^[⁷⁹^]

ในปี 2018 Nvidia ได้เปิดตัว GPU ซีรีส์ RTX 20 ซึ่งเพิ่ม คอร์ เรย์เทรซซิ่งให้กับ GPU ทำให้สามารถเรย์เทรซซิ่งแบบเรียลไทม์ได้อย่างมีประสิทธิภาพบนฮาร์ดแวร์สำหรับตลาดทั่วไป^{[ 80 ]} GPU Polaris 11และPolaris 10จาก AMD ผลิตด้วยกระบวนการ 14 นาโนเมตร การเปิดตัวส่งผลให้ประสิทธิภาพต่อวัตต์ของการ์ดวิดีโอ AMD เพิ่มขึ้นอย่างมาก^{[ 81 ]} AMD ยังได้เปิดตัว GPU ซีรีส์ Vega สำหรับตลาดระดับไฮเอนด์เพื่อเป็นคู่แข่งกับการ์ด Pascal ระดับไฮเอนด์ของ Nvidia ซึ่งมีคุณสมบัติHBM2เช่นเดียวกับ Titan V

ในปี 2019 AMD ได้เปิดตัวสถาปัตยกรรม ไมโคร/ชุดคำสั่ง Graphics Core Next (GCN) รุ่นต่อจากเดิม โดยใช้ชื่อว่าRDNAผลิตภัณฑ์แรกที่ใช้สถาปัตยกรรมนี้คือการ์ดจอRadeon RX 5000 ซีรีส์^{[ 82 ]}บริษัทได้ประกาศว่าสถาปัตยกรรมไมโคร RDNA รุ่นต่อจากนี้จะเป็นการปรับปรุงเพิ่มเติม (เป็นการ "รีเฟรช") AMD ได้เปิดตัวRadeon RX 6000 ซีรีส์ซึ่งเป็น การ์ดจอ RDNA 2ที่รองรับการเรย์เทรซซิ่งแบบเร่งด้วยฮาร์ดแวร์^{[ 83 ]}ผลิตภัณฑ์ซีรีส์นี้เปิดตัวในช่วงปลายปี 2020 ประกอบด้วย RX 6800, RX 6800 XT และ RX 6900 XT ^{[ 84 ]}^{[ 85 ]}ส่วน RX 6700 XT ซึ่งใช้ Navi 22 นั้น เปิดตัวในช่วงต้นปี 2021 ^{[ 86 ]}

PlayStation 5และXbox Series X และ Series Sวางจำหน่ายในปี 2020 โดยทั้งสองเครื่องใช้ GPU ที่ใช้สถาปัตยกรรมไมโคร RDNA 2 พร้อมการปรับปรุงทีละน้อยและการกำหนดค่า GPU ที่แตกต่างกันในแต่ละระบบ^{[ 87 ]}^{[ 88 ]}^{[ 89 ]}

ทศวรรษ 2020

ในช่วงทศวรรษ 2020 GPU ได้ถูกนำมาใช้มากขึ้นสำหรับการคำนวณที่เกี่ยวข้องกับ ปัญหา แบบขนานอย่างง่ายดายเช่น การฝึกเครือข่ายประสาทเทียมบนชุดข้อมูลขนาดใหญ่ที่จำเป็นสำหรับโมเดลภาษาขนาดใหญ่ ของปัญญาประดิษฐ์ คอร์ประมวลผลเฉพาะทางบน GPU รุ่นใหม่ส่วนใหญ่ที่ออกแบบมาสำหรับการเรียนรู้เชิงลึกให้ ประสิทธิภาพ FLOPSที่เพิ่มขึ้นอย่างมาก โดยใช้การคูณและการหารเมทริกซ์ 4×4 การใช้งานในช่วงแรก เช่น สถาปัตยกรรมไมโคร Volta ของ Nvidia ที่เปิดตัวในปี 2017 ^{[ 90 ]}พบผลลัพธ์สูงถึง 128 TFLOPS ในบางแอปพลิเคชัน^{[ 91 ]}

นับตั้งแต่นั้นมา คอร์เร่งความเร็ว AI ได้กลายเป็นคุณสมบัติที่ได้รับการยอมรับอย่างกว้างขวางในสถาปัตยกรรมไมโครสำหรับผู้บริโภคและเวิร์กสเตชัน โดยเริ่มจาก สถาปัตยกรรม ไมโคร Turing ของ Nvidia ในปี 2018 ^{[ 80 ]}ซึ่งเรียกว่า Tensor cores เดิมทีใช้สำหรับDeep Learning Super Sampling (DLSS) เพื่อเพิ่มประสิทธิภาพการเล่นเกมและปรับปรุงคุณภาพของภาพ ต่อมาได้มีการนำไปใช้ในซอฟต์แวร์ Broadcastของ Nvidia เพื่อมอบเอฟเฟกต์ที่ขับเคลื่อนด้วย AI มากมาย เช่น การกรองเสียงและการลดเสียงรบกวนในวิดีโอ และในซอฟต์แวร์อื่นๆ เช่นBlenderสำหรับ DLSS ในพอร์ตแสดงผล

เดิมที AMD ได้นำเอา "Matrix" Cores ที่เทียบเท่ากันมาใช้กับผู้บริโภคใน สถาปัตยกรรม RDNA 3แต่ Matrix Cores ของ RDNA 4 เป็นรุ่นแรกที่แนะนำการเร่งความเร็ว FP8 ซึ่งจำเป็นต่อการใช้งาน ฟีเจอร์ FSR Redstone อย่างเต็ม รูปแบบ เช่น Machine Learning Upscaling และ Frame Generation อย่างไรก็ตาม การดัดแปลงโดยชุมชนบนทั้ง Linux และ Windows ทำให้ GPU RDNA 2, 3 และ GPU ของคู่แข่งสามารถใช้งาน FSR 4 เวอร์ชันที่อ่อนกว่าที่เรียกว่า FSR 4 INT8 ได้PlayStation 5 Proที่เปิดตัวในปี 2024 มี Machine Learning cores ที่ปรับแต่งเอง ซึ่งเน้นเฉพาะการเร่งความเร็ว INT8 โดยอิงจาก RDNA 4 สำหรับ PlayStation Spectral Super Resolution เพื่อเพิ่มอัตราเฟรมและคุณภาพของภาพ

อินเทลได้นำเอาหน่วยประมวลผล "XMX" ที่เทียบเท่ากันมาใช้ใน GPU Arcทุกรุ่นโดยเริ่มจาก สถาปัตยกรรมไมโคร Alchemistซึ่งใช้สำหรับ XeSS (Xe Super Sampling), XeFG (Xe Frame Generation) และอื่นๆ

การเรย์เทรซซิ่งยังแพร่หลายอย่างมากในช่วงปี 2020 โดยมีเกมบางเกม เช่นDOOM: The Dark Agesที่ต้องใช้ GPU ที่รองรับการเรย์เทรซซิ่งแบบฮาร์ดแวร์จึงจะสามารถเริ่มเล่นได้^{[ 92 ]}แม้ว่าจะส่งผลให้ประสิทธิภาพลดลงและเข้าถึงได้ยากขึ้นโดยรวม แต่id softwareอ้างว่าสิ่งนี้ช่วยประหยัดเวลาทำงานหลายชั่วโมงและลดขนาดเกมลงกว่า 100 กิกะไบต์ เนื่องจากเกมถูกสร้างขึ้นโดยใช้การเรย์เทรซซิ่งทั้งหมด

ฝ่ายขาย

ในปี 2556 มีการจัดส่ง GPU ทั่วโลกจำนวน 438.3 ล้านเครื่อง และคาดการณ์สำหรับปี 2557 ไว้ที่ 414.2 ล้านเครื่อง อย่างไรก็ตาม ในไตรมาสที่สามของปี 2565 การจัดส่ง GPU สำหรับพีซีมีจำนวนรวมประมาณ 75.5 ล้านเครื่อง ลดลง 19% เมื่อเทียบกับปีก่อนหน้า^{[ 93 ]}^{[ 94 ]}

ดูเพิ่มเติม

ฮาร์ดแวร์

รายชื่อหน่วยประมวลผลกราฟิกของ AMD
รายชื่อหน่วยประมวลผลกราฟิกของ Nvidia
รายชื่อหน่วยประมวลผลกราฟิกของ Intel
รายชื่อหน่วยประมวลผลกราฟิกแบบแยกและแบบรวม
อินเทล จีเอ็มเอ
ลาร์ราบี
Nvidia PureVideo – เทคโนโลยีบิตสตรีมจากNvidiaที่ใช้ในชิปประมวลผลกราฟิกของพวกเขาเพื่อเร่งความเร็วในการถอดรหัสวิดีโอบนฮาร์ดแวร์ GPU ด้วย DXVA
โซซี
UVD (Unified Video Decoder) – เทคโนโลยีบิตสตรีมสำหรับการถอดรหัสวิดีโอจาก ATI เพื่อรองรับการถอดรหัสด้วยฮาร์ดแวร์ (GPU) ร่วมกับ DXVA

API

API OpenGL
OpenCL API
API OpenVX
เทนเซอร์โฟลว์ ไลท์
แมนเทิล (เอพีไอ)
โลหะ (เอพีอี)
- ML หลัก
วัลกัน (API)
ไดเร็กต์3ดี
- API การเร่งความเร็ววิดีโอ DirectX (DxVA)สำหรับระบบปฏิบัติการMicrosoft Windows
- ไดเร็กต์เอ็มแอล
ไดเร็กต์2ดี
- ไดเร็กดรอว์
- ไดเร็กต์ไรท์
API เร่งความเร็ววิดีโอ (VA API)
VDPAU (Video Decode and Presentation API for Unix)
X-Video Bitstream Acceleration (XvBA)คือเทคโนโลยีที่เทียบเท่ากับ DXVA ใน X11 สำหรับ MPEG-2, H.264 และ VC-1
X-Video Motion Compensation – ระบบชดเชยการเคลื่อนไหวแบบ X11 สำหรับตัวแปลงสัญญาณวิดีโอ MPEG-2 เท่านั้น

แอปพลิเคชัน

คลัสเตอร์ GPU
Mathematica – มีระบบรองรับการประมวลผล GPU ด้วย CUDA และ OpenCL ในตัว
การสร้างแบบจำลองโมเลกุลบน GPU
Deeplearning4j – โซลูชันโอเพนซอร์สสำหรับการเรียนรู้เชิงลึกแบบกระจายศูนย์สำหรับภาษา Java

ประชากร

รายชื่อชื่อที่นำมาใช้ตั้งชื่อสถาปัตยกรรมไมโครของ GPU ของ Nvidia

แหล่งที่มา

เพ็ดดี, จอน (1 มกราคม 2023). ประวัติศาสตร์ของ GPU – การพัฒนาใหม่ๆ . สปริงเกอร์ เนเจอร์. ISBN 978-3-03-114047-1. OCLC 1356877844 .

ลิงก์ภายนอก

NVIDIA – การประมวลผลด้วย GPU คืออะไร?
ชุดหนังสือ GPU Gems
– ประวัติฮาร์ดแวร์กราฟิก(เก็บถาวรเมื่อ 31 มีนาคม 2022 ที่Wayback Machine)
วิธีการทำงานของ GPU
โปรแกรมดูข้อมูล GPU Caps – โปรแกรมแสดงข้อมูลการ์ดจอ
ภาพรวม GPU ARM Mali

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[

[

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

,

31 ] คอมพิวเตอร์

[ 32 ]

[

[

[

[

[

[

[

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

[ 44 ]

[

[

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

[ 52 ]

[ 53 ]

[ 54 ]

[ 55 ]

[

[

[

[

[

[

[ 62 ]

[ 63 ]

[ 64 ]

65

66

[ 67 ]

[ 68 ]

[ 69 ]

[ 70 ]

71 ] การ์ด

[ 72 ]

[ 73 ]

74

[

[

[

[

[

[ 81 ]

[ 82 ]

[ 83 ]

[ 84 ]

[ 85 ]

[ 86 ]

[ 87 ]

[ 88 ]

[ 89 ]

[ 90 ]

[ 91 ]

[ 92 ]

[ 93 ]

[ 94 ]