กลับไปหน้าบทความ

อ่าน 21 นาที

หน่วยประมวลผลกราฟิก

หน่วย ประมวลผลกราฟิก ( GPU ) คือ วงจรไฟฟ้า เฉพาะทางที่ออกแบบมาสำหรับ การประมวลผลภาพดิจิทัล และเร่งความเร็วใน การประมวล ผลกราฟิกคอมพิวเตอร์ โดยอาจเป็นส่วนประกอบใน กราฟิกการ์ด...

หน่วยประมวลผลกราฟิก

ส่วนประกอบต่างๆ ของ GPU

หน่วยประมวลผลกราฟิก ( GPU ) คือ วงจรไฟฟ้าเฉพาะทางที่ออกแบบมาสำหรับการประมวลผลภาพดิจิทัลและเร่งความเร็วใน การประมวล ผลกราฟิกคอมพิวเตอร์โดยอาจเป็นส่วนประกอบในกราฟิกการ์ด แบบแยก หรือฝังอยู่ในเมนบอร์ดโทรศัพท์มือถือคอมพิวเตอร์ส่วนบุคคลเวิร์กสเตชันและเครื่องเล่นเกม GPU ยังถูกนำมาใช้ใน การประมวลผล ปัญญาประดิษฐ์ (AI) มากขึ้นเรื่อยๆ เนื่องจากความสามารถในการเร่งความเร็วเชิงพีชคณิตเชิงเส้น ซึ่งถูกนำมาใช้กันอย่างแพร่หลายในการประมวลผลกราฟิกเช่นกัน

ถึงแม้ว่าจะไม่มีคำจำกัดความที่ตายตัวสำหรับคำนี้ และอาจใช้เพื่ออธิบายระบบแสดงผลวิดีโอใดๆ ก็ได้ แต่ในปัจจุบัน GPU หมายถึงความสามารถในการคำนวณภายในที่จำเป็นสำหรับงานกราฟิกต่างๆ เช่น การหมุนและการปรับขนาดภาพ 3 มิติ และมักมีความสามารถเพิ่มเติมในการเรียกใช้โปรแกรมที่กำหนดเองที่เรียกว่าshadersซึ่งแตกต่างจากตัวควบคุมกราฟิกในยุคก่อนๆ ที่เรียกว่าตัวควบคุมการแสดงผลวิดีโอ (video display controllers)ซึ่งไม่มีความสามารถในการคำนวณภายใน หรือblittersซึ่งทำได้เพียงการเคลื่อนย้ายข้อมูลในหน่วยความจำขั้นพื้นฐานเท่านั้น GPU สมัยใหม่ถือกำเนิดขึ้นในช่วงทศวรรษ 1990 โดยเพิ่มความสามารถในการดำเนินการต่างๆ เช่น การวาดเส้นและข้อความโดยไม่ต้อง อาศัย CPUและต่อมาได้เพิ่มฟังก์ชันการทำงาน 3 มิติ

โดยทั่วไปแล้ว ฟังก์ชันด้านกราฟิกจะทำงานแยกจากกัน ทำให้สามารถใช้งานฟังก์ชันเหล่านี้บนหน่วยประมวลผลที่แยกจากกันได้ หน่วยประมวลผลกราฟิก (GPU) สมัยใหม่มีหน่วยประมวลผลหลายร้อยหรือหลายพันหน่วย ทำให้มีประโยชน์สำหรับการคำนวณที่ไม่เกี่ยวข้องกับกราฟิก ซึ่งเกี่ยวข้องกับ ปัญหาที่สามารถประมวลผล แบบขนานได้อย่างง่ายดายเนื่องจากโครงสร้างแบบขนานความสามารถของ GPU ในการคำนวณจำนวนมากได้อย่างรวดเร็ว ทำให้มีการนำไปใช้ในหลากหลายสาขา รวมถึงปัญญาประดิษฐ์ (AI) ซึ่ง GPU มีความสามารถโดดเด่นในการจัดการงานที่ต้องใช้ข้อมูลจำนวนมากและต้องการการคำนวณสูง การใช้งานที่ไม่เกี่ยวข้องกับกราฟิกอื่นๆ ได้แก่ การฝึกโครงข่ายประสาท เทียม และการขุดคริปโตเคอร์เรนซี

บริษัทผู้ผลิต GPU

บริษัทหลายแห่งผลิต GPU ภายใต้ชื่อแบรนด์ต่างๆ มากมาย ในปี 2552 Intel , NvidiaและAMD / ATIเป็นผู้นำตลาด โดยมีส่วนแบ่งการตลาด 49.4%, 27.8% และ 20.6% ตามลำดับ นอกจากนี้Matrox [ 1 ]ซึ่งเดิมผลิตโซลูชันแบบกำหนดเอง ปัจจุบันได้ปรับแต่ง GPU จาก Intel และ AMD สำหรับการใช้งานเวิร์กสเตชัน บริษัทจีน เช่นJingjia Microก็ได้ผลิต GPU สำหรับตลาดภายในประเทศเช่นกัน แม้ว่าในแง่ของยอดขายทั่วโลก พวกเขาจะตามหลังผู้นำตลาดอยู่ก็ตาม[ 2 ]

ฟังก์ชันการคำนวณ

การ์ดจอ ATI HD5470 (ดังภาพด้านบน พร้อม ท่อระบาย ความร้อน ทองแดง ) มีคุณสมบัติUVD 2.1 ซึ่งช่วยให้สามารถถอดรหัสวิดีโอรูปแบบ AVC และ VC-1 ได้

ปัจจัยหลายประการในการสร้าง GPU ส่งผลต่อประสิทธิภาพของการ์ดสำหรับการเรนเดอร์แบบเรียลไทม์ เช่น ขนาดของเส้นทางเชื่อมต่อในการผลิตอุปกรณ์เซมิคอนดักเตอร์ความถี่ของสัญญาณนาฬิกาและจำนวนและขนาดของแคชหน่วย ความจำบนชิปต่างๆ ประสิทธิภาพยังได้รับผลกระทบจากจำนวนสตรีมมิ่งมัลติโปรเซสเซอร์ (SM) สำหรับ GPU ของ NVidia หรือหน่วยประมวลผล (CU) สำหรับ GPU ของ AMD หรือคอร์ Xe สำหรับ GPU ที่ใช้ Intel Xe ซึ่งอธิบายถึงจำนวนหน่วยประมวลผลหลักบนซิลิคอนภายในชิป GPU ที่ทำการคำนวณหลัก โดยทั่วไปจะทำงานแบบขนานกับ SM/CU อื่นๆ บน GPU ประสิทธิภาพของ GPU โดยทั่วไปจะวัดเป็นจำนวนการดำเนินการจุดลอยตัวต่อวินาที ( FLOPS ) GPU รุ่นใหม่โดยทั่วไปจะให้ประสิทธิภาพที่วัดเป็นเทราฟลอป (TFLOPS) นี่เป็นการวัดประสิทธิภาพโดยประมาณ และไม่ควรนำมาใช้เป็นข้อเท็จจริง เนื่องจากปัจจัยอื่นๆ อาจส่งผลต่อประสิทธิภาพที่แท้จริง[ 3 ]

GPU รุ่นใหม่ๆ ยังมีบล็อกฮาร์ดแวร์เฉพาะสำหรับการเรย์เทรซซิ่งการเข้ารหัสวิดีโอและการเร่งความเร็ว AIอีก ด้วย

รูปแบบของ GPU

ในคอมพิวเตอร์ส่วนบุคคล GPU มีสองรูปแบบหลัก ได้แก่ กราฟิกเฉพาะ (เรียกอีกอย่างว่ากราฟิกแยก) และกราฟิกแบบรวม (เรียกอีกอย่างว่าโซลูชันกราฟิกแบบใช้ร่วมกัน โปรเซสเซอร์กราฟิกแบบรวม (IGP) หรือสถาปัตยกรรมหน่วยความจำแบบรวม (UMA)) [ 4 ]

หน่วยประมวลผลกราฟิกเฉพาะ

การ์ดจอแยกใช้RAM ในตัว ที่จัดสรรไว้สำหรับ GPU โดยเฉพาะ แทนที่จะใช้หน่วยความจำหลักของระบบคอมพิวเตอร์ โดยปกติแล้ว RAM นี้จะถูกเลือกมาเป็นพิเศษสำหรับปริมาณงานประมวลผลแบบอนุกรมที่คาดหวังของการ์ดจอ เช่นGDDR SDRAMซึ่งมีข้อดีด้านประสิทธิภาพอย่างมาก แต่ก็มีข้อเสียคืออาจเกิดปัญหา "คอขวด" เมื่อหน่วยความจำเฉพาะหมด ทำให้ประสิทธิภาพลดลง

เทคโนโลยีต่างๆ เช่นScalable Link Interface (SLI), NVLinkและCrossFireช่วยให้ GPU หลายตัวสามารถวาดภาพพร้อมกันบนหน้าจอเดียว ซึ่งเพิ่มพลังการประมวลผลสำหรับกราฟิก อย่างไรก็ตาม เทคโนโลยีเหล่านี้เริ่มไม่เป็นที่นิยมมากขึ้น เกมส่วนใหญ่ไม่ได้ใช้ GPU หลายตัวอย่างเต็มที่ เนื่องจากผู้ใช้ส่วนใหญ่ไม่สามารถซื้อได้[ 5 ] [ 6 ] [ 7 ] GPU หลายตัวยังคงถูกใช้ในซูเปอร์คอมพิวเตอร์ (เช่นในSummit ) บนเวิร์กสเตชันเพื่อเร่งความเร็ววิดีโอ (ประมวลผลวิดีโอหลายรายการพร้อมกัน) [ 8 ] [ 4 ] [ 9 ]และการเรนเดอร์ 3 มิติ[ 10 ]สำหรับเอฟเฟกต์ภาพ (VFX) [ 11 ] เวิร์กโหลด หน่วยประมวลผลกราฟิกอเนกประสงค์ (GPGPU) และสำหรับการจำลอง[ 12 ]และใน AI เพื่อเร่งการฝึกอบรม เช่นเดียวกับเวิร์กสเตชันและเซิร์ฟเวอร์ DGX ของ Nvidia

หน่วยประมวลผลกราฟิกแบบรวม

ตำแหน่งของ GPU แบบรวมในระบบโครงสร้างแบบนอร์ธบริดจ์ / เซาท์บริดจ์
เมนบอร์ดASRockที่มีกราฟิกในตัว พร้อมพอร์ต HDMI, VGA และ DVI สำหรับต่อออกสัญญาณ

หน่วยประมวลผลกราฟิกแบบรวม (IGPU) หรือที่เรียกว่ากราฟิกแบบรวมโซลูชันกราฟิกแบบใช้ร่วมกันหน่วยประมวลผลกราฟิกแบบรวม (IGP) หรือสถาปัตยกรรมหน่วยความจำแบบรวม (UMA) ใช้ส่วนหนึ่งของ RAM ของระบบคอมพิวเตอร์แทนที่จะใช้หน่วยความจำกราฟิกเฉพาะ IGP สามารถรวมเข้ากับเมนบอร์ดเป็นส่วนหนึ่งของชิปเซ็ตนอร์ธบริดจ์[ 13 ]หรือบนไดเดียวกัน(วงจรรวม)กับ CPU เช่นหน่วยประมวลผลเร่งความเร็ว (AMD APU) หรือIntel HD Graphics IGPU และ APU มีต้นทุนในการใช้งานต่ำกว่าการประมวลผลกราฟิกเฉพาะ แต่มีแนวโน้มที่จะมีความสามารถน้อยกว่า การประมวลผลกราฟิกแบบรวมถือว่าไม่เหมาะสมสำหรับเกม 3 มิติหรือโปรแกรมที่ใช้กราฟิกสูง แต่สามารถเรียกใช้โปรแกรมที่ใช้กราฟิกน้อยกว่า เช่น Adobe Flash ตัวอย่างของ IGP ดังกล่าว ได้แก่ ผลิตภัณฑ์จาก SiS และ VIA ในช่วงปี 2004 [ 14 ]อย่างไรก็ตาม หน่วยประมวลผลกราฟิกแบบรวมที่ทันสมัย ​​เช่นหน่วยประมวลผลเร่งความเร็วของ AMDและเทคโนโลยีกราฟิกของ Intelสามารถจัดการเกม AAA ได้ที่การตั้งค่าที่ต่ำกว่า

เนื่องจากการคำนวณ GPU ใช้หน่วยความจำมาก การประมวลผลแบบรวมอาจแข่งขันกับ CPU ในการใช้ RAM ของระบบที่ค่อนข้างช้า เนื่องจากมีหน่วยความจำวิดีโอเฉพาะน้อยมากหรือไม่มีเลย IGPU ใช้หน่วยความจำระบบที่มีแบนด์วิดท์สูงสุดในปัจจุบันที่ 128 กิกะไบต์ต่อวินาที ในขณะที่การ์ดกราฟิกแบบแยกอาจมีแบนด์วิดท์[ 15 ]มากกว่า 1,000 กิกะไบต์ต่อวินาทีระหว่างหน่วยความจำเข้าถึงแบบสุ่มวิดีโอ (VRAM) และแกน GPU แบนด์ วิดท์บัสหน่วยความจำนี้สามารถจำกัดประสิทธิภาพของ IGPU ได้ แม้ว่าหน่วยความจำแบบหลายช่องสัญญาณจะสามารถลดข้อบกพร่องนี้ได้[ 16 ]

ในระบบที่มี "สถาปัตยกรรมหน่วยความจำรวม" (UMA) รวมถึงโปรเซสเซอร์ AMD รุ่นใหม่ที่มีกราฟิกในตัว[ 17 ]โปรเซสเซอร์ Intel รุ่นใหม่ที่มีกราฟิกในตัว[ 18 ]โปรเซสเซอร์ Apple และคอนโซลรุ่นใหม่ แกน CPU และบล็อก GPU จะใช้พื้นที่หน่วยความจำและแอดเดรส RAM ร่วมกัน

การประมวลผลสตรีมและหน่วยประมวลผลกราฟิกอเนกประสงค์ (GPGPU)

เป็นเรื่องปกติที่จะใช้หน่วยประมวลผลกราฟิกอเนกประสงค์ (GPGPU) ในรูปแบบที่ดัดแปลงของตัวประมวลผลสตรีมหรือตัวประมวลผลเวกเตอร์โดยเรียกใช้เคอร์เนลการคำนวณซึ่งจะเปลี่ยนพลังการคำนวณมหาศาลของไปป์ไลน์เชเดอร์ของตัวเร่งกราฟิกสมัยใหม่ให้เป็นพลังการคำนวณอเนกประสงค์ ในบางแอปพลิเคชันที่ต้องการการดำเนินการเวกเตอร์จำนวนมาก สิ่งนี้สามารถให้ประสิทธิภาพสูงกว่า CPU ทั่วไปหลายเท่าตัว ผู้ผลิต GPU แบบแยกส่วนรายใหญ่ที่สุดสองราย ได้แก่AMDและNvidiaกำลังดำเนินการตามแนวทางนี้กับแอปพลิเคชันต่างๆ มากมาย Nvidia และ AMD ร่วมมือกับมหาวิทยาลัยสแตนฟอร์ดเพื่อสร้างไคลเอ็นต์บน GPU สำหรับ โครงการประมวลผลแบบ กระจาย Folding@homeสำหรับการคำนวณการพับโปรตีน ในบางสถานการณ์ GPU คำนวณได้เร็วกว่า CPU ที่ใช้กันทั่วไปในแอปพลิเคชันดังกล่าวถึงสี่สิบเท่า[ 19 ] [ 20 ]

คอมพิวเตอร์ประสิทธิภาพสูงที่ใช้ GPU มีบทบาทสำคัญในการสร้างแบบจำลองขนาดใหญ่ ซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุด 3 ใน 10 เครื่องในโลกใช้ประโยชน์จากการเร่งความเร็ว GPU [ 21 ]

ตั้งแต่ปี 2005 เป็นต้นมา มีความสนใจในการใช้ประสิทธิภาพที่ GPU นำเสนอสำหรับการคำนวณเชิงวิวัฒนาการโดยทั่วไป และโดยเฉพาะอย่างยิ่งสำหรับการเร่ง การประเมิน ความเหมาะสมในการเขียนโปรแกรมเชิงพันธุกรรมวิธีการส่วนใหญ่จะคอมไพล์โปรแกรมเชิงเส้นหรือ แบบต้นไม้ บนพีซีโฮสต์และถ่ายโอนไฟล์ปฏิบัติการไปยัง GPU เพื่อเรียกใช้ โดยทั่วไปแล้วจะได้เปรียบด้านประสิทธิภาพก็ต่อเมื่อเรียกใช้โปรแกรมที่ใช้งานอยู่เพียงโปรแกรมเดียวพร้อมกันกับปัญหาตัวอย่างจำนวนมากแบบขนาน โดยใช้ สถาปัตยกรรม คำสั่งเดียว ข้อมูลหลายชุด (SIMD) ของ GPU [ 22 ]นอกจากนี้ยังสามารถเร่งความเร็วได้อย่างมากโดยไม่ต้องคอมไพล์โปรแกรม แต่ให้ถ่ายโอนไปยัง GPU เพื่อตีความที่นั่น[ 23 ]

การ์ดจอภายนอก (eGPU)

GPU สามารถเชื่อมต่อกับบัสภายนอกของโน้ตบุ๊กได้PCI Expressเป็นบัสเดียวที่ใช้เพื่อจุดประสงค์นี้ พอร์ตอาจเป็น พอร์ต ExpressCardหรือmPCIe (PCIe ×1 สูงสุด 5 หรือ 2.5 กิกะบิตต่อวินาที ตามลำดับ) พอร์ต Thunderbolt 1, 2 หรือ 3 (PCIe ×4 สูงสุด 10, 20 หรือ 40 กิกะบิตต่อวินาที ตามลำดับ) พอร์ตUSB4 ที่รองรับ Thunderboltหรือ พอร์ต OCuLinkพอร์ตเหล่านี้มีเฉพาะในระบบโน้ตบุ๊กบางระบบเท่านั้น[ 24 ]เคส eGPU มีแหล่งจ่ายไฟ (PSU) ของตัวเอง เนื่องจาก GPU ที่ทรงพลังสามารถใช้พลังงานได้หลายร้อยวัตต์[ 25 ]

ประวัติศาสตร์

ทศวรรษ 1960

โบรชัวร์เครื่องเทอร์มินัล Adage Graphics ปี 1968

ฮาร์ดแวร์กราฟิก 3 มิติโดยเฉพาะมีมาตั้งแต่เครื่องเทอร์มินัล กราฟิก เช่นAdage AGT-30 จากปี 1967 ซึ่งใช้โปรเซสเซอร์เมทริกซ์แบบอนาล็อก ในปี 1969 บริษัท Evans & Sutherland (E&S) ได้เปิดตัวLine Drawing System-1 (LDS-1) ซึ่งเป็นระบบดิจิทัลทั้งหมดระบบแรกที่สามารถประมวลผลการคูณเมทริกซ์ได้ นอกจากนี้ ในปีเดียวกันนั้นเอง เครื่องเทอร์มินัลกราฟิกราคาประหยัดIMLAC PDS-1ก็ได้ถูกเปิดตัวขึ้น ต่อมามันถูกนำไปใช้เป็นเครื่องเล่นเกม 3 มิติรุ่นแรกๆ เช่น เกม Maze War

ทศวรรษ 1970

ในทศวรรษ 1970 คำว่า "GPU" เดิมทีหมายถึงหน่วยประมวลผลกราฟิก และอธิบายถึงหน่วยประมวลผลที่ตั้งโปรแกรมได้ซึ่งทำงานอย่างอิสระจาก CPU ซึ่งรับผิดชอบในการจัดการและแสดงผลกราฟิก[ 1 ] [ 2 ]

ในด้านฮาร์ดแวร์ระดับมืออาชีพ ในปี 1972 ระบบ PLATO IVเริ่มใช้งานได้ที่มหาวิทยาลัยอิลลินอยส์ เออร์บานา-แชมเปญระหว่างปี 1973 ถึง 1978 เกม 3 มิติแบบโครงลวดหลายผู้เล่นที่เชื่อมต่อเครือข่ายหลายเกมได้รับการพัฒนาและได้รับความนิยมจากผู้ใช้ระบบ นอกจากนี้ ในปี 1972 ระบบ E&S Continuous Tone 1 (CT1) "Watkins box" (ประกอบด้วย E&S LDS-2 และShaded Picture System ) ได้ถูกส่งมอบให้กับมหาวิทยาลัย Case Western Reserveซึ่งเป็นระบบแรกที่นำเสนอการแรเงาแบบ Gouraud แบบเรียลไทม์ ในปี 1975 ความร่วมมือระหว่างบริษัท Evans & Sutherland Computer Corporation และภาควิชากราฟิกคอมพิวเตอร์ของมหาวิทยาลัยยูทาห์ ส่งผลให้เกิดเฟรมบัฟเฟอร์ วิดีโอ MOSFET ตัวแรกที่สามารถแสดงสีและการแรเงาแบบเรียบเนียนได้ ระบบ E&S Continuous Tone 3 (CT3) ถูกส่งมอบให้กับ Lufthansaในปี 1977 สำหรับการฝึกอบรมนักบินโดยใช้การจำลองด้วยคอมพิวเตอร์ นับเป็นระบบกราฟิกตัวแรกที่สามารถแมปพื้นผิวแบบเรียลไทม์ได้ Ikonas ผลิตระบบกราฟิกที่มีกราฟิก 8 บิตและ 24 บิต และการเร่งความเร็ว 3 มิติในช่วงปลายทศวรรษที่ 70 [ 26 ]

บอร์ดระบบเกมอาร์เคดใช้วงจรกราฟิก 2 มิติแบบพิเศษมาตั้งแต่ทศวรรษ 1970 ในฮาร์ดแวร์วิดีโอเกมยุคแรกRAMสำหรับบัฟเฟอร์เฟรมมีราคาแพง ดังนั้นชิปวิดีโอจึงรวมข้อมูลเข้าด้วยกันในขณะที่จอแสดงผลถูกสแกนออกบนจอภาพ[ 27 ]

วงจร เปลี่ยนตำแหน่งบาร์เรลแบบพิเศษช่วยให้ CPU สามารถสร้าง ภาพเคลื่อนไหว ของกราฟิกเฟรมบัฟเฟอร์สำหรับวิดีโอเกมอาร์เคด ต่างๆ ในยุค 1970 จากMidwayและTaitoเช่นGun Fight (1975), Sea Wolf (1976) และSpace Invaders (1978) [ 28 ]ระบบ อาร์เคด Namco Galaxianในปี 1979 ใช้ฮาร์ดแวร์กราฟิก แบบพิเศษ ที่รองรับสี RGBสไปรท์หลากสี และพื้นหลังแบบไทล์แม ป [ 29 ]ฮาร์ดแวร์ Galaxian ถูกนำมาใช้อย่างแพร่หลายในช่วงยุคทองของวิดีโอเกมอาร์เคดโดยบริษัทเกมต่างๆ เช่นNamco , Centuri , Gremlin , Irem , Konami , Midway , Nichibutsu , SegaและTaito [ 30 ]

ไมโครโปรเซสเซอร์ Atari ANTICบนเมนบอร์ด Atari 130XE

Atari 2600ในปี 1977 ใช้ตัวแปลงสัญญาณวิดีโอที่เรียกว่าTelevision Interface Adaptor [ 31 ] คอมพิวเตอร์ Atari 8 บิต (ปี 1979) มีANTICซึ่งเป็นโปรเซสเซอร์วิดีโอที่ตีความคำสั่งที่อธิบาย " รายการแสดงผล " — วิธีที่เส้นสแกนแมปไปยัง โหมด บิตแมปหรืออักขระเฉพาะ และตำแหน่งที่จัดเก็บหน่วยความจำ (ดังนั้นจึงไม่จำเป็นต้องมีบัฟเฟอร์เฟรมที่ต่อเนื่องกัน) [ 32 ]รูทีนย่อยรหัสเครื่อง6502 สามารถเรียกใช้บนเส้นสแกน ได้ โดยการตั้งค่าบิตบนคำสั่งรายการแสดงผล[ 33 ] ANTIC ยังรองรับการเลื่อนแนวตั้งและ แนวนอนที่ราบรื่นโดย ไม่ขึ้นกับ CPU [ 34 ]

ทศวรรษ 1980

วงจรรวม Geometry Engine

ในช่วงทศวรรษ 1980 มีความก้าวหน้าอย่างมากในด้านฮาร์ดแวร์กราฟิก 3 มิติระดับมืออาชีพ สิ่งที่ส่งผลกระทบมากที่สุดอาจเป็นการพัฒนาGeometry Engine ในปี 1981 ซึ่งเป็นโปรเซสเซอร์เวกเตอร์VLSI ASICที่ออกแบบโดยJim ClarkและMarc Hannahที่มหาวิทยาลัยสแตนฟอร์ดโปรเซสเซอร์นี้เป็นต้นแบบของtensor core สมัยใหม่และโปรเซสเซอร์อื่นๆ ที่คล้ายกันซึ่งวางจำหน่ายสำหรับกราฟิกและ AI Geometry Engine ถูกนำไปใช้ในเวิร์กสเตชันของ Silicon Graphicsเป็นเวลาหลายปี ผลิตภัณฑ์แรกของ Silicon Graphics ที่จัดส่งในเดือนพฤศจิกายน 1983 คือ IRIS 1000 ซึ่งเป็นเทอร์มินัลที่มีกราฟิก 3 มิติแบบเร่งความเร็วด้วยฮาร์ดแวร์โดยใช้ Geometry Engine [ 26 ] Geometry Engine สามารถประมวลผลได้ประมาณ 6 ล้านครั้งต่อวินาที[ 35 ]

เนคμPD7220เอ

NEC μPD7220ในปี 1981 เป็นการนำ โปรเซสเซอร์แสดงผลกราฟิก คอมพิวเตอร์ส่วนบุคคล มาใช้เป็นครั้งแรก ในรูป แบบชิป วงจรรวมขนาดใหญ่ (LSI) ชิปเดียว ทำให้สามารถออกแบบการ์ดกราฟิกวิดีโอประสิทธิภาพสูงราคาประหยัดได้ เช่น การ์ดจากNumber Nine Visual Technologyและกลายเป็น GPU ที่เป็นที่รู้จักมากที่สุดจนถึงกลางทศวรรษ 1980 [ 36 ] เป็นโปรเซสเซอร์แสดงผลกราฟิก แบบ VLSI (very large-scale integration) โลหะ-ออกไซด์-เซมิคอนดักเตอร์ ( NMOS ) ตัวแรกที่รวมวงจรอย่างสมบูรณ์สำหรับพีซี รองรับความละเอียดสูงสุด1024×1024และวางรากฐานสำหรับตลาดกราฟิกพีซี มีการนำไปใช้ในการ์ดกราฟิกหลายรุ่นและได้รับอนุญาตให้ใช้กับรุ่นลอกเลียนแบบ เช่น Intel 82720 ซึ่งเป็นหน่วยประมวลผลกราฟิกตัวแรกของ Intel [ 37 ]เกมอาร์เคดของWilliams Electronics Robotron: 2084 , Joust , SinistarและBubblesซึ่งวางจำหน่ายในปี 1982 ทั้งหมดมี ชิป blitter แบบกำหนดเอง สำหรับการทำงานบนบิตแมป 16 สี[ 38 ] [ 39 ]

ในปี พ.ศ. 2527 ฮิตาชิได้วางจำหน่าย ARTC HD63484 ซึ่งเป็น โปรเซสเซอร์กราฟิก CMOS หลักตัวแรก สำหรับคอมพิวเตอร์ส่วนบุคคล ARTC สามารถแสดงผลความละเอียดสูงสุด 4Kเมื่ออยู่ใน โหมด ขาวดำมีการใช้งานในกราฟิกการ์ดและเทอร์มินัลจำนวนมากในช่วงปลายทศวรรษ พ.ศ. 2523 [ 40 ]

MOS 8367R0 – แอกนัส

ในปี 1985 คอมพิวเตอร์ Amigaได้ถูกวางจำหน่ายพร้อมชิปประมวลผลกราฟิกแบบกำหนดเองที่เรียกว่าAgnusซึ่งมีตัวประมวลผลภาพบิตแมป (blitter) สำหรับการจัดการภาพบิตแมป การวาดเส้น และการเติมพื้นที่ นอกจากนี้ยังรวมถึงตัวประมวลผลร่วม (coprocessor)ที่มีชุดคำสั่งง่ายๆ ของตัวเอง ซึ่งสามารถจัดการรีจิสเตอร์ฮาร์ดแวร์กราฟิกให้สอดคล้องกับลำแสงวิดีโอ (เช่น สำหรับการสลับพาเล็ตต่อเส้นสแกน การมัลติเพล็กซ์ สไปรท์ และการจัดการหน้าต่างด้วยฮาร์ดแวร์) หรือขับเคลื่อนตัวประมวลผลภาพบิตแมป (blitter) ได้

นอกจากนี้ ในปี 1985 IBM ยังได้ออกProfessional Graphics Controller ซึ่งออกแบบโดย Curtis Priemผู้ร่วมก่อตั้ง Nvidia ในเวลาต่อมาโดยเป็นการ์ด 3 มิติแบบพื้นฐานที่มี กราฟิก 640 × 480พิกเซล 256 สี ซึ่งใช้ CPU เฉพาะในการวาดกราฟิกโดยอิสระจากระบบหลัก การ์ดนี้ถูกนำไปใช้เป็นพื้นฐานโดยผู้ผลิตหลายราย (รวมถึงMatrox ) และการส่งสัญญาณ RGB แบบอนาล็อกนำไปสู่มาตรฐานวิดีโอ VGA โดยตรง[ 26 ]ต่อมาในช่วงทศวรรษ 1980 Priem ได้ทำงานเกี่ยวกับการ์ดกราฟิก 2 มิติเร่งความเร็วSun Microsystems GX (หรือที่รู้จักกันในชื่อ cgsix) ที่มีอิทธิพล [ 41 ]

ในปี พ.ศ. 2529 Texas Instrumentsได้วางจำหน่ายTMS34010ซึ่งเป็นโปรเซสเซอร์กราฟิกแบบโปรแกรมได้เต็มรูปแบบตัวแรก[ 42 ]มันสามารถรันโค้ดทั่วไปได้ แต่ยังมีชุดคำสั่งที่เน้นกราฟิกด้วย ในช่วงปี พ.ศ. 2533–2535 ชิปนี้ได้กลายเป็นพื้นฐานของการ์ด เร่งความเร็ว Windows ของ Texas Instruments Graphics Architecture ("TIGA")

อะแดปเตอร์ไมโครแชนเนล IBM 8514พร้อมหน่วยความจำเสริม

ต่อมาในปี 1987 ระบบกราฟิก IBM 8514ได้ถูกวางจำหน่าย นับเป็นหนึ่งในกราฟิกการ์ดรุ่นแรกๆ สำหรับเครื่องคอมพิวเตอร์ที่เข้ากันได้กับ IBM PCที่ใช้ฟังก์ชันคงที่สำหรับกราฟิก 2 มิติในฮาร์ดแวร์อิเล็กทรอนิกส์Sharp X68000ที่วางจำหน่ายในปี 1987 ใช้ชิปเซ็ตกราฟิกแบบกำหนดเอง[ 43 ]ที่มีจานสี 65,536 สี และรองรับฮาร์ดแวร์สำหรับสไปรท์ การเลื่อน และสนามเล่นหลายสนาม[ 44 ]โดยทำหน้าที่เป็นเครื่องพัฒนาสำหรับ บอร์ดเกมอาร์เคด CP SystemของCapcom คอมพิวเตอร์ FM Townsของ Fujitsu ที่วางจำหน่ายในปี 1989 รองรับจานสี 16,777,216 สี[ 45 ]

เพื่อเป็นข้อมูลประกอบIBMยังได้เปิด ตัวระบบแสดงผล Video Graphics Array (VGA) ในปี 1987 ด้วยความละเอียดสูงสุด640 × 480พิกเซล ซึ่งแตกต่างจาก 8514/A ตรงที่ VGA ไม่มีคุณสมบัติการเร่งความเร็วฮาร์ดแวร์ ในเดือนพฤศจิกายนปี 1988 NEC Home Electronicsได้ประกาศการก่อตั้งVideo Electronics Standards Association (VESA) เพื่อพัฒนาและส่งเสริมมาตรฐานการแสดงผลคอมพิวเตอร์Super VGA (SVGA) ให้เป็นมาตรฐานต่อจาก VGA Super VGA ช่วยให้สามารถแสดงผลกราฟิกด้วยความละเอียดสูงสุดถึง800 × 600พิกเซลซึ่งเพิ่มขึ้น 56% [ 46 ]

ในปี พ.ศ. 2531 SGI ได้จำหน่ายกราฟิกเวิร์กสเตชัน IRIS ที่มี Geometry Engine จำนวน 10-12 ตัว และได้เปิดตัวบอร์ดเสริมIrisVision สำหรับบัส IBM MicroChannel ( RS/6000 ) ซึ่งใช้ Geometry Engine เช่นกัน[ 26 ]

ในปี พ.ศ. 2531 ได้มีการเปิดตัวบอร์ดกราฟิก 3 มิติแบบโพลีโกนเฉพาะเครื่องแรกในเครื่องเกมอาร์เคด ได้แก่Namco System 21 [ 47 ]และTaito Air System [ 48 ]

ทศวรรษ 1990

S3 กราฟิกส์ViRGE
การ์ด Voodoo3 2000 AGP

ในช่วงทศวรรษ 1990 ฮาร์ดแวร์กราฟิก 3 มิติสำหรับเวิร์กสเตชันระดับมืออาชีพจาก Sun Microsystems, SGI และบริษัทอื่นๆ ได้ก้าวหน้าไปอย่างมาก การเปิดตัวOpenGLโดย SGI ในปี 1992 ได้ปูทางไปสู่มาตรฐานอินเทอร์เฟซการเขียนโปรแกรม 3 มิติที่ไม่ขึ้นกับฮาร์ดแวร์[ 49 ] [ 50 ]อย่างไรก็ตาม ในช่วงกลางและปลายทศวรรษ 1990 ฮาร์ดแวร์ระดับมืออาชีพก็ค่อยๆ ถูกบดบังด้วยผลิตภัณฑ์สำหรับผู้บริโภคซึ่งให้ประสิทธิภาพที่คล้ายคลึงกันหรือดีกว่า โดยเฉพาะอย่างยิ่งในด้านการแมปพื้นผิว ในราคาที่ต่ำกว่าและบนแพลตฟอร์มที่ผู้ใช้คุ้นเคย[ 50 ] [ 51 ]

ในปี พ.ศ. 2534 S3 Graphicsได้เปิดตัวS3 86C911ซึ่งนักออกแบบตั้งชื่อตามPorsche 911เพื่อบ่งบอกถึงประสิทธิภาพที่เพิ่มขึ้นตามที่สัญญาไว้[ 52 ] 86C911 ได้ก่อให้เกิดผู้เลียนแบบมากมาย: ภายในปี พ.ศ. 2538 ผู้ผลิตชิปกราฟิกพีซีรายใหญ่ทั้งหมดได้เพิ่ม การรองรับการเร่งความเร็ว 2 มิติลงในชิปของตน[ 53 ]ตัวเร่งความเร็ว Windowsที่มีฟังก์ชันคงที่ได้แซงหน้าตัวประมวลผลกราฟิกทั่วไปที่มีราคาแพงในด้านประสิทธิภาพของ Windows และตัวประมวลผลร่วมดังกล่าวก็ค่อยๆ หายไปจากตลาดพีซี

ในช่วงต้นและกลางทศวรรษ 1990 กราฟิก 3 มิติ แบบเรียลไทม์เริ่มแพร่หลายมากขึ้นในเกมอาร์เคด เกมคอมพิวเตอร์ และเกมคอนโซล ซึ่งนำไปสู่ความต้องการของสาธารณชนที่เพิ่มขึ้นสำหรับกราฟิก 3 มิติที่เร่งความเร็วด้วยฮาร์ดแวร์ ตัวอย่างแรกๆ ของฮาร์ดแวร์กราฟิก 3 มิติสำหรับตลาดมวลชนสามารถพบได้ในบอร์ดระบบอาร์เคด เช่นSega Model 1 , Namco System 22และSega Model 2และคอนโซลวิดีโอเกมรุ่นที่ห้าเช่นSaturn , PlayStationและNintendo 64ระบบอาร์เคดเช่น Sega Model 2 และ Namco Magic Edge Hornet Simulator ที่ใช้ SGI Onyxในปี 1993 สามารถทำการแปลง การตัด และการให้แสง ( transform, clipping, and lighting ) ด้วยฮาร์ดแวร์ได้หลายปีก่อนที่จะปรากฏในกราฟิกการ์ดสำหรับผู้บริโภค[ 54 ] [ 55 ]ในปี 1994 Sony ใช้คำว่า GPU (ซึ่งหมายถึงหน่วยประมวลผลกราฟิก) ในการอ้างอิงถึง GPU ของ Sony ที่ออกแบบโดย Toshiba สำหรับคอนโซล PlayStation [ 3 ]

อีกตัวอย่างหนึ่งในช่วงแรกคือ ชิป Super FXซึ่งเป็นชิปกราฟิกแบบRISCที่ใช้ในเกมSNES บางเกม โดยเฉพาะ DoomและStar Foxบางระบบใช้DSPเพื่อเร่งการแปลงFujitsuซึ่งทำงานเกี่ยวกับระบบเกมอาร์เคด Sega Model 2 [ 56 ]เริ่มทำงานเกี่ยวกับการรวม T&L เข้ากับ โซลูชัน LSI เดียว เพื่อใช้ในคอมพิวเตอร์ส่วนบุคคลในปี 1995 [ 57 ] Fujitsu Pinolite ซึ่งเป็นโปรเซสเซอร์เรขาคณิต 3 มิติเครื่องแรกสำหรับคอมพิวเตอร์ส่วนบุคคล ได้รับการประกาศในปี 1997 [ 58 ] GPU ฮาร์ดแวร์ T&L เครื่องแรกในคอนโซลวิดีโอเกมที่บ้านคือReality CoprocessorของNintendo 64ซึ่งวางจำหน่ายในปี 1996 [ 59 ]ในปี 1997 Mitsubishiได้วางจำหน่าย3Dpro/2MPซึ่งเป็น GPU ที่สามารถแปลงและให้แสงได้ สำหรับเวิร์กสเตชันและเดสก์ท็อปWindows NT [ 60 ] ATiใช้มันสำหรับการ์ดกราฟิกFireGL 4000ซึ่งวางจำหน่ายในปี 1997 [ 61 ]

คำว่า "GPU" ถูกบัญญัติโดยโซนี่ เพื่ออ้างถึง GPU ของโซนี่แบบ 32 บิต(ออกแบบโดยโตชิบา ) ในเครื่องเล่นวิดีโอเกมPlayStation ซึ่งวางจำหน่ายในปี 1994 [ 62 ]

ทศวรรษ 2000

ในเดือนตุลาคม พ.ศ. 2545 ด้วยการเปิดตัวATI Radeon 9700 (หรือที่รู้จักกันในชื่อ R300) ซึ่งเป็นตัวเร่งความเร็วDirect3D 9.0 ตัวแรกของโลก พิกเซลและเวอร์เท็กซ์ เชเดอร์สามารถใช้งานการวนซ้ำและการคำนวณเลขทศนิยมที่ยาวนานได้และกำลังกลายเป็นสิ่งที่ยืดหยุ่นได้เร็วเทียบเท่ากับ CPU แต่เร็วกว่าหลายเท่าสำหรับการดำเนินการอาร์เรย์รูปภาพ พิกเซลเชเดอร์มักใช้สำหรับการทำแผนที่พื้นผิวแบบนูนซึ่งเพิ่มพื้นผิวเพื่อให้วัตถุดูมันวาว ด้าน หยาบ หรือแม้กระทั่งกลมหรือนูนออกมา[ 63 ]

ด้วยการเปิดตัว Nvidia GeForce 8 ซีรีส์และหน่วยประมวลผลสตรีมทั่วไปใหม่ GPU จึงกลายเป็นอุปกรณ์ประมวลผลทั่วไปมากขึ้น GPU แบบขนานกำลังก้าวหน้าในการคำนวณแข่งกับ CPU และสาขาย่อยของการวิจัยที่เรียกว่าการประมวลผล GPU หรือGPGPUสำหรับการประมวลผลทั่วไปบน GPUได้ถูกนำไปประยุกต์ใช้ในสาขาที่หลากหลาย เช่น การเรียนรู้ ของเครื่อง[ 64 ]การสำรวจน้ำมันการประมวลผลภาพทางวิทยาศาสตร์พีชคณิตเชิงเส้น [ 65 ]สถิติ[ 66 ]การสร้างภาพ 3 มิติและการ กำหนดราคา ออปชั่นหุ้น GPGPU เป็นต้นแบบของสิ่งที่เรียกว่า compute shader ในปัจจุบัน (เช่นCUDA , OpenCL , DirectCompute ) และได้ใช้ฮาร์ดแวร์ในทางที่ผิดในระดับหนึ่งโดยการจัดการข้อมูลที่ส่งผ่านไปยังอัลกอริทึมเป็นแผนที่พื้นผิวและดำเนินการอัลกอริทึมโดยการวาดรูปสามเหลี่ยมหรือสี่เหลี่ยมด้วย pixel shader ที่เหมาะสม ซึ่งส่งผลให้เกิดค่าใช้จ่ายเพิ่มเติมบางส่วน เนื่องจากมีการใช้หน่วยประมวลผลต่างๆ เช่น ตัวแปลงสัญญาณสแกนในจุดที่ไม่จำเป็น (และการจัดการรูปสามเหลี่ยมก็ไม่ใช่เรื่องสำคัญ ยกเว้นเพื่อเรียกใช้พิกเซลเชเดอร์)

แพลตฟอร์ม CUDA ของ Nvidia ซึ่งเปิดตัวครั้งแรกในปี 2550 [ 67 ]เป็นโมเดลการเขียนโปรแกรมที่ได้รับการยอมรับอย่างกว้างขวางเป็นครั้งแรกสำหรับการประมวลผล GPU OpenCL เป็นมาตรฐานเปิดที่กำหนดโดยKhronos Groupซึ่งอนุญาตให้พัฒนาโค้ดสำหรับทั้ง GPU และ CPU โดยเน้นที่ความสามารถในการพกพา[ 68 ]โซลูชัน OpenCL ได้รับการสนับสนุนโดย Intel, AMD, Nvidia และ ARM และตามรายงานในปี 2554 โดยEvans Data OpenCL ได้กลายเป็นเครื่องมือ HPC ที่ได้รับความนิยมเป็นอันดับสอง[ 69 ]

ทศวรรษ 2010

ในปี 2010 Nvidia ได้ร่วมมือกับAudiเพื่อขับเคลื่อนแผงหน้าปัดรถยนต์ โดยใช้ GPU Tegraเพื่อเพิ่มฟังก์ชันการทำงานให้กับระบบนำทางและระบบความบันเทิงของรถยนต์[ 70 ]ความก้าวหน้าในเทคโนโลยี GPU ในรถยนต์ช่วยพัฒนาเทคโนโลยีการขับขี่อัตโนมัติ [ 71 ] การ์ด Radeon HD 6000 seriesของ AMD เปิดตัวในปี 2010 และในปี 2011 AMD ได้เปิดตัว GPU แบบแยกส่วน 6000M Series สำหรับอุปกรณ์พกพา[ 72 ] การ์ดกราฟิก ตระกูล KeplerของNvidia เปิดตัวในปี 2012 และถูกนำมาใช้ในการ์ด Nvidia 600 และ 700 series คุณสมบัติหนึ่งในสถาปัตยกรรมไมโคร GPU นี้รวมถึง GPU boost ซึ่งเป็นเทคโนโลยีที่ปรับความเร็วสัญญาณนาฬิกาของการ์ดวิดีโอให้เพิ่มขึ้นหรือลดลงตามการใช้พลังงาน[ 73 ] Kepler ยังได้แนะนำเทคโนโลยีเร่งความเร็วการเข้ารหัสวิดีโอ NVENC อีกด้วย

PS4 และXbox One วางจำหน่ายในปี 2013 โดยทั้งสองเครื่องใช้ GPU ที่พัฒนามาจากRadeon HD 7850 และ 7790 ของ AMD [ 74 ] GPUตระกูล Kepler ของ Nvidia ตามมาด้วย ตระกูล Maxwellซึ่งผลิตด้วยกระบวนการเดียวกัน ชิป 28 นาโนเมตรของ Nvidia ผลิตโดยTSMCในไต้หวันโดยใช้กระบวนการ 28 นาโนเมตร เมื่อเทียบกับเทคโนโลยี 40 นาโนเมตรในอดีต กระบวนการผลิตนี้ช่วยเพิ่มประสิทธิภาพได้ถึง 20 เปอร์เซ็นต์ในขณะที่ใช้พลังงานน้อยลง[ 75 ] [ 76 ]ชุดหูฟังเสมือนจริงมีความต้องการระบบสูง ผู้ผลิตแนะนำให้ใช้ GTX 970 และ R9 290X หรือดีกว่าในขณะที่วางจำหน่าย[ 77 ] [ 78 ]การ์ดที่ใช้ สถาปัตยกรรมไมโคร Pascalวางจำหน่ายในปี 2016 การ์ด GeForce 10 ซีรีส์เป็นการ์ดกราฟิกรุ่นนี้ ผลิตโดยใช้กระบวนการผลิต 16 นาโนเมตร ซึ่งปรับปรุงจากสถาปัตยกรรมไมโครรุ่นก่อนหน้า[ 79 ]

ในปี 2018 Nvidia ได้เปิดตัว GPU ซีรีส์ RTX 20 ซึ่งเพิ่ม คอร์ เรย์เทรซซิ่งให้กับ GPU ทำให้สามารถเรย์เทรซซิ่งแบบเรียลไทม์ได้อย่างมีประสิทธิภาพบนฮาร์ดแวร์สำหรับตลาดทั่วไป[ 80 ] GPU Polaris 11และPolaris 10จาก AMD ผลิตด้วยกระบวนการ 14 นาโนเมตร การเปิดตัวส่งผลให้ประสิทธิภาพต่อวัตต์ของการ์ดวิดีโอ AMD เพิ่มขึ้นอย่างมาก[ 81 ] AMD ยังได้เปิดตัว GPU ซีรีส์ Vega สำหรับตลาดระดับไฮเอนด์เพื่อเป็นคู่แข่งกับการ์ด Pascal ระดับไฮเอนด์ของ Nvidia ซึ่งมีคุณสมบัติHBM2เช่นเดียวกับ Titan V

ในปี 2019 AMD ได้เปิดตัวสถาปัตยกรรม ไมโคร/ชุดคำสั่ง Graphics Core Next (GCN) รุ่นต่อจากเดิม โดยใช้ชื่อว่าRDNAผลิตภัณฑ์แรกที่ใช้สถาปัตยกรรมนี้คือการ์ดจอRadeon RX 5000 ซีรีส์[ 82 ]บริษัทได้ประกาศว่าสถาปัตยกรรมไมโคร RDNA รุ่นต่อจากนี้จะเป็นการปรับปรุงเพิ่มเติม (เป็นการ "รีเฟรช") AMD ได้เปิดตัวRadeon RX 6000 ซีรีส์ซึ่งเป็น การ์ดจอ RDNA 2ที่รองรับการเรย์เทรซซิ่งแบบเร่งด้วยฮาร์ดแวร์[ 83 ]ผลิตภัณฑ์ซีรีส์นี้เปิดตัวในช่วงปลายปี 2020 ประกอบด้วย RX 6800, RX 6800 XT และ RX 6900 XT [ 84 ] [ 85 ]ส่วน RX 6700 XT ซึ่งใช้ Navi 22 นั้น เปิดตัวในช่วงต้นปี 2021 [ 86 ]

PlayStation 5และXbox Series X และ Series Sวางจำหน่ายในปี 2020 โดยทั้งสองเครื่องใช้ GPU ที่ใช้สถาปัตยกรรมไมโคร RDNA 2 พร้อมการปรับปรุงทีละน้อยและการกำหนดค่า GPU ที่แตกต่างกันในแต่ละระบบ[ 87 ] [ 88 ] [ 89 ]

ทศวรรษ 2020

ในช่วงทศวรรษ 2020 GPU ได้ถูกนำมาใช้มากขึ้นสำหรับการคำนวณที่เกี่ยวข้องกับ ปัญหา แบบขนานอย่างง่ายดายเช่น การฝึกเครือข่ายประสาทเทียมบนชุดข้อมูลขนาดใหญ่ที่จำเป็นสำหรับโมเดลภาษาขนาดใหญ่ ของปัญญาประดิษฐ์ คอร์ประมวลผลเฉพาะทางบน GPU รุ่นใหม่ส่วนใหญ่ที่ออกแบบมาสำหรับการเรียนรู้เชิงลึกให้ ประสิทธิภาพ FLOPSที่เพิ่มขึ้นอย่างมาก โดยใช้การคูณและการหารเมทริกซ์ 4×4 การใช้งานในช่วงแรก เช่น สถาปัตยกรรมไมโคร Volta ของ Nvidia ที่เปิดตัวในปี 2017 [ 90 ]พบผลลัพธ์สูงถึง 128 TFLOPS ในบางแอปพลิเคชัน[ 91 ]

นับตั้งแต่นั้นมา คอร์เร่งความเร็ว AI ได้กลายเป็นคุณสมบัติที่ได้รับการยอมรับอย่างกว้างขวางในสถาปัตยกรรมไมโครสำหรับผู้บริโภคและเวิร์กสเตชัน โดยเริ่มจาก สถาปัตยกรรม ไมโคร Turing ของ Nvidia ในปี 2018 [ 80 ]ซึ่งเรียกว่า Tensor cores เดิมทีใช้สำหรับDeep Learning Super Sampling (DLSS) เพื่อเพิ่มประสิทธิภาพการเล่นเกมและปรับปรุงคุณภาพของภาพ ต่อมาได้มีการนำไปใช้ในซอฟต์แวร์ Broadcastของ Nvidia เพื่อมอบเอฟเฟกต์ที่ขับเคลื่อนด้วย AI มากมาย เช่น การกรองเสียงและการลดเสียงรบกวนในวิดีโอ และในซอฟต์แวร์อื่นๆ เช่นBlenderสำหรับ DLSS ในพอร์ตแสดงผล

เดิมที AMD ได้นำเอา "Matrix" Cores ที่เทียบเท่ากันมาใช้กับผู้บริโภคใน สถาปัตยกรรม RDNA 3แต่ Matrix Cores ของ RDNA 4 เป็นรุ่นแรกที่แนะนำการเร่งความเร็ว FP8 ซึ่งจำเป็นต่อการใช้งาน ฟีเจอร์ FSR Redstone อย่างเต็ม รูปแบบ เช่น Machine Learning Upscaling และ Frame Generation อย่างไรก็ตาม การดัดแปลงโดยชุมชนบนทั้ง Linux และ Windows ทำให้ GPU RDNA 2, 3 และ GPU ของคู่แข่งสามารถใช้งาน FSR 4 เวอร์ชันที่อ่อนกว่าที่เรียกว่า FSR 4 INT8 ได้PlayStation 5 Proที่เปิดตัวในปี 2024 มี Machine Learning cores ที่ปรับแต่งเอง ซึ่งเน้นเฉพาะการเร่งความเร็ว INT8 โดยอิงจาก RDNA 4 สำหรับ PlayStation Spectral Super Resolution เพื่อเพิ่มอัตราเฟรมและคุณภาพของภาพ

อินเทลได้นำเอาหน่วยประมวลผล "XMX" ที่เทียบเท่ากันมาใช้ใน GPU Arcทุกรุ่นโดยเริ่มจาก สถาปัตยกรรมไมโคร Alchemistซึ่งใช้สำหรับ XeSS (Xe Super Sampling), XeFG (Xe Frame Generation) และอื่นๆ

การเรย์เทรซซิ่งยังแพร่หลายอย่างมากในช่วงปี 2020 โดยมีเกมบางเกม เช่นDOOM: The Dark Agesที่ต้องใช้ GPU ที่รองรับการเรย์เทรซซิ่งแบบฮาร์ดแวร์จึงจะสามารถเริ่มเล่นได้[ 92 ]แม้ว่าจะส่งผลให้ประสิทธิภาพลดลงและเข้าถึงได้ยากขึ้นโดยรวม แต่id softwareอ้างว่าสิ่งนี้ช่วยประหยัดเวลาทำงานหลายชั่วโมงและลดขนาดเกมลงกว่า 100 กิกะไบต์ เนื่องจากเกมถูกสร้างขึ้นโดยใช้การเรย์เทรซซิ่งทั้งหมด

ฝ่ายขาย

ในปี 2556 มีการจัดส่ง GPU ทั่วโลกจำนวน 438.3 ล้านเครื่อง และคาดการณ์สำหรับปี 2557 ไว้ที่ 414.2 ล้านเครื่อง อย่างไรก็ตาม ในไตรมาสที่สามของปี 2565 การจัดส่ง GPU สำหรับพีซีมีจำนวนรวมประมาณ 75.5 ล้านเครื่อง ลดลง 19% เมื่อเทียบกับปีก่อนหน้า[ 93 ] [ 94 ]

ดูเพิ่มเติม

ฮาร์ดแวร์

API

แอปพลิเคชัน

ประชากร

แหล่งที่มา

  • เพ็ดดี, จอน (1 มกราคม 2023). ประวัติศาสตร์ของ GPU – การพัฒนาใหม่ๆ . สปริงเกอร์ เนเจอร์. ISBN 978-3-03-114047-1. OCLC  1356877844 .
  • NVIDIA – การประมวลผลด้วย GPU คืออะไร?
  • ชุดหนังสือ GPU Gems
  • – ประวัติฮาร์ดแวร์กราฟิก(เก็บถาวรเมื่อ 31 มีนาคม 2022 ที่Wayback Machine)
  • วิธีการทำงานของ GPU
  • โปรแกรมดูข้อมูล GPU Caps – โปรแกรมแสดงข้อมูลการ์ดจอ
  • ภาพรวม GPU ARM Mali
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Graphics_processing_unit&oldid=1360035522#Integrated_graphics_processing_unit "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ หน่วยประมวลผลกราฟิก

หน่วย ประมวลผลกราฟิก ( GPU ) คือ วงจรไฟฟ้า เฉพาะทางที่ออกแบบมาสำหรับ การประมวลผลภาพดิจิทัล และเร่งความเร็วใน การประมวล ผลกราฟิกคอมพิวเตอร์ โดยอาจเป็นส่วนประกอบใน กราฟิกการ์ด...

บริษัทผู้ผลิต GPU

บริษัทหลายแห่งผลิต GPU ภายใต้ชื่อแบรนด์ต่างๆ มากมาย ในปี 2552 Intel , Nvidia และ AMD / ATI เป็นผู้นำตลาด โดยมีส่วนแบ่งการตลาด 49.4%, 27.8% และ 20.

ฟังก์ชันการคำนวณ

ปัจจัยหลายประการในการสร้าง GPU ส่งผลต่อประสิทธิภาพของการ์ดสำหรับการเรนเดอร์แบบเรียลไทม์ เช่น ขนาดของเส้นทางเชื่อมต่อใน การผลิตอุปกรณ์เซมิคอนดักเตอร์ ความถี่ ของสัญญาณนาฬิกา และจำนวนและขนาดของ แคชหน่วย ความจำบนชิปต่างๆ...

รูปแบบของ GPU

ในคอมพิวเตอร์ส่วนบุคคล GPU มีสองรูปแบบหลัก ได้แก่ กราฟิกเฉพาะ (เรียกอีกอย่างว่ากราฟิกแยก) และกราฟิกแบบรวม (เรียกอีกอย่างว่าโซลูชันกราฟิกแบบใช้ร่วมกัน โปรเซสเซอร์กราฟิกแบบรวม (IGP) หรือสถาปัตยกรรมหน่วยความจำแบบรวม (UMA)) [ 4 ]