อ่าน 11 นาที
เอ็นดีจีเอ็กซ์
Nvidia DGX ( Deep GPU Xceleration ) คือซีรี่ส์ของ เซิร์ฟเวอร์ และ เวิร์กสเตชัน ที่ออกแบบโดย Nvidia โดยมีเป้าหมายหลักเพื่อเพิ่มประสิทธิภาพ แอปพลิเคชัน การเรียนรู้เชิงลึก ผ่านการใช้...
เอ็นดีจีเอ็กซ์
ชั้นวางที่บรรจุซูเปอร์คอมพิวเตอร์ DGX-1 จำนวน 5 เครื่อง | |
| ผู้ผลิต | เอ็นดีวีดี |
|---|---|
| ปล่อยแล้ว | 2016 |
Nvidia DGX ( Deep GPU Xceleration ) คือซีรี่ส์ของเซิร์ฟเวอร์และเวิร์กสเตชันที่ออกแบบโดยNvidiaโดยมีเป้าหมายหลักเพื่อเพิ่มประสิทธิภาพ แอปพลิเคชัน การเรียนรู้เชิงลึกผ่านการใช้การประมวลผลทั่วไปบนหน่วยประมวลผลกราฟิก (GPGPU) ระบบเหล่านี้มักมาในรูปแบบแร็คเมาท์ โดยเริ่มแรกใช้ ซีพียูเซิร์ฟเวอร์x86ประสิทธิภาพสูง เปลี่ยนไปใช้ ARMในช่วงปี 2018 และวางจำหน่ายNUCในปี 2025
คุณสมบัติหลักของระบบ DGX คือการมี โมดูล GPU Nvidia Tesla จำนวน 4 ถึง 8 โมดูล ซึ่งติดตั้งอยู่บนเมนบอร์ดแยกต่างหาก GPU เหล่านี้สามารถเชื่อมต่อได้ทั้งผ่านซ็อก เก็ต SXMหรือ สล็อต PCIe x16 ทำให้สามารถผสานรวมเข้ากับสถาปัตยกรรมของระบบได้อย่างยืดหยุ่น เพื่อจัดการกับความร้อนที่เกิดขึ้นจำนวนมาก หน่วย DGX จึงติดตั้งฮีทซิงค์และพัดลมที่ออกแบบมาเพื่อรักษาอุณหภูมิการทำงานที่เหมาะสม
หน่วยประมวลผลกราฟิก (GPGPU) ของ Nvidia ถูกนำมาใช้ในซูเปอร์คอมพิวเตอร์ TOP500
นางแบบ
ปาสคาล - โวลตา
ดีจีเอ็กซ์-1
เซิร์ฟเวอร์ DGX-1 มีGPU 8 ตัว ที่ใช้การ์ดเสริมPascalหรือVolta [ 1 ] พร้อม หน่วยความจำHBM2รวม 128 GB เชื่อมต่อกันด้วย เครือข่ายเมช NVLink [ 2 ] DGX -1 ได้รับการประกาศเมื่อวันที่ 6 เมษายน 2559 [ 3 ]ทุกรุ่นใช้การกำหนดค่าซ็อกเก็ตคู่ของซีพียู Intel Xeon E5 และมีคุณสมบัติดังต่อไปนี้
- หน่วย ความจำ DDR4-2133ขนาด 512 GB
- ระบบเครือข่าย Dual 10 Gb
- SSD ขนาด 1.92 TB จำนวน 4 ตัว
- ความสามารถในการจ่ายไฟรวม 3200 วัตต์
- แชสซีแบบแร็คเมาท์ 3U
กลุ่มผลิตภัณฑ์นี้มีจุดประสงค์เพื่อเชื่อมช่องว่างระหว่าง GPU และตัวเร่งความเร็ว AIโดยใช้คุณสมบัติเฉพาะสำหรับงานประมวลผลการเรียนรู้เชิงลึก[ 4 ] DGX-1 รุ่นแรกที่ใช้ Pascal ให้ประสิทธิภาพการประมวลผลความแม่นยำครึ่งหนึ่งที่ 170 teraflops [ 5 ]ในขณะที่การอัปเกรดที่ใช้ Volta เพิ่มประสิทธิภาพนี้เป็น960 teraflops [ 6 ]
DGX-1 รุ่นแรกมีจำหน่ายเฉพาะในรูปแบบ Pascal เท่านั้น โดยใช้ซ็อกเก็ต SXM รุ่นแรก รุ่นปรับปรุงในภายหลังของ DGX-1 รองรับการ์ด Volta รุ่นแรกผ่านซ็อกเก็ต SXM-2 Nvidia ได้เสนอชุดอัปเกรดที่ช่วยให้ผู้ใช้ที่มี DGX-1 ที่ใช้ Pascal สามารถอัปเกรดเป็น DGX-1 ที่ใช้ Volta ได้[ 7 ] [ 8 ]
- DGX-1 ที่ใช้สถาปัตยกรรม Pascal มีสองรุ่น รุ่นหนึ่งมีIntel Xeon E5-2698 V3 จำนวน 16 คอร์ และอีกรุ่นหนึ่งมี E5-2698 V4 จำนวน 20 คอร์ ยังไม่มีข้อมูลราคาสำหรับรุ่นที่มี E5-2698 V4 ส่วน DGX-1 ที่ใช้สถาปัตยกรรม Pascal และมี E5-2698 V3 นั้นมีราคาเปิดตัวอยู่ที่ 129,000 ดอลลาร์สหรัฐ[ 9 ]
- DGX-1 ที่ใช้ Volta เป็นพื้นฐานนั้นติดตั้ง E5-2698 V4 และมีราคาเปิดตัวที่ 149,000 ดอลลาร์สหรัฐ[ 9 ]
สถานี DGX
DGX Station ได้รับการออกแบบให้เป็น ซูเปอร์คอมพิวเตอร์ AI แบบครบวงจร สำหรับใช้งานบนโต๊ะทำงาน เป็นคอมพิวเตอร์ แบบตั้งโต๊ะที่สามารถทำงานได้อย่างอิสระโดยสมบูรณ์โดยไม่ต้องใช้โครงสร้างพื้นฐานของศูนย์ข้อมูลทั่วไป เช่น ระบบระบายความร้อน แหล่งจ่ายไฟสำรอง หรือ แร็ ค ขนาด 19 นิ้ว
สถานี DGX มีให้บริการครั้งแรกพร้อมข้อกำหนดดังต่อไปนี้[ 10 ]
- ตัวเร่งความเร็ว Tesla V100 ที่ใช้สถาปัตยกรรม Volta จำนวน 4 ตัว แต่ละตัวมีหน่วยความจำHBM2 ขนาด 16 GB
- 480 TFLOPS FP16
- Intel Xeon E5-2698 v4 ตัวเดียว[ 11 ]
- 256 GB DDR4
- SSD ขนาด 1.92 TB จำนวน 4 ตัว
- อีเธอร์เน็ต 10 Gb สองพอร์ต
สถานี DGX ใช้ระบบระบายความร้อนด้วยน้ำเพื่อจัดการความร้อนของส่วนประกอบระบบทั้งหมดเกือบ 1500 วัตต์ได้ดียิ่งขึ้น ทำให้สามารถรักษาช่วงเสียงรบกวนให้อยู่ต่ำกว่า 35 เดซิเบลขณะใช้งาน[ 12 ]คุณสมบัตินี้และคุณสมบัติอื่นๆ ทำให้ระบบนี้เป็นตัวเลือกที่น่าสนใจสำหรับลูกค้าที่ไม่มีโครงสร้างพื้นฐานในการใช้งาน ระบบ DGX แบบแร็คเมาท์ซึ่งอาจมีเสียงดัง สร้างความร้อนสูง และใช้พื้นที่มาก นี่เป็นความพยายามครั้งแรกของ Nvidia ในการนำการประมวลผลประสิทธิภาพสูงมา ไว้ ที่โต๊ะทำงาน ซึ่งต่อมาได้กลายเป็นกลยุทธ์การตลาดที่โดดเด่นของ Nvidia [ 13 ]
ดีจีเอ็กซ์-2
Nvidia DGX-2 ซึ่งเป็นรุ่นต่อจาก DGX-1 ใช้การ์ด Volta-based V100 32 GB (รุ่นที่สอง) จำนวน 16 ใบในหน่วยเดียว มีการประกาศเปิดตัวเมื่อวันที่ 27 มีนาคม 2018 [ 14 ] DGX-2 ให้ประสิทธิภาพ 2 Petaflops พร้อมหน่วยความจำร่วม 512 GB สำหรับจัดการกับชุดข้อมูลขนาดใหญ่ และใช้ NVSwitch สำหรับการสื่อสารภายในที่มีแบนด์วิดท์สูง DGX-2 มีหน่วยความจำ HBM2รวม 512 GB และ DDR4รวม 1.5 TB นอกจากนี้ยังมี การ์ด InfiniBand 100 Gbit/s จำนวน 8 ใบ และพื้นที่จัดเก็บข้อมูล SSD 30.72 TB [ 15 ]ทั้งหมดนี้บรรจุอยู่ในตัวเครื่องแร็คเมาท์ขนาดใหญ่ 10U และใช้พลังงานสูงสุด 10 kW ภายใต้ภาระสูงสุด[ 16 ]ราคาเริ่มต้นของ DGX-2 คือ 399,000 ดอลลาร์สหรัฐ[ 17 ]
DGX-2 แตกต่างจากรุ่น DGX อื่นๆ ตรงที่มีบอร์ด GPU แยกกันสองบอร์ด แต่ละบอร์ดมี GPU แปดตัว บอร์ดเหล่านี้เชื่อมต่อกันด้วยระบบ NVSwitch ซึ่งช่วยให้สามารถสื่อสารแบนด์วิดท์เต็มรูปแบบระหว่าง GPU ทั้งหมดในระบบได้โดยไม่มีความล่าช้าเพิ่มเติมระหว่างบอร์ด[ 16 ]
นอกจากนี้ ยังมีการนำเสนอ DGX-2H ซึ่งเป็นรุ่นที่มีประสิทธิภาพสูงกว่าของ DGX-2 โดย DGX-2H ได้เปลี่ยนซีพียู Intel Xeon Platinum 8168 สองตัวของ DGX-2 เป็นซีพียู Intel Xeon Platinum 8174 สองตัวที่ได้รับการอัพเกรด การอัพเกรดนี้ไม่ได้เพิ่มจำนวนคอร์ต่อระบบ เนื่องจากซีพียูทั้งสองตัวมี 24 คอร์ และไม่ได้เปิดใช้งานฟังก์ชันใหม่ใดๆ ของระบบ แต่จะเพิ่มความถี่พื้นฐานของซีพียูจาก 2.7 GHz เป็น 3.1 GHz [ 18 ] [ 19 ] [ 20 ]
แอมแปร์
เซิร์ฟเวอร์ DGX A100
DGX A100 ได้รับการประกาศและวางจำหน่ายเมื่อวันที่ 14 พฤษภาคม 2020 โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 3 ซึ่งประกอบด้วยตัวเร่งความเร็ว A100 ที่ใช้Ampere จำนวน 8 ตัว [ 21 ]นอกจากนี้ยังมีพื้นที่จัดเก็บข้อมูลNVMe PCIe gen 4 ขนาด 15 TB [ 22 ] หน่วยความ จำ RAM ขนาด 1 TB และNIC ConnectX-6 HDR InfiniBand ความเร็ว 200 GB/s จำนวน 8 ตัวที่ขับเคลื่อนโดยMellanox DGX A100 มีขนาดเล็กกว่ารุ่นก่อนหน้าอย่าง DGX-2 มาก โดยใช้พื้นที่เพียง 6 ยูนิตแร็ค[ 23 ]
นอกจากนี้ DGX A100 ยังเปลี่ยนไปใช้ CPU AMD EPYC 7742 แบบ 64 คอร์ ซึ่งเป็นเซิร์ฟเวอร์ DGX เครื่องแรกที่ไม่ได้สร้างด้วย CPU Intel Xeon ราคาเริ่มต้นของเซิร์ฟเวอร์ DGX A100 คือ 199,000 ดอลลาร์สหรัฐ[ 21 ]
สถานี DGX A100
DGX Station A100 ซึ่งเป็นรุ่นต่อจาก DGX Station รุ่นดั้งเดิม มีเป้าหมายที่จะเติมเต็มช่องว่างเดียวกันกับ DGX Station ในแง่ของการเป็น โซลูชัน คลัสเตอร์แบบครบวงในกล่องเดียว ที่เงียบ มีประสิทธิภาพ และสามารถซื้อ เช่า หรือเช่าซื้อได้โดยบริษัทขนาดเล็กหรือบุคคลทั่วไปที่ต้องการใช้แมชชีนเลิร์นนิง โดยยังคงใช้การออกแบบหลายอย่างจาก DGX Station รุ่นดั้งเดิม เช่น รูปทรงแบบทาวเวอร์เมนบอร์ด CPU แบบซ็อกเก็ตเดียว ระบบระบายความร้อนแบบใหม่ที่ใช้สารทำความเย็น และจำนวนตัวเร่งความเร็วที่ลดลงเมื่อเทียบกับ DGX A100 แบบแร็คเมาท์ในรุ่นเดียวกัน[ 13 ]ราคาสำหรับ DGX Station A100 320G คือ 149,000 ดอลลาร์สหรัฐ และ 99,000 ดอลลาร์สหรัฐสำหรับรุ่น 160G นอกจากนี้ Nvidia ยังเสนอบริการเช่า Station ในราคาประมาณ 9,000 ดอลลาร์สหรัฐต่อเดือนผ่านพันธมิตรในสหรัฐอเมริกา (rentacomputer.com) และยุโรป (iRent IT Systems) เพื่อช่วยลดต้นทุนในการใช้งานระบบเหล่านี้ในขนาดเล็ก[ 24 ] [ 25 ]
DGX Station A100 มาพร้อมกับการกำหนดค่า A100 ในตัวสองแบบที่แตกต่างกัน
- ตัวเร่งความเร็ว A100 ที่ใช้สถาปัตยกรรม Ampere จำนวน 4 ตัว กำหนดค่าด้วยหน่วยความจำ 40 GB (HBM) หรือ 80 GB (HBM2e) ทำให้มีหน่วยความจำรวม 160 GB หรือ 320 GB ส่งผลให้ DGX Station A100 มีให้เลือกสองรุ่นคือ 160G หรือ 320G
- 2.5 PFLOPS FP16
- โปรเซสเซอร์ AMD EPYC 7742 แบบ 64 คอร์เดี่ยว
- 512 GB DDR4
- ไดรฟ์ NVMeสำหรับระบบปฏิบัติการขนาด 1.92 TB จำนวน 1 ตัว
- 1 x 7.68 TB U.2 NVMe Drive
- พอร์ตอีเธอร์เน็ต 10 Gb สองพอร์ต
- พอร์ต BMC 1 Gb เดี่ยว
ฮอปเปอร์
เซิร์ฟเวอร์ DGX H100
DGX H100 ได้รับการประกาศเมื่อวันที่ 22 มีนาคม 2022 [ 26 ]และวางแผนจะวางจำหน่ายในไตรมาสที่ 3 ของปี 2022 [ 27 ] โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 4 สร้างขึ้นด้วยตัวเร่งความเร็ว H100 ที่ใช้ Hopper จำนวน 8 ตัว ทำให้มีประสิทธิภาพการประมวลผล AI FP8 รวม 32 PFLOPs และหน่วยความจำ HBM3 ขนาด 640 GB ซึ่งเป็นการอัพเกรดจากหน่วยความจำ HBM2 ขนาด 640 GB ของ DGX A100 การอัพเกรดนี้ยังเพิ่ม แบนด์วิดท์ VRAMเป็น 3 TB/s อีกด้วย [ 28 ] DGX H100 เพิ่ม ขนาด แร็คเมาท์เป็น 8U เพื่อรองรับ TDP 700W ของการ์ด H100 SXM แต่ละตัว นอกจากนี้ DGX H100 ยังมี SSD ขนาด 1.92 TB สองตัวสำหรับ จัดเก็บ ระบบปฏิบัติการและพื้นที่จัดเก็บข้อมูลแบบโซลิดสเตท ขนาด 30.72 TB สำหรับข้อมูลแอปพลิ เคชัน
อีกหนึ่งส่วนเพิ่มเติมที่น่าสนใจคือ การมี Nvidia Bluefield 3 DPU สองตัว [ 29 ]และการอัปเกรดเป็น InfiniBand 400 Gbit/s ผ่านNIC Mellanox ConnectX-7 ซึ่งมีแบนด์วิดท์เป็นสองเท่าของ DGX A100 DGX H100 ใช้การ์ด 'Cedar Fever' ใหม่ โดยแต่ละการ์ดมีคอนโทรลเลอร์ ConnectX-7 400 GB/s สี่ตัว และสองการ์ดต่อระบบ ทำให้ DGX H100 มีแบนด์วิดท์เครือข่าย 3.2 Tbit/s ผ่าน Infiniband [ 30 ]
DGX H100 มีซีพียู Xeon Platinum 8480C Scalable สองตัว (ชื่อรหัสSapphire Rapids ) [ 31 ]และหน่วยความจำระบบ 2 เท รา ไบต์ [ 32 ]
DGX H100 มีราคาอยู่ที่ 379,000 ปอนด์ หรือประมาณ 482,000 ดอลลาร์สหรัฐ ณ เวลาที่วางจำหน่าย[ 33 ]
ดีจีเอ็กซ์ จีเอช200
DGX GH200 ซึ่งประกาศในเดือนพฤษภาคม 2023 ได้เชื่อมต่อชิป Nvidia Hopper Superchips จำนวน 32 ตัวเข้าด้วยกันเป็นชิปเดียว ซึ่งประกอบด้วย GPU H100 จำนวน 256 ตัว, CPU Grace Neoverse V2 72 คอร์ จำนวน 32 ตัว, VPI ConnectX-7 พอร์ตเดี่ยว OSFT จำนวน 32 ตัว พร้อม InfiniBand 400 Gbit/s และ VPI BlueField-3 พอร์ตคู่ จำนวน 16 ตัว พร้อมMellanox 200 Gbit/s [1] [2] Nvidia DGX GH200 ได้รับการออกแบบมาเพื่อรองรับโมเดลขนาดเทราไบต์สำหรับระบบแนะนำขนาดใหญ่ AI แบบสร้าง และการวิเคราะห์กราฟ โดยมีหน่วยความจำร่วม 19.5 TB พร้อมความสามารถในการปรับขนาดเชิงเส้นสำหรับโมเดล AI ขนาดใหญ่[ 34 ]
ดีจีเอ็กซ์ เฮลิออส
ซูเปอร์คอมพิวเตอร์ DGX Helios ที่ประกาศเปิดตัวในเดือนพฤษภาคม 2023 ประกอบด้วยระบบ DGX GH200 จำนวน 4 ระบบ แต่ละระบบเชื่อมต่อกันด้วยเครือข่าย Nvidia Quantum-2 InfiniBand เพื่อเพิ่มประสิทธิภาพการรับส่งข้อมูลสำหรับการฝึกโมเดล AI ขนาดใหญ่ Helios มี GPU H100 จำนวน 1,024 ตัว
แบล็กเวลล์
ดีจีเอ็กซ์ จีบี200


ประกาศเมื่อเดือนมีนาคม พ.ศ. 2567 [ 35 ] GB200 NVL72 เชื่อมต่อซีพียู Grace Arm Neoverse V2 72 คอร์ จำนวน 36 ตัว และ GPU B200 จำนวน 72 ตัว ในรูปแบบแร็คสเกล[ 36 ] GB200 NVL72 เป็นโซลูชันแบบแร็คสเกลที่ระบายความร้อนด้วยของเหลว ซึ่งมีโดเมน NVLink 72 GPU ที่ทำหน้าที่เป็น GPU ขนาดใหญ่ตัวเดียว[ 37 ] Nvidia DGX GB200 มีหน่วยความจำร่วม HBM3e ขนาด 13.5 TB พร้อมความสามารถในการปรับขนาดเชิงเส้นสำหรับโมเดล AI ขนาดใหญ่ ซึ่งน้อยกว่ารุ่นก่อนหน้า DGX GH200
ดีจีเอ็กซ์ ซูเปอร์พอด
DGX Superpod เป็น ระบบ ซูเปอร์คอมพิวเตอร์ แบบครบวงจรประสิทธิภาพสูง ที่ Nvidia จัดหาให้โดยใช้ฮาร์ดแวร์ DGX [ 38 ]มันรวมโหนดประมวลผล DGX เข้ากับพื้นที่จัดเก็บข้อมูลความเร็วสูงและเครือข่าย แบนด์วิดท์สูง เพื่อมอบโซลูชันสำหรับภาระงานการเรียนรู้ของเครื่องที่มีความต้องการสูงซูเปอร์คอมพิวเตอร์ Seleneที่ห้องปฏิบัติการแห่งชาติ Argonneเป็นตัวอย่างหนึ่งของระบบที่ใช้ DGX SuperPod
Selene ซึ่งสร้างจากโหนด DGX A100 จำนวน 280 โหนด ได้รับการจัดอันดับที่ 5 ใน รายชื่อ TOP500สำหรับซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุด ณ เวลาที่เสร็จสมบูรณ์ในเดือนมิถุนายน 2020 [ 39 ] SuperPod ที่ใช้ Hopper รุ่นใหม่สามารถขยายขนาดได้ถึงโหนด DGX H100 จำนวน 32 โหนด รวมเป็น GPU H100 ทั้งหมด 256 ตัว และ CPU x86 จำนวน 64 ตัว ทำให้ SuperPod ทั้งหมดมีหน่วยความจำ HBM3 ขนาด 20 TB แบนด์วิดท์การแบ่งครึ่ง 70.4 TB/s และการประมวลผล AI FP8 สูงถึง 1 ExaFLOP [ 28 ]จากนั้น SuperPod เหล่านี้สามารถนำมารวมกันเพื่อสร้างซูเปอร์คอมพิวเตอร์ขนาดใหญ่ขึ้นได้
ซูเปอร์คอมพิวเตอร์ Eos ซึ่งออกแบบ สร้าง และดำเนินการโดย Nvidia [ 40 ] [ 41 ] [ 42 ]สร้างขึ้นจาก SuperPods ที่ใช้ H100 จำนวน 18 เครื่อง รวมเป็นระบบ DGX H100 จำนวน 576 ระบบ สวิตช์ Quantum-2 InfiniBand จำนวน 500 ตัว และสวิตช์ NVLink จำนวน 360 ตัว ซึ่งทำให้ Eos สามารถประมวลผล FP8 ได้ 18 EFLOPs และประมวลผล FP16 ได้ 9 EFLOPs ทำให้ Eos เป็นซูเปอร์คอมพิวเตอร์ AI ที่เร็วที่สุดอันดับ 5 ของโลก ตาม TOP500 (ฉบับเดือนพฤศจิกายน 2023)
เนื่องจาก Nvidia ไม่ได้ผลิตอุปกรณ์หรือระบบจัดเก็บข้อมูลใดๆ Nvidia SuperPods จึงต้องพึ่งพาพันธมิตรในการจัดหาอุปกรณ์จัดเก็บข้อมูลประสิทธิภาพสูง ปัจจุบันพันธมิตรด้านการจัดเก็บข้อมูลสำหรับ Nvidia SuperPods ได้แก่Dell EMC , DDN , HPE , IBM , NetApp , Pavilion Data และVAST Data [ 43 ]
ดีจีเอ็กซ์ สปาร์ค

ในเดือนมีนาคม พ.ศ. 2568 Nvidia ยังได้ประกาศเปิดตัว DGX Spark (เดิมชื่อ DIGITS) ซึ่งเป็น "ซูเปอร์คอมพิวเตอร์ AI แบบตั้งโต๊ะ" ที่ใช้ CPU Blackwell Grace ซึ่งประกอบด้วยคอร์ ARM และ iGPU ในตัวที่เรียกว่า Nvidia GB10 Superchip [ 44 ]เครื่องเหล่านี้มุ่งเป้าไปที่นักวิจัยและโปรแกรมเมอร์ AI และมี RAM ในตัวขนาด 128 GB ทำให้สามารถฝึกฝนหรือปรับแต่งโมเดลขนาดใหญ่ได้ ("มากถึง 200 พันล้านพารามิเตอร์" ด้วยการควอนไทเซชัน) ผู้ผลิตพันธมิตรหลายรายยังนำเสนอ DGX Spark เวอร์ชันต่างๆ อีกด้วย[ 45 ] [ 46 ]
เครื่องเร่งอนุภาค
เริ่มต้นจาก P100 [ 47 ] [ 48 ] [ 49 ]ไปยัง V100 [ 50 ]ไปยัง A100 [ 51 ]ไปยัง H100 [ 52 ]ไปยัง B200 [ 53 ] [ 54 ]และไปยัง R100 [ 55 ]การเปรียบเทียบเครื่องเร่งอนุภาคที่ใช้ใน DGX:
ทั่วไปและสถาปัตยกรรม
| แบบอย่าง | สถาปัตยกรรม | ซ็อกเก็ต | จีพี | กระบวนการผลิต | จำนวนทรานซิสเตอร์ (พันล้าน) | ขนาดแม่พิมพ์ (มม. ² ) | เปิดตัว |
|---|---|---|---|---|---|---|---|
| พี100 | ปาสคาล | SXM/SXM2 | จีพี100 | TSMC 16FF+ | 15.3 | 610 | ไตรมาสที่ 2 ปี 2559 |
| V100 16GB | โวลต้า | SXM2 | จีวี100 | ทีเอสเอ็มซี 12เอฟเอ็น | 21.1 | 815 | ไตรมาสที่ 3 ปี 2560 |
| V100 32GB | SXM3 | ||||||
| A100 40GB | แอมแปร์ | SXM4 | GA100 | ทีเอสเอ็มซีเอ็น7 | 54.2 | 826 | ไตรมาสที่ 1 ปี 2020 |
| A100 80GB | ไตรมาสที่ 4 ปี 2020 | ||||||
| เอช100 | ฮอปเปอร์ | SXM5 | GH100 | ทีเอสเอ็มซี 4เอ็น | 80 | 814 | ไตรมาสที่ 3 ปี 2022 |
| เอช200 | ไตรมาสที่ 3 ปี 2023 | ||||||
| บี100 | แบล็กเวลล์ | SXM6 | จีบี100 | ทีเอสเอ็มซี 4เอ็นพี | 208 | ไม่มีข้อมูล | ไตรมาสที่ 4 ปี 2024 |
| บี200 | |||||||
| 100 แรนด์ | รูบิน | SXM7 | ไม่มีข้อมูล | ทีเอสเอ็มซี 3เอ็น | 338 | ไม่มีข้อมูล | ครึ่งหลังของปี 2026 |
คอร์, นาฬิกา และพลังงาน
| แบบอย่าง | นาฬิกาเร่งความเร็ว (เมกะเฮิร์ตซ์) | #SM | แกนกลาง (FP32 CUDA) | แกนกลาง (FP64 ไม่รวมเทนเซอร์) | แกนกลาง (ผสม INT32/FP32) | แกนกลาง (INT32) | ทีดีพี (W) |
|---|---|---|---|---|---|---|---|
| พี100 | 1480 | 56 | 3584 | ค.ศ. 1792 | ไม่มีข้อมูล | ไม่มีข้อมูล | 300 |
| V100 16GB | 1530 | 80 | 5120 | 2560 | ไม่มีข้อมูล | 5120 | 300 |
| V100 32GB | 350 | ||||||
| A100 40GB | 1410 | 108 | 6912 | 3456 | 6912 | ไม่มีข้อมูล | 400 |
| A100 80GB | |||||||
| เอช100 | 1980 | 132 | 16896 | 4608 | 16896 | ไม่มีข้อมูล | 700 |
| เอช200 | 1000 | ||||||
| บี100 | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | 700 |
| บี200 | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | 1000 |
| 100 แรนด์ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | 2300 |
หน่วยความจำและแคช
| แบบอย่าง | ประเภทหน่วยความจำ (เอชบีเอ็ม) | ขนาด VRAM (สหราชอาณาจักร) | ความเร็วหน่วยความจำ (กิกะไบต์/วินาที) | ความกว้างของรถบัส (บิต) | แบนด์วิดท์ (TB/s) | แคช L1 ต่อ SM (KB) | แคช L1 รวม (KB) | แคช L2 (KB) |
|---|---|---|---|---|---|---|---|---|
| พี100 | เอชบีเอ็ม2 | 16 | 1.4 | 4096 | 0.72 | 24 | 1344 | 4096 |
| V100 16GB | เอชบีเอ็ม2 | 16 | 1.75 | 4096 | 0.9 | 128 | 10240 | 6144 |
| V100 32GB | 32 | |||||||
| A100 40GB | เอชบีเอ็ม2 | 40 | 2.4 | 5120 | 1.52 | 192 | 20736 | 40960 |
| A100 80GB | HBM2e | 80 | 3.2 | |||||
| เอช100 | เอชบีเอ็ม3 | 80 | 5.2 | 5120 | 3.35 | 192 | 25344 | 51200 |
| เอช200 | HBM3e | 141 | 6.3 | 6144 | 4.8 | |||
| บี100 | HBM3e | 192 | 8 | 8192 | 8 | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล |
| บี200 | ||||||||
| 100 แรนด์ | เอชบีเอ็ม4 | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล |
ประสิทธิภาพการประมวลผล การเชื่อมต่อ และเครือข่าย
| แบบอย่าง | เอฟพี32 (TFLOPS) | เอฟพี64 (TFLOPS) | อินที8 เทนเซอร์หนาแน่น | FP16 เทนเซอร์หนาแน่น | บฟลัต16 เทนเซอร์หนาแน่น | เอฟเอฟ32 เทนเซอร์หนาแน่น | เอฟพี64 เทนเซอร์หนาแน่น | การเชื่อมต่อ (NVLink; เทราไบต์/วินาที) | การสร้างเครือข่าย |
|---|---|---|---|---|---|---|---|---|---|
| พี100 | 10.6 | 5.3 | ไม่มีข้อมูล | 21.2 | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | 0.16 | คอนเน็กต์เอ็กซ์-4 (100 กิกะไบต์/วินาที) |
| V100 16GB | 15.7 | 7.8 | ไม่มีข้อมูล | 125 TFLOPS | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | 0.3 | คอนเน็กต์เอ็กซ์-5 (100 กิกะไบต์/วินาที) |
| V100 32GB | |||||||||
| A100 40GB | 19.5 | 9.7 | 624 ท็อปส์ | 312 TFLOPS | 312 TFLOPS | 156 TFLOPS | 19.5 TFLOPS | 0.6 | คอนเน็กต์เอ็กซ์-6 (200 กิกะไบต์/วินาที) |
| A100 80GB | |||||||||
| เอช100 | 67 | 34 | 1.98 ป๊อปส์ | 990 TFLOPS | 990 TFLOPS | 495 TFLOPS | 67 TFLOPS | 0.9 | คอนเน็กต์เอ็กซ์-7 (400 กิกะไบต์/วินาที) |
| เอช200 | |||||||||
| บี100 | ไม่มีข้อมูล | ไม่มีข้อมูล | 3.5 ป๊อปส์ | 1.98 PFLOPS | 1.98 PFLOPS | 989 TFLOPS | 30 TFLOPS | 1.8 | คอนเน็กต์เอ็กซ์-7 (400 กิกะไบต์/วินาที) |
| บี200 | ไม่มีข้อมูล | ไม่มีข้อมูล | 4.5 ป๊อปส์ | 2.25 ฟล็อปส์ | 2.25 ฟล็อปส์ | 1.2 PFLOPS | 40 ทฟล็อปส์ | ||
| 100 แรนด์ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | คอนเน็กต์เอ็กซ์-9 (1600 กิกะไบต์/วินาที) |
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ เอ็นดีจีเอ็กซ์
Nvidia DGX ( Deep GPU Xceleration ) คือซีรี่ส์ของ เซิร์ฟเวอร์ และ เวิร์กสเตชัน ที่ออกแบบโดย Nvidia โดยมีเป้าหมายหลักเพื่อเพิ่มประสิทธิภาพ แอปพลิเคชัน การเรียนรู้เชิงลึก ผ่านการใช้...
ปาสคาล - โวลตา
เซิร์ฟเวอร์ DGX-1 มี GPU 8 ตัว ที่ใช้ การ์ดเสริม Pascal หรือ Volta [ 1 ] พร้อม หน่วยความจำ HBM2 รวม 128 GB เชื่อมต่อกันด้วย เครือข่ายเมช NVLink [ 2 ] DGX -1 ได้รับการประกาศเมื่อวันที่ 6 เมษายน 2559 [ 3 ] ทุกรุ่นใช้การกำหนดค่าซ็อกเก็ตคู่ของซีพียู Intel Xeon E5...
แอมแปร์
DGX A100 ได้รับการประกาศและวางจำหน่ายเมื่อวันที่ 14 พฤษภาคม 2020 โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 3 ซึ่งประกอบด้วยตัวเร่งความเร็ว A100 ที่ใช้ Ampere จำนวน 8 ตัว [ 21 ] นอกจากนี้ยังมีพื้นที่จัดเก็บข้อมูล NVMe PCIe gen 4 ขนาด 15 TB [ 22 ] หน่วยความ จำ RAM ขนาด 1...
ฮอปเปอร์
DGX H100 ได้รับการประกาศเมื่อวันที่ 22 มีนาคม 2022 [ 26 ] และวางแผนจะวางจำหน่ายในไตรมาสที่ 3 ของปี 2022 [ 27 ] โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 4 สร้างขึ้นด้วยตัวเร่งความเร็ว H100 ที่ใช้ Hopper จำนวน 8 ตัว ทำให้มีประสิทธิภาพการประมวลผล AI FP8 รวม 32 PFLOPs...