เอ็นดีจีเอ็กซ์

ดีจีเอ็กซ์
	ชั้นวางที่บรรจุซูเปอร์คอมพิวเตอร์ DGX-1 จำนวน 5 เครื่อง
ผู้ผลิต	เอ็นดีวีดี
ปล่อยแล้ว	2016

Nvidia DGX ( Deep GPU Xceleration ) คือซีรี่ส์ของเซิร์ฟเวอร์และเวิร์กสเตชันที่ออกแบบโดยNvidiaโดยมีเป้าหมายหลักเพื่อเพิ่มประสิทธิภาพ แอปพลิเคชัน การเรียนรู้เชิงลึกผ่านการใช้การประมวลผลทั่วไปบนหน่วยประมวลผลกราฟิก (GPGPU) ระบบเหล่านี้มักมาในรูปแบบแร็คเมาท์ โดยเริ่มแรกใช้ ซีพียูเซิร์ฟเวอร์x86ประสิทธิภาพสูง เปลี่ยนไปใช้ ARMในช่วงปี 2018 และวางจำหน่ายNUCในปี 2025

คุณสมบัติหลักของระบบ DGX คือการมี โมดูล GPU Nvidia Tesla จำนวน 4 ถึง 8 โมดูล ซึ่งติดตั้งอยู่บนเมนบอร์ดแยกต่างหาก GPU เหล่านี้สามารถเชื่อมต่อได้ทั้งผ่านซ็อก เก็ต SXMหรือ สล็อต PCIe x16 ทำให้สามารถผสานรวมเข้ากับสถาปัตยกรรมของระบบได้อย่างยืดหยุ่น เพื่อจัดการกับความร้อนที่เกิดขึ้นจำนวนมาก หน่วย DGX จึงติดตั้งฮีทซิงค์และพัดลมที่ออกแบบมาเพื่อรักษาอุณหภูมิการทำงานที่เหมาะสม

หน่วยประมวลผลกราฟิก (GPGPU) ของ Nvidia ถูกนำมาใช้ในซูเปอร์คอมพิวเตอร์ TOP500

นางแบบ

ปาสคาล - โวลตา

ดีจีเอ็กซ์-1

เซิร์ฟเวอร์ DGX-1 มีGPU 8 ตัว ที่ใช้การ์ดเสริม PascalหรือVolta ^[¹^] พร้อม หน่วยความจำHBM2รวม 128 GB เชื่อมต่อกันด้วย เครือข่ายเมช NVLink [ ²^]^DGX -1 ได้รับการประกาศเมื่อวันที่ 6 เมษายน 2559 ^[³^]ทุกรุ่นใช้การกำหนดค่าซ็อกเก็ตคู่ของซีพียู Intel Xeon E5 และมีคุณสมบัติดังต่อไปนี้

หน่วย ความจำ DDR4-2133ขนาด 512 GB
ระบบเครือข่าย Dual 10 Gb
SSD ขนาด 1.92 TB จำนวน 4 ตัว
ความสามารถในการจ่ายไฟรวม 3200 วัตต์
แชสซีแบบแร็คเมาท์ 3U

กลุ่มผลิตภัณฑ์นี้มีจุดประสงค์เพื่อเชื่อมช่องว่างระหว่าง GPU และตัวเร่งความเร็ว AIโดยใช้คุณสมบัติเฉพาะสำหรับงานประมวลผลการเรียนรู้เชิงลึก^{[ 4 ]} DGX-1 รุ่นแรกที่ใช้ Pascal ให้ประสิทธิภาพการประมวลผลความแม่นยำครึ่งหนึ่งที่ 170 teraflops ^[⁵^]ในขณะที่การอัปเกรดที่ใช้ Volta เพิ่มประสิทธิภาพนี้เป็น960 teraflops ^[⁶^]

DGX-1 รุ่นแรกมีจำหน่ายเฉพาะในรูปแบบ Pascal เท่านั้น โดยใช้ซ็อกเก็ต SXM รุ่นแรก รุ่นปรับปรุงในภายหลังของ DGX-1 รองรับการ์ด Volta รุ่นแรกผ่านซ็อกเก็ต SXM-2 Nvidia ได้เสนอชุดอัปเกรดที่ช่วยให้ผู้ใช้ที่มี DGX-1 ที่ใช้ Pascal สามารถอัปเกรดเป็น DGX-1 ที่ใช้ Volta ได้^{[ 7 ]}^{[ 8 ]}

DGX-1 ที่ใช้สถาปัตยกรรม Pascal มีสองรุ่น รุ่นหนึ่งมีIntel Xeon E5-2698 V3 จำนวน 16 คอร์ และอีกรุ่นหนึ่งมี E5-2698 V4 จำนวน 20 คอร์ ยังไม่มีข้อมูลราคาสำหรับรุ่นที่มี E5-2698 V4 ส่วน DGX-1 ที่ใช้สถาปัตยกรรม Pascal และมี E5-2698 V3 นั้นมีราคาเปิดตัวอยู่ที่ 129,000 ดอลลาร์สหรัฐ^{[ 9 ]}
DGX-1 ที่ใช้ Volta เป็นพื้นฐานนั้นติดตั้ง E5-2698 V4 และมีราคาเปิดตัวที่ 149,000 ดอลลาร์สหรัฐ^{[ 9 ]}

สถานี DGX

DGX Station ได้รับการออกแบบให้เป็น ซูเปอร์คอมพิวเตอร์ AI แบบครบวงจร สำหรับใช้งานบนโต๊ะทำงาน เป็นคอมพิวเตอร์ แบบตั้งโต๊ะที่สามารถทำงานได้อย่างอิสระโดยสมบูรณ์โดยไม่ต้องใช้โครงสร้างพื้นฐานของศูนย์ข้อมูลทั่วไป เช่น ระบบระบายความร้อน แหล่งจ่ายไฟสำรอง หรือ แร็ ค ขนาด 19 นิ้ว

สถานี DGX มีให้บริการครั้งแรกพร้อมข้อกำหนดดังต่อไปนี้^{[ 10 ]}

ตัวเร่งความเร็ว Tesla V100 ที่ใช้สถาปัตยกรรม Volta จำนวน 4 ตัว แต่ละตัวมีหน่วยความจำHBM2 ขนาด 16 GB
480 TFLOPS FP16
Intel Xeon E5-2698 v4 ตัวเดียว^{[ 11 ]}
256 GB DDR4
SSD ขนาด 1.92 TB จำนวน 4 ตัว
อีเธอร์เน็ต 10 Gb สองพอร์ต

สถานี DGX ใช้ระบบระบายความร้อนด้วยน้ำเพื่อจัดการความร้อนของส่วนประกอบระบบทั้งหมดเกือบ 1500 วัตต์ได้ดียิ่งขึ้น ทำให้สามารถรักษาช่วงเสียงรบกวนให้อยู่ต่ำกว่า 35 เดซิเบลขณะใช้งาน^{[ 12 ]}คุณสมบัตินี้และคุณสมบัติอื่นๆ ทำให้ระบบนี้เป็นตัวเลือกที่น่าสนใจสำหรับลูกค้าที่ไม่มีโครงสร้างพื้นฐานในการใช้งาน ระบบ DGX แบบแร็คเมาท์ซึ่งอาจมีเสียงดัง สร้างความร้อนสูง และใช้พื้นที่มาก นี่เป็นความพยายามครั้งแรกของ Nvidia ในการนำการประมวลผลประสิทธิภาพสูงมา ไว้ ที่โต๊ะทำงาน ซึ่งต่อมาได้กลายเป็นกลยุทธ์การตลาดที่โดดเด่นของ Nvidia ^{[ 13 ]}

ดีจีเอ็กซ์-2

Nvidia DGX-2 ซึ่งเป็นรุ่นต่อจาก DGX-1 ใช้การ์ด Volta-based V100 32 GB (รุ่นที่สอง) จำนวน 16 ใบในหน่วยเดียว มีการประกาศเปิดตัวเมื่อวันที่ 27 มีนาคม 2018 ^{[ 14 ]} DGX-2 ให้ประสิทธิภาพ 2 Petaflops พร้อมหน่วยความจำร่วม 512 GB สำหรับจัดการกับชุดข้อมูลขนาดใหญ่ และใช้ NVSwitch สำหรับการสื่อสารภายในที่มีแบนด์วิดท์สูง DGX-2 มีหน่วยความจำ HBM2รวม 512 GB และ DDR4รวม 1.5 TB นอกจากนี้ยังมี การ์ด InfiniBand 100 Gbit/s จำนวน 8 ใบ และพื้นที่จัดเก็บข้อมูล SSD 30.72 TB ^{[ 15 ]}ทั้งหมดนี้บรรจุอยู่ในตัวเครื่องแร็คเมาท์ขนาดใหญ่ 10U และใช้พลังงานสูงสุด 10 kW ภายใต้ภาระสูงสุด^{[ 16 ]}ราคาเริ่มต้นของ DGX-2 คือ 399,000 ดอลลาร์สหรัฐ^{[ 17 ]}

DGX-2 แตกต่างจากรุ่น DGX อื่นๆ ตรงที่มีบอร์ด GPU แยกกันสองบอร์ด แต่ละบอร์ดมี GPU แปดตัว บอร์ดเหล่านี้เชื่อมต่อกันด้วยระบบ NVSwitch ซึ่งช่วยให้สามารถสื่อสารแบนด์วิดท์เต็มรูปแบบระหว่าง GPU ทั้งหมดในระบบได้โดยไม่มีความล่าช้าเพิ่มเติมระหว่างบอร์ด^{[ 16 ]}

นอกจากนี้ ยังมีการนำเสนอ DGX-2H ซึ่งเป็นรุ่นที่มีประสิทธิภาพสูงกว่าของ DGX-2 โดย DGX-2H ได้เปลี่ยนซีพียู Intel Xeon Platinum 8168 สองตัวของ DGX-2 เป็นซีพียู Intel Xeon Platinum 8174 สองตัวที่ได้รับการอัพเกรด การอัพเกรดนี้ไม่ได้เพิ่มจำนวนคอร์ต่อระบบ เนื่องจากซีพียูทั้งสองตัวมี 24 คอร์ และไม่ได้เปิดใช้งานฟังก์ชันใหม่ใดๆ ของระบบ แต่จะเพิ่มความถี่พื้นฐานของซีพียูจาก 2.7 GHz เป็น 3.1 GHz ^{[ 18 ]}^{[ 19 ]}^{[ 20 ]}

แอมแปร์

เซิร์ฟเวอร์ DGX A100

DGX A100 ได้รับการประกาศและวางจำหน่ายเมื่อวันที่ 14 พฤษภาคม 2020 โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 3 ซึ่งประกอบด้วยตัวเร่งความเร็ว A100 ที่ใช้Ampere จำนวน 8 ตัว ^{[ 21 ]}นอกจากนี้ยังมีพื้นที่จัดเก็บข้อมูลNVMe PCIe gen 4 ขนาด 15 TB ^[²²^] หน่วยความ จำ RAM ขนาด 1 TB และNIC ConnectX-6 HDR InfiniBand ความเร็ว 200 GB/s จำนวน 8 ตัวที่ขับเคลื่อนโดยMellanox DGX A100 มีขนาดเล็กกว่ารุ่นก่อนหน้าอย่าง DGX-2 มาก โดยใช้พื้นที่เพียง 6 ยูนิตแร็ค^[²³^]

นอกจากนี้ DGX A100 ยังเปลี่ยนไปใช้ CPU AMD EPYC 7742 แบบ 64 คอร์ ซึ่งเป็นเซิร์ฟเวอร์ DGX เครื่องแรกที่ไม่ได้สร้างด้วย CPU Intel Xeon ราคาเริ่มต้นของเซิร์ฟเวอร์ DGX A100 คือ 199,000 ดอลลาร์สหรัฐ^{[ 21 ]}

สถานี DGX A100

DGX Station A100 ซึ่งเป็นรุ่นต่อจาก DGX Station รุ่นดั้งเดิม มีเป้าหมายที่จะเติมเต็มช่องว่างเดียวกันกับ DGX Station ในแง่ของการเป็น โซลูชัน คลัสเตอร์แบบครบวงในกล่องเดียว ที่เงียบ มีประสิทธิภาพ และสามารถซื้อ เช่า หรือเช่าซื้อได้โดยบริษัทขนาดเล็กหรือบุคคลทั่วไปที่ต้องการใช้แมชชีนเลิร์นนิง โดยยังคงใช้การออกแบบหลายอย่างจาก DGX Station รุ่นดั้งเดิม เช่น รูปทรงแบบทาวเวอร์เมนบอร์ด CPU แบบซ็อกเก็ตเดียว ระบบระบายความร้อนแบบใหม่ที่ใช้สารทำความเย็น และจำนวนตัวเร่งความเร็วที่ลดลงเมื่อเทียบกับ DGX A100 แบบแร็คเมาท์ในรุ่นเดียวกัน^{[ 13 ]}ราคาสำหรับ DGX Station A100 320G คือ 149,000 ดอลลาร์สหรัฐ และ 99,000 ดอลลาร์สหรัฐสำหรับรุ่น 160G นอกจากนี้ Nvidia ยังเสนอบริการเช่า Station ในราคาประมาณ 9,000 ดอลลาร์สหรัฐต่อเดือนผ่านพันธมิตรในสหรัฐอเมริกา (rentacomputer.com) และยุโรป (iRent IT Systems) เพื่อช่วยลดต้นทุนในการใช้งานระบบเหล่านี้ในขนาดเล็ก^{[ 24 ]}^{[ 25 ]}

DGX Station A100 มาพร้อมกับการกำหนดค่า A100 ในตัวสองแบบที่แตกต่างกัน

ตัวเร่งความเร็ว A100 ที่ใช้สถาปัตยกรรม Ampere จำนวน 4 ตัว กำหนดค่าด้วยหน่วยความจำ 40 GB (HBM) หรือ 80 GB (HBM2e) ทำให้มีหน่วยความจำรวม 160 GB หรือ 320 GB ส่งผลให้ DGX Station A100 มีให้เลือกสองรุ่นคือ 160G หรือ 320G
2.5 PFLOPS FP16
โปรเซสเซอร์ AMD EPYC 7742 แบบ 64 คอร์เดี่ยว
512 GB DDR4
ไดรฟ์ NVMeสำหรับระบบปฏิบัติการขนาด 1.92 TB จำนวน 1 ตัว
1 x 7.68 TB U.2 NVMe Drive
พอร์ตอีเธอร์เน็ต 10 Gb สองพอร์ต
พอร์ต BMC 1 Gb เดี่ยว

ฮอปเปอร์

เซิร์ฟเวอร์ DGX H100

DGX H100 ได้รับการประกาศเมื่อวันที่ 22 มีนาคม 2022 ^{[ 26 ]}และวางแผนจะวางจำหน่ายในไตรมาสที่ 3 ของปี 2022 ^{[ 27 ]} โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 4 สร้างขึ้นด้วยตัวเร่งความเร็ว H100 ที่ใช้ Hopper จำนวน 8 ตัว ทำให้มีประสิทธิภาพการประมวลผล AI FP8 รวม 32 PFLOPs และหน่วยความจำ HBM3 ขนาด 640 GB ซึ่งเป็นการอัพเกรดจากหน่วยความจำ HBM2 ขนาด 640 GB ของ DGX A100 การอัพเกรดนี้ยังเพิ่ม แบนด์วิดท์ VRAMเป็น 3 TB/s อีกด้วย ^{[ 28 ]} DGX H100 เพิ่ม ขนาด แร็คเมาท์เป็น 8U เพื่อรองรับ TDP 700W ของการ์ด H100 SXM แต่ละตัว นอกจากนี้ DGX H100 ยังมี SSD ขนาด 1.92 TB สองตัวสำหรับ จัดเก็บ ระบบปฏิบัติการและพื้นที่จัดเก็บข้อมูลแบบโซลิดสเตท ขนาด 30.72 TB สำหรับข้อมูลแอปพลิ เคชัน

อีกหนึ่งส่วนเพิ่มเติมที่น่าสนใจคือ การมี Nvidia Bluefield 3 DPU สองตัว ^{[ 29 ]}และการอัปเกรดเป็น InfiniBand 400 Gbit/s ผ่านNIC Mellanox ConnectX-7 ซึ่งมีแบนด์วิดท์เป็นสองเท่าของ DGX A100 DGX H100 ใช้การ์ด 'Cedar Fever' ใหม่ โดยแต่ละการ์ดมีคอนโทรลเลอร์ ConnectX-7 400 GB/s สี่ตัว และสองการ์ดต่อระบบ ทำให้ DGX H100 มีแบนด์วิดท์เครือข่าย 3.2 Tbit/s ผ่าน Infiniband ^[³⁰^]

DGX H100 มีซีพียู Xeon Platinum 8480C Scalable สองตัว (ชื่อรหัสSapphire Rapids ) ^{[ 31 ]}และหน่วยความจำระบบ 2 เท รา ไบต์ ^{[ 32 ]}

DGX H100 มีราคาอยู่ที่ 379,000 ปอนด์ หรือประมาณ 482,000 ดอลลาร์สหรัฐ ณ เวลาที่วางจำหน่าย^{[ 33 ]}

ดีจีเอ็กซ์ จีเอช200

DGX GH200 ซึ่งประกาศในเดือนพฤษภาคม 2023 ได้เชื่อมต่อชิป Nvidia Hopper Superchips จำนวน 32 ตัวเข้าด้วยกันเป็นชิปเดียว ซึ่งประกอบด้วย GPU H100 จำนวน 256 ตัว, CPU Grace Neoverse V2 72 คอร์ จำนวน 32 ตัว, VPI ConnectX-7 พอร์ตเดี่ยว OSFT จำนวน 32 ตัว พร้อม InfiniBand 400 Gbit/s และ VPI BlueField-3 พอร์ตคู่ จำนวน 16 ตัว พร้อมMellanox 200 Gbit/s [1] [2] Nvidia DGX GH200 ได้รับการออกแบบมาเพื่อรองรับโมเดลขนาดเทราไบต์สำหรับระบบแนะนำขนาดใหญ่ AI แบบสร้าง และการวิเคราะห์กราฟ โดยมีหน่วยความจำร่วม 19.5 TB พร้อมความสามารถในการปรับขนาดเชิงเส้นสำหรับโมเดล AI ขนาดใหญ่^{[ 34 ]}

ดีจีเอ็กซ์ เฮลิออส

ซูเปอร์คอมพิวเตอร์ DGX Helios ที่ประกาศเปิดตัวในเดือนพฤษภาคม 2023 ประกอบด้วยระบบ DGX GH200 จำนวน 4 ระบบ แต่ละระบบเชื่อมต่อกันด้วยเครือข่าย Nvidia Quantum-2 InfiniBand เพื่อเพิ่มประสิทธิภาพการรับส่งข้อมูลสำหรับการฝึกโมเดล AI ขนาดใหญ่ Helios มี GPU H100 จำนวน 1,024 ตัว

แบล็กเวลล์

ดีจีเอ็กซ์ จีบี200

ประกาศเมื่อเดือนมีนาคม พ.ศ. 2567 ^{[ 35 ]} GB200 NVL72 เชื่อมต่อซีพียู Grace Arm Neoverse V2 72 คอร์ จำนวน 36 ตัว และ GPU B200 จำนวน 72 ตัว ในรูปแบบแร็คสเกล^{[ 36 ]} GB200 NVL72 เป็นโซลูชันแบบแร็คสเกลที่ระบายความร้อนด้วยของเหลว ซึ่งมีโดเมน NVLink 72 GPU ที่ทำหน้าที่เป็น GPU ขนาดใหญ่ตัวเดียว^{[ 37 ]} Nvidia DGX GB200 มีหน่วยความจำร่วม HBM3e ขนาด 13.5 TB พร้อมความสามารถในการปรับขนาดเชิงเส้นสำหรับโมเดล AI ขนาดใหญ่ ซึ่งน้อยกว่ารุ่นก่อนหน้า DGX GH200

ดีจีเอ็กซ์ ซูเปอร์พอด

DGX Superpod เป็น ระบบ ซูเปอร์คอมพิวเตอร์ แบบครบวงจรประสิทธิภาพสูง ที่ Nvidia จัดหาให้โดยใช้ฮาร์ดแวร์ DGX ^{[ 38 ]}มันรวมโหนดประมวลผล DGX เข้ากับพื้นที่จัดเก็บข้อมูลความเร็วสูงและเครือข่าย แบนด์วิดท์สูง เพื่อมอบโซลูชันสำหรับภาระงานการเรียนรู้ของเครื่องที่มีความต้องการสูงซูเปอร์คอมพิวเตอร์ Seleneที่ห้องปฏิบัติการแห่งชาติ Argonneเป็นตัวอย่างหนึ่งของระบบที่ใช้ DGX SuperPod

Selene ซึ่งสร้างจากโหนด DGX A100 จำนวน 280 โหนด ได้รับการจัดอันดับที่ 5 ใน รายชื่อ TOP500สำหรับซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุด ณ เวลาที่เสร็จสมบูรณ์ในเดือนมิถุนายน 2020 ^{[ 39 ]} SuperPod ที่ใช้ Hopper รุ่นใหม่สามารถขยายขนาดได้ถึงโหนด DGX H100 จำนวน 32 โหนด รวมเป็น GPU H100 ทั้งหมด 256 ตัว และ CPU x86 จำนวน 64 ตัว ทำให้ SuperPod ทั้งหมดมีหน่วยความจำ HBM3 ขนาด 20 TB แบนด์วิดท์การแบ่งครึ่ง 70.4 TB/s และการประมวลผล AI FP8 สูงถึง 1 ExaFLOP ^[²⁸^]จากนั้น SuperPod เหล่านี้สามารถนำมารวมกันเพื่อสร้างซูเปอร์คอมพิวเตอร์ขนาดใหญ่ขึ้นได้

ซูเปอร์คอมพิวเตอร์ Eos ซึ่งออกแบบ สร้าง และดำเนินการโดย Nvidia ^{[ 40 ]}^{[ 41 ]}^{[ 42 ]}สร้างขึ้นจาก SuperPods ที่ใช้ H100 จำนวน 18 เครื่อง รวมเป็นระบบ DGX H100 จำนวน 576 ระบบ สวิตช์ Quantum-2 InfiniBand จำนวน 500 ตัว และสวิตช์ NVLink จำนวน 360 ตัว ซึ่งทำให้ Eos สามารถประมวลผล FP8 ได้ 18 EFLOPs และประมวลผล FP16 ได้ 9 EFLOPs ทำให้ Eos เป็นซูเปอร์คอมพิวเตอร์ AI ที่เร็วที่สุดอันดับ 5 ของโลก ตาม TOP500 (ฉบับเดือนพฤศจิกายน 2023)

เนื่องจาก Nvidia ไม่ได้ผลิตอุปกรณ์หรือระบบจัดเก็บข้อมูลใดๆ Nvidia SuperPods จึงต้องพึ่งพาพันธมิตรในการจัดหาอุปกรณ์จัดเก็บข้อมูลประสิทธิภาพสูง ปัจจุบันพันธมิตรด้านการจัดเก็บข้อมูลสำหรับ Nvidia SuperPods ได้แก่Dell EMC , DDN , HPE , IBM , NetApp , Pavilion Data และVAST Data ^{[ 43 ]}

ดีจีเอ็กซ์ สปาร์ค

ในเดือนมีนาคม พ.ศ. 2568 Nvidia ยังได้ประกาศเปิดตัว DGX Spark (เดิมชื่อ DIGITS) ซึ่งเป็น "ซูเปอร์คอมพิวเตอร์ AI แบบตั้งโต๊ะ" ที่ใช้ CPU Blackwell Grace ซึ่งประกอบด้วยคอร์ ARM และ iGPU ในตัวที่เรียกว่า Nvidia GB10 Superchip ^{[ 44 ]}เครื่องเหล่านี้มุ่งเป้าไปที่นักวิจัยและโปรแกรมเมอร์ AI และมี RAM ในตัวขนาด 128 GB ทำให้สามารถฝึกฝนหรือปรับแต่งโมเดลขนาดใหญ่ได้ ("มากถึง 200 พันล้านพารามิเตอร์" ด้วยการควอนไทเซชัน) ผู้ผลิตพันธมิตรหลายรายยังนำเสนอ DGX Spark เวอร์ชันต่างๆ อีกด้วย^{[ 45 ]}^{[ 46 ]}

เครื่องเร่งอนุภาค

เริ่มต้นจาก P100 ^{[ 47 ]}^{[ 48 ]}^{[ 49 ]}ไปยัง V100 ^{[ 50 ]}ไปยัง A100 ^{[ 51 ]}ไปยัง H100 ^{[ 52 ]}ไปยัง B200 ^{[ 53 ]}^{[ 54 ]}และไปยัง R100 ^{[ 55 ]}การเปรียบเทียบเครื่องเร่งอนุภาคที่ใช้ใน DGX:

ทั่วไปและสถาปัตยกรรม

แบบอย่าง	สถาปัตยกรรม	ซ็อกเก็ต	จีพี	กระบวนการผลิต	จำนวนทรานซิสเตอร์ (พันล้าน)	ขนาดแม่พิมพ์ (มม. ^² )	เปิดตัว
พี100	ปาสคาล	SXM/SXM2	จีพี100	TSMC 16FF+	15.3	610	ไตรมาสที่ 2 ปี 2559
V100 16GB	โวลต้า	SXM2	จีวี100	ทีเอสเอ็มซี 12เอฟเอ็น	21.1	815	ไตรมาสที่ 3 ปี 2560
V100 32GB	โวลต้า	SXM3	จีวี100	ทีเอสเอ็มซี 12เอฟเอ็น	21.1	815	ไตรมาสที่ 3 ปี 2560
A100 40GB	แอมแปร์	SXM4	GA100	ทีเอสเอ็มซีเอ็น7	54.2	826	ไตรมาสที่ 1 ปี 2020
A100 80GB	แอมแปร์	SXM4	GA100	ทีเอสเอ็มซีเอ็น7	54.2	826	ไตรมาสที่ 4 ปี 2020
เอช100	ฮอปเปอร์	SXM5	GH100	ทีเอสเอ็มซี 4เอ็น	80	814	ไตรมาสที่ 3 ปี 2022
เอช200	ฮอปเปอร์	SXM5	GH100	ทีเอสเอ็มซี 4เอ็น	80	814	ไตรมาสที่ 3 ปี 2023
บี100	แบล็กเวลล์	SXM6	จีบี100	ทีเอสเอ็มซี 4เอ็นพี	208	ไม่มีข้อมูล	ไตรมาสที่ 4 ปี 2024
บี200	แบล็กเวลล์	SXM6	จีบี100	ทีเอสเอ็มซี 4เอ็นพี	208	ไม่มีข้อมูล	ไตรมาสที่ 4 ปี 2024
100 แรนด์	รูบิน	SXM7	ไม่มีข้อมูล	ทีเอสเอ็มซี 3เอ็น	338	ไม่มีข้อมูล	ครึ่งหลังของปี 2026

คอร์, นาฬิกา และพลังงาน

แบบอย่าง	นาฬิกาเร่งความเร็ว (เมกะเฮิร์ตซ์)	#SM	แกนกลาง (FP32 CUDA)	แกนกลาง (FP64 ไม่รวมเทนเซอร์)	แกนกลาง (ผสม INT32/FP32)	แกนกลาง (INT32)	ทีดีพี (W)
พี100	1480	56	3584	ค.ศ. 1792	ไม่มีข้อมูล	ไม่มีข้อมูล	300
V100 16GB	1530	80	5120	2560	ไม่มีข้อมูล	5120	300
V100 32GB	1530	80	5120	2560	ไม่มีข้อมูล	5120	350
A100 40GB	1410	108	6912	3456	6912	ไม่มีข้อมูล	400
A100 80GB	1410	108	6912	3456	6912	ไม่มีข้อมูล	400
เอช100	1980	132	16896	4608	16896	ไม่มีข้อมูล	700
เอช200	1980	132	16896	4608	16896	ไม่มีข้อมูล	1000
บี100	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	700
บี200	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	1000
100 แรนด์	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	2300

หน่วยความจำและแคช

แบบอย่าง	ประเภทหน่วยความจำ (เอชบีเอ็ม)	ขนาด VRAM (สหราชอาณาจักร)	ความเร็วหน่วยความจำ (กิกะไบต์/วินาที)	ความกว้างของรถบัส (บิต)	แบนด์วิดท์ (TB/s)	แคช L1 ต่อ SM (KB)	แคช L1 รวม (KB)	แคช L2 (KB)
พี100	เอชบีเอ็ม2	16	1.4	4096	0.72	24	1344	4096
V100 16GB	เอชบีเอ็ม2	16	1.75	4096	0.9	128	10240	6144
V100 32GB	เอชบีเอ็ม2	32	1.75	4096	0.9	128	10240	6144
A100 40GB	เอชบีเอ็ม2	40	2.4	5120	1.52	192	20736	40960
A100 80GB	HBM2e	80	3.2	5120	1.52	192	20736	40960
เอช100	เอชบีเอ็ม3	80	5.2	5120	3.35	192	25344	51200
เอช200	HBM3e	141	6.3	6144	4.8	192	25344	51200
บี100	HBM3e	192	8	8192	8	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล
บี200	HBM3e	192	8	8192	8	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล
100 แรนด์	เอชบีเอ็ม4	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล

ประสิทธิภาพการประมวลผล การเชื่อมต่อ และเครือข่าย

แบบอย่าง	เอฟพี32 (TFLOPS)	เอฟพี64 (TFLOPS)	อินที8 เทนเซอร์หนาแน่น	FP16 เทนเซอร์หนาแน่น	บฟลัต16 เทนเซอร์หนาแน่น	เอฟเอฟ32 เทนเซอร์หนาแน่น	เอฟพี64 เทนเซอร์หนาแน่น	การเชื่อมต่อ (NVLink; เทราไบต์/วินาที)	การสร้างเครือข่าย
พี100	10.6	5.3	ไม่มีข้อมูล	21.2	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	0.16	คอนเน็กต์เอ็กซ์-4 (100 กิกะไบต์/วินาที)
V100 16GB	15.7	7.8	ไม่มีข้อมูล	125 TFLOPS	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	0.3	คอนเน็กต์เอ็กซ์-5 (100 กิกะไบต์/วินาที)
V100 32GB	15.7	7.8	ไม่มีข้อมูล	125 TFLOPS	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	0.3	คอนเน็กต์เอ็กซ์-5 (100 กิกะไบต์/วินาที)
A100 40GB	19.5	9.7	624 ท็อปส์	312 TFLOPS	312 TFLOPS	156 TFLOPS	19.5 TFLOPS	0.6	คอนเน็กต์เอ็กซ์-6 (200 กิกะไบต์/วินาที)
A100 80GB	19.5	9.7	624 ท็อปส์	312 TFLOPS	312 TFLOPS	156 TFLOPS	19.5 TFLOPS	0.6	คอนเน็กต์เอ็กซ์-6 (200 กิกะไบต์/วินาที)
เอช100	67	34	1.98 ป๊อปส์	990 TFLOPS	990 TFLOPS	495 TFLOPS	67 TFLOPS	0.9	คอนเน็กต์เอ็กซ์-7 (400 กิกะไบต์/วินาที)
เอช200	67	34	1.98 ป๊อปส์	990 TFLOPS	990 TFLOPS	495 TFLOPS	67 TFLOPS	0.9	คอนเน็กต์เอ็กซ์-7 (400 กิกะไบต์/วินาที)
บี100	ไม่มีข้อมูล	ไม่มีข้อมูล	3.5 ป๊อปส์	1.98 PFLOPS	1.98 PFLOPS	989 TFLOPS	30 TFLOPS	1.8	คอนเน็กต์เอ็กซ์-7 (400 กิกะไบต์/วินาที)
บี200	ไม่มีข้อมูล	ไม่มีข้อมูล	4.5 ป๊อปส์	2.25 ฟล็อปส์	2.25 ฟล็อปส์	1.2 PFLOPS	40 ทฟล็อปส์	1.8	คอนเน็กต์เอ็กซ์-7 (400 กิกะไบต์/วินาที)
100 แรนด์	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	ไม่มีข้อมูล	คอนเน็กต์เอ็กซ์-9 (1600 กิกะไบต์/วินาที)

ดูเพิ่มเติม

[

2

[

[ 4 ]

[

[

[ 7 ]

[ 8 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[

[

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

[ 44 ]

[ 45 ]

[ 46 ]

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 53 ]

[ 54 ]