กลับไปหน้าบทความ

อ่าน 11 นาที

เอ็นดีจีเอ็กซ์

Nvidia DGX ( Deep GPU Xceleration ) คือซีรี่ส์ของ เซิร์ฟเวอร์ และ เวิร์กสเตชัน ที่ออกแบบโดย Nvidia โดยมีเป้าหมายหลักเพื่อเพิ่มประสิทธิภาพ แอปพลิเคชัน การเรียนรู้เชิงลึก ผ่านการใช้...

เอ็นดีจีเอ็กซ์

ดีจีเอ็กซ์
ชั้นวางที่บรรจุซูเปอร์คอมพิวเตอร์ DGX-1 จำนวน 5 เครื่อง
ผู้ผลิตเอ็นดีวีดี
ปล่อยแล้ว2016 ( 2016 )

Nvidia DGX ( Deep GPU Xceleration ) คือซีรี่ส์ของเซิร์ฟเวอร์และเวิร์กสเตชันที่ออกแบบโดยNvidiaโดยมีเป้าหมายหลักเพื่อเพิ่มประสิทธิภาพ แอปพลิเคชัน การเรียนรู้เชิงลึกผ่านการใช้การประมวลผลทั่วไปบนหน่วยประมวลผลกราฟิก (GPGPU) ระบบเหล่านี้มักมาในรูปแบบแร็คเมาท์ โดยเริ่มแรกใช้ ซีพียูเซิร์ฟเวอร์x86ประสิทธิภาพสูง เปลี่ยนไปใช้ ARMในช่วงปี 2018 และวางจำหน่ายNUCในปี 2025

คุณสมบัติหลักของระบบ DGX คือการมี โมดูล GPU Nvidia Tesla จำนวน 4 ถึง 8 โมดูล ซึ่งติดตั้งอยู่บนเมนบอร์ดแยกต่างหาก GPU เหล่านี้สามารถเชื่อมต่อได้ทั้งผ่านซ็อก เก็ต SXMหรือ สล็อต PCIe x16 ทำให้สามารถผสานรวมเข้ากับสถาปัตยกรรมของระบบได้อย่างยืดหยุ่น เพื่อจัดการกับความร้อนที่เกิดขึ้นจำนวนมาก หน่วย DGX จึงติดตั้งฮีทซิงค์และพัดลมที่ออกแบบมาเพื่อรักษาอุณหภูมิการทำงานที่เหมาะสม

หน่วยประมวลผลกราฟิก (GPGPU) ของ Nvidia ถูกนำมาใช้ในซูเปอร์คอมพิวเตอร์ TOP500

นางแบบ

ปาสคาล - โวลตา

ดีจีเอ็กซ์-1

เซิร์ฟเวอร์ DGX-1 มีGPU 8 ตัว ที่ใช้การ์ดเสริมPascalหรือVolta [ 1 ] พร้อม หน่วยความจำHBM2รวม 128 GB เชื่อมต่อกันด้วย เครือข่ายเมช NVLink [ 2 ] DGX -1 ได้รับการประกาศเมื่อวันที่ 6 เมษายน 2559 [ 3 ]ทุกรุ่นใช้การกำหนดค่าซ็อกเก็ตคู่ของซีพียู Intel Xeon E5 และมีคุณสมบัติดังต่อไปนี้

  • หน่วย ความจำ DDR4-2133ขนาด 512 GB
  • ระบบเครือข่าย Dual 10 Gb
  • SSD ขนาด 1.92 TB จำนวน 4 ตัว
  • ความสามารถในการจ่ายไฟรวม 3200 วัตต์
  • แชสซีแบบแร็คเมาท์ 3U

กลุ่มผลิตภัณฑ์นี้มีจุดประสงค์เพื่อเชื่อมช่องว่างระหว่าง GPU และตัวเร่งความเร็ว AIโดยใช้คุณสมบัติเฉพาะสำหรับงานประมวลผลการเรียนรู้เชิงลึก[ 4 ] DGX-1 รุ่นแรกที่ใช้ Pascal ให้ประสิทธิภาพการประมวลผลความแม่นยำครึ่งหนึ่งที่ 170 teraflops [ 5 ]ในขณะที่การอัปเกรดที่ใช้ Volta เพิ่มประสิทธิภาพนี้เป็น960 teraflops [ 6 ]

DGX-1 รุ่นแรกมีจำหน่ายเฉพาะในรูปแบบ Pascal เท่านั้น โดยใช้ซ็อกเก็ต SXM รุ่นแรก รุ่นปรับปรุงในภายหลังของ DGX-1 รองรับการ์ด Volta รุ่นแรกผ่านซ็อกเก็ต SXM-2 Nvidia ได้เสนอชุดอัปเกรดที่ช่วยให้ผู้ใช้ที่มี DGX-1 ที่ใช้ Pascal สามารถอัปเกรดเป็น DGX-1 ที่ใช้ Volta ได้[ 7 ] [ 8 ]

  • DGX-1 ที่ใช้สถาปัตยกรรม Pascal มีสองรุ่น รุ่นหนึ่งมีIntel Xeon E5-2698 V3 จำนวน 16 คอร์ และอีกรุ่นหนึ่งมี E5-2698 V4 จำนวน 20 คอร์ ยังไม่มีข้อมูลราคาสำหรับรุ่นที่มี E5-2698 V4 ส่วน DGX-1 ที่ใช้สถาปัตยกรรม Pascal และมี E5-2698 V3 นั้นมีราคาเปิดตัวอยู่ที่ 129,000 ดอลลาร์สหรัฐ[ 9 ]
  • DGX-1 ที่ใช้ Volta เป็นพื้นฐานนั้นติดตั้ง E5-2698 V4 และมีราคาเปิดตัวที่ 149,000 ดอลลาร์สหรัฐ[ 9 ]

สถานี DGX

DGX Station ได้รับการออกแบบให้เป็น ซูเปอร์คอมพิวเตอร์ AI แบบครบวงจร สำหรับใช้งานบนโต๊ะทำงาน เป็นคอมพิวเตอร์ แบบตั้งโต๊ะที่สามารถทำงานได้อย่างอิสระโดยสมบูรณ์โดยไม่ต้องใช้โครงสร้างพื้นฐานของศูนย์ข้อมูลทั่วไป เช่น ระบบระบายความร้อน แหล่งจ่ายไฟสำรอง หรือ แร็ ค ขนาด 19 นิ้ว

สถานี DGX มีให้บริการครั้งแรกพร้อมข้อกำหนดดังต่อไปนี้[ 10 ]

  • ตัวเร่งความเร็ว Tesla V100 ที่ใช้สถาปัตยกรรม Volta จำนวน 4 ตัว แต่ละตัวมีหน่วยความจำHBM2 ขนาด 16 GB
  • 480 TFLOPS FP16
  • Intel Xeon E5-2698 v4 ตัวเดียว[ 11 ]
  • 256 GB DDR4
  • SSD ขนาด 1.92 TB จำนวน 4 ตัว
  • อีเธอร์เน็ต 10 Gb สองพอร์ต

สถานี DGX ใช้ระบบระบายความร้อนด้วยน้ำเพื่อจัดการความร้อนของส่วนประกอบระบบทั้งหมดเกือบ 1500 วัตต์ได้ดียิ่งขึ้น ทำให้สามารถรักษาช่วงเสียงรบกวนให้อยู่ต่ำกว่า 35 เดซิเบลขณะใช้งาน[ 12 ]คุณสมบัตินี้และคุณสมบัติอื่นๆ ทำให้ระบบนี้เป็นตัวเลือกที่น่าสนใจสำหรับลูกค้าที่ไม่มีโครงสร้างพื้นฐานในการใช้งาน ระบบ DGX แบบแร็คเมาท์ซึ่งอาจมีเสียงดัง สร้างความร้อนสูง และใช้พื้นที่มาก นี่เป็นความพยายามครั้งแรกของ Nvidia ในการนำการประมวลผลประสิทธิภาพสูงมา ไว้ ที่โต๊ะทำงาน ซึ่งต่อมาได้กลายเป็นกลยุทธ์การตลาดที่โดดเด่นของ Nvidia [ 13 ]

ดีจีเอ็กซ์-2

Nvidia DGX-2 ซึ่งเป็นรุ่นต่อจาก DGX-1 ใช้การ์ด Volta-based V100 32 GB (รุ่นที่สอง) จำนวน 16 ใบในหน่วยเดียว มีการประกาศเปิดตัวเมื่อวันที่ 27 มีนาคม 2018 [ 14 ] DGX-2 ให้ประสิทธิภาพ 2 Petaflops พร้อมหน่วยความจำร่วม 512 GB สำหรับจัดการกับชุดข้อมูลขนาดใหญ่ และใช้ NVSwitch สำหรับการสื่อสารภายในที่มีแบนด์วิดท์สูง DGX-2 มีหน่วยความจำ HBM2รวม 512 GB และ DDR4รวม 1.5 TB นอกจากนี้ยังมี การ์ด InfiniBand 100 Gbit/s จำนวน 8 ใบ และพื้นที่จัดเก็บข้อมูล SSD 30.72 TB [ 15 ]ทั้งหมดนี้บรรจุอยู่ในตัวเครื่องแร็คเมาท์ขนาดใหญ่ 10U และใช้พลังงานสูงสุด 10 kW ภายใต้ภาระสูงสุด[ 16 ]ราคาเริ่มต้นของ DGX-2 คือ 399,000 ดอลลาร์สหรัฐ[ 17 ]

DGX-2 แตกต่างจากรุ่น DGX อื่นๆ ตรงที่มีบอร์ด GPU แยกกันสองบอร์ด แต่ละบอร์ดมี GPU แปดตัว บอร์ดเหล่านี้เชื่อมต่อกันด้วยระบบ NVSwitch ซึ่งช่วยให้สามารถสื่อสารแบนด์วิดท์เต็มรูปแบบระหว่าง GPU ทั้งหมดในระบบได้โดยไม่มีความล่าช้าเพิ่มเติมระหว่างบอร์ด[ 16 ]

นอกจากนี้ ยังมีการนำเสนอ DGX-2H ซึ่งเป็นรุ่นที่มีประสิทธิภาพสูงกว่าของ DGX-2 โดย DGX-2H ได้เปลี่ยนซีพียู Intel Xeon Platinum 8168 สองตัวของ DGX-2 เป็นซีพียู Intel Xeon Platinum 8174 สองตัวที่ได้รับการอัพเกรด การอัพเกรดนี้ไม่ได้เพิ่มจำนวนคอร์ต่อระบบ เนื่องจากซีพียูทั้งสองตัวมี 24 คอร์ และไม่ได้เปิดใช้งานฟังก์ชันใหม่ใดๆ ของระบบ แต่จะเพิ่มความถี่พื้นฐานของซีพียูจาก 2.7 GHz เป็น 3.1 GHz [ 18 ] [ 19 ] [ 20 ]

แอมแปร์

เซิร์ฟเวอร์ DGX A100

DGX A100 ได้รับการประกาศและวางจำหน่ายเมื่อวันที่ 14 พฤษภาคม 2020 โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 3 ซึ่งประกอบด้วยตัวเร่งความเร็ว A100 ที่ใช้Ampere จำนวน 8 ตัว [ 21 ]นอกจากนี้ยังมีพื้นที่จัดเก็บข้อมูลNVMe PCIe gen 4 ขนาด 15 TB [ 22 ] หน่วยความ จำ RAM ขนาด 1 TB และNIC ConnectX-6 HDR InfiniBand ความเร็ว 200 GB/s จำนวน 8 ตัวที่ขับเคลื่อนโดยMellanox DGX A100 มีขนาดเล็กกว่ารุ่นก่อนหน้าอย่าง DGX-2 มาก โดยใช้พื้นที่เพียง 6 ยูนิตแร็ค[ 23 ]

นอกจากนี้ DGX A100 ยังเปลี่ยนไปใช้ CPU AMD EPYC 7742 แบบ 64 คอร์ ซึ่งเป็นเซิร์ฟเวอร์ DGX เครื่องแรกที่ไม่ได้สร้างด้วย CPU Intel Xeon ราคาเริ่มต้นของเซิร์ฟเวอร์ DGX A100 คือ 199,000 ดอลลาร์สหรัฐ[ 21 ]

สถานี DGX A100

DGX Station A100 ซึ่งเป็นรุ่นต่อจาก DGX Station รุ่นดั้งเดิม มีเป้าหมายที่จะเติมเต็มช่องว่างเดียวกันกับ DGX Station ในแง่ของการเป็น โซลูชัน คลัสเตอร์แบบครบวงในกล่องเดียว ที่เงียบ มีประสิทธิภาพ และสามารถซื้อ เช่า หรือเช่าซื้อได้โดยบริษัทขนาดเล็กหรือบุคคลทั่วไปที่ต้องการใช้แมชชีนเลิร์นนิง โดยยังคงใช้การออกแบบหลายอย่างจาก DGX Station รุ่นดั้งเดิม เช่น รูปทรงแบบทาวเวอร์เมนบอร์ด CPU แบบซ็อกเก็ตเดียว ระบบระบายความร้อนแบบใหม่ที่ใช้สารทำความเย็น และจำนวนตัวเร่งความเร็วที่ลดลงเมื่อเทียบกับ DGX A100 แบบแร็คเมาท์ในรุ่นเดียวกัน[ 13 ]ราคาสำหรับ DGX Station A100 320G คือ 149,000 ดอลลาร์สหรัฐ และ 99,000 ดอลลาร์สหรัฐสำหรับรุ่น 160G นอกจากนี้ Nvidia ยังเสนอบริการเช่า Station ในราคาประมาณ 9,000 ดอลลาร์สหรัฐต่อเดือนผ่านพันธมิตรในสหรัฐอเมริกา (rentacomputer.com) และยุโรป (iRent IT Systems) เพื่อช่วยลดต้นทุนในการใช้งานระบบเหล่านี้ในขนาดเล็ก[ 24 ] [ 25 ]

DGX Station A100 มาพร้อมกับการกำหนดค่า A100 ในตัวสองแบบที่แตกต่างกัน

  • ตัวเร่งความเร็ว A100 ที่ใช้สถาปัตยกรรม Ampere จำนวน 4 ตัว กำหนดค่าด้วยหน่วยความจำ 40 GB (HBM) หรือ 80 GB (HBM2e) ทำให้มีหน่วยความจำรวม 160 GB หรือ 320 GB ส่งผลให้ DGX Station A100 มีให้เลือกสองรุ่นคือ 160G หรือ 320G
  • 2.5 PFLOPS FP16
  • โปรเซสเซอร์ AMD EPYC 7742 แบบ 64 คอร์เดี่ยว
  • 512 GB DDR4
  • ไดรฟ์ NVMeสำหรับระบบปฏิบัติการขนาด 1.92 TB จำนวน 1 ตัว
  • 1 x 7.68 TB U.2 NVMe Drive
  • พอร์ตอีเธอร์เน็ต 10 Gb สองพอร์ต
  • พอร์ต BMC 1 Gb เดี่ยว

ฮอปเปอร์

เซิร์ฟเวอร์ DGX H100

DGX H100 ได้รับการประกาศเมื่อวันที่ 22 มีนาคม 2022 [ 26 ]และวางแผนจะวางจำหน่ายในไตรมาสที่ 3 ของปี 2022 [ 27 ] โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 4 สร้างขึ้นด้วยตัวเร่งความเร็ว H100 ที่ใช้ Hopper จำนวน 8 ตัว ทำให้มีประสิทธิภาพการประมวลผล AI FP8 รวม 32 PFLOPs และหน่วยความจำ HBM3 ขนาด 640 GB ซึ่งเป็นการอัพเกรดจากหน่วยความจำ HBM2 ขนาด 640 GB ของ DGX A100 การอัพเกรดนี้ยังเพิ่ม แบนด์วิดท์ VRAMเป็น 3 TB/s อีกด้วย [ 28 ] DGX H100 เพิ่ม ขนาด แร็คเมาท์เป็น 8U เพื่อรองรับ TDP 700W ของการ์ด H100 SXM แต่ละตัว นอกจากนี้ DGX H100 ยังมี SSD ขนาด 1.92 TB สองตัวสำหรับ จัดเก็บ ระบบปฏิบัติการและพื้นที่จัดเก็บข้อมูลแบบโซลิดสเตท ขนาด 30.72 TB สำหรับข้อมูลแอปพลิ เคชัน

อีกหนึ่งส่วนเพิ่มเติมที่น่าสนใจคือ การมี Nvidia Bluefield 3 DPU สองตัว [ 29 ]และการอัปเกรดเป็น InfiniBand 400 Gbit/s ผ่านNIC Mellanox ConnectX-7 ซึ่งมีแบนด์วิดท์เป็นสองเท่าของ DGX A100 DGX H100 ใช้การ์ด 'Cedar Fever' ใหม่ โดยแต่ละการ์ดมีคอนโทรลเลอร์ ConnectX-7 400 GB/s สี่ตัว และสองการ์ดต่อระบบ ทำให้ DGX H100 มีแบนด์วิดท์เครือข่าย 3.2 Tbit/s ผ่าน Infiniband [ 30 ]

DGX H100 มีซีพียู Xeon Platinum 8480C Scalable สองตัว (ชื่อรหัสSapphire Rapids ) [ 31 ]และหน่วยความจำระบบ 2 เท รา ไบต์ [ 32 ]

DGX H100 มีราคาอยู่ที่ 379,000 ปอนด์ หรือประมาณ 482,000 ดอลลาร์สหรัฐ ณ เวลาที่วางจำหน่าย[ 33 ]

ดีจีเอ็กซ์ จีเอช200

DGX GH200 ซึ่งประกาศในเดือนพฤษภาคม 2023 ได้เชื่อมต่อชิป Nvidia Hopper Superchips จำนวน 32 ตัวเข้าด้วยกันเป็นชิปเดียว ซึ่งประกอบด้วย GPU H100 จำนวน 256 ตัว, CPU Grace Neoverse V2 72 คอร์ จำนวน 32 ตัว, VPI ConnectX-7 พอร์ตเดี่ยว OSFT จำนวน 32 ตัว พร้อม InfiniBand 400 Gbit/s และ VPI BlueField-3 พอร์ตคู่ จำนวน 16 ตัว พร้อมMellanox 200 Gbit/s [1] [2] Nvidia DGX GH200 ได้รับการออกแบบมาเพื่อรองรับโมเดลขนาดเทราไบต์สำหรับระบบแนะนำขนาดใหญ่ AI แบบสร้าง และการวิเคราะห์กราฟ โดยมีหน่วยความจำร่วม 19.5 TB พร้อมความสามารถในการปรับขนาดเชิงเส้นสำหรับโมเดล AI ขนาดใหญ่[ 34 ]

ดีจีเอ็กซ์ เฮลิออส

ซูเปอร์คอมพิวเตอร์ DGX Helios ที่ประกาศเปิดตัวในเดือนพฤษภาคม 2023 ประกอบด้วยระบบ DGX GH200 จำนวน 4 ระบบ แต่ละระบบเชื่อมต่อกันด้วยเครือข่าย Nvidia Quantum-2 InfiniBand เพื่อเพิ่มประสิทธิภาพการรับส่งข้อมูลสำหรับการฝึกโมเดล AI ขนาดใหญ่ Helios มี GPU H100 จำนวน 1,024 ตัว

แบล็กเวลล์

ดีจีเอ็กซ์ จีบี200

การ์ดจอ DGX B200/8
เมนบอร์ด Nvidia DGX B200 สำหรับการ์ดจอ 8 ช่อง (ระบายความร้อนด้วยอากาศ)
เอ็นดีวีจี200
ระบบแร็ค Nvidia GB200 NVL72

ประกาศเมื่อเดือนมีนาคม พ.ศ. 2567 [ 35 ]  GB200 NVL72 เชื่อมต่อซีพียู Grace Arm Neoverse V2 72 คอร์ จำนวน 36 ตัว และ GPU B200 จำนวน 72 ตัว ในรูปแบบแร็คสเกล[ 36 ] GB200 NVL72 เป็นโซลูชันแบบแร็คสเกลที่ระบายความร้อนด้วยของเหลว ซึ่งมีโดเมน NVLink 72 GPU ที่ทำหน้าที่เป็น GPU ขนาดใหญ่ตัวเดียว[ 37 ] Nvidia DGX GB200 มีหน่วยความจำร่วม HBM3e ขนาด 13.5 TB พร้อมความสามารถในการปรับขนาดเชิงเส้นสำหรับโมเดล AI ขนาดใหญ่ ซึ่งน้อยกว่ารุ่นก่อนหน้า DGX GH200

ดีจีเอ็กซ์ ซูเปอร์พอด

DGX Superpod เป็น ระบบ ซูเปอร์คอมพิวเตอร์ แบบครบวงจรประสิทธิภาพสูง ที่ Nvidia จัดหาให้โดยใช้ฮาร์ดแวร์ DGX [ 38 ]มันรวมโหนดประมวลผล DGX เข้ากับพื้นที่จัดเก็บข้อมูลความเร็วสูงและเครือข่าย แบนด์วิดท์สูง เพื่อมอบโซลูชันสำหรับภาระงานการเรียนรู้ของเครื่องที่มีความต้องการสูงซูเปอร์คอมพิวเตอร์ Seleneที่ห้องปฏิบัติการแห่งชาติ Argonneเป็นตัวอย่างหนึ่งของระบบที่ใช้ DGX SuperPod

Selene ซึ่งสร้างจากโหนด DGX A100 จำนวน 280 โหนด ได้รับการจัดอันดับที่ 5 ใน รายชื่อ TOP500สำหรับซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุด ณ เวลาที่เสร็จสมบูรณ์ในเดือนมิถุนายน 2020 [ 39 ] SuperPod ที่ใช้ Hopper รุ่นใหม่สามารถขยายขนาดได้ถึงโหนด DGX H100 จำนวน 32 โหนด รวมเป็น GPU H100 ทั้งหมด 256 ตัว และ CPU x86 จำนวน 64 ตัว ทำให้ SuperPod ทั้งหมดมีหน่วยความจำ HBM3 ขนาด 20 TB แบนด์วิดท์การแบ่งครึ่ง 70.4 TB/s และการประมวลผล AI FP8 สูงถึง 1 ExaFLOP [ 28 ]จากนั้น SuperPod เหล่านี้สามารถนำมารวมกันเพื่อสร้างซูเปอร์คอมพิวเตอร์ขนาดใหญ่ขึ้นได้

ซูเปอร์คอมพิวเตอร์ Eos ซึ่งออกแบบ สร้าง และดำเนินการโดย Nvidia [ 40 ] [ 41 ] [ 42 ]สร้างขึ้นจาก SuperPods ที่ใช้ H100 จำนวน 18 เครื่อง รวมเป็นระบบ DGX H100 จำนวน 576 ระบบ สวิตช์ Quantum-2 InfiniBand จำนวน 500 ตัว และสวิตช์ NVLink จำนวน 360 ตัว ซึ่งทำให้ Eos สามารถประมวลผล FP8 ได้ 18 EFLOPs และประมวลผล FP16 ได้ 9 EFLOPs ทำให้ Eos เป็นซูเปอร์คอมพิวเตอร์ AI ที่เร็วที่สุดอันดับ 5 ของโลก ตาม TOP500 (ฉบับเดือนพฤศจิกายน 2023)

เนื่องจาก Nvidia ไม่ได้ผลิตอุปกรณ์หรือระบบจัดเก็บข้อมูลใดๆ Nvidia SuperPods จึงต้องพึ่งพาพันธมิตรในการจัดหาอุปกรณ์จัดเก็บข้อมูลประสิทธิภาพสูง ปัจจุบันพันธมิตรด้านการจัดเก็บข้อมูลสำหรับ Nvidia SuperPods ได้แก่Dell EMC , DDN , HPE , IBM , NetApp , Pavilion Data และVAST Data [ 43 ]

ดีจีเอ็กซ์ สปาร์ค

NVIDIA DGX Spark พร้อมNIC ConnectX-7

ในเดือนมีนาคม พ.ศ. 2568 Nvidia ยังได้ประกาศเปิดตัว DGX Spark (เดิมชื่อ DIGITS) ซึ่งเป็น "ซูเปอร์คอมพิวเตอร์ AI แบบตั้งโต๊ะ" ที่ใช้ CPU Blackwell Grace ซึ่งประกอบด้วยคอร์ ARM และ iGPU ในตัวที่เรียกว่า Nvidia GB10 Superchip [ 44 ]เครื่องเหล่านี้มุ่งเป้าไปที่นักวิจัยและโปรแกรมเมอร์ AI และมี RAM ในตัวขนาด 128 GB ทำให้สามารถฝึกฝนหรือปรับแต่งโมเดลขนาดใหญ่ได้ ("มากถึง 200 พันล้านพารามิเตอร์" ด้วยการควอนไทเซชัน) ผู้ผลิตพันธมิตรหลายรายยังนำเสนอ DGX Spark เวอร์ชันต่างๆ อีกด้วย[ 45 ] [ 46 ]

เครื่องเร่งอนุภาค

เริ่มต้นจาก P100 [ 47 ] [ 48 ] [ 49 ]ไปยัง V100 [ 50 ]ไปยัง A100 [ 51 ]ไปยัง H100 [ 52 ]ไปยัง B200 [ 53 ] [ 54 ]และไปยัง R100 [ 55 ]การเปรียบเทียบเครื่องเร่งอนุภาคที่ใช้ใน DGX:

ทั่วไปและสถาปัตยกรรม

แบบอย่าง สถาปัตยกรรม ซ็อกเก็ต จีพี กระบวนการผลิต จำนวนทรานซิสเตอร์

(พันล้าน)

ขนาดแม่พิมพ์

(มม. ² )

เปิดตัว
พี100 ปาสคาลSXM/SXM2 จีพี100 TSMC 16FF+ 15.3 610 ไตรมาสที่ 2 ปี 2559
V100 16GB โวลต้าSXM2 จีวี100 ทีเอสเอ็มซี 12เอฟเอ็น 21.1 815 ไตรมาสที่ 3 ปี 2560
V100 32GB SXM3
A100 40GB แอมแปร์SXM4 GA100 ทีเอสเอ็มซีเอ็น7 54.2 826 ไตรมาสที่ 1 ปี 2020
A100 80GB ไตรมาสที่ 4 ปี 2020
เอช100 ฮอปเปอร์SXM5 GH100 ทีเอสเอ็มซี 4เอ็น 80 814 ไตรมาสที่ 3 ปี 2022
เอช200 ไตรมาสที่ 3 ปี 2023
บี100 แบล็กเวลล์SXM6 จีบี100 ทีเอสเอ็มซี 4เอ็นพี 208 ไม่มีข้อมูล ไตรมาสที่ 4 ปี 2024
บี200
100 แรนด์ รูบินSXM7ไม่มีข้อมูลทีเอสเอ็มซี 3เอ็น 338ไม่มีข้อมูลครึ่งหลังของปี 2026

คอร์, นาฬิกา และพลังงาน

แบบอย่าง นาฬิกาเร่งความเร็ว

(เมกะเฮิร์ตซ์)

#SM แกนกลาง

(FP32 CUDA)

แกนกลาง

(FP64 ไม่รวมเทนเซอร์)

แกนกลาง

(ผสม INT32/FP32)

แกนกลาง

(INT32)

ทีดีพี

(W)

พี100 1480 56 3584 ค.ศ. 1792ไม่มีข้อมูลไม่มีข้อมูล300
V100 16GB 1530 80 5120 2560 ไม่มีข้อมูล 5120 300
V100 32GB 350
A100 40GB 1410 108 6912 3456 6912 ไม่มีข้อมูล 400
A100 80GB
เอช100 1980 132 16896 4608 16896 ไม่มีข้อมูล 700
เอช200 1000
บี100 ไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูล700
บี200 ไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูล1000
100 แรนด์ ไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูล2300

หน่วยความจำและแคช

แบบอย่าง ประเภทหน่วยความจำ

(เอชบีเอ็ม)

ขนาด VRAM

(สหราชอาณาจักร)

ความเร็วหน่วยความจำ

(กิกะไบต์/วินาที)

ความกว้างของรถบัส

(บิต)

แบนด์วิดท์

(TB/s)

แคช L1

ต่อ SM (KB)

แคช L1

รวม (KB)

แคช L2

(KB)

พี100 เอชบีเอ็ม2 16 1.4 4096 0.72 24 1344 4096
V100 16GB เอชบีเอ็ม2 16 1.75 4096 0.9 128 10240 6144
V100 32GB 32
A100 40GB เอชบีเอ็ม2 40 2.4 5120 1.52 192 20736 40960
A100 80GB HBM2e 80 3.2
เอช100 เอชบีเอ็ม3 80 5.2 5120 3.35 192 25344 51200
เอช200 HBM3e 141 6.3 6144 4.8
บี100 HBM3e 192 8 8192 8 ไม่มีข้อมูล ไม่มีข้อมูล ไม่มีข้อมูล
บี200
100 แรนด์ เอชบีเอ็ม4ไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูล

ประสิทธิภาพการประมวลผล การเชื่อมต่อ และเครือข่าย

แบบอย่าง เอฟพี32

(TFLOPS)

เอฟพี64

(TFLOPS)

อินที8

เทนเซอร์หนาแน่น

FP16

เทนเซอร์หนาแน่น

บฟลัต16

เทนเซอร์หนาแน่น

เอฟเอฟ32

เทนเซอร์หนาแน่น

เอฟพี64

เทนเซอร์หนาแน่น

การเชื่อมต่อ

(NVLink; เทราไบต์/วินาที)

การสร้างเครือข่าย
พี100 10.6 5.3ไม่มีข้อมูล21.2ไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูล0.16 คอนเน็กต์เอ็กซ์-4

(100 กิกะไบต์/วินาที)

V100 16GB 15.7 7.8 ไม่มีข้อมูล 125 TFLOPS ไม่มีข้อมูล ไม่มีข้อมูล ไม่มีข้อมูล 0.3 คอนเน็กต์เอ็กซ์-5

(100 กิกะไบต์/วินาที)

V100 32GB
A100 40GB 19.5 9.7 624 ท็อปส์ 312 TFLOPS 312 TFLOPS 156 TFLOPS 19.5 TFLOPS 0.6 คอนเน็กต์เอ็กซ์-6

(200 กิกะไบต์/วินาที)

A100 80GB
เอช100 67 34 1.98 ป๊อปส์ 990 TFLOPS 990 TFLOPS 495 TFLOPS 67 TFLOPS 0.9 คอนเน็กต์เอ็กซ์-7

(400 กิกะไบต์/วินาที)

เอช200
บี100 ไม่มีข้อมูลไม่มีข้อมูล3.5 ป๊อปส์ 1.98 PFLOPS 1.98 PFLOPS 989 TFLOPS 30 TFLOPS 1.8 คอนเน็กต์เอ็กซ์-7

(400 กิกะไบต์/วินาที)

บี200 ไม่มีข้อมูลไม่มีข้อมูล4.5 ป๊อปส์ 2.25 ฟล็อปส์ 2.25 ฟล็อปส์ 1.2 PFLOPS 40 ทฟล็อปส์
100 แรนด์ ไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลคอนเน็กต์เอ็กซ์-9

(1600 กิกะไบต์/วินาที)

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Nvidia_DGX&oldid=1361348796#Nvidia_HGX "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ เอ็นดีจีเอ็กซ์

Nvidia DGX ( Deep GPU Xceleration ) คือซีรี่ส์ของ เซิร์ฟเวอร์ และ เวิร์กสเตชัน ที่ออกแบบโดย Nvidia โดยมีเป้าหมายหลักเพื่อเพิ่มประสิทธิภาพ แอปพลิเคชัน การเรียนรู้เชิงลึก ผ่านการใช้...

ปาสคาล - โวลตา

เซิร์ฟเวอร์ DGX-1 มี GPU 8 ตัว ที่ใช้ การ์ดเสริม Pascal หรือ Volta [ 1 ] พร้อม หน่วยความจำ HBM2 รวม 128 GB เชื่อมต่อกันด้วย เครือข่ายเมช NVLink [ 2 ] DGX -1 ได้รับการประกาศเมื่อวันที่ 6 เมษายน 2559 [ 3 ] ทุกรุ่นใช้การกำหนดค่าซ็อกเก็ตคู่ของซีพียู Intel Xeon E5...

แอมแปร์

DGX A100 ได้รับการประกาศและวางจำหน่ายเมื่อวันที่ 14 พฤษภาคม 2020 โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 3 ซึ่งประกอบด้วยตัวเร่งความเร็ว A100 ที่ใช้ Ampere จำนวน 8 ตัว [ 21 ] นอกจากนี้ยังมีพื้นที่จัดเก็บข้อมูล NVMe PCIe gen 4 ขนาด 15 TB [ 22 ] หน่วยความ จำ RAM ขนาด 1...

ฮอปเปอร์

DGX H100 ได้รับการประกาศเมื่อวันที่ 22 มีนาคม 2022 [ 26 ] และวางแผนจะวางจำหน่ายในไตรมาสที่ 3 ของปี 2022 [ 27 ] โดยเป็นเซิร์ฟเวอร์ DGX รุ่นที่ 4 สร้างขึ้นด้วยตัวเร่งความเร็ว H100 ที่ใช้ Hopper จำนวน 8 ตัว ทำให้มีประสิทธิภาพการประมวลผล AI FP8 รวม 32 PFLOPs...