กลับไปหน้าบทความ

อ่าน 10 นาที

เอ็นวีลิงก์

NVLink เป็นลิงก์ การสื่อสารแบบอนุกรมหลายเลนระยะใกล้แบบใช้สายซึ่งพัฒนาโดยNvidiaแตกต่างจากPCI Express ตรงที่ อุปกรณ์หนึ่งสามารถประกอบด้วย NVLink หลายตัว และอุปกรณ์ต่างๆ...

เอ็นวีลิงก์

เอ็นวีลิงก์
นักพัฒนาเอ็นดีวีดี
ผู้ผลิต
พิมพ์เทคโนโลยีมัลติGPUและCPU
ผู้มาก่อนอินเทอร์เฟซลิงก์ที่ปรับขนาดได้ (SLI)

NVLink เป็นลิงก์ การสื่อสารแบบอนุกรมหลายเลนระยะใกล้แบบใช้สายซึ่งพัฒนาโดยNvidiaแตกต่างจากPCI Express ตรงที่ อุปกรณ์หนึ่งสามารถประกอบด้วย NVLink หลายตัว และอุปกรณ์ต่างๆ สามารถใช้เครือข่ายแบบตาข่ายในการสื่อสารแทนการใช้ฮับ /สวิตช์ส่วนกลาง โปรโตคอลนี้ได้รับการประกาศครั้งแรกในเดือนมีนาคม 2014 และใช้การเชื่อมต่อสัญญาณความเร็วสูงที่เป็นกรรมสิทธิ์ (NVHS) [ 1 ]

สำหรับ GPU จำนวนน้อย เลน NVLink บนอุปกรณ์เดียวก็เพียงพอสำหรับการเชื่อมต่อแบบ mesh ทั่วถึง เพื่อรองรับจำนวน GPU ที่สูงขึ้น NVLink จึงใช้สถาปัตยกรรมแบบ packet-switched ตั้งแต่ปี 2018 โดยสวิตช์กลางสามารถให้บริการพอร์ตสองเลนได้สูงสุด 32 พอร์ต NVSwitch สำหรับ NVLink 4.0 สามารถทำการคำนวณอย่างง่ายบางอย่างได้เอง (เช่น ผลรวม การกระจายเสียง) เพื่อลดความจำเป็นในการสื่อสารด้วยตัวเร่งความเร็ว "SHARP" [ 2 ]

หลักการ

NVLink เป็นเทคโนโลยีที่พัฒนาโดยNvidiaสำหรับการถ่ายโอนข้อมูลและรหัสควบคุมในระบบประมวลผลระหว่าง CPU และ GPU และระหว่าง GPU กับ GPU NVLink กำหนดการ เชื่อมต่อ แบบจุดต่อจุดด้วยอัตราการส่งข้อมูล 20, 25 และ 50 Gbit/s (v1.0/v2.0/v3.0+ ตามลำดับ) ต่อคู่สายสัญญาณแบบดิฟเฟอเรนเชียล สำหรับ NVLink 1.0 และ 2.0 คู่สายสัญญาณแบบดิฟเฟอเรนเชียลแปดคู่จะรวมกันเป็น "ซับลิงก์" และ "ซับลิงก์" สองอัน อันละทิศทาง จะรวมกันเป็น "ลิงก์" ตั้งแต่ NVLink 3.0 เป็นต้นไป จะมีเพียงคู่สายสัญญาณแบบดิฟเฟอเรนเชียลสี่คู่เท่านั้นที่รวมกันเป็น "ซับลิงก์" สำหรับ NVLink 2.0 ขึ้นไป อัตราการส่งข้อมูลรวมสำหรับซับลิงก์คือ 25 GB/s และอัตราการส่งข้อมูลรวมสำหรับลิงก์คือ 50 GB/s GPU V100 แต่ละตัวรองรับได้สูงสุดหกลิงก์ ดังนั้น GPU แต่ละตัวจึงสามารถรองรับแบนด์วิดท์แบบสองทิศทางรวมได้สูงสุด 300 GB/s [ 3 ] [ 4 ]ผลิตภัณฑ์ NVLink ที่เปิดตัวจนถึงปัจจุบันมุ่งเน้นไปที่พื้นที่แอปพลิเคชันประสิทธิภาพสูง NVLink 3.0 ซึ่งประกาศเมื่อวันที่ 14 พฤษภาคม 2020 เพิ่มอัตราการส่งข้อมูลต่อคู่ดิฟเฟอเรนเชียลจาก 25 Gbit/s เป็น 50 Gbit/s ในขณะที่ลดจำนวนคู่ต่อ NVLink จาก 8 เหลือ 4 ด้วยลิงก์ 12 ลิงก์สำหรับ GPU A100 ที่ใช้ Ampereทำให้แบนด์วิดท์รวมเป็น 600 GB/s [ 5 ] สถาปัตยกรรมไมโคร GPU Hopper ซึ่งประกาศในเดือนมีนาคม 2022 มีลิงก์ NVLink 4.0 จำนวน 18 ลิงก์ ทำให้แบนด์วิดท์รวมเป็น 900 GB/s [ 6 ]ดังนั้น NVLink 2.0, 3.0 และ 4.0 ทั้งหมดมีอัตราการส่งข้อมูล 50 GB/s ต่อลิงก์แบบสองทิศทาง และมีลิงก์ 6, 12 และ 18 ลิงก์ตามลำดับ

ผลงาน

ตารางต่อไปนี้แสดงการเปรียบเทียบตัวชี้วัดพื้นฐานตามข้อกำหนดมาตรฐาน:

การเชื่อมต่อ อัตราการโอน รหัสบรรทัดการปรับสัญญาณอัตราการรับส่งข้อมูลที่มีประสิทธิภาพต่อเลนหรือ NVLink (ทิศทางเดียว) ความยาวเลนรวมสูงสุด[ a ]Total Links (NVLink) แบนด์วิดท์รวม (PCIe x16 หรือ NVLink) สร้างสรรค์ขึ้นจากการออกแบบ
PCIe 3.x8 จีที/วินาที128b/130bเอ็นอาร์ซี0.99 GB/s50 ซม. (20 นิ้ว) [ 7 ]31.51 GB/sปาสคาล , โวลตา , ทิวริง
PCIe 4.016 จีที/วินาที128b/130bเอ็นอาร์ซี1.97 GB/s20–30 ซม. (8–12 นิ้ว) [ 7 ]63.02 GB/sโวลต้าบนเซเวียร์แอมแปร์พาเวอร์9
PCIe 5.032 GT/s [ 8 ]128b/130bเอ็นอาร์ซี3.94 GB/s126.03 GB/sฮอปเปอร์
PCIe 6.064 GT/s236B/256B FLIT [ 9 ]พีเอเอ็ม4เอฟอีซี7.56 GB/s242 GB/sแบล็กเวลล์
NVLink 1.020 GT/sเอ็นอาร์ซี20 GB/s4160 GB/sปาสคาล , POWER8+
NVLink 2.025 จีที/วินาทีเอ็นอาร์ซี25 GB/s6300 GB/sโวลต้า , พาวเวอร์9
NVLink 3.050 จีที/วินาทีเอ็นอาร์ซี25 GB/s12600 GB/sแอมแปร์
NVLink 4.050 GT/s [ 10 ]PAM4 คู่ดิฟเฟอเรนเชียล25 GB/s18900 GB/sฮอปเปอร์ , เอ็นดีวี เกรซ
NVLink 5.0 [ 11 ]100 จีที/วินาทีPAM4 คู่ดิฟเฟอเรนเชียล50 GB/s181800 GB/sแบล็กเวลล์ , โนวิดา เกรซ

ตารางต่อไปนี้แสดงการเปรียบเทียบพารามิเตอร์บัสที่เกี่ยวข้องสำหรับเซมิคอนดักเตอร์ในโลกแห่งความเป็นจริงที่นำเสนอ NVLink เป็นหนึ่งในตัวเลือก:

เซมิคอนดักเตอร์ รูปแบบการจัดส่งโดยรถโดยสาร/รถบัส การเชื่อมต่อ อัตราค่าเทคโนโลยีการส่งกำลัง (ต่อเลน) จำนวนเลนต่อลิงก์ย่อย (ขาออก + ขาเข้า) อัตราการส่งข้อมูลย่อย (ต่อทิศทางข้อมูล) [ b ]จำนวนลิงก์ย่อยหรือหน่วย อัตราการส่งข้อมูลรวม (ขาออก + ขาเข้า) [ b ]จำนวนช่องทางทั้งหมด (ขาออก + ขาเข้า) อัตราการส่งข้อมูลรวม (ขาออก + ขาเข้า) [ b ]
เอ็นดีวีจีพี100P100 SXM, [ 12 ] P100 PCI-E [ 13 ]PCIe 3.0 8 จีที/วินาที16 + 16 []128 กิกะบิต/วินาที = 16 กิกะไบต์/วินาที116 + 16 GB/s [ 14 ]32 [] 32 GB/s
เอ็นดีวี100V100 SXM2, [ 15 ] V100 PCI-E [ 16 ]PCIe 3.0 8 จีที/วินาที16 + 16 []128 กิกะบิต/วินาที = 16 กิกะไบต์/วินาที1 16 + 16 GB/s32 [] 32 GB/s
Nvidia TU104GeForce RTX 2080 , Quadro RTX 5000PCIe 3.0 8 จีที/วินาที16 + 16 []128 กิกะบิต/วินาที = 16 กิกะไบต์/วินาที1 16 + 16 GB/s32 [] 32 GB/s
Nvidia TU102GeForce RTX 2080 Ti, Quadro RTX 6000/8000PCIe 3.0 8 จีที/วินาที16 + 16 []128 กิกะบิต/วินาที = 16 กิกะไบต์/วินาที1 16 + 16 GB/s32 [] 32 GB/s
Nvidia GA100 [ 17 ] [ 18 ]

Nvidia GA102 [ 19 ]

แอมแปร์ A100 (SXM4 และ PCIe) [ 20 ]PCIe 4.0 16 GT/s16 + 16 []256 กิกะบิต/วินาที = 32 กิกะไบต์/วินาที1 32 + 32 GB/s32 [] 64 GB/s
เอ็นดีวีจีพี100P100 SXM (ไม่สามารถใช้งานร่วมกับ P100 PCI-E ได้) [ 21 ]NVLink 1.020 GT/s 8 + 8 [ e ]160 กิกะบิต/วินาที = 20 กิกะไบต์/วินาที4 80 + 80 GB/s64160 GB/s
เอ็นดีวี100V100 SXM2 [ 22 ] (ไม่สามารถใช้งานร่วมกับ V100 PCI-E ได้)NVLink 2.025 จีที/วินาที 8 + 8 [ e ]200 กิกะบิต/วินาที = 25 กิกะไบต์/วินาที6 [ 23 ]150 + 150 GB/s96300 GB/s
Nvidia TU104GeForce RTX 2080 , Quadro RTX 5000 [ 24 ]NVLink 2.025 จีที/วินาที 8 + 8 [ e ]200 กิกะบิต/วินาที = 25 กิกะไบต์/วินาที1 + GB/s16 50 GB/s
Nvidia TU102GeForce RTX 2080 Ti, Quadro RTX 6000/8000 [ 24 ]NVLink 2.025 จีที/วินาที 8 + 8 [ e ]200 กิกะบิต/วินาที = 25 กิกะไบต์/วินาที2 50 + 50 GB/s32100 GB/s
Nvidia GA100 [ 17 ] [ 18 ]แอมแปร์ A100 (SXM4 และ PCIe) [ 20 ]NVLink 3.050 จีที/วินาที 4 + 4 [ e ]200 กิกะบิต/วินาที = 25 กิกะไบต์/วินาที12 [ 25 ]300 + 300 GB/s96600 GB/s
Nvidia GA102 [ 19 ]GeForce RTX 3090, Quadro RTX A6000NVLink 3.028.125 จีที/วินาที 4 + 4 [ e ]112.5 กิกะบิต/วินาที = 14.0625 กิกะไบต์/วินาที456.25 + 56.25 GB/s16112.5 GB/s
NVSwitch สำหรับ Hopper [ 26 ](สวิตช์ 64 พอร์ตที่เชื่อมต่ออย่างสมบูรณ์) NVLink 4.0 106.25 จีที/วินาที 9 + 9 [ e ]450 กิกะบิต/วินาที 18 3600 + 3600 GB/s 128 7200 GB/s
Nvidia Grace CPU [ 27 ]ชิปซูเปอร์ Nvidia GH200 PCIe-5 (4x, 16x) ที่ความเร็ว 512 GB/s
Nvidia Grace CPU [ 27 ]ชิปซูเปอร์ Nvidia GH200 NVLink-C2C ที่ความเร็ว 900 GB/s
Nvidia Hopper GPU [ 27 ]ชิปซูเปอร์ Nvidia GH200 NVLink-C2C ที่ความเร็ว 900 GB/s
Nvidia Hopper GPU [ 27 ]ชิปซูเปอร์ Nvidia GH200 NVLink 4 (18x) @ 900 GB/s
  1. ^ PCIe: รวม 5 นิ้วสำหรับ PCB
  2. ^ a b cคอลัมน์อัตราข้อมูลคือค่าสูงสุดทางทฤษฎี
  3. ^ a b c d eค่าตัวอย่าง; เศษส่วนอื่นๆ สำหรับการใช้งานเลน PCIe น่าจะเป็นไปได้
  4. ^ a b c d eเลน PCIe เดียวถ่ายโอนข้อมูลผ่านคู่สายแบบดิฟเฟอเรนเชียล
  5. ^ a b c d e f gค่าตัวอย่าง; การรวมซับลิงก์ NVLink น่าจะเป็นไปได้

ประสิทธิภาพในโลกแห่งความเป็นจริงสามารถกำหนดได้โดยการใช้ต้นทุนค่าใช้จ่ายในการส่งข้อมูลที่แตกต่างกัน รวมถึงอัตราการใช้งาน ซึ่งมาจากแหล่งข้อมูลต่างๆ ดังนี้:

ข้อจำกัดทางกายภาพเหล่านั้นมักจะลดอัตราการส่งข้อมูลลงเหลือระหว่าง 90-95 เปอร์เซ็นต์ของอัตราการถ่ายโอน การทดสอบ NVLink แสดงให้เห็นอัตราการถ่ายโอนที่ทำได้ประมาณ 35.3 Gbit/s (โฮสต์ไปยังอุปกรณ์) สำหรับการเชื่อมต่อ NVLink 40 Gbit/s (อัปโหลด 2 ซับเลน) ไปยัง GPU P100 ในระบบที่ขับเคลื่อนด้วยชุด CPU IBM POWER8 [ 28 ]

ใช้กับแผงวงจรแบบเสียบปลั๊ก

สำหรับบอร์ดเสียบปลั๊กแบบต่างๆ (ปัจจุบันมีบอร์ด GPU สำหรับเล่นเกมระดับไฮเอนด์และระดับมืออาชีพจำนวนไม่มากที่มีคุณสมบัตินี้) ที่มีขั้วต่อเพิ่มเติมสำหรับเชื่อมต่อเข้าด้วยกันเป็นกลุ่ม NVLink นั้น ก็จะมีปลั๊กเชื่อมต่อแบบ PCB ขนาดกะทัดรัดที่แตกต่างกันเล็กน้อยอยู่จำนวนหนึ่ง โดยทั่วไปแล้ว บอร์ดประเภทเดียวกันเท่านั้นที่จะสามารถเชื่อมต่อกันได้เนื่องจากโครงสร้างทางกายภาพและตรรกะ ในบางกรณี อาจต้องใช้ปลั๊กที่เหมือนกันสองตัวเพื่อให้ได้อัตราการส่งข้อมูลสูงสุด ปัจจุบัน ปลั๊กทั่วไปมีรูปทรงตัว U โดยมีขั้วต่อแบบตะแกรงละเอียดอยู่ที่ปลายแต่ละด้านของรูปทรงที่หันออกจากผู้ดู ความกว้างของปลั๊กจะเป็นตัวกำหนดระยะห่างระหว่างการ์ดเสียบปลั๊กกับบอร์ดหลักของระบบคอมพิวเตอร์ ซึ่งระยะห่างในการวางการ์ดมักจะถูกกำหนดโดยปลั๊กที่เข้ากันได้ (ความกว้างของปลั๊กที่มีจำหน่ายทั่วไปคือ 3 ถึง 5 สล็อต และขึ้นอยู่กับประเภทของบอร์ดด้วย) [ 29 ] [ 30 ]การเชื่อมต่อนี้มักถูกเรียกว่าScalable Link Interface (SLI) ตั้งแต่ปี 2004 เนื่องจากโครงสร้างและรูปลักษณ์ แม้ว่าการออกแบบที่ใช้ NVLink ในปัจจุบันจะมีลักษณะทางเทคนิคที่แตกต่างกันมากและมีฟีเจอร์ที่แตกต่างกันในระดับพื้นฐานเมื่อเทียบกับการออกแบบก่อนหน้านี้ อุปกรณ์จริงที่รายงานมีดังนี้: [ 31 ]

  • Quadro GP100 (การ์ดคู่หนึ่งจะใช้บริดจ์ได้สูงสุด 2 ตัว[ 32 ]การตั้งค่านี้รองรับการเชื่อมต่อ NVLink 2 หรือ 4 การเชื่อมต่อด้วยความเร็วสูงสุด 160 GB/s [ 33 ]ซึ่งอาจคล้ายกับ NVLink 1.0 ที่มีความเร็ว 20 GT/s)
  • Quadro GV100 (การ์ดสองใบจะต้องใช้บริดจ์สูงสุด 2 ตัวและรองรับความเร็วสูงสุด 200 GB/s [ 29 ] - ซึ่งอาจคล้ายกับ NVLink 2.0 ที่มีความเร็ว 25 GT/s และ 4 ลิงก์)
  • GeForce RTX 2080 ที่ใช้ TU104 (พร้อมบริดจ์เดี่ยว "GeForce RTX NVLink-Bridge" [ 34 ] )
  • GeForce RTX 2080 Ti ที่ใช้ TU102 (พร้อมบริดจ์เดี่ยว "GeForce RTX NVLink-Bridge" [ 30 ] )
  • GeForce RTX 3090 ที่ใช้ GA102 (พร้อม "GeForce RTX NVLink-Bridge เฉพาะ (สำหรับผลิตภัณฑ์ซีรี่ส์ 30)") [ 35 ]
  • Quadro RTX 5000 [ 36 ]ที่ใช้ TU104 [ 37 ] (พร้อมบริดจ์เดี่ยว "NVLink" สูงสุด 50 GB/s [ 38 ] - ซึ่งอาจคล้ายกับ NVLink 2.0 ที่มี 25 GT/s และ 1 ลิงก์)
  • Quadro RTX 6000 [ 36 ]ที่ใช้ TU102 [ 37 ] (พร้อมบริดจ์เดี่ยว "NVLink HB" สูงสุด 100 GB/s [ 38 ] - ซึ่งอาจคล้ายกับ NVLink 2.0 ที่มี 25 GT/s และ 2 ลิงก์)
  • Quadro RTX 8000 [ 36 ]ที่ใช้ TU102 [ 39 ] (พร้อมบริดจ์เดี่ยว "NVLink HB" สูงสุด 100 GB/s [ 38 ] - ซึ่งอาจคล้ายกับ NVLink 2.0 ที่มี 25 GT/s และ 2 ลิงก์)

ซอฟต์แวร์บริการและการเขียนโปรแกรม

สำหรับผลิตภัณฑ์ Tesla, Quadro และ Grid นั้น NVML-API (Nvidia Management Library API) มีฟังก์ชันชุดหนึ่งสำหรับควบคุมการเชื่อมต่อ NVLink บางส่วนบนระบบ Windows และ Linux โดยใช้โปรแกรม เช่น การประเมินส่วนประกอบและเวอร์ชัน รวมถึงการสอบถามสถานะ/ข้อผิดพลาดและการตรวจสอบประสิทธิภาพ[ 40 ]นอกจากนี้ ด้วยการจัดเตรียมไลบรารี NCCL (Nvidia Collective Communications Library) นักพัฒนาในพื้นที่สาธารณะจะสามารถนำไปใช้งานได้อย่างมีประสิทธิภาพ เช่น การใช้งานปัญญาประดิษฐ์และหัวข้อที่ต้องการการคำนวณสูงบน NVLink [ 41 ]หน้า "การตั้งค่า 3 มิติ" » "กำหนดค่า SLI, Surround, PhysX" ในแผงควบคุม Nvidia และ แอปพลิเคชันตัวอย่าง CUDA "simpleP2P" ใช้ API ดังกล่าวเพื่อให้บริการที่เกี่ยวข้องกับคุณสมบัติ NVLink บนแพลตฟอร์ม Linux แอปพลิเคชันบรรทัดคำสั่งที่มีคำสั่งย่อย "nvidia-smi nvlink" ให้ข้อมูลและการควบคุมขั้นสูงที่คล้ายกัน[ 31 ]

ประวัติศาสตร์

เมื่อวันที่ 5 เมษายน 2559 Nvidia ได้ประกาศว่า NVLink จะถูกนำไปใช้ใน GPU GP100 ที่ใช้ สถาปัตยกรรมไมโคร Pascalเช่น ในผลิตภัณฑ์ Nvidia Tesla P100 [ 42 ]ด้วยการเปิดตัวฐานคอมพิวเตอร์ประสิทธิภาพสูง DGX-1 ทำให้สามารถมีโมดูล P100 ได้มากถึงแปดโมดูลในระบบแร็คเดียวที่เชื่อมต่อกับ CPU โฮสต์ได้มากถึงสองตัวบอร์ดตัวนำ (...) อนุญาตให้มีบอร์ดเฉพาะสำหรับการกำหนดเส้นทางการเชื่อมต่อ NVLink – แต่ละ P100 ต้องการ 800 พิน 400 สำหรับ PCIe + พลังงาน และอีก 400 สำหรับ NVLink รวมแล้วเกือบ 1600 เส้นทางบนบอร์ดสำหรับ NVLink เพียงอย่างเดียว (...) [ 43 ] CPU แต่ละตัวมีการเชื่อมต่อโดยตรงกับ P100 จำนวน 4 หน่วยผ่าน PCIe และ P100 แต่ละตัวมี NVLink หนึ่งตัวไปยัง P100 อีก 3 ตัวในกลุ่ม CPU เดียวกัน บวกกับ NVLink อีกหนึ่งตัวไปยัง P100 อีกหนึ่งตัวในกลุ่ม CPU อื่นแต่ละ NVLink (อินเทอร์เฟซลิงก์) ให้บริการแบบสองทิศทางที่ 20 GB/วินาที ขึ้นและ 20 GB/วินาที ลง โดยมี 4 ลิงก์ต่อ GPU GP100 ทำให้มีแบนด์วิดท์รวม 80 GB/วินาที ขึ้นและอีก 80 GB/วินาที ลง[ 44 ] NVLink รองรับการกำหนดเส้นทาง ดังนั้นในการออกแบบ DGX-1 สำหรับ P100 แต่ละตัว จะสามารถเข้าถึง P100 อีก 4 ตัวจากทั้งหมด 7 ตัวได้โดยตรง และอีก 3 ตัวที่เหลือสามารถเข้าถึงได้ด้วยการกระโดดเพียงครั้งเดียว ตามภาพประกอบในสิ่งพิมพ์บนบล็อกของ Nvidia ตั้งแต่ปี 2014 NVLink อนุญาตให้รวมลิงก์แต่ละรายการเพื่อเพิ่มประสิทธิภาพแบบจุดต่อจุด ตัวอย่างเช่น การออกแบบที่มี P100 สองตัวและลิงก์ทั้งหมดที่สร้างขึ้นระหว่างสองหน่วยจะทำให้สามารถใช้แบนด์วิดท์ NVLink เต็มที่ 80 GB/วินาที ระหว่างกันได้[ 45 ]

ในงาน GTC2017 นิฟดาได้นำเสนอ GPU รุ่น Volta และระบุถึงการรวมเอา NVLink เวอร์ชัน 2.0 ที่ได้รับการปรับปรุงใหม่ ซึ่งจะช่วยให้สามารถรับส่งข้อมูล I/O รวมได้ถึง 300 GB/s สำหรับชิปตัวเดียวในดีไซน์นี้ และยังประกาศเพิ่มเติมเกี่ยวกับการเปิดให้สั่งจองล่วงหน้าพร้อมสัญญาว่าจะส่งมอบในไตรมาสที่ 3 ปี 2017 สำหรับคอมพิวเตอร์ประสิทธิภาพสูง DGX-1 และ DGX-Station ที่จะติดตั้งโมดูล GPU ประเภท V100 และมี NVLink 2.0 ที่ใช้งานได้ในรูปแบบเครือข่าย (สองกลุ่มของโมดูล V100 สี่โมดูลที่มีการเชื่อมต่อระหว่างกลุ่ม) หรือในรูปแบบการเชื่อมต่อแบบเต็มรูปแบบของกลุ่มโมดูล V100 สี่โมดูลกลุ่มเดียว

ในปี 2017–2018 IBM และ Nvidia ได้ส่งมอบ ซูเปอร์คอมพิวเตอร์ SummitและSierraให้กับกระทรวงพลังงานของสหรัฐอเมริกา[ 46 ]ซึ่งรวมซีพียูตระกูลPOWER9 ของ IBM และสถาปัตยกรรม Volta ของ Nvidia โดยใช้ NVLink 2.0 สำหรับการเชื่อมต่อ CPU-GPU และ GPU-GPU และInfiniBand EDR สำหรับการเชื่อมต่อระบบ[ 47 ]

ในปี 2020 Nvidia ประกาศว่าจะไม่เพิ่มโปรไฟล์ไดรเวอร์ SLI ใหม่สำหรับ ซีรี่ส์ RTX 2000และรุ่นเก่ากว่าตั้งแต่วันที่ 1 มกราคม 2021 เป็นต้นไป[ 48 ]

ในปี 2022 คอนเน็กเตอร์ NVLink ถูกถอดออกจากสถาปัตยกรรม Ada Lovelace โดย Jensen Huang ซีอีโอของ Nvidia ระบุว่า I/O ที่ว่างจากการถอดคอนเน็กเตอร์นี้จะถูกนำไปใช้เพื่อความสามารถในการประมวลผล AI และมีเจตนาที่จะเปลี่ยนไปใช้มาตรฐาน PCIe Gen 5.0 [ 49 ] [ 50 ] [ 51 ]ผู้ใช้บางรายรายงานว่าบอร์ดบางรุ่นมีร่องรอยของคอนเน็กเตอร์ NVLink ที่ถูกถอดออก[ 52 ] [ 53 ] [ 54 ]เทคโนโลยี NVLink ยังคงมีให้ใช้งานสำหรับศูนย์ข้อมูลและผู้ใช้ระดับองค์กร[ 55 ]

ได้รับการสนับสนุนจากผู้ผลิตรายอื่น

ในปี 2025 มีการประกาศเปิดตัว NVLink Fusion เพื่ออนุญาตให้นักออกแบบชิปสามารถอนุญาตและรวม NVLink เข้ากับผลิตภัณฑ์ของตนได้[ 56 ]ต่อมา NVLink Fusion ได้รับการอนุญาตจากARMและSiFiveสำหรับผลิตภัณฑ์ศูนย์ข้อมูล[ 57 ] [ 58 ]และAmazon Web Servicesสำหรับตัวเร่งความเร็วTrainium4 ที่กำลังจะมาถึง [ 59 ]

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=NVLink&oldid=1353859495 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ เอ็นวีลิงก์

NVLink เป็นลิงก์ การสื่อสารแบบอนุกรมหลายเลนระยะใกล้แบบใช้สายซึ่งพัฒนาโดยNvidiaแตกต่างจากPCI Express ตรงที่ อุปกรณ์หนึ่งสามารถประกอบด้วย NVLink หลายตัว และอุปกรณ์ต่างๆ...

หลักการ

NVLink เป็นเทคโนโลยีที่พัฒนาโดย Nvidia สำหรับการถ่ายโอนข้อมูลและรหัสควบคุมในระบบประมวลผลระหว่าง CPU และ GPU และระหว่าง GPU กับ GPU NVLink กำหนดการ เชื่อมต่อ แบบจุดต่อจุด ด้วยอัตราการส่งข้อมูล 20, 25 และ 50 Gbit/s (v1.0/v2.0/v3.

ผลงาน

ตารางต่อไปนี้แสดงการเปรียบเทียบตัวชี้วัดพื้นฐานตามข้อกำหนดมาตรฐาน:

ใช้กับแผงวงจรแบบเสียบปลั๊ก

สำหรับบอร์ดเสียบปลั๊กแบบต่างๆ (ปัจจุบันมีบอร์ด GPU สำหรับเล่นเกมระดับไฮเอนด์และระดับมืออาชีพจำนวนไม่มากที่มีคุณสมบัตินี้) ที่มีขั้วต่อเพิ่มเติมสำหรับเชื่อมต่อเข้าด้วยกันเป็นกลุ่ม NVLink นั้น ก็จะมีปลั๊กเชื่อมต่อแบบ PCB...