อ่าน 3 นาที
เอดีเอ็ม เอ็กซ์ดีเอ็นเอ
XDNA เป็น สถาปัตยกรรมไมโคร สำหรับ โปรเซสเซอร์การเรียนรู้เชิงลึก ที่พัฒนาโดย AMD ได้ รับการออกแบบมาเพื่อจัดการ งานที่เกี่ยวข้องกับ การเรียนรู้ของเครื่อง (ML) เช่น ซอฟต์แวร์...
เอดีเอ็ม เอ็กซ์ดีเอ็นเอ
แผนภาพอย่างง่ายของหน่วยประมวลผลกราฟิก AMD XDNA NPU เช่นเดียวกับที่พบในโปรเซสเซอร์ Ryzen 7040 | |
| บริษัทออกแบบ | เอดีเอ็ม |
|---|---|
| แนะนำ | เมษายน 2566 |
| พิมพ์ | สถาปัตยกรรมไมโครของหน่วยประมวลผลประสาท |
XDNAเป็นสถาปัตยกรรมไมโครสำหรับโปรเซสเซอร์การเรียนรู้เชิงลึกที่พัฒนาโดยAMD ได้ รับการออกแบบมาเพื่อจัดการ งานที่เกี่ยวข้องกับ การเรียนรู้ของเครื่อง (ML) เช่น ซอฟต์แวร์ ปัญญาประดิษฐ์ (AI) โดยใช้ เทคโนโลยีของ Xilinx ซึ่ง AMD ได้เข้าซื้อกิจการในปี 2022 การออกแบบซิลิคอนที่ใช้ XDNA ถูกนำไปใช้ใน โปรเซสเซอร์Ryzen AIของบริษัทโดยเสริม ซีพียู ZenและจีพียูRDNAบนชิปเดียวกัน[ 1 ] [ 2 ]
สถาปัตยกรรมและลักษณะเด่น
XDNA ใช้สถาปัตยกรรมดาต้าโฟลว์เชิง พื้นที่ โดยที่ไทล์ของ AI Engine (AIE) จะประมวลผลข้อมูลแบบขนานโดยมีการเข้าถึงหน่วยความจำภายนอกให้น้อยที่สุด การออกแบบนี้ใช้ประโยชน์จากความขนานและความใกล้เคียงของข้อมูลเพื่อเพิ่มประสิทธิภาพและประหยัดพลังงาน ไทล์ AIE แต่ละอันประกอบด้วย:
- โปรเซสเซอร์เวกเตอร์VLIW + SIMD ที่ได้รับการปรับแต่งมาเพื่อรองรับงานประมวลผลปริมาณมากและการดำเนินการกับเทนเซอร์
- โปรเซสเซอร์แบบ RISC ชนิด สเกลาร์ทำหน้าที่ควบคุมการไหลของโปรแกรมและดำเนินการเสริมต่างๆ
- บล็อกหน่วยความจำภายในสำหรับจัดเก็บน้ำหนัก การกระตุ้น และสัมประสิทธิ์ระดับกลาง ช่วยลดการพึ่งพาDRAM ภายนอก และลดความหน่วง
- หน่วยความจำโปรแกรมและข้อมูลภายในชิปที่ช่วยลดความหน่วงและพลังงานลงอีกด้วยการลดปริมาณการรับส่งข้อมูลไปยังหน่วยความจำภายนอกให้น้อยที่สุด
- กลไก DMAเฉพาะและระบบเชื่อมต่อแบบตั้งโปรแกรมได้สำหรับการถ่ายโอนข้อมูลแบบกำหนดได้และมีแบนด์วิดท์สูงระหว่างไทล์
แผงไทล์สามารถปรับขนาดและประกอบได้ ทำให้ AMD สามารถกำหนดค่าNPUด้วยจำนวนไทล์ที่แตกต่างกันเพื่อให้เหมาะกับเป้าหมายด้านพลังงาน พื้นที่ และประสิทธิภาพที่แตกต่างกัน ความถี่ในการทำงานโดยทั่วไปจะสูงถึง 1.3 GHz ซึ่งสามารถปรับได้ตามข้อจำกัดด้านความร้อนและพลังงาน
รุ่นต่างๆ
รุ่นแรก (XDNA)
XDNA NPU รุ่นแรกเปิดตัวในช่วงต้นปี 2023 พร้อมกับซีรี่ส์ Ryzen 7040 "Phoenix" ซึ่งทำได้ถึง 10 TOPS (Tera Operations Per Second) ในรูปแบบอุปกรณ์พกพา[ 3 ]
การปรับปรุงครั้งแรก: ฮอว์คพอยต์
ซีรีส์ Ryzen 8040 "Hawk Point" ที่วางจำหน่ายในปี 2024 ได้ปรับปรุง NPU ผ่าน การอัปเดต เฟิร์มแวร์ความเร็วสัญญาณนาฬิกาที่สูงขึ้น และการปรับแต่งเพิ่มเติม ทำให้ประสิทธิภาพเพิ่มขึ้นเป็นประมาณ 16 TOPS [ 4 ]
รุ่นที่สอง (XDNA 2)
XDNA 2 เปิดตัวพร้อมกับโปรเซสเซอร์มือถือ Ryzen AI 300 และ PRO 300 ที่ใช้ สถาปัตยกรรม Zen 5รุ่นนี้เพิ่มประสิทธิภาพการประมวลผล AI อย่างมาก โดยสามารถทำความเร็วได้ถึง 55 TOPS ในรุ่นเรือธง[ 1 ] [ 5 ] [ 6 ]
โครงสร้างภายในของไมโครสถาปัตยกรรม
หัวใจหลักของ XDNA คืออาร์เรย์ของไทล์ AI Engine ที่จัดเรียงตามพื้นที่ ทำให้สามารถประมวลผลเวิร์กโหลด ML แบบขนานและแบบไปป์ไลน์ได้ แต่ละไทล์ประกอบด้วย:
- คอร์เวกเตอร์ VLIW + SIMD ที่ได้รับการปรับแต่งให้เหมาะสมกับตัวดำเนินการ ML ทั่วไป เช่น การคูณเมทริกซ์และการคอนโวลูชัน
- ตัวประมวลผลควบคุมแบบสเกลาร์สำหรับจัดลำดับคำสั่งและจัดการการทำงานระดับไทล์
- บล็อก SRAMบนชิปใช้สำหรับจัดเก็บพารามิเตอร์ของโมเดลและข้อมูลระดับกลาง เพื่อลดการเข้าถึงหน่วยความจำภายนอกที่มีค่าใช้จ่ายสูง
- ตัวควบคุม DMA ที่ตั้งโปรแกรมได้และโครงสร้างการเชื่อมต่อที่มีความหน่วงต่ำ ช่วยให้การเคลื่อนย้ายข้อมูลเป็นไปอย่างแน่นอนโดยมีการหยุดชะงักน้อยที่สุด
การออกแบบทางสถาปัตยกรรมนี้ช่วยให้สามารถประมวลผลด้วยความหน่วงต่ำและแบนด์วิดท์สูง ซึ่งเป็นสิ่งจำเป็นสำหรับการอนุมาน AI แบบเรียลไทม์ในอุปกรณ์ปลายทาง
ประโยชน์
- ความหน่วงที่แน่นอน:สถาปัตยกรรมกระแสข้อมูลเชิงพื้นที่ช่วยให้มั่นใจได้ถึงเวลาการประมวลผลที่คาดการณ์ได้และสม่ำเสมอ ซึ่งเป็นสิ่งสำคัญสำหรับแอปพลิเคชันแบบเรียลไทม์
- ประสิทธิภาพการใช้พลังงาน:การใช้หน่วยความจำภายในชิปช่วยลดการเข้าถึง DRAM ภายนอก ทำให้การใช้พลังงานลดลงเมื่อเทียบกับวิธีการ GPU หรือ CPU แบบดั้งเดิม[ 7 ]
- ความหนาแน่นในการประมวลผล: ประสิทธิภาพ TOPS สูงใน พื้นที่ ซิลิคอน ขนาดกะทัดรัด ช่วยให้สามารถผสานรวมเข้ากับอุปกรณ์ที่บางและเบา เช่นอัลตร้าบุ๊กและเวิร์กสเตชันแบบพกพาได้
- ความสามารถในการปรับขนาด:การออกแบบโมดูลาร์ของแผ่นกระเบื้องรองรับการปรับขนาดตั้งแต่บนอุปกรณ์พกพาขนาดเล็กที่มีแผ่นกระเบื้องจำนวนน้อย ไปจนถึงเซิร์ฟเวอร์ระดับองค์กรที่มีแผ่นกระเบื้องจำนวนมาก
การบูรณาการผลิตภัณฑ์
| แบบอย่าง | สถาปัตยกรรม NPU | คอร์/เธรดของซีพียู | จุดสูงสุดของ NPU | หมายเหตุ |
|---|---|---|---|---|
| ซีพียู Ryzen 7040 "ฟีนิกซ์" | XDNA (รุ่นที่ 1) | สูงสุด 8C / 16T | ~10 ท็อปส์ | การเปิดตัว XDNA ครั้งแรกในอัลตร้าบุ๊ก |
| ซีพียู Ryzen 8040 "Hawk Point" | XDNA (รุ่นปรับปรุงครั้งแรก) | สูงสุด 8C / 16T | ~16 ท็อปส์ | ปรับปรุงความเร็วสัญญาณนาฬิกา/การปรับแต่ง NPU |
| Ryzen AI 300 / PRO 300 ("Strix Point") | เอ็กซ์ดีเอ็นเอ 2 | สูงสุด 12C / 24T | ~50–55 TOPS | ซีพียู AI สำหรับมือถือระดับเรือธง |
| ซีพียู Ryzen AI 5 330 | เอ็กซ์ดีเอ็นเอ 2 | 4C / 8T | ~50 เสื้อ | ชิป AI ระดับเริ่มต้นพร้อม NPU เต็มรูปแบบ |
ซอฟต์แวร์และระบบนิเวศ
XDNA ได้รับการสนับสนุนผ่านซอฟต์แวร์ROCm (Radeon Open Compute) และ Vitis AI ของ AMD ทำให้ผู้พัฒนาสามารถใช้ NPU เพื่อเร่งความเร็วเวิร์กโหลด AI ได้อย่างมีประสิทธิภาพ เฟรมเวิร์ก ML ยอดนิยม เช่นONNX , TensorFlowและPyTorchได้รับการสนับสนุนผ่านเครื่องมือเหล่านี้[ 8 ]นอกจากนี้ Microsoft Windows ML runtime ยังรวมการเร่งความเร็ว AMD NPU ในอุปกรณ์ที่วางจำหน่ายในชื่อCopilot+ PC ทำให้สามารถอนุมาน AI ในพื้นที่ได้โดยไม่ต้องพึ่งพาคลาวด์[ 9 ]
ข้อจำกัด
- ค่า TOP ที่โฆษณาไว้เป็นค่าสูงสุดทางทฤษฎี ประสิทธิภาพการทำงานจริงจะแตกต่างกันไปตามสภาวะความร้อนที่เหมาะสม ลักษณะเฉพาะของภาระงาน และการปรับแต่งไดรเวอร์/ซอฟต์แวร์
- โมเดลระดับเริ่มต้นบางรุ่นจะปิดใช้งานหรือจำกัดฟังก์ชันการทำงานของ NPU เพื่อประหยัดพลังงานและลดพื้นที่บนชิป
- ระบบนิเวศซอฟต์แวร์และเครื่องมือต่างๆ กำลังพัฒนาอย่างต่อเนื่อง และคาดว่าจะมีการปรับปรุงอย่างต่อเนื่องเพื่อใช้ประโยชน์จากความสามารถของฮาร์ดแวร์ได้อย่างเต็มที่
ดูเพิ่มเติม
ลิงก์ภายนอก
- AMD XDNA – หน้าอย่างเป็นทางการ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ เอดีเอ็ม เอ็กซ์ดีเอ็นเอ
XDNA เป็น สถาปัตยกรรมไมโคร สำหรับ โปรเซสเซอร์การเรียนรู้เชิงลึก ที่พัฒนาโดย AMD ได้ รับการออกแบบมาเพื่อจัดการ งานที่เกี่ยวข้องกับ การเรียนรู้ของเครื่อง (ML) เช่น ซอฟต์แวร์...
สถาปัตยกรรมและลักษณะเด่น
XDNA ใช้ สถาปัตยกรรมดาต้าโฟลว์เชิง พื้นที่ โดยที่ไทล์ของ AI Engine (AIE) จะประมวลผลข้อมูล แบบขนานโดย มีการเข้าถึงหน่วยความจำภายนอกให้น้อยที่สุด การออกแบบนี้ใช้ประโยชน์จากความขนานและความใกล้เคียงของข้อมูลเพื่อเพิ่มประสิทธิภาพและประหยัดพลังงาน ไทล์ AIE...
รุ่นแรก (XDNA)
XDNA NPU รุ่นแรกเปิดตัวในช่วงต้นปี 2023 พร้อมกับซีรี่ส์ Ryzen 7040 "Phoenix" ซึ่งทำได้ถึง 10 TOPS (Tera Operations Per Second) ในรูปแบบอุปกรณ์พกพา [ 3 ]
การปรับปรุงครั้งแรก: ฮอว์คพอยต์
ซีรีส์ Ryzen 8040 "Hawk Point" ที่วางจำหน่ายในปี 2024 ได้ปรับปรุง NPU ผ่าน การอัปเดต เฟิร์มแวร์ ความเร็วสัญญาณนาฬิกาที่สูงขึ้น และการปรับแต่งเพิ่มเติม ทำให้ประสิทธิภาพเพิ่มขึ้นเป็นประมาณ 16 TOPS [ 4 ]