กลับไปหน้าบทความ

อ่าน 13 นาที

เทราสเคล (สถาปัตยกรรมระดับไมโคร)

TeraScale เป็นชื่อรหัสสำหรับตระกูล สถาปัตยกรรมไมโคร หน่วยประมวลผลกราฟิก ที่พัฒนาโดย ATI Technologies / AMD และเป็น สถาปัตยกรรมไมโครตัว ที่สอง ที่ใช้ โมเดล shader แบบรวมต่อ จาก...

เทราสเคล (สถาปัตยกรรมระดับไมโคร)

TeraScaleเป็นชื่อรหัสสำหรับตระกูลสถาปัตยกรรมไมโครหน่วยประมวลผลกราฟิก ที่พัฒนาโดยATI Technologies / AMDและเป็นสถาปัตยกรรมไมโครตัว ที่สอง ที่ใช้โมเดล shader แบบรวมต่อจากXenos TeraScale เข้ามาแทนที่สถาปัตยกรรมไมโครแบบ fixed-pipelineเดิมและแข่งขันโดยตรงกับสถาปัตยกรรมไมโคร shader แบบรวมตัวแรกของ Nvidia ที่ชื่อTesla [ 1 ] [ 2 ]

เทคโนโลยี TeraScale ถูกนำไปใช้ในRadeon HD 2000ที่ผลิตด้วยกระบวนการ 80 นาโนเมตรและ65 นาโนเมตร , Radeon HD 3000ที่ผลิตด้วยกระบวนการ 65 นาโนเมตรและ 55 นาโนเมตร, Radeon HD 4000 ที่ผลิต ด้วยกระบวนการ 55 นาโนเมตรและ 40 นาโนเมตร, Radeon HD 5000และRadeon HD 6000ที่ผลิตด้วยกระบวนการ 40 นาโนเมตร นอกจากนี้ TeraScale ยังถูกใช้ในหน่วยประมวลผลเร่งความเร็วของ AMDที่มีชื่อรหัสว่า "Brazos", "Llano", "Trinity" และ "Richland" และยังพบ TeraScale ในการ์ดจอแบรนด์ต่อๆ มาบางรุ่นอีกด้วย

TeraScale เป็น สถาปัตยกรรม VLIW SIMDในขณะที่ Tesla เป็น สถาปัตยกรรม RISC SIMD ซึ่งคล้ายกับGraphics Core Next ซึ่ง เป็นรุ่นต่อจาก TeraScale TeraScale ใช้HyperZ [ 3 ]

ตัวสร้างโค้ด LLVM (เช่น ส่วนหลังของคอมไพเลอร์) พร้อมใช้งานสำหรับ TeraScale [ 4 ]แต่ดูเหมือนว่าจะไม่มีอยู่ในเมทริกซ์ของ LLVM [ 5 ]เช่นMesa 3Dใช้ประโยชน์จากสิ่งนี้

เทราสเกล 1 (VLIW5)

เทราสเกล 1
วันที่วางจำหน่ายพฤษภาคม 2550 ( พฤษภาคม 2550 )
ประวัติศาสตร์
ผู้มาก่อนไม่เป็นที่ทราบกันโดยทั่วไป
ผู้สืบทอดเทราสเกล 2
สถานะการสนับสนุน
ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่ปลายปี 2013 (เวอร์ชันไดรเวอร์ Windows สุดท้าย: 13.9 สำหรับWindows Vistaและ7 , 13.1 สำหรับWindows 8และ 13.4 เวอร์ชันเบต้าสำหรับWindows XPและ 8)

TeraScale ได้รับการประกาศและวางจำหน่ายครั้งแรกพร้อมกับRadeon HD 2000 seriesในปี 2007 ในงานSIGGRAPH 08ในเดือนธันวาคม 2008 ไมค์ ฮูสตัน พนักงาน ของ AMDได้อธิบายรายละเอียดบางส่วนของสถาปัตยกรรมไมโคร TeraScale [ 6 ]

ในงาน FOSDEM09 Matthias Hopf จากSUSE Linux ซึ่งเป็นพันธมิตรทางเทคโนโลยีของ AMD ได้นำเสนอสไลด์เกี่ยวกับการเขียนโปรแกรมไดรเวอร์โอเพนซอร์สสำหรับ R600 [ 7 ]

เชเดอร์แบบรวม

สถาปัตยกรรม GPU รุ่นก่อนหน้าใช้ไปป์ไลน์แบบตายตัว กล่าวคือ มีโปรเซสเซอร์ shader ที่แยกต่างหากสำหรับshader แต่ละประเภท TeraScale ใช้ประโยชน์จากโปรเซสเซอร์ shader ที่ยืดหยุ่นจำนวนมาก ซึ่งสามารถกำหนดเวลาให้ประมวลผล shader ประเภทต่างๆ ได้ ทำให้เพิ่มปริมาณงานของ GPU อย่างมีนัยสำคัญ (ขึ้นอยู่กับส่วนผสมของคำสั่งแอปพลิเคชันดังที่กล่าวไว้ด้านล่าง) คอร์ R600 ประมวลผล vertex, geometry และ pixel shader ตามที่ระบุไว้ใน ข้อกำหนด Direct3D 10.0 สำหรับShader Model 4.0 นอกเหนือจาก การสนับสนุน OpenGL 3.3 อย่างเต็มรูปแบบ [ 8 ]

ฟังก์ชัน shader แบบรวมใหม่นี้ใช้ สถาปัตยกรรม คำสั่งยาวมาก (VLIW) ซึ่งแกนหลักจะดำเนินการแบบขนาน[ 9 ]

กลุ่มเชเดอร์ถูกจัดระเบียบเป็นหน่วยประมวลผลสตรีม 5 หน่วย แต่ละหน่วยประมวลผลสตรีมสามารถประมวลผลคำสั่ง MAD (หรือ ADD หรือ MUL) จุดลอยตัวความแม่นยำเดี่ยวที่เสร็จสมบูรณ์ได้ต่อรอบสัญญาณนาฬิกาผลคูณดอท (DP และกรณีพิเศษโดยการรวม ALU) และการบวกจำนวนเต็ม[ 10 ]หน่วยที่ 5 มีความซับซ้อนมากขึ้นและสามารถจัดการฟังก์ชันทรานสเซนเดนทัล พิเศษเพิ่มเติมได้ เช่นไซน์และโคไซน์[ 10 ]แต่ละกลุ่มเชเดอร์สามารถดำเนินการคำสั่งได้ 6 คำสั่งต่อรอบสัญญาณนาฬิกา (สูงสุด) ซึ่งประกอบด้วยคำสั่งเชเดอร์ 5 คำสั่งบวกการแตกสาขา 1 คำสั่ง[ 10 ]

ที่น่าสังเกตคือ สถาปัตยกรรม VLIW นำมาซึ่งความท้าทายแบบคลาสสิกบางประการที่มีอยู่ในการออกแบบ VLIW โดยเฉพาะอย่างยิ่งการรักษาการไหลของคำสั่งให้เหมาะสมที่สุด[ 9 ]นอกจากนี้ ชิปไม่สามารถออกคำสั่งพร้อมกันได้เมื่อคำสั่งหนึ่งขึ้นอยู่กับผลลัพธ์ของอีกคำสั่งหนึ่ง ประสิทธิภาพของ GPU ขึ้นอยู่กับส่วนผสมของคำสั่งที่แอปพลิเคชันใช้ และความสามารถของคอมไพเลอร์แบบเรียลไทม์ในไดรเวอร์ในการจัดระเบียบคำสั่งดังกล่าว[ 10 ]

คอร์ R600 ประกอบด้วยคลัสเตอร์เชเดอร์ 64 คลัสเตอร์ ในขณะที่คอร์ RV610 และ RV630 มีคลัสเตอร์เชเดอร์ 8 และ 24 คลัสเตอร์ตามลำดับ

การสร้างรูปทรงเรขาคณิตด้วยฮาร์ดแวร์

TeraScale ประกอบด้วยหน่วยประมวลผลหลายหน่วยที่สามารถดำเนินการเทสเซลเลชันได้ ซึ่งคล้ายกับหน่วยประมวลผลแบบโปรแกรมได้ของGPU Xenosที่ใช้ใน Xbox 360

การสร้างรูปทรงสามมิติ (Tessellation) ได้รับการกำหนดอย่างเป็นทางการใน API หลักๆ โดยเริ่มจาก DirectX 11 และ OpenGL 4.0 GPU ที่ใช้ TeraScale 1 (ซีรี่ส์ HD 2000, 3000 และ 4000) เป็นไปตามมาตรฐาน Direct3D 10 และ OpenGL 3.3 เท่านั้น ดังนั้นจึงใช้หลักการสร้างรูปทรงสามมิติที่แตกต่างกันซึ่งใช้ส่วนขยาย API เฉพาะของผู้ผลิต[ 11 ] GPU ที่ใช้ TeraScale 2 (เริ่มจากซีรี่ส์ Radeon HD 5000 ) เป็นรุ่นแรกที่เป็นไปตามเทคนิคการสร้างรูปทรงสามมิติของทั้ง Direct3D 11 และ OpenGL 4.0 [ 12 ]แม้ว่าตัวสร้างรูปทรงสามมิติ TeraScale 1 จะมีดีไซน์ที่เรียบง่ายกว่า แต่ AMD อธิบายว่าเป็นส่วนย่อยของมาตรฐานการสร้างรูปทรงสามมิติในภายหลัง[ 13 ]

หน่วยเทสเซลเลเตอร์ TeraScale ช่วยให้นักพัฒนาสามารถนำตาข่ายรูปหลายเหลี่ยมแบบง่ายๆ มาแบ่งย่อยโดยใช้ฟังก์ชันการประเมินพื้นผิวโค้ง มีรูปแบบเทสเซลเลชันที่แตกต่างกัน เช่นพื้นผิว Bézierที่มีN-patches , B-splinesและNURBSและยังมีเทคนิคการแบ่งย่อยพื้นผิวบางอย่าง ซึ่งโดยปกติจะรวมถึงการแมปการกระจัดของพื้นผิวบางประเภท[ 14 ]โดยพื้นฐานแล้ว สิ่งนี้ช่วยให้โมเดลที่มีรูปหลายเหลี่ยมน้อยๆ สามารถเพิ่มความหนาแน่นของรูปหลายเหลี่ยมได้อย่างมากแบบเรียลไทม์โดยมีผลกระทบต่อประสิทธิภาพน้อยมาก Scott Wasson จาก Tech Report ตั้งข้อสังเกตในระหว่างการสาธิตของ AMD ว่าโมเดลที่ได้นั้นมีความหนาแน่นมากด้วยรูปหลายเหลี่ยมหลายล้านรูปจนดูเหมือนเป็นของแข็ง[ 9 ]

ตัวสร้างเทสเซลเลเตอร์ TeraScale ชวนให้นึกถึงATI TruFormซึ่งเป็นชื่อแบรนด์ของหน่วยประมวลผลเทสเซลเลชันฮาร์ดแวร์รุ่นแรกๆ ที่ใช้ในRadeon 8500 ในตอนแรก [ 15 ]

ATI TruFormได้รับความสนใจจากนักพัฒนาซอฟต์แวร์น้อยมาก เกมบางเกม (เช่น Madden NFL 2004 , Serious Sam , Unreal Tournament 2003และ 2004และ Morrowind อย่างไม่เป็นทางการ ) มีการรองรับเทคโนโลยีเทสเซลเลชันของ ATI การปรับตัวที่ช้าเช่นนี้เกี่ยวข้องกับข้อเท็จจริงที่ว่ามันไม่ใช่คุณสมบัติที่ใช้ร่วมกับ GPU ของ NVIDIA เนื่องจาก NVIDIA ได้นำโซลูชันเทสเซลเลชันที่แข่งขันกันมาใช้โดยใช้แพทช์ Quintic-RT ซึ่งได้รับการสนับสนุนจากนักพัฒนาเกมรายใหญ่น้อยกว่า [ 16 ]เนื่องจาก GPU ของ Xbox 360 ใช้สถาปัตยกรรมของ ATI Microsoft จึงมองว่าเทสเซลเลชันพื้นผิวที่เร่งด้วยฮาร์ดแวร์เป็นคุณสมบัติหลักของ GPU สองสามปีต่อมา คุณสมบัติเทสเซลเลชันกลายเป็นข้อบังคับเมื่อมีการเปิดตัว DirectX 11 ในปี 2009 [ 14 ] [ 17 ]

แม้ว่าหลักการเทสเซลเลชันที่นำมาใช้กับ TeraScale จะไม่ได้เป็นส่วนหนึ่งของข้อกำหนด OpenGL 3.3 หรือ Direct3D 10.0 และคู่แข่งอย่างเช่นซีรี่ส์ GeForce 8ขาดฮาร์ดแวร์ที่คล้ายกัน แต่ Microsoft ก็ได้เพิ่มคุณสมบัติเทสเซลเลชันเป็นส่วนหนึ่งของแผนการในอนาคตของ DirectX 10.1 [ 17 ]ในที่สุด Microsoft ก็ได้นำเทสเซลเลชันมาใช้เป็นความสามารถที่จำเป็น ไม่ใช่กับ DirectX 10.1 แต่เป็น DirectX 11 [ 18 ]

เทคโนโลยีการประมวลผลทางเรขาคณิต GCNเป็นโซลูชันล่าสุดของ AMD (ซึ่งได้เข้าซื้อกิจการ GPU ของ ATI) สำหรับการสร้างรูปทรงเรขาคณิตโดยใช้ GPU

ตัวประมวลผลการส่งแบบอัลตร้าเธรด

แม้ว่า R600 จะแตกต่างอย่างมากจากการออกแบบก่อนหน้านี้ แต่ก็ยังคงมีคุณสมบัติหลายอย่างร่วมกับรุ่นก่อนหน้าอย่างRadeon R520 [ 9 ]โปรเซสเซอร์Ultra-Threaded Dispatch Processorเป็นส่วนประกอบทางสถาปัตยกรรมหลักของคอร์ R600 เช่นเดียวกับ GPU Radeon X1000 โปรเซสเซอร์นี้จัดการเธรดจำนวนมากที่กำลังทำงานอยู่สามประเภทที่แตกต่างกัน (vertex, geometry และ pixel shaders) และสลับไปมาระหว่างเธรดเหล่านั้นตามความจำเป็น[ 9 ]ด้วยจำนวนเธรดจำนวนมากที่ได้รับการจัดการพร้อมกัน ทำให้สามารถจัดลำดับเธรดใหม่เพื่อใช้ประโยชน์จาก shaders ได้อย่างเหมาะสมที่สุด กล่าวอีกนัยหนึ่ง โปรเซสเซอร์ dispatch จะประเมินสิ่งที่จะเกิดขึ้นในส่วนอื่นๆ ของ R600 และพยายามรักษาประสิทธิภาพการประมวลผลให้สูงที่สุดเท่าที่จะเป็นไปได้ นอกจากนี้ยังมีการจัดการในระดับที่ต่ำกว่าด้วย โดยแต่ละอาร์เรย์ SIMD ของโปรเซสเซอร์สตรีม 80 ตัวจะมี sequencer และ arbiter ของตัวเอง arbiter จะตัดสินใจว่าจะประมวลผลเธรดใดต่อไป ในขณะที่ sequencer พยายามจัดลำดับคำสั่งใหม่เพื่อให้ได้ประสิทธิภาพที่ดีที่สุดภายในแต่ละเธรด[ 9 ]

การสร้างพื้นผิวและการลดรอยหยัก

การสร้างพื้นผิวและเอาต์พุตสุดท้ายบนคอร์ R600 นั้นคล้ายคลึงกันแต่ก็แตกต่างจาก R580 ด้วยเช่นกัน R600 มีหน่วยประมวลผลพื้นผิว 4 หน่วยที่แยกออกจากกัน (เป็นอิสระ) จากคอร์ shader เช่นเดียวกับใน GPU R520 และ R580 [ 9 ] หน่วยเอาต์พุตการเรนเดอร์ (ROPs) ของซีรี่ส์ Radeon HD 2000 ในปัจจุบันทำหน้าที่ลดรอยหยักแบบหลายตัวอย่าง (MSAA) โดยใช้กริดตัวอย่างที่ตั้งโปรแกรมได้ซึ่งมีจุดตัวอย่างสูงสุด 8 จุด แทนที่จะใช้พิกเซล shaders เหมือนในซีรี่ส์ Radeon X1000นอกจากนี้ยังมีคุณสมบัติใหม่คือความสามารถในการกรองพื้นผิว FP16 ซึ่งเป็นที่นิยมในการ จัดแสง HDRด้วยความเร็วเต็มที่ ROPs ยังสามารถทำการ กรอง แบบ trilinearและanisotropicบนรูปแบบพื้นผิวทั้งหมด บน R600s จะมีพิกเซลทั้งหมด 16 พิกเซลต่อรอบสัญญาณนาฬิกาสำหรับพื้นผิว FP16 ในขณะที่พื้นผิว FP32 ที่มีความแม่นยำสูงกว่าจะกรองด้วยความเร็วครึ่งหนึ่ง (8 พิกเซลต่อรอบสัญญาณนาฬิกา) [ 9 ]

ความสามารถในการป้องกันการเกิดรอยหยัก (Anti-aliasing) บน R600 มีประสิทธิภาพมากกว่าซีรี่ส์ R520 นอกจากความสามารถในการทำ 8× MSAA ซึ่งเพิ่มขึ้นจาก 6× MSAA ใน R300 ถึง R580 แล้ว R600 ยังมี โหมด ป้องกันการเกิดรอยหยักด้วยฟิลเตอร์แบบกำหนดเอง (CFAA) ใหม่ CFAA หมายถึงการใช้งานฟิลเตอร์ที่ไม่ใช่แบบกล่อง ซึ่งจะพิจารณาพิกเซลรอบๆ พิกเซลที่กำลังประมวลผลเพื่อคำนวณสีสุดท้ายและป้องกันการเกิดรอยหยักของภาพ[ 10 ] CFAA ทำงานโดยใช้ shaders แทนที่จะใช้ ROPs ซึ่งทำให้การเขียนโปรแกรมมีประสิทธิภาพมากขึ้นเนื่องจากสามารถปรับแต่งฟิลเตอร์ได้ แต่ก็อาจทำให้เกิดปัญหาด้านประสิทธิภาพเนื่องจากการใช้ทรัพยากร shader ณ เวลาที่เปิดตัว R600 CFAA ใช้ฟิลเตอร์แบบกว้างและแคบ โดยตัวอย่างจากภายนอกพิกเซลที่กำลังประมวลผลจะถูกถ่วงน้ำหนักเชิงเส้นตามระยะห่างจากจุดศูนย์กลางของพิกเซลนั้น โดยฟังก์ชันเชิงเส้นจะถูกปรับตามฟิลเตอร์แบบกว้างหรือแคบที่เลือก[ 10 ]

ตัวควบคุมหน่วยความจำ

ตัวควบคุมหน่วยความจำเชื่อมต่อผ่านบัสวงแหวนแบบสองทิศทางภายในที่พันรอบโปรเซสเซอร์ ใน Radeon HD 2900 บัสวงแหวนนี้เป็นแบบสองทิศทางขนาด 1,024 บิต (อ่าน 512 บิตและเขียน 512 บิต) โดยมีช่องหน่วยความจำ 64 บิต 8 ช่อง ทำให้ความกว้างของบัสรวมเป็น 512 บิตบน 2900 XT [ 9 ]ใน Radeon HD 3800 บัสวงแหวนนี้เป็นแบบ 512 บิต ใน Radeon HD 2600 และ HD 3600 บัสวงแหวนนี้เป็นแบบ 256 บิต และใน Radeon HD 2400 และ HD 3400 ไม่มีบัสวงแหวน

การอัปเดตครึ่งรุ่น

ซีรี่ส์นี้ได้รับการอัปเดตครึ่งรุ่นด้วยการลดขนาดชิป (55 นาโนเมตร) รุ่นต่างๆ ได้แก่ RV670, RV635 และ RV620 ทุกรุ่นรองรับ PCI Express 2.0, DirectX 10.1 พร้อมคุณสมบัติ Shader Model 4.1, OpenGL 3.3, ตัวถอดรหัสวิดีโอแบบรวม ATI (UVD) เฉพาะสำหรับทุกรุ่น[ 19 ]และเทคโนโลยี PowerPlayสำหรับการ์ดวิดีโอเดสก์ท็อป[ 20 ]

ยกเว้นซีรี่ส์ Radeon HD 3800 ทุกรุ่นรองรับเอาต์พุต DisplayPort ในตัว 2 ช่องสัญญาณ รองรับจอแสดงผล 24 และ 30 บิต สำหรับความละเอียดสูงสุด 2,560×1,600 พิกเซล แต่ละเอาต์พุตมี 1, 2 หรือ 4 เลนต่อเอาต์พุต โดยมีอัตราการส่งข้อมูลสูงสุด 2.7 Gbit/s ต่อเลน

ATI อ้างว่าการสนับสนุน DirectX 10.1 จะนำมาซึ่งประสิทธิภาพและประสิทธิภาพการประมวลผลที่ดีขึ้น พร้อมลดข้อผิดพลาดในการปัดเศษ (0.5  ULPเมื่อเทียบกับข้อผิดพลาดเฉลี่ย 1.0 ULP ซึ่งถือเป็นข้อผิดพลาดที่ยอมรับได้) รายละเอียดและคุณภาพของภาพที่ดีขึ้น และการส่องสว่างทั่วโลก (เทคนิคที่ใช้ในภาพยนตร์แอนิเมชั่นและอื่นๆ ซึ่งมอบประสบการณ์การเล่นเกมที่สมจริงยิ่งขึ้น[ 21 ] )

การ์ดแสดงผล

เทราสเกล 2 (VLIW5)

เทราสเกล 2
วันที่วางจำหน่ายกันยายน 2552 ( กันยายน 2552 )
ประวัติศาสตร์
ผู้มาก่อนเทราสเกล 1
ผู้สืบทอดเทราสเกล 3
สถานะการสนับสนุน
ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่กลางปี ​​2015 (ไดรเวอร์ Windows เวอร์ชันสุดท้าย 15.7.1 สำหรับWindows 7 , 8.1และ10ภายใต้ชื่อ "Catalyst" และเวอร์ชันเบต้า 16.2.1 ภายใต้ชื่อ "Radeon Software")

TeraScale 2 (VLIW5) เปิดตัวพร้อมกับ GPU ซีรี่ส์ Radeon HD 5000ในรุ่น "Evergreen" ในปี 2009

ในงาน HPG10 Mark Fowler ได้นำเสนอสถาปัตยกรรม "Evergreen" และระบุว่า เช่น 5870 (Cypress), 5770 (Juniper) และ 5670 (Redwood) รองรับความละเอียดสูงสุด 6 เท่าของ 2560×1600 พิกเซล ในขณะที่ 5470 (Cedar) รองรับ 4 เท่าของ 2560×1600 พิกเซล ซึ่งมีความสำคัญต่อการรองรับจอภาพหลายจอของ AMD Eyefinity [ 22 ]

ด้วยการเปิดตัวCypress สถาปัตยกรรมของ เอ็นจิ้นกราฟิก Terascaleได้รับการอัปเกรดด้วยจำนวนสตรีมคอร์ หน่วยประมวลผลพื้นผิว และหน่วยประมวลผล ROP ที่เพิ่มขึ้นเป็นสองเท่าเมื่อเทียบกับ RV770 สถาปัตยกรรมของสตรีมคอร์ยังคงไม่เปลี่ยนแปลงมากนัก แต่เพิ่มการรองรับความสามารถของ DirectX 11/ DirectCompute 11 ด้วยคำสั่งใหม่[ 23 ]และการรองรับ OpenGL 4.5 อย่างเต็มรูปแบบ[ 24 ]เช่นเดียวกับ RV770 หน่วยประมวลผลพื้นผิวสี่หน่วยจะเชื่อมโยงกับสตรีมคอร์ 16 คอร์ (แต่ละคอร์มีหน่วยประมวลผลห้าหน่วย รวมเป็นหน่วยประมวลผลทั้งหมด 80 หน่วย) การรวมกันนี้เรียกว่าSIMD คอร์

แตกต่างจาก Radeon R700รุ่นก่อนหน้าเนื่องจาก DirectX 11 กำหนดให้ผู้พัฒนาสามารถควบคุมการแทรกสอดได้อย่างเต็มที่ จึงได้ลบตัวแทรกสอดเฉพาะออก และหันมาใช้คอร์ SIMD แทน คอร์สตรีมสามารถจัดการ คำสั่งการ คูณบวกแบบรวม (FMA) ที่มีความแม่นยำในการปัดเศษสูงกว่าได้ทั้งในความแม่นยำเดี่ยวและคู่ ซึ่งเพิ่มความแม่นยำมากกว่าการคูณบวก (MAD) และเป็นไปตามมาตรฐานIEEE 754-2008 [ 25 ]คำสั่งผลรวมของความแตกต่างสัมบูรณ์ (SAD) ได้ถูกเพิ่มเข้าไปในโปรเซสเซอร์โดยตรง คำสั่งนี้สามารถใช้เพื่อปรับปรุงประสิทธิภาพของกระบวนการบางอย่างได้อย่างมาก เช่น การเข้ารหัสและการแปลงรหัสวิดีโอในเอ็นจิ้น 3 มิติ แต่ละคอร์ SIMD มีส่วนแบ่งข้อมูลภายใน 32 KiB และแคช L1 ขนาด 8 KiB [ 23 ]ในขณะที่คอร์ SIMD ทั้งหมดใช้ส่วนแบ่งข้อมูลทั่วโลก 64 KiB ร่วมกัน

ตัวควบคุมหน่วยความจำ

ตัวควบคุมหน่วยความจำแต่ละตัว จะเชื่อมต่อกับ ROPสี่ตัวหนึ่งตัวต่อช่อง 64 บิต และแคช L2 ขนาด 512 KiB เฉพาะ[ 23 ]

การประหยัดพลังงาน

รองรับโปรแกรม AMD PowerPlay ซึ่งประกอบด้วยการปรับความถี่แบบไดนามิกและเทคโนโลยีอื่นๆ อีกหลายอย่างที่มีเป้าหมายเพื่อลดการใช้พลังงาน

ชิป

  • ชิปส์เอเวอร์กรีน:
    • ซีดาร์ RV810
    • ไซเพรส RV870
    • เฮมล็อก R800
    • จูนิเปอร์ RV840
    • เรดวูด RV830
  • มันฝรั่งทอดกรอบจากหมู่เกาะทางเหนือ:
    • บาร์ตส์ RV940
    • ไคคอส RV910
    • เครื่องบินรบ Turks RV930
  • APU ที่มี IGP ระดับ TeraScale 2:
    • ลลาโน
    • ออนแทรีโอ
    • ซาคาเต้

เทราสเกล 3 (VLIW4)

เทราสเกล 3
วันที่วางจำหน่ายตุลาคม 2553 ( ตุลาคม 2553 )
ประวัติศาสตร์
ผู้มาก่อนเทราสเกล 2
ผู้สืบทอดกราฟิกคอร์เน็กซ์ 1
สถานะการสนับสนุน
ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่กลางปี ​​2015 (ไดรเวอร์ Windows เวอร์ชันสุดท้าย 15.7.1 สำหรับWindows 7 , 8.1และ10ภายใต้ชื่อ "Catalyst" และเวอร์ชันเบต้า 16.2.1 ภายใต้ชื่อ "Radeon Software")

TeraScale 3 (VLIW4) แทนที่การออกแบบ VLIW แบบ 5 ทางก่อนหน้านี้ด้วยการออกแบบ VLIW แบบ 4 ทาง การออกแบบใหม่นี้ยังรวมหน่วยเทสเซลเลชันเพิ่มเติมเพื่อปรับปรุงประสิทธิภาพของ Direct3D 11 รองรับ Direct3D 11 พร้อม Shader Model 5.0 และ OpenGL 4.5 บน Windows [ 26 ]

เทคโนโลยี TeraScale 3 ถูกนำมาใช้ใน กราฟิกการ์ด Radeon HD 6900ในปี 2010 และยังถูกนำไปใช้ในAPU รุ่น Trinity และ Richland อีกด้วย

การประหยัดพลังงาน

สถาปัตยกรรมของ PowerTune เวอร์ชันใหม่กว่าที่เปิดตัวพร้อมกับชิปGCN1.1

AMD PowerTune ซึ่งเป็นการปรับความถี่แบบไดนามิกสำหรับ GPU ได้รับการแนะนำพร้อมกับRadeon HD 6900 series เมื่อวันที่ 15 ธันวาคม 2010 และได้รับการพัฒนาอย่างต่อเนื่อง ดังที่บันทึกไว้ในบทวิจารณ์บางส่วนโดยAnandTech [ 27 ] [ 28 ] [ 29 ] [ 30 ]

ชิป

  • มันฝรั่งทอดกรอบจากหมู่เกาะทางเหนือ:
    • เคย์แมน RV970
    • แอนทิลลีส อาร์900
    • อาคาร Trinity และ Richland มีหน่วยประมวลผลกราฟิก TeraScale 3 IGP

ผู้สืบทอด

ในงาน HPG11เมื่อเดือนสิงหาคม 2011 พนักงาน AMD Michael Mantor (สถาปนิกอาวุโส) และ Mike Houston (สถาปนิก) ได้นำเสนอGraphics Core Nextซึ่งเป็นสถาปัตยกรรมไมโครที่ต่อจาก TeraScale [ 31 ]

การเปรียบเทียบชิป TeraScale

สถาปัตยกรรมไมโคร เทราสเกล 1 เทราสเกล 2 เทราสเกล 3
ชิป1600 แรนด์ RV610 RV620 RV630 RV635 RV670 RV710 RV711 RV730 RV740 RV770 RV790 ซีดาร์(RV810) เรดวูด(RV830) จูนิเปอร์(RV840) ไซเปรส(RV870) ไคคอส(RV910) ชาวเติร์ก(RV930) บาร์ตส์(RV940) เคย์แมน(RV970)
ชื่อรหัสเปเล่ลากาคูปาชากาวาริโอบูมลุยจิมาริโอวอลเดนเวกิวาสปาร์ตัน??????วิคตอเรีย?
รุ่นชิป ไม่มีข้อมูลเอ็ม72 เอ็ม74 เอ็ม82 เอ็ม76 เอ็ม86 เอ็ม88 เอ็ม92 เอ็ม93 เอ็ม96 เอ็ม97 เอ็ม98 ไม่มีข้อมูลพาร์ค ร็อบสัน คาปิลาโนเมดิสันไพน์วูด บรอดเวย์แกรนวิลล์ เฮมล็อก เล็กซิงตัน เซย์มัวร์ โอเนกาเทมส์วิสเลอร์ แบล็คคอมบ์ แอนทิลลีส
แฟบ (นาโนเมตร) 80 65 55 65 55 40 55 40
ขนาดแม่พิมพ์ (มม. ² ) 42085 / 82 (M74)67153135192731461372562825910416633467118 / 104 (แม่น้ำเทมส์, วิสเลอร์)255 / 212 (แบล็กคอมบ์)389
ทรานซิสเตอร์ (ล้าน) 7201801813903786662425148269569592926271,0402,1543707161,7002,640
ความหนาแน่นของทรานซิสเตอร์(MTr/ mm² ) 1.72.1 / 2.2 (M74)2.72.52.83.53.33.56.03.73.44.96.06.36.45.56.1 / 6.9 (แม่น้ำเทมส์, วิสเลอร์)6.7 / 8.0 (แบล็คคอมบ์)6.8
หน่วยคำนวณ 423414810251020/5 (เลกซิงตัน)261424
ตัวประมวลผลเธรด 164816832408204080 / 20 (เลกซิงตัน)8245696
ตัวประมวลผลสตรีม3204012032080320640800804008001600 / 400 (เล็กซิงตัน)16048011201536
หน่วยการแมปพื้นผิว164816832408204080 / 20 (เลกซิงตัน)8245696
หน่วยแสดงผล164164816481632 / 8 (เลกซิงตัน)483232
Z/สเตนซิล โอพีเอส3283243264440163240128
แคช L1  (KB) 32 ต่อ 4 SP (ตัวประมวลผลสตรีม)16 ต่อ CU (หน่วยประมวลผล)8 ต่อ CU
แคช L2 (KB) 256326412825664128256128256512 / 256 (เลกซิงตัน)128256512
แสดงผลเอนจินหลัก 2.03.02.03.02.03.23.14.05.0
ตัวถอดรหัสวิดีโอแบบรวมอาวิโว่ เอชดี1.02.22.02.33.1
การเปิดตัวครั้งแรก พฤษภาคม 2550มกราคม 2550มกราคม 2551มิถุนายน 2550มกราคม 2551พฤศจิกายน 2550กันยายน 2551พฤษภาคม 2553กันยายน 2551เมษายน 2552มิถุนายน 2551เมษายน 2552กุมภาพันธ์ 2553มกราคม 2553ตุลาคม 2552กันยายน 2552กุมภาพันธ์ 2554ตุลาคม 2553ธันวาคม 2010
ชุด R600 ( Radeon HD 2000 / Radeon HD 3000 ) R700 ( Radeon HD 4000 ) เอเวอร์กรีน ( Radeon HD 5000 ) หมู่เกาะนอร์เทิร์น ( Radeon HD 6000 )
เอกสารอ้างอิง [ 32 ] [ 33 ][ 34 ] [ 35 ] [ 36 ] [ 37 ][ 38 ] [ 39 ] [ 40 ][ 41 ] [ 42 ] [ 43 ][ 44 ] [ 45 ] [ 46 ][ 47 ] [ 48 ] [ 49 ][ 50 ] [ 51 ] [ 52 ][ 53 ] [ 54 ][ 55 ] [ 56 ] [ 57 ][ 58 ] [ 59 ] [ 60 ][ 61 ] [ 62 ] [ 63 ][ 64 ] [ 65 ][ 66 ] [ 67 ] [ 68 ] [ 69 ][ 70 ] [ 71 ] [ 72 ] [ 73 ] [ 74 ][ 75 ] [ 76 ] [ 77 ][ 78 ] [ 79 ] [ 80 ] [ 81 ][ 82 ] [ 83 ] [ 84 ][ 85 ] [ 86 ] [ 87 ] [ 88 ] [ 89 ][ 90 ] [ 91 ] [ 92 ][ 93 ] [ 94 ] [ 95 ]

1ชิป Duo เช่น R680 (2x RV670) และ R700 (2x RV770) ไม่ได้อยู่ในรายการ[ 96 ] [ 97 ] [ 98 ] [ 99 ]

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=TeraScale_(microarchitecture)&oldid=1327108288#TeraScale_2 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ เทราสเคล (สถาปัตยกรรมระดับไมโคร)

TeraScale เป็นชื่อรหัสสำหรับตระกูล สถาปัตยกรรมไมโคร หน่วยประมวลผลกราฟิก ที่พัฒนาโดย ATI Technologies / AMD และเป็น สถาปัตยกรรมไมโครตัว ที่สอง ที่ใช้ โมเดล shader แบบรวมต่อ จาก...

เทราสเกล 1 (VLIW5)

TeraScale ได้รับการประกาศและวางจำหน่ายครั้งแรกพร้อมกับ Radeon HD 2000 series ในปี 2007 ในงาน SIGGRAPH 08 ในเดือนธันวาคม 2008 ไมค์ ฮูสตัน พนักงาน ของ AMD ได้อธิบายรายละเอียดบางส่วนของสถาปัตยกรรมไมโคร TeraScale [ 6 ]

เชเดอร์แบบรวม

สถาปัตยกรรม GPU รุ่นก่อนหน้าใช้ไปป์ไลน์แบบตายตัว กล่าวคือ มีโปรเซสเซอร์ shader ที่แยกต่างหากสำหรับ shader แต่ละประเภท TeraScale ใช้ประโยชน์จากโปรเซสเซอร์ shader ที่ยืดหยุ่นจำนวนมาก ซึ่งสามารถกำหนดเวลาให้ประมวลผล shader ประเภทต่างๆ ได้ ทำให้เพิ่มปริมาณงานของ...

การสร้างรูปทรงเรขาคณิตด้วยฮาร์ดแวร์

TeraScale ประกอบด้วยหน่วยประมวลผลหลายหน่วยที่สามารถดำเนินการ เทสเซลเลชัน ได้ ซึ่งคล้ายกับหน่วยประมวลผลแบบโปรแกรมได้ของ GPU Xenos ที่ใช้ใน Xbox 360