เทราสเคล (สถาปัตยกรรมระดับไมโคร)

Q: เทราสเกล 1 (VLIW5)

TeraScale ได้รับการประกาศและวางจำหน่ายครั้งแรกพร้อมกับ Radeon HD 2000 series ในปี 2007 ในงาน SIGGRAPH 08 ในเดือนธันวาคม 2008 ไมค์ ฮูสตัน พนักงาน ของ AMD ได้อธิบายรายละเอียดบางส่วนของสถาปัตยกรรมไมโคร TeraScale [ 6 ]

เทราสเกล 3
วันที่วางจำหน่าย	ตุลาคม 2553
ประวัติศาสตร์
ผู้มาก่อน	เทราสเกล 2
ผู้สืบทอด	กราฟิกคอร์เน็กซ์ 1
สถานะการสนับสนุน
	ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่กลางปี 2015 (ไดรเวอร์ Windows เวอร์ชันสุดท้าย 15.7.1 สำหรับWindows 7 , 8.1และ10ภายใต้ชื่อ "Catalyst" และเวอร์ชันเบต้า 16.2.1 ภายใต้ชื่อ "Radeon Software")

เทราสเกล 2
วันที่วางจำหน่าย	กันยายน 2552
ประวัติศาสตร์
ผู้มาก่อน	เทราสเกล 1
ผู้สืบทอด	เทราสเกล 3
สถานะการสนับสนุน
	ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่กลางปี 2015 (ไดรเวอร์ Windows เวอร์ชันสุดท้าย 15.7.1 สำหรับWindows 7 , 8.1และ10ภายใต้ชื่อ "Catalyst" และเวอร์ชันเบต้า 16.2.1 ภายใต้ชื่อ "Radeon Software")

เทราสเกล 1
วันที่วางจำหน่าย	พฤษภาคม 2550
ประวัติศาสตร์
ผู้มาก่อน	ไม่เป็นที่ทราบกันโดยทั่วไป
ผู้สืบทอด	เทราสเกล 2
สถานะการสนับสนุน
	ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่ปลายปี 2013 (เวอร์ชันไดรเวอร์ Windows สุดท้าย: 13.9 สำหรับWindows Vistaและ7 , 13.1 สำหรับWindows 8และ 13.4 เวอร์ชันเบต้าสำหรับWindows XPและ 8)

TeraScaleเป็นชื่อรหัสสำหรับตระกูลสถาปัตยกรรมไมโคร หน่วยประมวลผลกราฟิก ที่พัฒนาโดยATI Technologies / AMDและเป็นสถาปัตยกรรมไมโครตัว ที่สอง ที่ใช้โมเดล shader แบบรวมต่อจากXenos TeraScale เข้ามาแทนที่สถาปัตยกรรมไมโครแบบ fixed-pipelineเดิมและแข่งขันโดยตรงกับสถาปัตยกรรมไมโคร shader แบบรวมตัวแรกของ Nvidia ที่ชื่อTesla ^[¹^]^[²^]

เทคโนโลยี TeraScale ถูกนำไปใช้ในRadeon HD 2000ที่ผลิตด้วยกระบวนการ 80 นาโนเมตรและ65 นาโนเมตร , Radeon HD 3000ที่ผลิตด้วยกระบวนการ 65 นาโนเมตรและ 55 นาโนเมตร, Radeon HD 4000 ที่ผลิต ด้วยกระบวนการ 55 นาโนเมตรและ 40 นาโนเมตร, Radeon HD 5000และRadeon HD 6000ที่ผลิตด้วยกระบวนการ 40 นาโนเมตร นอกจากนี้ TeraScale ยังถูกใช้ในหน่วยประมวลผลเร่งความเร็วของ AMDที่มีชื่อรหัสว่า "Brazos", "Llano", "Trinity" และ "Richland" และยังพบ TeraScale ในการ์ดจอแบรนด์ต่อๆ มาบางรุ่นอีกด้วย

TeraScale เป็น สถาปัตยกรรม VLIW SIMDในขณะที่ Tesla เป็น สถาปัตยกรรม RISC SIMD ซึ่งคล้ายกับGraphics Core Next ซึ่ง เป็นรุ่นต่อจาก TeraScale TeraScale ใช้HyperZ ^{[ 3 ]}

ตัวสร้างโค้ด LLVM (เช่น ส่วนหลังของคอมไพเลอร์) พร้อมใช้งานสำหรับ TeraScale ^{[ 4 ]}แต่ดูเหมือนว่าจะไม่มีอยู่ในเมทริกซ์ของ LLVM ^{[ 5 ]}เช่นMesa 3Dใช้ประโยชน์จากสิ่งนี้

เทราสเกล 1 (VLIW5)

TeraScale ได้รับการประกาศและวางจำหน่ายครั้งแรกพร้อมกับRadeon HD 2000 seriesในปี 2007 ในงานSIGGRAPH 08ในเดือนธันวาคม 2008 ไมค์ ฮูสตัน พนักงาน ของ AMDได้อธิบายรายละเอียดบางส่วนของสถาปัตยกรรมไมโคร TeraScale ^{[ 6 ]}

ในงาน FOSDEM09 Matthias Hopf จากSUSE Linux ซึ่งเป็นพันธมิตรทางเทคโนโลยีของ AMD ได้นำเสนอสไลด์เกี่ยวกับการเขียนโปรแกรมไดรเวอร์โอเพนซอร์สสำหรับ R600 ^{[ 7 ]}

เชเดอร์แบบรวม

สถาปัตยกรรม GPU รุ่นก่อนหน้าใช้ไปป์ไลน์แบบตายตัว กล่าวคือ มีโปรเซสเซอร์ shader ที่แยกต่างหากสำหรับshader แต่ละประเภท TeraScale ใช้ประโยชน์จากโปรเซสเซอร์ shader ที่ยืดหยุ่นจำนวนมาก ซึ่งสามารถกำหนดเวลาให้ประมวลผล shader ประเภทต่างๆ ได้ ทำให้เพิ่มปริมาณงานของ GPU อย่างมีนัยสำคัญ (ขึ้นอยู่กับส่วนผสมของคำสั่งแอปพลิเคชันดังที่กล่าวไว้ด้านล่าง) คอร์ R600 ประมวลผล vertex, geometry และ pixel shader ตามที่ระบุไว้ใน ข้อกำหนด Direct3D 10.0 สำหรับShader Model 4.0 นอกเหนือจาก การสนับสนุน OpenGL 3.3 อย่างเต็มรูปแบบ ^{[ 8 ]}

ฟังก์ชัน shader แบบรวมใหม่นี้ใช้ สถาปัตยกรรม คำสั่งยาวมาก (VLIW) ซึ่งแกนหลักจะดำเนินการแบบขนาน^{[ 9 ]}

กลุ่มเชเดอร์ถูกจัดระเบียบเป็นหน่วยประมวลผลสตรีม 5 หน่วย แต่ละหน่วยประมวลผลสตรีมสามารถประมวลผลคำสั่ง MAD (หรือ ADD หรือ MUL) จุดลอยตัวความแม่นยำเดี่ยวที่เสร็จสมบูรณ์ได้ต่อรอบสัญญาณนาฬิกาผลคูณดอท (DP และกรณีพิเศษโดยการรวม ALU) และการบวกจำนวนเต็ม^{[ 10 ]}หน่วยที่ 5 มีความซับซ้อนมากขึ้นและสามารถจัดการฟังก์ชันทรานสเซนเดนทัล พิเศษเพิ่มเติมได้ เช่นไซน์และโคไซน์^{[ 10 ]}แต่ละกลุ่มเชเดอร์สามารถดำเนินการคำสั่งได้ 6 คำสั่งต่อรอบสัญญาณนาฬิกา (สูงสุด) ซึ่งประกอบด้วยคำสั่งเชเดอร์ 5 คำสั่งบวกการแตกสาขา 1 คำ^สั่ง^[ 10 ^]

ที่น่าสังเกตคือ สถาปัตยกรรม VLIW นำมาซึ่งความท้าทายแบบคลาสสิกบางประการที่มีอยู่ในการออกแบบ VLIW โดยเฉพาะอย่างยิ่งการรักษาการไหลของคำสั่งให้เหมาะสมที่สุด^{[ 9 ]}นอกจากนี้ ชิปไม่สามารถออกคำสั่งพร้อมกันได้เมื่อคำสั่งหนึ่งขึ้นอยู่กับผลลัพธ์ของอีกคำสั่งหนึ่ง ประสิทธิภาพของ GPU ขึ้นอยู่กับส่วนผสมของคำสั่งที่แอปพลิเคชันใช้ และความสามารถของคอมไพเลอร์แบบเรียลไทม์ในไดรเวอร์ในการจัดระเบียบคำสั่งดังกล่าว^{[ 10 ]}

คอร์ R600 ประกอบด้วยคลัสเตอร์เชเดอร์ 64 คลัสเตอร์ ในขณะที่คอร์ RV610 และ RV630 มีคลัสเตอร์เชเดอร์ 8 และ 24 คลัสเตอร์ตามลำดับ

การสร้างรูปทรงเรขาคณิตด้วยฮาร์ดแวร์

TeraScale ประกอบด้วยหน่วยประมวลผลหลายหน่วยที่สามารถดำเนินการเทสเซลเลชันได้ ซึ่งคล้ายกับหน่วยประมวลผลแบบโปรแกรมได้ของGPU Xenosที่ใช้ใน Xbox 360

การสร้างรูปทรงสามมิติ (Tessellation) ได้รับการกำหนดอย่างเป็นทางการใน API หลักๆ โดยเริ่มจาก DirectX 11 และ OpenGL 4.0 GPU ที่ใช้ TeraScale 1 (ซีรี่ส์ HD 2000, 3000 และ 4000) เป็นไปตามมาตรฐาน Direct3D 10 และ OpenGL 3.3 เท่านั้น ดังนั้นจึงใช้หลักการสร้างรูปทรงสามมิติที่แตกต่างกันซึ่งใช้ส่วนขยาย API เฉพาะของผู้ผลิต^{[ 11 ]} GPU ที่ใช้ TeraScale 2 (เริ่มจากซีรี่ส์ Radeon HD 5000 ) เป็นรุ่นแรกที่เป็นไปตามเทคนิคการสร้างรูปทรงสามมิติของทั้ง Direct3D 11 และ OpenGL 4.0 ^{[ 12 ]}แม้ว่าตัวสร้างรูปทรงสามมิติ TeraScale 1 จะมีดีไซน์ที่เรียบง่ายกว่า แต่ AMD อธิบายว่าเป็นส่วนย่อยของมาตรฐานการสร้างรูปทรงสามมิติในภายหลัง^{[ 13 ]}

หน่วยเทสเซลเลเตอร์ TeraScale ช่วยให้นักพัฒนาสามารถนำตาข่ายรูปหลายเหลี่ยมแบบง่ายๆ มาแบ่งย่อยโดยใช้ฟังก์ชันการประเมินพื้นผิวโค้ง มีรูปแบบเทสเซลเลชันที่แตกต่างกัน เช่นพื้นผิว Bézierที่มีN-patches , B-splinesและNURBSและยังมีเทคนิคการแบ่งย่อยพื้นผิวบางอย่าง ซึ่งโดยปกติจะรวมถึงการแมปการกระจัดของพื้นผิวบางประเภท^{[ 14 ]}โดยพื้นฐานแล้ว สิ่งนี้ช่วยให้โมเดลที่มีรูปหลายเหลี่ยมน้อยๆ สามารถเพิ่มความหนาแน่นของรูปหลายเหลี่ยมได้อย่างมากแบบเรียลไทม์โดยมีผลกระทบต่อประสิทธิภาพน้อยมาก Scott Wasson จาก Tech Report ตั้งข้อสังเกตในระหว่างการสาธิตของ AMD ว่าโมเดลที่ได้นั้นมีความหนาแน่นมากด้วยรูปหลายเหลี่ยมหลายล้านรูปจนดูเหมือนเป็นของแข็ง^{[ 9 ]}

ตัวสร้างเทสเซลเลเตอร์ TeraScale ชวนให้นึกถึงATI TruFormซึ่งเป็นชื่อแบรนด์ของหน่วยประมวลผลเทสเซลเลชันฮาร์ดแวร์รุ่นแรกๆ ที่ใช้ใน^Radeon 8500 ในตอนแรก [ ¹⁵^]

ATI TruFormได้รับความสนใจจากนักพัฒนาซอฟต์แวร์น้อยมาก เกมบางเกม (เช่น Madden NFL 2004 , Serious Sam , Unreal Tournament 2003และ 2004และ Morrowind อย่างไม่เป็นทางการ ) มีการรองรับเทคโนโลยีเทสเซลเลชันของ ATI การปรับตัวที่ช้าเช่นนี้เกี่ยวข้องกับข้อเท็จจริงที่ว่ามันไม่ใช่คุณสมบัติที่ใช้ร่วมกับ GPU ของ NVIDIA เนื่องจาก NVIDIA ได้นำโซลูชันเทสเซลเลชันที่แข่งขันกันมาใช้โดยใช้แพทช์ Quintic-RT ซึ่งได้รับการสนับสนุนจากนักพัฒนาเกมรายใหญ่น้อยกว่า^{[ 16 ]}เนื่องจาก GPU ของ Xbox 360 ใช้สถาปัตยกรรมของ ATI Microsoft จึงมองว่าเทสเซลเลชันพื้นผิวที่เร่งด้วยฮาร์ดแวร์เป็นคุณสมบัติหลักของ GPU สองสามปีต่อมา คุณสมบัติเทสเซลเลชันกลายเป็นข้อบังคับเมื่อมีการเปิดตัว DirectX 11 ในปี 2009^{[ 14 ]}^{[ 17 ]}

แม้ว่าหลักการเทสเซลเลชันที่นำมาใช้กับ TeraScale จะไม่ได้เป็นส่วนหนึ่งของข้อกำหนด OpenGL 3.3 หรือ Direct3D 10.0 และคู่แข่งอย่างเช่นซีรี่ส์ GeForce 8ขาดฮาร์ดแวร์ที่คล้ายกัน แต่ Microsoft ก็ได้เพิ่มคุณสมบัติเทสเซลเลชันเป็นส่วนหนึ่งของแผนการในอนาคตของ DirectX 10.1 ^{[ 17 ]}ในที่สุด Microsoft ก็ได้นำเทสเซลเลชันมาใช้เป็นความสามารถที่จำเป็น ไม่ใช่กับ DirectX 10.1 แต่เป็น DirectX 11 ^{[ 18 ]}

เทคโนโลยีการประมวลผลทางเรขาคณิต GCNเป็นโซลูชันล่าสุดของ AMD (ซึ่งได้เข้าซื้อกิจการ GPU ของ ATI) สำหรับการสร้างรูปทรงเรขาคณิตโดยใช้ GPU

ตัวประมวลผลการส่งแบบอัลตร้าเธรด

แม้ว่า R600 จะแตกต่างอย่างมากจากการออกแบบก่อนหน้านี้ แต่ก็ยังคงมีคุณสมบัติหลายอย่างร่วมกับรุ่นก่อนหน้าอย่างRadeon R520 ^{[ 9 ]}โปรเซสเซอร์Ultra-Threaded Dispatch Processorเป็นส่วนประกอบทางสถาปัตยกรรมหลักของคอร์ R600 เช่นเดียวกับ GPU Radeon X1000 โปรเซสเซอร์นี้จัดการเธรดจำนวนมากที่กำลังทำงานอยู่สามประเภทที่แตกต่างกัน (vertex, geometry และ pixel shaders) และสลับไปมาระหว่างเธรดเหล่านั้นตามความจำเป็น^{[ 9 ]}ด้วยจำนวนเธรดจำนวนมากที่ได้รับการจัดการพร้อมกัน ทำให้สามารถจัดลำดับเธรดใหม่เพื่อใช้ประโยชน์จาก shaders ได้อย่างเหมาะสมที่สุด กล่าวอีกนัยหนึ่ง โปรเซสเซอร์ dispatch จะประเมินสิ่งที่จะเกิดขึ้นในส่วนอื่นๆ ของ R600 และพยายามรักษาประสิทธิภาพการประมวลผลให้สูงที่สุดเท่าที่จะเป็นไปได้ นอกจากนี้ยังมีการจัดการในระดับที่ต่ำกว่าด้วย โดยแต่ละอาร์เรย์ SIMD ของโปรเซสเซอร์สตรีม 80 ตัวจะมี sequencer และ arbiter ของตัวเอง arbiter จะตัดสินใจว่าจะประมวลผลเธรดใดต่อไป ในขณะที่ sequencer พยายามจัดลำดับคำสั่งใหม่เพื่อให้ได้ประสิทธิภาพที่ดีที่สุดภายในแต่ละเธรด^{[ 9 ]}

การสร้างพื้นผิวและการลดรอยหยัก

การสร้างพื้นผิวและเอาต์พุตสุดท้ายบนคอร์ R600 นั้นคล้ายคลึงกันแต่ก็แตกต่างจาก R580 ด้วยเช่นกัน R600 มีหน่วยประมวลผลพื้นผิว 4 หน่วยที่แยกออกจากกัน (เป็นอิสระ) จากคอร์ shader เช่นเดียวกับใน GPU R520 และ R580 ^{[ 9 ]} หน่วยเอาต์พุตการเรนเดอร์ (ROPs) ของซีรี่ส์ Radeon HD 2000 ในปัจจุบันทำหน้าที่ลดรอยหยักแบบหลายตัวอย่าง (MSAA) โดยใช้กริดตัวอย่างที่ตั้งโปรแกรมได้ซึ่งมีจุดตัวอย่างสูงสุด 8 จุด แทนที่จะใช้พิกเซล shaders เหมือนในซีรี่ส์ Radeon X1000นอกจากนี้ยังมีคุณสมบัติใหม่คือความสามารถในการกรองพื้นผิว FP16 ซึ่งเป็นที่นิยมในการ จัดแสง HDRด้วยความเร็วเต็มที่ ROPs ยังสามารถทำการ กรอง แบบ trilinearและanisotropicบนรูปแบบพื้นผิวทั้งหมด บน R600s จะมีพิกเซลทั้งหมด 16 พิกเซลต่อรอบสัญญาณนาฬิกาสำหรับพื้นผิว FP16 ในขณะที่พื้นผิว FP32 ที่มีความแม่นยำสูงกว่าจะกรองด้วยความเร็วครึ่งหนึ่ง (8 พิกเซลต่อรอบสัญญาณนาฬิกา) ^{[ 9 ]}

ความสามารถในการป้องกันการเกิดรอยหยัก (Anti-aliasing) บน R600 มีประสิทธิภาพมากกว่าซีรี่ส์ R520 นอกจากความสามารถในการทำ 8× MSAA ซึ่งเพิ่มขึ้นจาก 6× MSAA ใน R300 ถึง R580 แล้ว R600 ยังมี โหมด ป้องกันการเกิดรอยหยักด้วยฟิลเตอร์แบบกำหนดเอง (CFAA) ใหม่ CFAA หมายถึงการใช้งานฟิลเตอร์ที่ไม่ใช่แบบกล่อง ซึ่งจะพิจารณาพิกเซลรอบๆ พิกเซลที่กำลังประมวลผลเพื่อคำนวณสีสุดท้ายและป้องกันการเกิดรอยหยักของภาพ^{[ 10 ]} CFAA ทำงานโดยใช้ shaders แทนที่จะใช้ ROPs ซึ่งทำให้การเขียนโปรแกรมมีประสิทธิภาพมากขึ้นเนื่องจากสามารถปรับแต่งฟิลเตอร์ได้ แต่ก็อาจทำให้เกิดปัญหาด้านประสิทธิภาพเนื่องจากการใช้ทรัพยากร shader ณ เวลาที่เปิดตัว R600 CFAA ใช้ฟิลเตอร์แบบกว้างและแคบ โดยตัวอย่างจากภายนอกพิกเซลที่กำลังประมวลผลจะถูกถ่วงน้ำหนักเชิงเส้นตามระยะห่างจากจุดศูนย์กลางของพิกเซลนั้น โดยฟังก์ชันเชิงเส้นจะถูกปรับตามฟิลเตอร์แบบกว้างหรือแคบที่เลือก^{[ 10 ]}

ตัวควบคุมหน่วยความจำ

ตัวควบคุมหน่วยความจำเชื่อมต่อผ่านบัสวงแหวนแบบสองทิศทางภายในที่พันรอบโปรเซสเซอร์ ใน Radeon HD 2900 บัสวงแหวนนี้เป็นแบบสองทิศทางขนาด 1,024 บิต (อ่าน 512 บิตและเขียน 512 บิต) โดยมีช่องหน่วยความจำ 64 บิต 8 ช่อง ทำให้ความกว้างของบัสรวมเป็น 512 บิตบน 2900 XT ^{[ 9 ]}ใน Radeon HD 3800 บัสวงแหวนนี้เป็นแบบ 512 บิต ใน Radeon HD 2600 และ HD 3600 บัสวงแหวนนี้เป็นแบบ 256 บิต และใน Radeon HD 2400 และ HD 3400 ไม่มีบัสวงแหวน

การอัปเดตครึ่งรุ่น

ซีรี่ส์นี้ได้รับการอัปเดตครึ่งรุ่นด้วยการลดขนาดชิป (55 นาโนเมตร) รุ่นต่างๆ ได้แก่ RV670, RV635 และ RV620 ทุกรุ่นรองรับ PCI Express 2.0, DirectX 10.1 พร้อมคุณสมบัติ Shader Model 4.1, OpenGL 3.3, ตัวถอดรหัสวิดีโอแบบรวม ATI (UVD) เฉพาะสำหรับทุกรุ่น^{[ 19 ]}และเทคโนโลยี PowerPlayสำหรับการ์ดวิดีโอเดสก์ท็อป^{[ 20 ]}

ยกเว้นซีรี่ส์ Radeon HD 3800 ทุกรุ่นรองรับเอาต์พุต DisplayPort ในตัว 2 ช่องสัญญาณ รองรับจอแสดงผล 24 และ 30 บิต สำหรับความละเอียดสูงสุด 2,560×1,600 พิกเซล แต่ละเอาต์พุตมี 1, 2 หรือ 4 เลนต่อเอาต์พุต โดยมีอัตราการส่งข้อมูลสูงสุด 2.7 Gbit/s ต่อเลน

ATI อ้างว่าการสนับสนุน DirectX 10.1 จะนำมาซึ่งประสิทธิภาพและประสิทธิภาพการประมวลผลที่ดีขึ้น พร้อมลดข้อผิดพลาดในการปัดเศษ (0.5 ULPเมื่อเทียบกับข้อผิดพลาดเฉลี่ย 1.0 ULP ซึ่งถือเป็นข้อผิดพลาดที่ยอมรับได้) รายละเอียดและคุณภาพของภาพที่ดีขึ้น และการส่องสว่างทั่วโลก (เทคนิคที่ใช้ในภาพยนตร์แอนิเมชั่นและอื่นๆ ซึ่งมอบประสบการณ์การเล่นเกมที่สมจริงยิ่งขึ้น^{[ 21 ]} )

การ์ดแสดงผล

เทราสเกล 2 (VLIW5)

TeraScale 2 (VLIW5) เปิดตัวพร้อมกับ GPU ซีรี่ส์ Radeon HD 5000ในรุ่น "Evergreen" ในปี 2009

ในงาน HPG10 Mark Fowler ได้นำเสนอสถาปัตยกรรม "Evergreen" และระบุว่า เช่น 5870 (Cypress), 5770 (Juniper) และ 5670 (Redwood) รองรับความละเอียดสูงสุด 6 เท่าของ 2560×1600 พิกเซล ในขณะที่ 5470 (Cedar) รองรับ 4 เท่าของ 2560×1600 พิกเซล ซึ่งมีความสำคัญต่อการรองรับจอภาพหลายจอ ของ AMD Eyefinity ^[²²^]

ด้วยการเปิดตัวCypress สถาปัตยกรรมของ เอ็นจิ้นกราฟิก Terascaleได้รับการอัปเกรดด้วยจำนวนสตรีมคอร์ หน่วยประมวลผลพื้นผิว และหน่วยประมวลผล ROP ที่เพิ่มขึ้นเป็นสองเท่าเมื่อเทียบกับ RV770 สถาปัตยกรรมของสตรีมคอร์ยังคงไม่เปลี่ยนแปลงมากนัก แต่เพิ่มการรองรับความสามารถของ DirectX 11/ DirectCompute 11 ด้วยคำสั่งใหม่^{[ 23 ]}และการรองรับ OpenGL 4.5 อย่างเต็มรูปแบบ^{[ 24 ]}เช่นเดียวกับ RV770 หน่วยประมวลผลพื้นผิวสี่หน่วยจะเชื่อมโยงกับสตรีมคอร์ 16 คอร์ (แต่ละคอร์มีหน่วยประมวลผลห้าหน่วย รวมเป็นหน่วยประมวลผลทั้งหมด 80 หน่วย) การรวมกันนี้เรียกว่าSIMD คอร์

แตกต่างจาก Radeon R700รุ่นก่อนหน้าเนื่องจาก DirectX 11 กำหนดให้ผู้พัฒนาสามารถควบคุมการแทรกสอดได้อย่างเต็มที่ จึงได้ลบตัวแทรกสอดเฉพาะออก และหันมาใช้คอร์ SIMD แทน คอร์สตรีมสามารถจัดการ คำสั่งการ คูณบวกแบบรวม (FMA) ที่มีความแม่นยำในการปัดเศษสูงกว่าได้ทั้งในความแม่นยำเดี่ยวและคู่ ซึ่งเพิ่มความแม่นยำมากกว่าการคูณบวก (MAD) และเป็นไปตามมาตรฐานIEEE 754-2008 ^{[ 25 ]}คำสั่งผลรวมของความแตกต่างสัมบูรณ์ (SAD) ได้ถูกเพิ่มเข้าไปในโปรเซสเซอร์โดยตรง คำสั่งนี้สามารถใช้เพื่อปรับปรุงประสิทธิภาพของกระบวนการบางอย่างได้อย่างมาก เช่น การเข้ารหัสและการแปลงรหัสวิดีโอในเอ็นจิ้น 3 มิติ แต่ละคอร์ SIMD มีส่วนแบ่งข้อมูลภายใน 32 KiB และแคช L1 ขนาด 8 KiB ^{[ 23 ]}ในขณะที่คอร์ SIMD ทั้งหมดใช้ส่วนแบ่งข้อมูลทั่วโลก 64 KiB ร่วมกัน

ตัวควบคุมหน่วยความจำ

ตัวควบคุมหน่วยความจำแต่ละตัว จะเชื่อมต่อกับ ROPสี่ตัวหนึ่งตัวต่อช่อง 64 บิต และแคช L2 ขนาด 512 KiB เฉพาะ^{[ 23 ]}

การประหยัดพลังงาน

รองรับโปรแกรม AMD PowerPlay ซึ่งประกอบด้วยการปรับความถี่แบบไดนามิกและเทคโนโลยีอื่นๆ อีกหลายอย่างที่มีเป้าหมายเพื่อลดการใช้พลังงาน

ชิป

ชิปส์เอเวอร์กรีน:
- ซีดาร์ RV810
- ไซเพรส RV870
- เฮมล็อก R800
- จูนิเปอร์ RV840
- เรดวูด RV830
มันฝรั่งทอดกรอบจากหมู่เกาะทางเหนือ:
- บาร์ตส์ RV940
- ไคคอส RV910
- เครื่องบินรบ Turks RV930
APU ที่มี IGP ระดับ TeraScale 2:
- ลลาโน
- ออนแทรีโอ
- ซาคาเต้

เทราสเกล 3 (VLIW4)

TeraScale 3 (VLIW4) แทนที่การออกแบบ VLIW แบบ 5 ทางก่อนหน้านี้ด้วยการออกแบบ VLIW แบบ 4 ทาง การออกแบบใหม่นี้ยังรวมหน่วยเทสเซลเลชันเพิ่มเติมเพื่อปรับปรุงประสิทธิภาพของ Direct3D 11 รองรับ Direct3D 11 พร้อม Shader Model 5.0 และ OpenGL 4.5 บน Windows ^{[ 26 ]}

เทคโนโลยี TeraScale 3 ถูกนำมาใช้ใน กราฟิกการ์ด Radeon HD 6900ในปี 2010 และยังถูกนำไปใช้ในAPU รุ่น Trinity และ Richland อีกด้วย

การประหยัดพลังงาน

AMD PowerTune ซึ่งเป็นการปรับความถี่แบบไดนามิกสำหรับ GPU ได้รับการแนะนำพร้อมกับRadeon HD 6900 series เมื่อวันที่ 15 ธันวาคม 2010 และได้รับการพัฒนาอย่างต่อเนื่อง ดังที่บันทึกไว้ในบทวิจารณ์บางส่วนโดยAnandTech ^{[ 27 ]}^{[ 28 ]}^{[ 29 ]}^{[ 30 ]}

ชิป

มันฝรั่งทอดกรอบจากหมู่เกาะทางเหนือ:
- เคย์แมน RV970
- แอนทิลลีส อาร์900
- อาคาร Trinity และ Richland มีหน่วยประมวลผลกราฟิก TeraScale 3 IGP

ผู้สืบทอด

ในงาน HPG11เมื่อเดือนสิงหาคม 2011 พนักงาน AMD Michael Mantor (สถาปนิกอาวุโส) และ Mike Houston (สถาปนิก) ได้นำเสนอGraphics Core Nextซึ่งเป็นสถาปัตยกรรมไมโครที่ต่อจาก TeraScale ^{[ 31 ]}

การเปรียบเทียบชิป TeraScale

สถาปัตยกรรมไมโคร	เทราสเกล 1												เทราสเกล 2							เทราสเกล 3
ชิป¹	600 แรนด์	RV610	RV620	RV630	RV635	RV670	RV710	RV711	RV730	RV740	RV770	RV790	ซีดาร์(RV810)	เรดวูด(RV830)	จูนิเปอร์(RV840)	ไซเปรส(RV870)	ไคคอส(RV910)	ชาวเติร์ก(RV930)	บาร์ตส์(RV940)	เคย์แมน(RV970)
ชื่อรหัส	เปเล่	ลากา	คูปา	ชากา	วาริโอ	บูม	ลุยจิ		มาริโอ	วอลเดน	เวกิวา	สปาร์ตัน	?	?	?	?	?	?	วิคตอเรีย	?
รุ่นชิป	ไม่มีข้อมูล	เอ็ม72 เอ็ม74	เอ็ม82	เอ็ม76	เอ็ม86	เอ็ม88	เอ็ม92	เอ็ม93	เอ็ม96	เอ็ม97	เอ็ม98	ไม่มีข้อมูล	พาร์ค ร็อบสัน	คาปิลาโนเมดิสันไพน์วูด	บรอดเวย์แกรนวิลล์	เฮมล็อก เล็กซิงตัน	เซย์มัวร์	โอเนกาเทมส์วิสเลอร์	แบล็คคอมบ์	แอนทิลลีส
แฟบ (นาโนเมตร)	80	65	55	65	55					40	55		40
ขนาดแม่พิมพ์ (มม. ^² )	420	85 / 82 (M74)	67	153	135	192	73		146	137	256	282	59	104	166	334	67	118 / 104 (แม่น้ำเทมส์, วิสเลอร์)	255 / 212 (แบล็กคอมบ์)	389
ทรานซิสเตอร์ (ล้าน)	720	180	181	390	378	666	242		514	826	956	959	292	627	1,040	2,154	370	716	1,700	2,640
ความหนาแน่นของทรานซิสเตอร์(MTr/ ^mm² )	1.7	2.1 / 2.2 (M74)	2.7	2.5	2.8	3.5	3.3		3.5	6.0	3.7	3.4	4.9	6.0	6.3	6.4	5.5	6.1 / 6.9 (แม่น้ำเทมส์, วิสเลอร์)	6.7 / 8.0 (แบล็คคอมบ์)	6.8
หน่วยคำนวณ	4	2		3		4	1		4	8	10		2	5	10	20/5 (เลกซิงตัน)	2	6	14	24
ตัวประมวลผลเธรด	16	4		8		16	8		32		40		8	20	40	80 / 20 (เลกซิงตัน)	8	24	56	96
ตัวประมวลผลสตรีม	320	40		120		320	80		320	640	800		80	400	800	1600 / 400 (เล็กซิงตัน)	160	480	1120	1536
หน่วยการแมปพื้นผิว	16	4		8		16	8		32		40		8	20	40	80 / 20 (เลกซิงตัน)	8	24	56	96
หน่วยแสดงผล	16	4				16	4		8	16			4	8	16	32 / 8 (เลกซิงตัน)	4	8	32	32
Z/สเตนซิล โอพีเอส	32	8				32	4		32	64			4	40			16	32	40	128
แคช L1 (KB)	32 ต่อ 4 SP (ตัวประมวลผลสตรีม)						16 ต่อ CU (หน่วยประมวลผล)						8 ต่อ CU
แคช L2 (KB)	256	32	64		128	256	64		128		256		128	256		512 / 256 (เลกซิงตัน)	128	256	512
แสดงผลเอนจินหลัก	2.0		3.0	2.0	3.0	2.0	3.2				3.1		4.0				5.0
ตัวถอดรหัสวิดีโอแบบรวม	อาวิโว่ เอชดี	1.0					2.2				2.0		2.3				3.1
การเปิดตัวครั้งแรก	พฤษภาคม 2550	มกราคม 2550	มกราคม 2551	มิถุนายน 2550	มกราคม 2551	พฤศจิกายน 2550	กันยายน 2551	พฤษภาคม 2553	กันยายน 2551	เมษายน 2552	มิถุนายน 2551	เมษายน 2552	กุมภาพันธ์ 2553	มกราคม 2553	ตุลาคม 2552	กันยายน 2552	กุมภาพันธ์ 2554		ตุลาคม 2553	ธันวาคม 2010
ชุด	R600 ( Radeon HD 2000 / Radeon HD 3000 )						R700 ( Radeon HD 4000 )						เอเวอร์กรีน ( Radeon HD 5000 )				หมู่เกาะนอร์เทิร์น ( Radeon HD 6000 )
เอกสารอ้างอิง	^{[ 32 ]}^{[ 33 ]}	^{[ 34 ]}^{[ 35 ]}^{[ 36 ]}^{[ 37 ]}	^{[ 38 ]}^{[ 39 ]}^{[ 40 ]}	^{[ 41 ]}^{[ 42 ]}^{[ 43 ]}	^{[ 44 ]}^{[ 45 ]}^{[ 46 ]}	^{[ 47 ]}^{[ 48 ]}^{[ 49 ]}	^{[ 50 ]}^{[ 51 ]}^{[ 52 ]}	^{[ 53 ]}^{[ 54 ]}	^{[ 55 ]}^{[ 56 ]}^{[ 57 ]}	^{[ 58 ]}^{[ 59 ]}^{[ 60 ]}	^{[ 61 ]}^{[ 62 ]}^{[ 63 ]}	^{[ 64 ]}^{[ 65 ]}	^{[ 66 ]}^{[ 67 ]}^{[ 68 ]}^{[ 69 ]}	^{[ 70 ]}^{[ 71 ]}^{[ 72 ]}^{[ 73 ]}^{[ 74 ]}	^{[ 75 ]}^{[ 76 ]}^{[ 77 ]}	^{[ 78 ]}^{[ 79 ]}^{[ 80 ]}^{[ 81 ]}	^{[ 82 ]}^{[ 83 ]}^{[ 84 ]}	^{[ 85 ]}^{[ 86 ]}^{[ 87 ]}^{[ 88 ]}^{[ 89 ]}	^{[ 90 ]}^{[ 91 ]}^{[ 92 ]}	^{[ 93 ]}^{[ 94 ]}^{[ 95 ]}

¹ชิป Duo เช่น R680 (2x RV670) และ R700 (2x RV770) ไม่ได้อยู่ในรายการ^{[ 96 ]}^{[ 97 ]}^{[ 98 ]}^{[ 99 ]}

[

[

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

Radeon

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

[ 44 ]

[ 45 ]

[ 46 ]

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

[ 52 ]

[ 53 ]

[ 54 ]

[ 55 ]

[ 56 ]

[ 57 ]

[ 58 ]

[ 59 ]

[ 60 ]

[ 61 ]

[ 62 ]

[ 63 ]

[ 64 ]

[ 65 ]

[ 66 ]

[ 67 ]

[ 68 ]

[ 69 ]

[ 70 ]

[ 71 ]

[ 72 ]

[ 73 ]

[ 74 ]

[ 75 ]

[ 76 ]

[ 77 ]

[ 78 ]

[ 79 ]

[ 80 ]

[ 81 ]

[ 82 ]

[ 83 ]

[ 84 ]

[ 85 ]

[ 86 ]

[ 87 ]

[ 88 ]

[ 89 ]

[ 90 ]

[ 91 ]

[ 92 ]

[ 93 ]

[ 94 ]

[ 95 ]

[ 96 ]

[ 97 ]

[ 98 ]

[ 99 ]

ประวัติศาสตร์
วันที่วางจำหน่าย	พฤษภาคม 2550 ( พฤษภาคม 2550 )
ผู้มาก่อน	ไม่เป็นที่ทราบกันโดยทั่วไป
ผู้สืบทอด	เทราสเกล 2
สถานะการสนับสนุน
ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่ปลายปี 2013 (เวอร์ชันไดรเวอร์ Windows สุดท้าย: 13.9 สำหรับWindows Vistaและ7 , 13.1 สำหรับWindows 8และ 13.4 เวอร์ชันเบต้าสำหรับWindows XPและ 8)

ประวัติศาสตร์
วันที่วางจำหน่าย	กันยายน 2552 ( กันยายน 2552 )
ผู้มาก่อน	เทราสเกล 1
ผู้สืบทอด	เทราสเกล 3
สถานะการสนับสนุน
ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่กลางปี 2015 (ไดรเวอร์ Windows เวอร์ชันสุดท้าย 15.7.1 สำหรับWindows 7 , 8.1และ10ภายใต้ชื่อ "Catalyst" และเวอร์ชันเบต้า 16.2.1 ภายใต้ชื่อ "Radeon Software")

ประวัติศาสตร์
วันที่วางจำหน่าย	ตุลาคม 2553 ( ตุลาคม 2553 )
ผู้มาก่อน	เทราสเกล 2
ผู้สืบทอด	กราฟิกคอร์เน็กซ์ 1
สถานะการสนับสนุน
ไม่ได้รับการสนับสนุนอีกต่อไปตั้งแต่กลางปี 2015 (ไดรเวอร์ Windows เวอร์ชันสุดท้าย 15.7.1 สำหรับWindows 7 , 8.1และ10ภายใต้ชื่อ "Catalyst" และเวอร์ชันเบต้า 16.2.1 ภายใต้ชื่อ "Radeon Software")

เทราสเคล (สถาปัตยกรรมระดับไมโคร)

เทราสเกล 1 (VLIW5)

เชเดอร์แบบรวม

การสร้างรูปทรงเรขาคณิตด้วยฮาร์ดแวร์

ตัวประมวลผลการส่งแบบอัลตร้าเธรด

การสร้างพื้นผิวและการลดรอยหยัก

ตัวควบคุมหน่วยความจำ

การอัปเดตครึ่งรุ่น

การ์ดแสดงผล

เทราสเกล 2 (VLIW5)

ตัวควบคุมหน่วยความจำ

การประหยัดพลังงาน

ชิป

เทราสเกล 3 (VLIW4)

การประหยัดพลังงาน

ชิป

ผู้สืบทอด

การเปรียบเทียบชิป TeraScale

ข้อมูลสำคัญจากบทความ