vliw

来源：求职简历网时间：2023-12-04 15:20:18 编辑：简历君关注度：147手机版

命名解析 Radeon HD 6000系列的来历可以说是相当曲折。按照AMD最早的计划，Radeon HD 5000系列之后要转向新的核心架构，代号“南方群岛”(Southern Islands)，制造工艺也会更新，但是无奈负责代

命名解析

Radeon HD 6000系列的来历可以说是相当曲折。按照AMD最早的计划，Radeon HD 5000系列之后要转向新的核心架构，代号“南方群岛”(Southern Islands)，制造工艺也会更新，但是无奈负责代工的台积电40nm工艺花了很长时间才成熟起来，又突然决定取消32nm工艺而直奔28nm，AMD随之被迫更改了产品研发和发布计划，于是就有了新的“北方群岛”(Northern Islands)，也就是Radeon HD 6000系列。

简单来说，

Radeon HD 6000系列是一次妥协的产物，仍旧使用R600以来的核心架构体系，制造工艺也还是40nm，不过在诸多内部细节和技术特性方面进行了广泛的增强，无论性能还是功能都大大优于Radeon HD 5000系列，而且产品良率也完全不再是问题。

但是在产品编号上，AMD耍了一个小小的花招。尽管还是一目了然的四位数字，但并不只是简单地把首位从5换成6。上代首发的Radeon HD 5800系列面向的是高端市场，而现在所谓的Radeon HD 6800系列并不完全与之对应，从市场区间划分上来说其实是Radeon HD 5700系列的后辈。等到下个月，AMD还会推出更高端型号

Radeon HD 6970、Radeon HD 6950，开发代号“Cayman”，

继续稳固高端市场地位；年底的时候，我们就将看到新的旗舰型单卡双芯产品

Radeon HD 6990，开发代号“Antilles”。

这一次，AMD同样打算速战速决，不给对手任何喘息之机。

这种新的命名方式一方面源于AMD在显卡市场上掌握着绝对的主动权，有充足的空间按照自己的意愿调整产品线，另一方面也是因为新系列产品的性能表现有了长足的进步，有足够的资本将自己提升一个档次。

HD6800 Barts定位解析：直击GTX460

Radeon HD 5000/6000系列高端产品的性能顺序可以排列为：

6990>5970>6970>6950>5870>6870>5850>6850>5770>5750。

它也直接证明新的编号体系并非只是个数字游戏而已。

Radeon HD 6870

的性能其实稍弱于Radeon HD 5870，但是价格上也要便宜很大一个档次

，因此性价比同样再次有了明显的提高，延续了AMD高端显卡近年来的一贯趋势。

Barts： Radeon HD 6800系列、Cayman： Radeon HD 6900系列将会共同取代Cypress：Radeon HD 5800系列

，以更丰富的产品型号对市场进行细化，满足不同价位消费则会的需要；

Radeon HD 5700系列则并不会立即消失

，而是将伴随新系列继续销售，有消息称可能会改名为Radeon HD 6700系列，但是AMD还没有做出最终决定。

架构与规格：延续传统、全面增强

HD6800架构解析

架构方面之前曾有各种各样的传闻，但是受到各方面限制，特别是台积电代工工艺的落后，Radeon HD 6800系列所属的“北方群岛”家族并没有在核心架构方面进行大规模的重新设计，而是基本沿用了R600以来的4D+1D式SIMD流处理器结构，并在诸多细节上做了优化和增强，AMD称之为“第二代DX11设计”。总的来说，北方群岛更像是一次承前启后的过渡，再往后的下一代我们才会看到基于28nm新工艺的新架构，不出意外就是同样风传了很久的“南方群岛”。

按照AMD的说法，Radeon HD 6000系列架构重点有五大方面的进步：

1、更强的单位面积性能，比上代提升最多35%；

2、第二代DX11设计，更快的曲面细分和几何吞吐；

3、新的和改进的画质功能，包括抗锯齿和

各向异性过滤

；

4、增强的多媒体加速，包括UVD3

硬件解码

引擎、AMD

APP

并行异构计算技术、蓝光3D立体技术；

5、下一代显示技术，包括Eyefinity+多屏输出、HDMI 1.4a规范、DisplayPort 1.2规范。

Radeon HD 6800系列对内核设计做了重新配置，单精度浮点性能最高能够突破2TFlops(每秒2万亿次计算)大关，每秒钟能够处理的像素也能超过240亿，同时曲面细分单元进行了特别增强(第七代)，光栅器(Rasterizer)也配备了两个，Hub部分有PCI-E 2.1总线控制器、UVD3硬件解码引擎、CrossFireX管理引擎、Eyefinity显示控制器等，显存控制器则依然是四个64-bit，总位宽256-bit，继续搭配高速GDDR5显存颗粒。

新核心集成了17亿个晶体管，核心面积为255平方毫米。Radeon HD 6870/6850分别有14个、12个SIMD引擎，每个引擎还是80个流处理器，总共1140个、960个，纹理单元56个、48个，ROP光栅单元都是32个。

Radeon HD 6870被AMD称为“市场甜点的轻松赢家”，核心频率900MHz，单精度浮点性能2.0TFlops，搭载1GB GDDR5显存，等效频率4200MHz，整卡空闲功耗19W、满载功耗151W，使用双插槽散热器和双六针辅助供电接口，输出接口两个DVI、两个mini DisplayPort、一个HDMI。

Radeon HD 6870国内官方建议零售价1899-1999元人民币，直接竞争对手最初被定为GeForce GTX 460 1GB，官方测试数据显示平均超出25-30%，最多可超过50%，不过在最后关头，AMD将对手提高到了GeForce GTX 470，显示了充足的自信心。

Radeon HD 6850则号称是“DX11性能、功耗和价格的新典范”，核心频率775MHz，单精度浮点性能1.5TFlops，同样搭载1GB GDDR5显存，但是等效频率降至4000MHz，整卡空闲功耗仍是19W，但是满载功耗降低到127W，只需单六针辅助供电，不过公版散热器也是双插槽设计，另外输出接口同为两个DVI、两个mini DP、一个HDMI。

Radeon HD 6850国内官方建议零售价1299-1399元人民币，直接竞争对手最初定为GeForce GTX 460 768MB，官方测试数据显示平均超出也有30%左右，最多可超过60%，最后时刻又改成了GeForce GTX 460 1GB。

现在我们就对比一下Radeon HD 6870、Radeon HD 5850。后者核心面积和晶体管规模要大不少(334平方毫米和21.5亿个)，流处理器、纹理单元分别多出120个、16个，显存带宽甚至也稍高一些(153.6GB/s和134.4GB/s)，但是根据AMD提供的数据，二者3DMark Vantage得分分别为X7730、X7403，也就是说Radeon HD 6870以更小的核心规模实现了更高的性能，单位面积的性能自然更是高出一大截，而且更喜人的是满载功耗保持在同样的水平(151W)，空闲功耗更是降低了8W，按幅度计算就是30%，显然新卡的性能功耗比也要好得多。

另外值得一提的是，重新设计的新核心在几何吞吐能力方面也有显著进步，Radeon HD 6870达到了每秒钟9亿个三角形，Radeon HD 5850则是7.25亿个。这可以看作是对NVIDIA宣传几何性能的一个回应。

新特性：强化画质

画质增强

消费级显卡最主要的使命自然是提供更好的3D游戏性能和画面，而提升画质最传统、最广泛的方法当属抗锯齿(AA)和各向异性过滤(AF)。Radeon HD 6800在这两方面都有所革新，还特别简化了相关用户界面，方便使用。

Radeon HD 6800支持新的形态抗锯齿(Morphological Anti-Aliasing)，简称MLAA。

该技术由Intel提出，不过此前是基于CPU运算的，AMD则将其移植到了GPU上，使用后期处理过滤技术结合DirectCompute进行加速，全面支持DX9/10/11应用程序。AMD宣称，MLAA可提供全场景抗锯齿，而不限于多边形边缘、Alpha测试表面，速度也要比超级采样，性能上接近于可编程过滤抗锯齿(CFAA)。

MLAA抗锯齿属于一种后期处理效果，换言之就是首先正常渲染每一帧，然后再进行一次着色器处理来执行过滤，这不同于传统的多重采样抗锯齿(MSAA)和超级采样抗锯齿(SSAA)，后者都是在帧渲染的同时执行过滤。事实上，MLAA也能用来消除静态图像的锯齿，只不过用在动态画面上效果更好。

MLAA中，过滤器会首先按照不同的像素尺寸样式检测高对比度边缘(锯齿产生的主要原因)，假设它们应该是与像素边缘不切合的直线，然后消除每个边缘理想线的长度和角度，根据边缘旁边每个像素的较深和较浅颜色确定符合比例的覆盖范围，最终实现抗锯齿。

由于边缘检测步骤需要频繁的对相邻像素颜色进行采样和重采样，数据重新使用的几率很高。AMD使用LDS(本地数据共享)硬件避免冗余数据预取、显著提升性能。

各向异性过滤也有所改进，尤其是算法方面，还保持了全面的性能和角度独立性。

配合新技术，催化剂控制中心的3D部分同样有了变化，可在此开启MLAA抗锯齿，还有全新的Catalyst A.I.滑块，能够直接控制纹理过滤和优化。

新特性：高效曲面细分

增强曲面细分

DX11带来了诸多新特性、新技术，曲面细分(Tessellation)按说只是其中的一种，但因为显卡厂商的种种不同宣传而备受关注，也引发了不少争议，比如按照NVIDIA的说法，他们的Fermi架构才是真正的DX11架构，因为设计了专门的曲面细分单元，高负载下性能更好。

事实上，当年ATI在Radeon 8500上就首次试验了这种技术的雏形，使用了固顶功能的PN三角形。虽然当时的技术还极不成熟，游戏应用也未普及，但ATI并未放弃，此后每一代产品都在进行更新和完善，比如Xbox 360 GPU上加入了位移映射和自适应曲面细分，Radeon HD 2000、3000两代产品分别支持DX10、DX10.1，Radeon HD 4000系列又增强了性能，但直到Radeon HD 5000系列上才借着DX11的东风修成正果，成为业界标准规范的一部分。Radeon HD 6000系列针对曲面细分又做了深入优化，重点改进了线程管理和缓冲。

AMD提供的数据显示，

Radeon HD 6870相比于Radeon HD 5870在曲面细分性能上有了最多一倍的增加

，不过具体取决于曲面细分因子，1-13的时候普遍都能超过50%，其中5-10的时候效果是最好的。

AMD还特意讲解了部署曲面细分的正确方法，包括将最重要的细节添加到场景中，同时有效压缩几何；专注于最有效的使用模式，理想情况下每个多边形16个像素，取得画质和性能的最佳平衡；自适应曲面细分非常有效，只有在接近观众的物体、边缘轮廓、高细节区域才使用高级别的曲面细分，反之则使用低级别。

AMD声称，过量使用曲面细分并不会有太好的画质效果，反而会让显卡失去效率，比如阴影过多、抗锯齿处理多边形边缘过多等等，暴力使用只是一种无谓的浪费。

新特性：改进影音多媒体

影音播放一贯是A卡的优势，近年来在这方面的投入力度也是越来越强，对HTPC玩家的吸引力也越来越强，源码输出、催化剂画质增强都广为津津乐道。

UVD3.0

Radeon HD 6800上又提出了

“EyeSpeed”视觉加速技术

，包括两大方面：一是GPU并行计算，基于开放的OpenCL、DirectCompute 11标准规范；二是高清视频的解码、输出与播放，支持蓝光3D立体技术，并整合了第三代UVD 3.0视频解码硬件引擎。

UVD 3.0对高清玩家来说尤其诱人。相比前两代，它增

加了MPEG-2、MPEG-4 Part 2 (

DivX/XviD

)、Blu-Ray 3D (MVC)等编码格式的全程硬件解码

，用户可以将更多视频解码工作交给GPU处理，进一步减轻CPU负担。篇幅所限，有关UVD3等视频播放新特性日后会专文深入介绍。

AMD还提到了Radeon HD 6800系列精确的色彩校正技术。借助色域映射引擎，AMD可以在广色域液晶面板上精确地再现原始色彩，并在整个管线内保存色彩细节。

先进的硬件技术自然需要广泛的应用软件支持。经过广泛深入的合作，AMD已经拉上了多家知名的多媒体播放与编辑厂商，Radeon HD 6800尚未发布就获得了大量播放器、编辑器的辅佐，包括ArcSoftTotalMedia Theatre、TotalMediaShowBiz，Corel WinDVD Pro 2010、DigitalStudio 2010，CyberLinkPowerDVD 10 Mark II，DDD TriDef (3D)，DivX Plus等等。

新特性：灵活多屏输出Eyefinity+

Eyefinity+

Eyefinity(宽域)多显输出技术是Radeo n HD 5000系列最闪亮的地方之一，只要一块显卡就可以组建最多六屏系统，大大降低了多屏架设的成本，既极大地拓宽了游戏玩家的视野，也非常适合办公、渲染、展示等专业场合。现在，Radeon HD 6000系列又进一步提升，带来了增强版的“Eyefinity+”。

Eyefinity+技术的精髓是DisplayPort 1.2标准规范。相比于此前的1.1a版本，最新的 1.2版本将数据带宽从10.8Gbps翻番到21.6Gbps，视频输出率也从8.64Gbps翻番到17.28Gbps，60Hz 24bpp下的最大分辨率支持提升到2560×2048之上，而且特别支持多流输出(MTS)。

得益于此，Eyefinity+获得了更高的传输带宽，再加上带内立体3D信号，就为支持3D立体技术打开了方便之门，而且尤其是支持单接口多数据流、多显示输出，通俗地说就是一个接口可以连接多台显示器，因而只需要两个DisplayPort接口就能连接六台显示器。

而此前的Eyefinity只能一个接口对应一台显示器，想组建六屏系统就得同时使用六个接口，所以才有了Radeon HD 5870 Eyefinity 6特别版。

Radeon HD 6800系列公版都配备了多大五个输出接口，包括两个mini DisplayPort、两个DVI、一个HDMI，组建多屏系统的方式也非常灵活。

第一种方法：

只使用两个mini DisplayPort接口，其一通过MTS Hub转接来连接三台显示器，其二通过菊花链方式依次连接三台显示器，这就完成了六屏系统。

第二种方法：

同样只使用两个mini DisplayPort接口，分别连接一台MTS Hub，再分别接上三台显示器，六屏搞定。

第三种方法：

其中一个mini

DisplayPort接口

连接MST Hub之后扩展四台显示器，另外两个DVI接口分别连接一台，同样是六屏。

MTS Hub还可以连接多种不同分辨率的显示器，全高清、高清、高清+可以并存。

努力拓展产业生态系统支持也是Eyefinity技术的重中之重。迄今为止，DisplayPort接口显示产品在市面上已经超过35款，Eyefinity认证游戏超过45款、兼容游戏数百款，不久前AMD还与显卡厂商合作推出了相对廉价的DisplayPort转单链接DVI适配器。

性能方面，AMD给出的数据是3×1920×1080水平模式下，Radeon HD 6850/6850单卡在所有主流游戏中都能获得30FPS以上的稳定帧率，部分还可达到甚至超过60FPS。

配合Eyefinity、CrossFireX技术，AMD双卡互连的执行效率也是越来越搞，号称两块Radeon HD 6850相比单卡的性能提升幅度最高可达惊人的99%(《Far Cry 2》)，少的也能超过80%。

3×1920×1080三屏模式下，同为双卡的Radeon HD 6870 CrossFireX相比于GeForce GTX 460 1GB SLI的优势也是非常明显，领先幅度少则接近20%，多则达到80%。当然了，这些都是官方宣传数据，仅供参考。

新特性：3D立体

HD3D

现如今，3D立体已经成为不可阻挡的大势所趋，NVIDIA 3D Vision技术都已经获得了上千件产品的支持，AMD自然也不能落后，此番推出了“HD3D”(高清立体)技术。

不过不同于对手的捆绑式方案，AMD选择了与业界合作的开放态度，灵活提供多种解决方案，给用户自主选择的机会，成本也更低。

AMD的3D立体方案中，自己只提供Radeon HD 6000系列显卡硬件，中间件可选Dynamic Digital Depth(DDD)、iZ3D等供应商合作伙伴的方案(前者的就是TriDef)，视频和蓝光3D播放软件来自ArcSoft、Corel、CyberLink、Roxio，眼镜及发射器来自Bit Cauldron、XpanD、RealD，至于3D电视、投影仪、显示器等显示设备就广泛多了，某些厂商也正在专门针对AMD方案开发和发布相关显示设备。

为了支持3D立体，Radeon HD 6800系列配备的HDMI接口都已经升级支持HDMI 1.4a规范，支持新款3D立体电视和HDMI帧包装格式。

3D游戏方面，AMD Radeon HD 6000支持DX9/10/11四缓冲，配合DDD、iZ3D的转换软件可为400多款游戏带来立体效果，2011年还会有原生的3D立体游戏。

性能上AMD也给出了一些数据。Radeon HD 6870配合iZ3D中间件在优派的120Hz 3D显示器上以1080p全高清分辨率运行3D立体游戏，平均帧率不低于35FPS，高可接近70FPS。

HD6900 Cayman定位解析：避开GTX580

北方群岛

Radeon HD 6900系列当然是面向高端游戏市场的，将会取代现在的Radeon HD 5800系列，而与Radeon HD 6800/5700系列并肩打江山。当然了，这里不可避免地得重新解释一下AMD的产品型号命名策略。根据最初的计划，Barts、Cayman核心应该分别叫作Radeon HD 6700/6800系列而替代Radeon HD 5700/5800系列，但是首先AMD自然为Barts核心非常优秀，配得上更高的地位，其次Radeon HD 5700系列在主流市场上非常热门、广为追捧，直接就这么拿下实在可惜，于是AMD就玩儿了一个从市场策略上看很聪明、从消费角度看很混乱的做法：Barts、Cayman核心分别提升一个档次，命名为Radeon HD 6800/6900系列，Radeon HD 5700系列则继续留在市场上笼络中端用户，而新的单卡双芯型号则被挤到了顶，只能叫Radeon HD 6990。AMD这么做自然有其充分的理由，毕竟厂商的目标是利用各种可能的手段赚尽可能多的钱，也就是追求利润最大化。AMD在DX11市场上居于领先地位，也有一定的空间和余地按照自己的意愿去部署产品线，作为消费者就只能被动接受了。不管怎么说，Radeon HD 6000系列毕竟是新核心新产品，总比直接改名的马甲好得多。

按照AMD最后时刻敲定的策略，

Radeon HD 6970在国内的官方建议零售价为2999-3099元人民币，Radeon HD 6950则是2299-2399元人民币

，远远低于此前预计的3999元、2999元。至于竞争对手，AMD延续了田忌赛马的策略，

Radeon HD 6900系列避开锋芒毕露的GeForce GTX 580(3999元)而携手杀向刚刚诞生的GeForce GTX 570(2999元)

，

或者更确切地说主要由Radeon HD 6970去对付GeForce GTX 570，Radeon HD 6950则暂时没有很直接的对手

，因为往下的GeForce GTX 460、GeForce GTS 450分别交给了Radeon HD 6800系列、5700系列。

当然了，GeForce GTX 580也不会被放任自流，因为AMD仍有迄今为止地球上最快的显卡Radeon HD 5970，明年初还会更新为Radeon HD 6990，继续二打一的策略。

全新内核架构：4D图形与计算

无论开发什么新产品，设计人员总要首先设定一些预期目标，然后通过技术上的努力去实现，从而满足市场和用户的需要。可以说，只有合理的目标与顺利的执行有机结合才能诞生一款优秀的产品。

4D图形与计算

在Cayman Radeon HD 6900系列身上，AMD就提出了

四大目标：高效的图形与计算架构、强大的几何性能、新的画质技术、新的能效与功耗管理

。下边我们就从这四个方面着手，细细品位Radeon HD 6900的内核架构与技术精髓。

为了实现高效的图形与计算架构，AMD该用了

重新定义的VLIW4架构

，同时还引入了双图形引擎、更多SIMD引擎与纹理单元、升级的渲染后端、更高的显存带宽、新的GPU计算技术。

VLIW全称为Very Long Instruction Word，意思是超常指令字架构，是一种非常长的指令组合，通过把许多条指令连在一起来增加运算的速度。从第一代DX10 R600内核开始，AMD就一直使用VLIW5方式，又称5D式，也就是五个流处理器编为一组，但并非所有流处理器都是相同的，其中四个较小、较简单，另一个较大、较复杂做为特殊单元。这种架构设计在硬件方面看有着很高的效率和很深的潜力，但是结构比较复杂，对应的软件编程就很困难，始终难以真正发挥全部实力。

如今AMD终于在内核层面翻新为VLIW4方式(4D式)，每个编组由四个流处理器、一个分支单元、一个通用目的寄存器组成，其中四个流处理器的整数、浮点执行功能完全相同(不再有T-Unit)，可以执行四路并行发射，但是特殊功能占据四个发射位中的三个。

AMD宣称，VLIW4架构有着更好的利用率，能将性能与核心面积比提高10%，简化调度与寄存器管理，逻辑核心也可以很好地重复使用。

除了前端，渲染器后端也进行了升级，支持写入操作合并，16位整数操作提速两倍，32位浮点操作也快了两到四倍。

GPU并行计算方面，新内核最大的亮点就是增加了一个全局异步寄存器，从而支持异步分配，可以同时执行多个计算内核，每个内核都有自己的命令队列与受保护虚拟寻址域。此外还有两个双向DMA引擎(更快的系统内存读写速度)、着色器读取操作合并、LDS(本地数据存储)直接预取、流控制改进、更快双精度操作(单精度的1/5提高到1/4)。

全新内核架构：曲面细分性能

曲面细分性能

在NVIDIA所谓真DX11的大肆宣传下，几何性能特别是曲面细分性能的地位被提高到了一个夸张的地步，但事实上AMD在这方面早已经历了多个时代的进化，现在更是发展到了第八代曲面细分单元——Radeon HD 6800、5000系列分别是第七代和第六代。

Radeon HD 6900配备了

两个独立又合作的图形引擎

，每时钟周期内都能处理两个原语(Primitive)，具备基于区块的负载均衡，转换和隐面消除率翻番。

每个图形引擎内都有一个光栅器与一个第八代曲面细分单元

，前者每时钟周期内可处理最多32个像素，后者

结合用于更高曲面细分等级的片外缓冲，可实现最多三倍于Radeon HD 5870的曲面细分性能，至少也会有1.5倍

。《异形大战铁血战士》、《地铁2033》、《失落的星球2》、《潜行者：普里皮亚季的呼唤》、Unigine Heaven等一系列NVIDIA宣传自己曲面细分性能强劲的游戏和测试程序中，Radeon HD 6970相比于Radeon HD 5870能带来30-69%的大幅性能提升。

不过我们还是想唠叨一句：

曲面细分是个好技术，但终究只是DX11技术群中的一份子而已，并不是唯一，多线程、计算着色器、纹理压缩等技术的重要性丝毫不比它弱。AMD、NVIDIA都完全实现了对DX11技术的支持，只不过因为发展思路和策略不同，具体方式和执行效率有所差异，不存在什么真假之说

。

全新内核架构：AA/AF增强画质

抗锯齿

画质增强技术方面，AMD每一代新产品都会加入新功能，此番除了形态抗锯齿(MLAA)之外还有

增强画质抗锯齿(EQAA)、增强各向异性过滤与纹理过滤

。

EQAA其实并不是全新的抗锯齿技术，而是

属于多重采样抗锯齿(MSAA)的一种新模式，每像素最多16个覆盖

采样点

，双倍于标准的MSAA

，而且色彩与覆盖采样点的数量可以独立控制，并能够自定义采样模式与过滤器。有趣的是，

EQAA兼容自适应抗锯齿(AAA)、超级采样抗锯齿(SSAA)、MLAA

，换言之就是能够同时使用，共同改善画质。

AMD宣称，

EQAA可以在同等量的显存消耗下带来更好的画质，对性能的影响也最多不过5%左右

。

MLAA就不再重复介绍了，只看看AMD举的一个例子，照此说来MLAA、MSAA搭档合作效果最佳。

全新内核架构：全新功耗管理

功耗管理

说起高端显卡，除了强大的性能之外往往还伴随着恐怖的高功耗，以及随之而来的复杂散热器、烦人噪音、巨额电费。GeForce GTX 580引入了硬件电源监控电路，Radeon HD 6900则在Radeon HD 5000/6800系列的基础上又祭出了全新技术“PowerTune”(电源调节)，灵活性上远胜历史悠久的ATI PowePlay。

首先必须解释一个很常见的名字：TDP(热设计功耗)。和微处理器(CPU)一样，GPU图形核心也会在运行中消耗能量，并将其转换成热量，再散发出去，能量消耗的速度受限于系统提供能量、挥发热量的双重能力。为此GPU厂商就向系统制造商提供了热设计功耗这么一个参数，代表稳定运行所需要的最大能量消耗值，方便他们合理地设计系统，而且该参数受电压、核心频率、工作负载、漏电率、环境温度等多种因素的影响。

ATI PowerPlay只是简单地指定了显卡核心与显存频率的两三个等级，分别对应待机、日常负载、游戏和拷机负载等应用，一旦确定就不可再更改。

AMD PowerTune则利用显卡上集成的控制处理器来实时监视GPU负载、内部计算GPU功耗，藉此实时动态调整运行频率，从而在满足热设计功耗限制的前提下带来更高的性能，特别是允许GPU在高负载状态下运行于更高的频率

。

换句话说，GPU以往只有中间状态、最高状态等几种僵死的P-State性能等级，现在

加入AMD PowerTune技术后就有了几乎无数种状态并能实时调节转换，允许最高状态下的核心频率更高，同时仍然满足热设计功耗要求，而那些受热设计功耗限制的应用程序也可以从这种更高频率中获益。

除此之外，Radeon HD 6900系列还支持

直接控制GPU功耗

，不需要再绕过频率和电压调节，并支持AMD OverDrive工具。

技术上讲解和理解起来都很晦涩，但看看下边的典型应用实例你就会明白了。首先大家需要知道的是，显卡实际功耗在不同环境下是相差很大的，FurMark、3DMark、OCCT等测试和拷机软件往往能将显卡功耗发挥到很高水平甚至达到极致，但主流3D游戏中其实都是比较低的。这就是AMD PowerTune技术进一步发威的前提。

Radeon HD 6950在默认功耗设置下运行3DMark Vantage柏林噪音测试，GPU核心频率在700MHz上下的较大范围内实时动态调整，程序运行帧率则稳定保持在接近150FPS。

然后

在催化剂控制中心的OverDrive页面内，拖动功耗控制(Power Control)的滑杆，范围从-20%到+20%，代表显卡功耗的降低和增加范围

。

同样的测试中，默认功耗下GPU核心频率在很大范围内调节，但极少超过750MHz，此时平均帧率140FPS；增加5%的功耗空间后，核心频率大部分时间都在750MHz之上，而且是不是达到800MHz，此时帧率升至155FPS；

增加10%的功耗空间时核心频率就一直运行在额定的800MHz，帧率继续升至162FPS

。

转到《异形大战铁血战士》这样的普通游戏，默认设置下帧率超过55FPS，很流畅，都功耗也超过了250W，相当费电；于是将功耗空间降低10%，帧率仍有55FPS左右，实际功耗降至250W之下；

再降低20%呢，帧率跌至50FPS，依然足够流畅，功耗却大幅降低至220W多一点，从而在保证游戏体验的前提下节省耗电量

。

另外除了功耗控制技术的改进，Radeon HD 6900系列的散热设计同样毫不含糊，和Radeon HD 6800系列一样使用了第五代真空腔均热板(Vapor Chamber)技术，由涡轮风扇、大面积纯铜底座、纯铜热管、密集散热鳍片等部分组成。

HD6990 Antilles定位解析：完美接任HD5970

虽然台积电28nm工艺非常不给力，致使AMD野心勃勃的南方群岛计划流产，但是AMD依旧迅速变招拿出了B计划，开始推出第二代DX11 Radeon HD 6000系列家族，而且在市场策略、核心架构方面都有了相当大的变化，比如Radeon HD 6800系列地位提升、Radeon HD 6900系列改用VLIW4 4D式流处理器单元。虽然所谓全新架构的处子秀不算很惊艳，没有撼动GeForce GTX 580的市场地位，但这也正好符合AMD的一贯策略，即以小核心占领性能级市场，然后再双芯并联去争夺发烧级市场。后边这一步，正是要靠Radeon HD 6990去努力。

Radeon HD 6990开发代号Antilles，原计划在2010年底发布，但因为种种原因拖延至今。GeForce GTX 590至今神龙见首不见尾，虽说按道理性能应该更恐怖，但是看样子还得登上一段时间(NVIDIA的下一步是本月中旬的GeForce GTX 550 Ti)。就这样，Radeon HD 6990在并无多大压力的情况下得以顺利接过前辈的枪、荣登卡皇宝座，再次成为地球上最快的显卡。

不管你是否认同这种单卡双芯的形式，它都是无可争议的性能王者。

当然了，这也标志着Radeon HD 5970完美的一生开始结束，老卡皇可以笑着退休了。

规格解析：双芯并联+超频

Radeon HD 6990使用了两颗Cayman Radeon HD 6900图形核心并使用PLX桥接芯片内部连，因此在架构上就没什么好说的了，完全继承了Radeon HD 6970/6950的诸多新特性，包括VLIW 4D流处理器单元、升级的渲染器后端、增强的GPU计算、双图形引擎与两个第八代曲面细分单元、EQAA增强画质抗锯齿、PowerTune功耗管理技术等等。当然了，Radeon HD 6870/6850以来引入的大量功能特性也都延续了下来，包括MLAA形态抗锯齿、改进的各向异性过滤、UVD3视频解码引擎、增强的多屏输出Eyefinity等等。无论从哪方面看，Radeon HD 6990都完全称得上是集大成者，综合了AMD迄今为止最优秀的图形和视频技术。

规格解析

Radeon HD 6990拥有

多达52.8亿个晶体管，3072个流处理器、192个纹理单元、64个ROP单元，显存位宽2×256-bit，显存容量多达4GB

，都是Radeon HD 6970/6950的两倍，不过受散热、功耗的限制，预设频率并没有达到Radeon HD 6970的级别，但也高于Radeon HD 6950，其中

核心为830MHz，显存等效为5GHz

。

Radeon HD 6990的

浮点计算能力因此高达惊人的单精度5.1TFlops、双精度1.27TFlops，分别符合IEEE754-SP、IEEE754-DP标准

，另外纹理填充率159.4GT/s、像素填充率53.1GP/s、显存带宽320GB/s。

更恐怖的是，Radeon HD 6990还有相当大的超频空间。首先，它和Radeon HD 6970/6950一样

配备了

双BIOS

和切换开关，因此提供两种模式：默认模式下核心电压1.12V，频率如上；超频模式下核心电压加至1.175V，频率直接也拉升到880MHz，显存频率不变，基本相当于两块Radeon HD 5970。

这时候的Radeon HD 6990将拥有

5.4TFlops

单精度浮点运算能力，纹理、像素填充率也都有进一步增加。

如果游戏玩家和发烧友们还不满足，可以再借助催化剂控制中心、AMD OverDrive或者第三方软件进一步超频。核心频率可以轻松超过900MHz，借助更强的散热器乃至液氮等等超过1GHz也是小菜一碟，甚至催化剂控制中心预设的最高值就达到了史无前例的1200MHz。显存频率也能很轻易地提升到5.5GHz乃至6GHz，基本上已经是GDDR5显存颗粒的极限了。

如此彪悍的规格自然会带来不可小觑的发热量和功耗。Radeon HD 6990在空闲情况下的功耗为37W，秉承了近两代优秀的待机功耗控制能力，不过在典型游戏状态下整卡功耗会飙升至350W，拷机时候的峰值功耗更实惠接近375W，不得不使用了两个八针辅助供电接口，每一个都可以供电150W。

软硬兼施： 6990双重手段控制功耗

在硬件设计上，AMD工程师的目标是做一块即使功耗达到450W也依然能够应付的超级显卡，对付Radeon HD 6990的350W左右自然就没什么问题了。为此，AMD在这块卡上使用了极其奢华的电路设计，完全不计成本。供电方面是

第二代数字可编程Volterra供电控制器

，专为VDDC电压控制器开发的大型附属设备，相比之前使用的效率明显提升，可增大电流、降低温度和功耗。

PCB布局方面也发生了很大的变化，抛弃了以往GPU核心在左、供电电路在右的传统，改而将

供电部分设计在PCB中央，位于两颗GPU核心之间，紧挨着PLX桥接芯片。

AMD宣称这种设计能够为每颗GPU核心与相关的显存芯片提供更高效率的供电。

电路板本身也是精挑细选的，只为保证更高的速度、更低的漏电率。

功耗控制

散热器外部看上去和Radeon HD 6800/6900系列非常相似，但是内部已经根据PCB的变化做了相应调整。

全封闭的外壳中，每颗GPU核心对应一个真空均热板散热模块，中间供电电路对应涡轮风扇，还特别加入了相变

导热材料

(TIM)

，声称可将散热性能提升8%，综合起来散热能力比Radeon HD 5970增加了20%之多，足以对付450W的功耗和发热

最为难得的是，相比于前辈Radeon HD 5970，Radeon HD 6990的PCB长度、散热器体积都没有增大，其中

PCB还是11.5英寸(292毫米)

。虽然握在手里依然形如超大型板砖，但至少没有更加变态。

Radeon HD 6970/6950身上开始实践的PowerTune技术这次终于到了真正发挥作用的时刻。

PowerTune是此前PowerPlay技术的进化版本，而且不仅仅是用于节能，更用于加速。它利用显卡上集成的控制处理器来实时监视GPU负载、内部计算GPU功耗，藉此实时、动态地调整运行频率。

一方面，PowerTune技术下显卡的核心、显存频率都不再局限于寥寥几种状态，而是能够根据实际负载无缝地调节与切换，尽可能地不造成任何能耗上的浪费。另一方面，

PowerTune技术能够让显卡在高负载应用种自动加速，从而获得更高的运行频率和更好的游戏性能，但又不会超过热设计功耗的限制范围，以避免在极限测试和

拷机测试

中造成硬件损坏。

从一定程度上讲，这有些类似AMD、Intel处理器上使用的动态加速技术Turbo Core、Turbo Boost(睿频)。

可以说，有了PowerTune技术之后显卡就变得非常智能了，会随时根据实际负载来调节自己的运行状态。负载要求低的时候就逐渐降下来，省电节能降噪；负载要求高的时候就看情况加速上去，根据不同的要求自动超频，带来更好的性能。

按照AMD给出的测试数据，Radeon HD 6990结合PowerTune技术能将最大功耗控制在375W，游戏速度普遍有20-30FPS的提升，FurMark、OCCT等非游戏类的拷机测试中也能适当地小幅加速，达到性能与功耗的兼顾与平衡，而不像NVIDIA GeForce GTX 500系列那样碰到拷机测试就自动降频，看起来功耗低了，但只是一种被动的保护措施而已。

Eyefinity再升级：支持单卡垂直五屏

eyefinty

Radeon HD 6990的输出接口配置也很特别，

一个双链接DVI，四个mini DisplayPort 1.2

，搭配MTS Hub转接器或者采用菊花链串联形式同样可以支持最多六屏输出。至于为什么这么安排，自然有其特殊理由，马上你就可以看到了。

为了方便玩家组建多屏系统并降低成本，

AMD将随卡附送三个转接头，分别可以将mini DP转接为被动式单链接DVI、主动式单链接DVI、被动式HDMI。

迄今为止，AMD已经发布了21款DX11显卡，全部支持Eyefinity多屏输出技术，而且有数十种不同的多屏配置方式，单卡最多可连接六台显示器。与此同时，通过认证或者准备就绪的Eyefinity兼容游戏、应用软件也达到了69款。

而除了传统的各种多屏模式，Radeon HD 6990又带来一种视野广阔、环绕效果更为震撼的新模式：

五台显示器垂直并列

，分辨率支持5×900×1600、5×1080×1920、5×1200×1920等等。