当前位置:求职简历网 > 知识 > 正文

vliw

命名解析 Radeon HD 6000系列的来历可以说是相当曲折。按照AMD最早的计划,Radeon HD 5000系列之后要转向新的核心架构,代号“南方群岛”(Southern Islands),制造工艺也会更新,但是无奈负责代
命名解析

Radeon HD 6000系列的来历可以说是相当曲折。按照AMD最早的计划,Radeon HD 5000系列之后要转向新的核心架构,代号“南方群岛”(Southern Islands),制造工艺也会更新,但是无奈负责代工的台积电40nm工艺花了很长时间才成熟起来,又突然决定取消32nm工艺而直奔28nm,AMD随之被迫更改了产品研发和发布计划,于是就有了新的“北方群岛”(Northern Islands),也就是Radeon HD 6000系列。

简单来说,

Radeon HD 6000系列是一次妥协的产物,仍旧使用R600以来的核心架构体系,制造工艺也还是40nm,不过在诸多内部细节和技术特性方面进行了广泛的增强,无论性能还是功能都大大优于Radeon HD 5000系列,而且产品良率也完全不再是问题。

但是在产品编号上,AMD耍了一个小小的花招。尽管还是一目了然的四位数字,但并不只是简单地把首位从5换成6。上代首发的Radeon HD 5800系列面向的是高端市场,而现在所谓的Radeon HD 6800系列并不完全与之对应,从市场区间划分上来说其实是Radeon HD 5700系列的后辈。等到下个月,AMD还会推出更高端型号

Radeon HD 6970、Radeon HD 6950,开发代号“Cayman”,

继续稳固高端市场地位;年底的时候,我们就将看到新的旗舰型单卡双芯产品

Radeon HD 6990,开发代号“Antilles”。

这一次,AMD同样打算速战速决,不给对手任何喘息之机。

这种新的命名方式一方面源于AMD在显卡市场上掌握着绝对的主动权,有充足的空间按照自己的意愿调整产品线,另一方面也是因为新系列产品的性能表现有了长足的进步,有足够的资本将自己提升一个档次。

HD6800 Barts定位解析:直击GTX460

Radeon HD 5000/6000系列高端产品的性能顺序可以排列为:

6990>5970>6970>6950>5870>6870>5850>6850>5770>5750。

它也直接证明新的编号体系并非只是个数字游戏而已。

Radeon HD 6870

的性能其实稍弱于Radeon HD 5870,但是价格上也要便宜很大一个档次

,因此性价比同样再次有了明显的提高,延续了AMD高端显卡近年来的一贯趋势。

Barts: Radeon HD 6800系列、Cayman: Radeon HD 6900系列将会共同取代Cypress:Radeon HD 5800系列

,以更丰富的产品型号对市场进行细化,满足不同价位消费则会的需要;

Radeon HD 5700系列则并不会立即消失

,而是将伴随新系列继续销售,有消息称可能会改名为Radeon HD 6700系列,但是AMD还没有做出最终决定。

架构与规格:延续传统、全面增强

HD6800架构解析

架构方面之前曾有各种各样的传闻,但是受到各方面限制,特别是台积电代工工艺的落后,Radeon HD 6800系列所属的“北方群岛”家族并没有在核心架构方面进行大规模的重新设计,而是基本沿用了R600以来的4D+1D式SIMD流处理器结构,并在诸多细节上做了优化和增强,AMD称之为“第二代DX11设计”。总的来说,北方群岛更像是一次承前启后的过渡,再往后的下一代我们才会看到基于28nm新工艺的新架构,不出意外就是同样风传了很久的“南方群岛”。

按照AMD的说法,Radeon HD 6000系列架构重点有五大方面的进步:

1、更强的单位面积性能,比上代提升最多35%;

2、第二代DX11设计,更快的曲面细分和几何吞吐;

3、新的和改进的画质功能,包括抗锯齿和

各向异性过滤

4、增强的多媒体加速,包括UVD3

硬件解码

引擎、AMD

APP

并行异构计算技术、蓝光3D立体技术;

5、下一代显示技术,包括Eyefinity+多屏输出、HDMI 1.4a规范、DisplayPort 1.2规范。

Radeon HD 6800系列对内核设计做了重新配置,单精度浮点性能最高能够突破2TFlops(每秒2万亿次计算)大关,每秒钟能够处理的像素也能超过240亿,同时曲面细分单元进行了特别增强(第七代),光栅器(Rasterizer)也配备了两个,Hub部分有PCI-E 2.1总线控制器、UVD3硬件解码引擎、CrossFireX管理引擎、Eyefinity显示控制器等,显存控制器则依然是四个64-bit,总位宽256-bit,继续搭配高速GDDR5显存颗粒。

新核心集成了17亿个晶体管,核心面积为255平方毫米。Radeon HD 6870/6850分别有14个、12个SIMD引擎,每个引擎还是80个流处理器,总共1140个、960个,纹理单元56个、48个,ROP光栅单元都是32个。

Radeon HD 6870被AMD称为“市场甜点的轻松赢家”,核心频率900MHz,单精度浮点性能2.0TFlops,搭载1GB GDDR5显存,等效频率4200MHz,整卡空闲功耗19W、满载功耗151W,使用双插槽散热器和双六针辅助供电接口,输出接口两个DVI、两个mini DisplayPort、一个HDMI。

Radeon HD 6870国内官方建议零售价1899-1999元人民币,直接竞争对手最初被定为GeForce GTX 460 1GB,官方测试数据显示平均超出25-30%,最多可超过50%,不过在最后关头,AMD将对手提高到了GeForce GTX 470,显示了充足的自信心。

Radeon HD 6850则号称是“DX11性能、功耗和价格的新典范”,核心频率775MHz,单精度浮点性能1.5TFlops,同样搭载1GB GDDR5显存,但是等效频率降至4000MHz,整卡空闲功耗仍是19W,但是满载功耗降低到127W,只需单六针辅助供电,不过公版散热器也是双插槽设计,另外输出接口同为两个DVI、两个mini DP、一个HDMI。

Radeon HD 6850国内官方建议零售价1299-1399元人民币,直接竞争对手最初定为GeForce GTX 460 768MB,官方测试数据显示平均超出也有30%左右,最多可超过60%,最后时刻又改成了GeForce GTX 460 1GB。

现在我们就对比一下Radeon HD 6870、Radeon HD 5850。后者核心面积和晶体管规模要大不少(334平方毫米和21.5亿个),流处理器、纹理单元分别多出120个、16个,显存带宽甚至也稍高一些(153.6GB/s和134.4GB/s),但是根据AMD提供的数据,二者3DMark Vantage得分分别为X7730、X7403,也就是说Radeon HD 6870以更小的核心规模实现了更高的性能,单位面积的性能自然更是高出一大截,而且更喜人的是满载功耗保持在同样的水平(151W),空闲功耗更是降低了8W,按幅度计算就是30%,显然新卡的性能功耗比也要好得多。

另外值得一提的是,重新设计的新核心在几何吞吐能力方面也有显著进步,Radeon HD 6870达到了每秒钟9亿个三角形,Radeon HD 5850则是7.25亿个。这可以看作是对NVIDIA宣传几何性能的一个回应。

新特性:强化画质

画质增强

消费级显卡最主要的使命自然是提供更好的3D游戏性能和画面,而提升画质最传统、最广泛的方法当属抗锯齿(AA)和各向异性过滤(AF)。Radeon HD 6800在这两方面都有所革新,还特别简化了相关用户界面,方便使用。

Radeon HD 6800支持新的形态抗锯齿(Morphological Anti-Aliasing),简称MLAA。

该技术由Intel提出,不过此前是基于CPU运算的,AMD则将其移植到了GPU上,使用后期处理过滤技术结合DirectCompute进行加速,全面支持DX9/10/11应用程序。AMD宣称,MLAA可提供全场景抗锯齿,而不限于多边形边缘、Alpha测试表面,速度也要比超级采样,性能上接近于可编程过滤抗锯齿(CFAA)。

MLAA抗锯齿属于一种后期处理效果,换言之就是首先正常渲染每一帧,然后再进行一次着色器处理来执行过滤,这不同于传统的多重采样抗锯齿(MSAA)和超级采样抗锯齿(SSAA),后者都是在帧渲染的同时执行过滤。事实上,MLAA也能用来消除静态图像的锯齿,只不过用在动态画面上效果更好。

MLAA中,过滤器会首先按照不同的像素尺寸样式检测高对比度边缘(锯齿产生的主要原因),假设它们应该是与像素边缘不切合的直线,然后消除每个边缘理想线的长度和角度,根据边缘旁边每个像素的较深和较浅颜色确定符合比例的覆盖范围,最终实现抗锯齿。

由于边缘检测步骤需要频繁的对相邻像素颜色进行采样和重采样,数据重新使用的几率很高。AMD使用LDS(本地数据共享)硬件避免冗余数据预取、显著提升性能。

各向异性过滤也有所改进,尤其是算法方面,还保持了全面的性能和角度独立性。

配合新技术,催化剂控制中心的3D部分同样有了变化,可在此开启MLAA抗锯齿,还有全新的Catalyst A.I.滑块,能够直接控制纹理过滤和优化。

新特性:高效曲面细分

增强曲面细分

DX11带来了诸多新特性、新技术,曲面细分(Tessellation)按说只是其中的一种,但因为显卡厂商的种种不同宣传而备受关注,也引发了不少争议,比如按照NVIDIA的说法,他们的Fermi架构才是真正的DX11架构,因为设计了专门的曲面细分单元,高负载下性能更好。

事实上,当年ATI在Radeon 8500上就首次试验了这种技术的雏形,使用了固顶功能的PN三角形。虽然当时的技术还极不成熟,游戏应用也未普及,但ATI并未放弃,此后每一代产品都在进行更新和完善,比如Xbox 360 GPU上加入了位移映射和自适应曲面细分,Radeon HD 2000、3000两代产品分别支持DX10、DX10.1,Radeon HD 4000系列又增强了性能,但直到Radeon HD 5000系列上才借着DX11的东风修成正果,成为业界标准规范的一部分。Radeon HD 6000系列针对曲面细分又做了深入优化,重点改进了线程管理和缓冲。

AMD提供的数据显示,

Radeon HD 6870相比于Radeon HD 5870在曲面细分性能上有了最多一倍的增加

,不过具体取决于曲面细分因子,1-13的时候普遍都能超过50%,其中5-10的时候效果是最好的。

AMD还特意讲解了部署曲面细分的正确方法,包括将最重要的细节添加到场景中,同时有效压缩几何;专注于最有效的使用模式,理想情况下每个多边形16个像素,取得画质和性能的最佳平衡;自适应曲面细分非常有效,只有在接近观众的物体、边缘轮廓、高细节区域才使用高级别的曲面细分,反之则使用低级别。

AMD声称,过量使用曲面细分并不会有太好的画质效果,反而会让显卡失去效率,比如阴影过多、抗锯齿处理多边形边缘过多等等,暴力使用只是一种无谓的浪费。

新特性:改进影音多媒体

影音播放一贯是A卡的优势,近年来在这方面的投入力度也是越来越强,对HTPC玩家的吸引力也越来越强,源码输出、催化剂画质增强都广为津津乐道。

UVD3.0

Radeon HD 6800上又提出了

“EyeSpeed”视觉加速技术

,包括两大方面:一是GPU并行计算,基于开放的OpenCL、DirectCompute 11标准规范;二是高清视频的解码、输出与播放,支持蓝光3D立体技术,并整合了第三代UVD 3.0视频解码硬件引擎。

UVD 3.0对高清玩家来说尤其诱人。相比前两代,它增

加了MPEG-2、MPEG-4 Part 2 (

DivX/XviD

)、Blu-Ray 3D (MVC)等编码格式的全程硬件解码

,用户可以将更多视频解码工作交给GPU处理,进一步减轻CPU负担。篇幅所限,有关UVD3等视频播放新特性日后会专文深入介绍。

AMD还提到了Radeon HD 6800系列精确的色彩校正技术。借助色域映射引擎,AMD可以在广色域液晶面板上精确地再现原始色彩,并在整个管线内保存色彩细节。

先进的硬件技术自然需要广泛的应用软件支持。经过广泛深入的合作,AMD已经拉上了多家知名的多媒体播放与编辑厂商,Radeon HD 6800尚未发布就获得了大量播放器、编辑器的辅佐,包括ArcSoftTotalMedia Theatre、TotalMediaShowBiz,Corel WinDVD Pro 2010、DigitalStudio 2010,CyberLinkPowerDVD 10 Mark II,DDD TriDef (3D),DivX Plus等等。

新特性:灵活多屏输出Eyefinity+

Eyefinity+

Eyefinity(宽域)多显输出技术是Radeo n HD 5000系列最闪亮的地方之一,只要一块显卡就可以组建最多六屏系统,大大降低了多屏架设的成本,既极大地拓宽了游戏玩家的视野,也非常适合办公、渲染、展示等专业场合。现在,Radeon HD 6000系列又进一步提升,带来了增强版的“Eyefinity+”。

Eyefinity+技术的精髓是DisplayPort 1.2标准规范。相比于此前的1.1a版本,最新的 1.2版本将数据带宽从10.8Gbps翻番到21.6Gbps,视频输出率也从8.64Gbps翻番到17.28Gbps,60Hz 24bpp下的最大分辨率支持提升到2560×2048之上,而且特别支持多流输出(MTS)。

得益于此,Eyefinity+获得了更高的传输带宽,再加上带内立体3D信号,就为支持3D立体技术打开了方便之门,而且尤其是支持单接口多数据流、多显示输出,通俗地说就是一个接口可以连接多台显示器,因而只需要两个DisplayPort接口就能连接六台显示器。

而此前的Eyefinity只能一个接口对应一台显示器,想组建六屏系统就得同时使用六个接口,所以才有了Radeon HD 5870 Eyefinity 6特别版。

Radeon HD 6800系列公版都配备了多大五个输出接口,包括两个mini DisplayPort、两个DVI、一个HDMI,组建多屏系统的方式也非常灵活。

第一种方法:

只使用两个mini DisplayPort接口,其一通过MTS Hub转接来连接三台显示器,其二通过菊花链方式依次连接三台显示器,这就完成了六屏系统。

第二种方法:

同样只使用两个mini DisplayPort接口,分别连接一台MTS Hub,再分别接上三台显示器,六屏搞定。

第三种方法:

其中一个mini

DisplayPort接口

连接MST Hub之后扩展四台显示器,另外两个DVI接口分别连接一台,同样是六屏。

MTS Hub还可以连接多种不同分辨率的显示器,全高清、高清、高清+可以并存。

努力拓展产业生态系统支持也是Eyefinity技术的重中之重。迄今为止,DisplayPort接口显示产品在市面上已经超过35款,Eyefinity认证游戏超过45款、兼容游戏数百款,不久前AMD还与显卡厂商合作推出了相对廉价的DisplayPort转单链接DVI适配器。

性能方面,AMD给出的数据是3×1920×1080水平模式下,Radeon HD 6850/6850单卡在所有主流游戏中都能获得30FPS以上的稳定帧率,部分还可达到甚至超过60FPS。

配合Eyefinity、CrossFireX技术,AMD双卡互连的执行效率也是越来越搞,号称两块Radeon HD 6850相比单卡的性能提升幅度最高可达惊人的99%(《Far Cry 2》),少的也能超过80%。

3×1920×1080三屏模式下,同为双卡的Radeon HD 6870 CrossFireX相比于GeForce GTX 460 1GB SLI的优势也是非常明显,领先幅度少则接近20%,多则达到80%。当然了,这些都是官方宣传数据,仅供参考。

新特性:3D立体

HD3D

现如今,3D立体已经成为不可阻挡的大势所趋,NVIDIA 3D Vision技术都已经获得了上千件产品的支持,AMD自然也不能落后,此番推出了“HD3D”(高清立体)技术。

不过不同于对手的捆绑式方案,AMD选择了与业界合作的开放态度,灵活提供多种解决方案,给用户自主选择的机会,成本也更低。

AMD的3D立体方案中,自己只提供Radeon HD 6000系列显卡硬件,中间件可选Dynamic Digital Depth(DDD)、iZ3D等供应商合作伙伴的方案(前者的就是TriDef),视频和蓝光3D播放软件来自ArcSoft、Corel、CyberLink、Roxio,眼镜及发射器来自Bit Cauldron、XpanD、RealD,至于3D电视、投影仪、显示器等显示设备就广泛多了,某些厂商也正在专门针对AMD方案开发和发布相关显示设备。

为了支持3D立体,Radeon HD 6800系列配备的HDMI接口都已经升级支持HDMI 1.4a规范,支持新款3D立体电视和HDMI帧包装格式。

3D游戏方面,AMD Radeon HD 6000支持DX9/10/11四缓冲,配合DDD、iZ3D的转换软件可为400多款游戏带来立体效果,2011年还会有原生的3D立体游戏。

性能上AMD也给出了一些数据。Radeon HD 6870配合iZ3D中间件在优派的120Hz 3D显示器上以1080p全高清分辨率运行3D立体游戏,平均帧率不低于35FPS,高可接近70FPS。

HD6900 Cayman定位解析:避开GTX580

北方群岛

Radeon HD 6900系列当然是面向高端游戏市场的,将会取代现在的Radeon HD 5800系列,而与Radeon HD 6800/5700系列并肩打江山。当然了,这里不可避免地得重新解释一下AMD的产品型号命名策略。根据最初的计划,Barts、Cayman核心应该分别叫作Radeon HD 6700/6800系列而替代Radeon HD 5700/5800系列,但是首先AMD自然为Barts核心非常优秀,配得上更高的地位,其次Radeon HD 5700系列在主流市场上非常热门、广为追捧,直接就这么拿下实在可惜,于是AMD就玩儿了一个从市场策略上看很聪明、从消费角度看很混乱的做法:Barts、Cayman核心分别提升一个档次,命名为Radeon HD 6800/6900系列,Radeon HD 5700系列则继续留在市场上笼络中端用户,而新的单卡双芯型号则被挤到了顶,只能叫Radeon HD 6990。AMD这么做自然有其充分的理由,毕竟厂商的目标是利用各种可能的手段赚尽可能多的钱,也就是追求利润最大化。AMD在DX11市场上居于领先地位,也有一定的空间和余地按照自己的意愿去部署产品线,作为消费者就只能被动接受了。不管怎么说,Radeon HD 6000系列毕竟是新核心新产品,总比直接改名的马甲好得多。

按照AMD最后时刻敲定的策略,

Radeon HD 6970在国内的官方建议零售价为2999-3099元人民币,Radeon HD 6950则是2299-2399元人民币

,远远低于此前预计的3999元、2999元。至于竞争对手,AMD延续了田忌赛马的策略,

Radeon HD 6900系列避开锋芒毕露的GeForce GTX 580(3999元)而携手杀向刚刚诞生的GeForce GTX 570(2999元)

或者更确切地说主要由Radeon HD 6970去对付GeForce GTX 570,Radeon HD 6950则暂时没有很直接的对手

,因为往下的GeForce GTX 460、GeForce GTS 450分别交给了Radeon HD 6800系列、5700系列。

当然了,GeForce GTX 580也不会被放任自流,因为AMD仍有迄今为止地球上最快的显卡Radeon HD 5970,明年初还会更新为Radeon HD 6990,继续二打一的策略。

全新内核架构:4D图形与计算

无论开发什么新产品,设计人员总要首先设定一些预期目标,然后通过技术上的努力去实现,从而满足市场和用户的需要。可以说,只有合理的目标与顺利的执行有机结合才能诞生一款优秀的产品。

4D图形与计算

在Cayman Radeon HD 6900系列身上,AMD就提出了

四大目标:高效的图形与计算架构、强大的几何性能、新的画质技术、新的能效与功耗管理

。下边我们就从这四个方面着手,细细品位Radeon HD 6900的内核架构与技术精髓。

为了实现高效的图形与计算架构,AMD该用了

重新定义的VLIW4架构

,同时还引入了双图形引擎、更多SIMD引擎与纹理单元、升级的渲染后端、更高的显存带宽、新的GPU计算技术。

VLIW全称为Very Long Instruction Word,意思是超常指令字架构,是一种非常长的指令组合,通过把许多条指令连在一起来增加运算的速度。从第一代DX10 R600内核开始,AMD就一直使用VLIW5方式,又称5D式,也就是五个流处理器编为一组,但并非所有流处理器都是相同的,其中四个较小、较简单,另一个较大、较复杂做为特殊单元。这种架构设计在硬件方面看有着很高的效率和很深的潜力,但是结构比较复杂,对应的软件编程就很困难,始终难以真正发挥全部实力。

如今AMD终于在内核层面翻新为VLIW4方式(4D式),每个编组由四个流处理器、一个分支单元、一个通用目的寄存器组成,其中四个流处理器的整数、浮点执行功能完全相同(不再有T-Unit),可以执行四路并行发射,但是特殊功能占据四个发射位中的三个。

AMD宣称,VLIW4架构有着更好的利用率,能将性能与核心面积比提高10%,简化调度与寄存器管理,逻辑核心也可以很好地重复使用。

除了前端,渲染器后端也进行了升级,支持写入操作合并,16位整数操作提速两倍,32位浮点操作也快了两到四倍。

GPU并行计算方面,新内核最大的亮点就是增加了一个全局异步寄存器,从而支持异步分配,可以同时执行多个计算内核,每个内核都有自己的命令队列与受保护虚拟寻址域。此外还有两个双向DMA引擎(更快的系统内存读写速度)、着色器读取操作合并、LDS(本地数据存储)直接预取、流控制改进、更快双精度操作(单精度的1/5提高到1/4)。

全新内核架构:曲面细分性能

曲面细分性能

在NVIDIA所谓真DX11的大肆宣传下,几 何性能特别是曲面细分性能的地位被提高到了一个夸张的地步,但事实上AMD在这方面早已经历了多个时代的进化,现在更是发展到了第八代曲面细分单元——Radeon HD 6800、5000系列分别是第七代和第六代。

Radeon HD 6900配备了

两个独立又合作的图形引擎

,每时钟周期内都能处理两个原语(Primitive),具备基于区块的负载均衡,转换和隐面消除率翻番。

每个图形引擎内都有一个光栅器与一个第八代曲面细分单元

,前者每时钟周期内可处理最多32个像素,后者

结合用于更高曲面细分等级的片外缓冲,可实现最多三倍于Radeon HD 5870的曲面细分性能,至少也会有1.5倍

。《异形大战铁血战士》、《地铁2033》、《失落的星球2》、《潜行者:普里皮亚季的呼唤》、Unigine Heaven等一系列NVIDIA宣传自己曲面细分性能强劲的游戏和测试程序中,Radeon HD 6970相比于Radeon HD 5870能带来30-69%的大幅性能提升。

不过我们还是想唠叨一句:

曲面细分是个好技术,但终究只是DX11技术群中的一份子而已,并不是唯一,多线程、计算着色器、纹理压缩等技术的重要性丝毫不比它弱。AMD、NVIDIA都完全实现了对DX11技术的支持,只不过因为发展思路和策略不同,具体方式和执行效率有所差异,不存在什么真假之说

全新内核架构:AA/AF增强画质

抗锯齿

画质增强技术方面,AMD每一代新产品都会加入新功能,此番除了形态抗锯齿(MLAA)之外还有

增强画质抗锯齿(EQAA)、增强各向异性过滤与纹理过滤

EQAA其实并不是全新的抗锯齿技术,而是

属于多重采样抗锯齿(MSAA)的一种新模式,每像素最多16个覆盖

采样点

,双倍于标准的MSAA

,而且色彩与覆盖采样点的数量可以独立控制,并能够自定义采样模式与过滤器。有趣的是,

EQAA兼容自适应抗锯齿(AAA)、超级采样抗锯齿(SSAA)、MLAA

,换言之就是能够同时使用,共同改善画质。

AMD宣称,

EQAA可以在同等量的显存消耗下带来更好的画质,对性能的影响也最多不过5%左右

MLAA就不再重复介绍了,只看看AMD举的一个例子,照此说来MLAA、MSAA搭档合作效果最佳。

全新内核架构:全新功耗管理

功耗管理

说起高端显 卡,除了强大的性能之外往往还伴随着恐怖的高功耗,以及随之而来的复杂散热器、烦人噪音、巨额电费。GeForce GTX 580引入了硬件电源监控电路,Radeon HD 6900则在Radeon HD 5000/6800系列的基础上又祭出了全新技术“PowerTune”(电源调节),灵活性上远胜历史悠久的ATI PowePlay。

首先必须解释一个很常见的名字:TDP(热设计功耗)。和微处理器(CPU)一样,GPU图形核心也会在运行中消耗能量,并将其转换成热量,再散发出去,能量消耗的速度受限于系统提供能量、挥发热量的双重能力。为此GPU厂商就向系统制造商提供了热设计功耗这么一个参数,代表稳定运行所需要的最大能量消耗值,方便他们合理地设计系统,而且该参数受电压、核心频率、工作负载、漏电率、环境温度等多种因素的影响。

ATI PowerPlay只是简单地指定了显卡核心与显存频率的两三个等级,分别对应待机、日常负载、游戏和拷机负载等应用,一旦确定就不可再更改。

AMD PowerTune则利用显卡上集成的控制处理器来实时监视GPU负载、内部计算GPU功耗,藉此实时动态调整运行频率,从而在满足热设计功耗限制的前提下带来更高的性能,特别是允许GPU在高负载状态下运行于更高的频率

换句话说,GPU以往只有中间状态、最高状态等几种僵死的P-State性能等级,现在

加入AMD PowerTune技术后就有了几乎无数种状态并能实时调节转换,允许最高状态下的核心频率更高,同时仍然满足热设计功耗要求,而那些受热设计功耗限制的应用程序也可以从这种更高频率中获益。

除此之外,Radeon HD 6900系列还支持

直接控制GPU功耗

,不需要再绕过频率和电压调节,并支持AMD OverDrive工具。

技术上讲解和理解起来都很晦涩,但看看下边的典型应用实例你就会明白了。首先大家需要知道的是,显卡实际功耗在不同环境下是相差很大的,FurMark、3DMark、OCCT等测试和拷机软件往往能将显卡功耗发挥到很高水平甚至达到极致,但主流3D游戏中其实都是比较低的。这就是AMD PowerTune技术进一步发威的前提。

Radeon HD 6950在默认功耗设置下运行3DMark Vantage柏林噪音测试,GPU核心频率在700MHz上下的较大范围内实时动态调整,程序运行帧率则稳定保持在接近150FPS。

然后

在催化剂控制中心的OverDrive页面内,拖动功耗控制(Power Control)的滑杆,范围从-20%到+20%,代表显卡功耗的降低和增加范围

同样的测试中,默认功耗下GPU核心频率在很大范围内调节,但极少超过750MHz,此时平均帧率140FPS;增加5%的功耗空间后,核心频率大部分时间都在750MHz之上,而且是不是达到800MHz,此时帧率升至155FPS;

增加10%的功耗空间时核心频率就一直运行在额定的800MHz,帧率继续升至162FPS

转到《异形大战铁血战士》这样的普通游戏,默认设置下帧率超过55FPS,很流畅,都功耗也超过了250W,相当费电;于是将功耗空间降低10%,帧率仍有55FPS左右,实际功耗降至250W之下;

再降低20%呢,帧率跌至50FPS,依然足够流畅,功耗却大幅降低至220W多一点,从而在保证游戏体验的前提下节省耗电量

另外除了功耗控制技术的改进,Radeon HD 6900系列的散热设计同样毫不含糊,和Radeon HD 6800系列一样使用了第五代真空腔均热板(Vapor Chamber)技术,由涡轮风扇、大面积纯铜底座、纯铜热管、密集散热鳍片等部分组成。

HD6990 Antilles定位解析:完美接任HD5970

虽然台积电28nm工艺非常不给力,致使AMD野心勃勃的南方群岛计划流产,但是AMD依旧迅速变招拿出了B计划,开始推出第二代DX11 Radeon HD 6000系列家族,而且在市场策略、核心架构方面都有了相当大的变化,比如Radeon HD 6800系列地位提升、Radeon HD 6900系列改用VLIW4 4D式流处理器单元。虽然所谓全新架构的处子秀不算很惊艳,没有撼动GeForce GTX 580的市场地位,但这也正好符合AMD的一贯策略,即以小核心占领性能级市场,然后再双芯并联去争夺发烧级市场。后边这一步,正是要靠Radeon HD 6990去努力。

Radeon HD 6990开发代号Antilles,原计划在2010年底发布,但因为种种原因拖延至今。GeForce GTX 590至今神龙见首不见尾,虽说按道理性能应该更恐怖,但是看样子还得登上一段时间(NVIDIA的下一步是本月中旬的GeForce GTX 550 Ti)。就这样,Radeon HD 6990在并无多大压力的情况下得以顺利接过前辈的枪、荣登卡皇宝座,再次成为地球上最快的显卡。

不管你是否认同这种单卡双芯的形式,它都是无可争议的性能王者。

当然了,这也标志着Radeon HD 5970完美的一生开始结束,老卡皇可以笑着退休了。

规格解析:双芯并联+超频

Radeon HD 6990使用了两颗Cayman Radeon HD 6900图形核心并使用PLX桥接芯片内部连,因此在架构上就没什么好说的了,完全继承了Radeon HD 6970/6950的诸多新特性,包括VLIW 4D流处理器单元、升级的渲染器后端、增强的GPU计算、双图形引擎与两个第八代曲面细分单元、EQAA增强画质抗锯齿、PowerTune功耗管理技术等等。当然了,Radeon HD 6870/6850以来引入的大量功能特性也都延续了下来,包括MLAA形态抗锯齿、改进的各向异性过滤、UVD3视频解码引擎、增强的多屏输出Eyefinity等等。无论从哪方面看,Radeon HD 6990都完全称得上是集大成者,综合了AMD迄今为止最优秀的图形和视频技术。

规格解析

Radeon HD 6990拥有

多达52.8亿个晶体管,3072个流处理器、192个纹理单元、64个ROP单元,显存位宽2×256-bit,显存容量多达4GB

,都是Radeon HD 6970/6950的两倍,不过受散热、功耗的限制,预设频率并没有达到Radeon HD 6970的级别,但也高于Radeon HD 6950,其中

核心为830MHz,显存等效为5GHz

Radeon HD 6990的

浮点计算能力因此高达惊人的单精度5.1TFlops、双精度1.27TFlops,分别符合IEEE754-SP、IEEE754-DP标准

,另外纹理填充率159.4GT/s、像素填充率53.1GP/s、显存带宽320GB/s。

更恐怖的是,Radeon HD 6990还有相当大的超频空间。首先,它和Radeon HD 6970/6950一样

配备了

双BIOS

和切换开关,因此提供两种模式:默认模式下核心电压1.12V,频率如上;超频模式下核心电压加至1.175V,频率直接也拉升到880MHz,显存频率不变,基本相当于两块Radeon HD 5970。

这时候的Radeon HD 6990将拥有

5.4TFlops

单精度浮点运算能力,纹理、像素填充率也都有进一步增加。

如果游戏玩家和发烧友们还不满足,可以再借助催化剂控制中心、AMD OverDrive或者第三方软件进一步超频。核心频率可以轻松超过900MHz,借助更强的散热器乃至液氮等等超过1GHz也是小菜一碟,甚至催化剂控制中心预设的最高值就达到了史无前例的1200MHz。显存频率也能很轻易地提升到5.5GHz乃至6GHz,基本上已经是GDDR5显存颗粒的极限了。

如此彪悍的规格自然会带来不可小觑的发热量和功耗。Radeon HD 6990在空闲情况下的功耗为37W,秉承了近两代优秀的待机功耗控制能力,不过在典型游戏状态下整卡功耗会飙升至350W,拷机时候的峰值功耗更实惠接近375W,不得不使用了两个八针辅助供电接口,每一个都可以供电150W。

软硬兼施: 6990双重手段控制功耗

在硬件设计上,AMD工程师的目标是做一块即使功耗达到450W也依然能够应付的超级显卡,对付Radeon HD 6990的350W左右自然就没什么问题了。为此,AMD在这块卡上使用了极其奢华的电路设计,完全不计成本。供电方面是

第二代数字可编程Volterra供电控制器

,专为VDDC电压控制器开发的大型附属设备,相比之前使用的效率明显提升,可增大电流、降低温度和功耗。

PCB布局方面也发生了很大的变化,抛弃了以往GPU核心在左、供电电路在右的传统,改而将

供电部分设计在PCB中央,位于两颗GPU核心之间,紧挨着PLX桥接芯片。

AMD宣称这种设计能够为每颗GPU核心与相关的显存芯片提供更高效率的供电。

电路板本身也是精挑细选的,只为保证更高的速度、更低的漏电率。

功耗控制

散热器外部看上去和Radeon HD 6800/6900系列非常相似,但是内部已经根据PCB的变化做了相应调整。

全封闭的外壳中,每颗GPU核心对应一个真空均热板散热模块,中间供电电路对应涡轮风扇,还特别加入了相变

导热材料

(TIM)

,声称可将散热性能提升8%,综合起来散热能力比Radeon HD 5970增加了20%之多,足以对付450W的功耗和发热

最为难得的是,相比于前辈Radeon HD 5970,Radeon HD 6990的PCB长度、散热器体积都没有增大,其中

PCB还是11.5英寸(292毫米)

。虽然握在手里依然形如超大型板砖,但至少没有更加变态。

Radeon HD 6970/6950身上开始实践的PowerTune技术这次终于到了真正发挥作用的时刻。

PowerTune是此前PowerPlay技术的进化版本,而且不仅仅是用于节能,更用于加速。它利用显卡上集成的控制处理器来实时监视GPU负载、内部计算GPU功耗,藉此实时、动态地调整运行频率。

一方面,PowerTune技术下显卡的核心、显存频率都不再局限于寥寥几种状态,而是能够根据实际负载无缝地调节与切换,尽可能地不造成任何能耗上的浪费。另一方面,

PowerTune技术能够让显卡在高负载应用种自动加速,从而获得更高的运行频率和更好的游戏性能,但又不会超过热设计功耗的限制范围,以避免在极限测试和

拷机测试

中造成硬件损坏。

从一定程度上讲,这有些类似AMD、Intel处理器上使用的动态加速技术Turbo Core、Turbo Boost(睿频)。

可以说,有了PowerTune技术之后显卡就变得非常智能了,会随时根据实际负载来调节自己的运行状态。负载要求低的时候就逐渐降下来,省电节能降噪;负载要求高的时候就看情况加速上去,根据不同的要求自动超频,带来更好的性能。

按照AMD给出的测试数据,Radeon HD 6990结合PowerTune技术能将最大功耗控制在375W,游戏速度普遍有20-30FPS的提升,FurMark、OCCT等非游戏类的拷机测试中也能适当地小幅加速,达到性能与功耗的兼顾与平衡,而不像NVIDIA GeForce GTX 500系列那样碰到拷机测试就自动降频,看起来功耗低了,但只是一种被动的保护措施而已。

Eyefinity再升级:支持单卡垂直五屏

eyefinty

Radeon HD 6990的输出接口配置也很特别,

一个双链接DVI,四个mini DisplayPort 1.2

,搭配MTS Hub转接器或者采用菊花链串联形式同样可以支持最多六屏输出。至于为什么这么安排,自然有其特殊理由,马上你就可以看到了。

为了方便玩家组建多屏系统并降低成本,

AMD将随卡附送三个转接头,分别可以将mini DP转接为被动式单链接DVI、主动式单链接DVI、被动式HDMI。

迄今为止,AMD已经发布了21款DX11显卡,全部支持Eyefinity多屏输出技术,而且有数十种不同的多屏配置方式,单卡最多可连接六台显示器。与此同时,通过认证或者准备就绪的Eyefinity兼容游戏、应用软件也达到了69款。

而除了传统的各种多屏模式,Radeon HD 6990又带来一种视野广阔、环绕效果更为震撼的新模式:

五台显示器垂直并列

,分辨率支持5×900×1600、5×1080×1920、5×1200×1920等等。

知识相关

知识推荐

求职简历网为你分享个人简历、求职简历、简历模板、简历范文等求职简历知识。

Copyrights 2018-2023 求职简历网 All rights reserved.