今日显卡导读
&&&&&& &&&性能和效率的革命!GTX670首发全测试
性能和效率的革命!GTX670首发全测试
日 21:00&出处:&【原创】 作者:蒋尚文 编辑:
开普勒三巨头到齐:显卡/游戏迎辉煌时代
泡泡网显卡频道5月10日&从第一款真正意义上的3D电脑游戏诞生开始,显卡就如影随形。可以说显卡和游戏是互相促进而又互相制衡。在显卡发展史上,既有显卡性能过剩的时期,又有游戏画面超前发展的阶段。
从8800GTX拉开DX10大幕开始,以CRYSIS为首的DX10,DX11游戏画质突飞猛进,让当时的显卡不堪重负。然而时过境迁,随着28nm工艺的应用和GCN、Kepler架构的更新,A/N两家的显卡性能爆发式增长,就目前来看,现有游戏已经难不倒最新显卡了。
在今年的NGF2012大会上,NVIDIA创始人黄仁勋信心满满的邀请到了大名鼎鼎的“显卡危机”系列游戏开发商Crytek公司CEO,而《虚幻4》、《孤岛危机3》、《HAWKEN》、《使命召唤9》、《光荣使命》,这几款即将发布游戏和引擎的画面,让在场的数千名游戏玩家惊讶不已。
毫无疑问,2012年将是游戏画质再次提升的一年,更强劲的显卡也终将找到用武之地。继GTX680、GTX690之后,GCN和Kepler架构优劣之争基本尘埃落定,NVIDIA今天又发布了第三款Kepler架构次高端显卡——GTX670。那这款更注重性价比的产品在规格删减之后,较之旗舰显卡性能会有多大的损失?是否能继续保持性能领先竞争对手?
能否超越HD7970?GTX670规格解析
首先我们来看看NVIDIA的公版产品,作为NVIDIA目前次高端的型号,GTX670在硬件配备方面可以看成是GTX680的删节版,但同样搭载了GK104显示核心,显存规格也和GTX680并无二致,这款GTX670的性能应该不会让大家失望。
GTX670采用的GK104核心拥有1344个CUDA核心,112个纹理单元以及32个ROP光栅单元,核心频率915MHz,等效显存频率6008MHz,搭配2GB GDDR5显存,位宽256bit。长篇大论的分析相信大家看得都很累,最后我们将Tahiti与GK104这两颗GPU的所有规格都列出来,进行全方位的对比:
下面就通过数据分析一下架构的特性:
1. GK104的晶体管数比GF110减少了,但流处理器数量达到了三倍,NVIDIA改进架构、提高浮点运算的努力效果显著。但是,同为1536个流处理器,GK104的晶体管数要远大于Cayman核心,这就证明了SIMT还是要比SIMD更消耗晶体管;
2. GTX680的核心与显存频率都创新高,但是TDP却不到200W,这都要归功于它小核心的设计、以及不再使用双倍CUDA频率的作法,NVIDIA控制功耗的作法成效显著;
3. Tahiti的晶体管数是GK104的1.22倍,流处理器数量是1.33倍,这两个数字差距不是很大,N/A双方自DX10时代以来头一次达到了相似的晶体管利用率;
4. 从Cayman到Tahiti,用了1.63倍的晶体管数才让流处理器数量达到了原来的1.33倍;从GF110到GK104,NVIDIA减少了晶体管数量却让流处理器达到原来的三倍;可以看出双方都在向对方的架构靠拢,目的只有一个,就是提高GPU的运算效能;
通过之前的测试数据来看,的GCN架构相比上代确实提高了GPU的效能。而NVIDIA方面,GTX670的性能也必定远超GTX580。
在核心面积、晶体管数量、功耗、流处理器数量、显存容量、显存位宽得各方面都不占优势(唯一的优势就是频率)的情况下,GTX670的综合性能是否能够超越HD7970?
公版GTX670做工设计拆解赏析
&& GTX670依然沿用传统的涡轮风扇设计。
从显卡背面可以看到,GTX670采用了有史以来最短的次高端PCB板,NVIDIA可能认为GTX670不需要更复杂的PCB就能发挥出全部效能,而散热器补齐了整个显卡的长度。
整卡重量为580克,入手感觉比较轻。
GTX670和之前所有公版显卡不同,采用了与众不同的散热器设计,PCB比散热器短了不少。
&& 供电采用4相核心供电设计,双6PIN 12V供电接口,公版相对用料扎实,做工精湛。
显卡采用28nm GK104核心架构,内建1344个CUDA核心,112个纹理单元以及32个ROP光栅单元,核心频率915MHz。
和GTX680一样,显卡配备了8颗H5GQ2H24AFR-R0C颗粒,显存带宽256bit,显存容量2048MB,显存颗粒的理论极限速率达到6.0Gbps,轻松应对高分辨率画质的3D游戏。
GTX670显卡接口提供了双DVI+DisplayPort+mini-HDMI接口,输出分辨率高达。七彩虹670显卡原生支持3屏输出,最高可支持4屏输出,为高端玩家提供身临其境的游戏体验。
首发显卡曝光:索泰非公版GTX670
索泰670-2GD5极速版基于NVIDIA公版产品,采用最新28nm制造工艺的GK104显示核心,1344个流处理器。在显存容量和显存位宽方面与GTX680保持了一致,采用了2GB GDDR5显存设计,256bit显存位宽。Base/Bost/显存频率达到915/ Mhz。除此之外,GTX680特有的GPU动态提速技术、自适应垂直同步、TXAA/ FXAA等先进技术,在670身上也是一应俱全,这也全都得益于Kepler架构的优异性能。
做工方面,索泰670-2GD5极速版延续了索泰一向豪华用料的作风,整张PCB上面电容和电器元件分布十分密集而有序。PCB的设计风格也与680极其相似,POWER部分都采用了横向的布局设计,辅助供电接口则采用竖向设计,更大的节约了PCB空间。
索泰670-2GD5极速版采用了4+2相的顶级SMT供电设计,超低内阻的MOS管品质优异,保证了整张显卡的供电稳定。显存方面使用的是现代0.4ns的显存颗粒,显存频率高达6008Mhz,整卡功耗比680更低,仅有170w。
散热方面,采用了公版原装进口的嵌入式热管散热片+动力强劲的涡轮风扇设计,配备底部搭配大面积的铜底接触面,而且还搭配三根高速解热的热管。在Kepler全新的高效能架构下,这套散热系统如鱼得水。相对传统的热管,散热面积更大,大大提升了散热效率。
在接口方面,索泰670-2GD5极速版采用双DVI+HDMI+DP输出,可以实现各种双头输出模式,并且支持一卡三屏。另外显卡还配备EMI屏蔽罩的全数字输出接口,提供更出色的输出效果。
首发显卡曝光:七彩虹公版GTX670
七彩虹推出了两款GTX670,首先送测的是这款公版的GTX670。
&&除了七彩虹的logo不同以外,PCB、散热供电和频率设置都和公版并无二致。
前面已经对公版显卡有了详细的介绍,这里不再赘述,喜欢公版的朋友可以关注这款显卡。
首发显卡曝光:影驰非公版GTX670
影驰GTX670采用了基于最新28nm工艺的GK104显示核心,GK104拥有1344个CUDA Cores。它不但能完美支持DirectX11.1 API、CUDA、PhysX、3D VISION、PureVideo高清硬件加速技术,还支持最新的动态超频技术Dynamic Clocking动态超频技术、NVIDIA 3D Vision Surround技术以及NVIDIA Adaptive Vsync技术。
影驰GTX670采用了6+8PIN进行供电,而基础频率运行在的(6008),搭载2GB/256Bit的极速GDDR5显存。而其动态提速频率为(6008),并且可以通过搭配影驰自主研发的Magic Panel K提供更大的频率提速空间,大大提升显卡在游戏中的表现。
GeForce GTX 670是GeForce GTX 680把流处理器数量减少一组得来的,其在性能、功耗、温度等方面都有非常相近表现,而由于NVIDIA在这代产品中加入了GPU Boost功能,使得频率的上限有所限制。不过本着DIY精神,影驰尝试将GTX 680的BIOS刷入GTX 670中,在提高了Base Clock的基础上,超频后Boost Clock也会一并提高,性价比着实领先GTX 680不少。
影驰GTX670四星黑将采用了银河双子星散热技术。该散热由大面积铜制底部、4根特别加工的无压缩超高效热管组成。银河双子星还采用了大量大面积散热铝片加上双9CM高效风扇进行散热。完全满足GTX670满载以及Dynamic Clocking的发热需求。而其银河双子星的LOGO上还采用Led设计,晚上更显个性。
影驰GTX670在输出方面提供了2DVI*2、HDMI*1、DP*1,高端接口一应俱全。而GTX680为NVIDIA首块原生单卡支持4屏输出的显卡,用户只需接上所有接口即可轻松体验应用。
首发显卡曝光:非公版GTX670
华硕也在第一时间发布了GTX670显卡。
沿用了成熟的DirectCU II散热设计。
加装了背板,显卡更结实。
重新设计的供电
超合金供电
散热器特写
接口方面,显卡采用的是DP+HDMI+双DVI的组合,可以支持单卡三屏环绕功能!
首发显卡曝光:技嘉非公版GTX670
技嘉也第一时间推出了非公版的GTX670。
和公版不同,技嘉GTX670采用了更高规格的6+8pin供电。
3风扇散热器的冷却效率非常高,而且静音控制的很不错。
接口方面,显卡采用的是DP+HDMI+双DVI的组合,可以支持单卡三屏环绕功能!
首发显卡曝光:映众非公版GTX670
日,NVIDIA全球战略合作伙伴,一线AIC映众(Inno3D)携手NVIDIA,正式发布全新的旗舰级别GeForce GTX 670冰龙版显卡!作为Kepler架构的第二款单核芯产品,GeForce GTX 670延续了GTX680高性能低功耗的特点,沿用最新的28nm工艺制程生产,配备了1344个CUDA处理器,拥有2GB的超大海量显存,拥有GPU Boost动态提速频率技术,更重要的是,其价格要相比GTX680来得更亲民一些,因此更受高端玩家的关注!
在去年采用GTX580方案设计生产GTX570冰龙版大获成功之后,此次映众(Inno3D)再次沿用这种采用旗舰级方案设计生产副旗舰级产品的策略。这款映众(Inno3D)GTX670冰龙版显卡就是采用增强型的GTX680公版P2002 PCB,搭配映众(Inno3D)全新独家专利的HerculeZ 3000百变大力神三风扇五热管散热器的强强组合,在保障显卡稳定之余,还可以为GTX670提供更澎湃的动力,更强劲的散热,同时默认频率也大幅度提升到了MHz的超公版水平,默认性能已经基本达到了公版GTX680的水平,可以说是目前市场上最强悍的GTX670显卡!在发布首日,这款GTX670冰龙版已经第一时间到货,报价为3199元,与公版同价,性价比非常强悍!
映众(Inno3D)GTX670冰龙版基于GTX680 P2002公版方案增强设计,搭载GK104核心,采用NVIDIA最新的28nm工艺制程。核心拥有1344个CUDA处理器,核心频率为1020MHz,借助Boost加速技术,最高可到1100MHz,完美支持DirectX 11.1标准,支持CUDA,PhysX,3D Surround,3D Vision,PureVideo,OpenGL 4.1,Displayport以及HDMI 1.4等技术标准。
散热方面是这款映众(Inno3D)GTX670冰龙版的另一特色!GTX670冰龙版采用映众(Inno3D)全新设计的HerculeZ 3000百变大力神散热器,拥有五热管与三风扇的豪华配备,与之前的三风扇五热管散热器相比,这款全新的HerculeZ 3000百变大力神最大的特点就是易拆洗可定制!
HerculeZ 3000百变大力神散热器的导流罩采用模块化设计,使用六角螺丝固定,用户可以通过显卡随卡赠送的六角螺丝刀轻松将其拆卸下来,对其进行清洗,当然,风扇叶片亦是可以轻松拆下来清洁的。除了可以清洗之后,HerculeZ 3000百变大力神还支持用户对其进行改造。比如追求静音的用户,可以选择拆下一个或者两个风扇,以令噪音更低!而追求极限超频的用户,则可以选择组建双大台风的散热方案!
接口方面,显卡采用的是DP+HDMI+双DVI的组合,可以支持单卡三屏环绕功能!
开普勒之架构:流处理器暴增之谜
基于效能和计算能力方面的考虑,NVIDIA与AMD不约而同的改变了架构,NVIDIA虽然还是采用SIMT架构,但也借鉴了AMD“较老”的SIMD架构之作法,降低控制逻辑单元和指令发射器的比例,用较少的逻辑单元去控制更多的CUDA核心。于是一组SM当中容纳了192个核心的壮举就变成了现实!
通过上面这个示意图就看的很清楚了,CUDA核心的缩小主要归功于28nm工艺的使用,而如此之多的CUDA核心,与之搭配的控制逻辑单元面积反而缩小了,NVIDIA强化运算单元削减控制单元的意图就很明显了。
Fermi的硬件相关性检查变为Kepler的软件预解码
此时相信有人会问,降低控制单元的比例那是不是意味着NVIDIA赖以成名的高效率架构将会一去不复返了?理论上来说效率肯定会有损失,但实际上并没有想象中的那么严重。NVIDIA发现线程的调度有一定的规律性,编译器所发出的条件指令可以被预测到,此前这部分工作是由专门的硬件单元来完成的,而现在可以用简单的程序来取代,这样就能节约不少的晶体管。
随意在开普勒中NVIDIA将一大部分指令派发和控制的操作交给了软件(驱动)来处理。而且GPU的架构并没有本质上的改变,只是结构和规模以及控制方式发生了变化,只要驱动支持到位,与游戏开发商保持紧密的合作,效率损失必然会降到最低——事实上NVIDIA著名的The Way策略就是干这一行的!
The Way(游戏之道)计划可以保证NVIDA的GPU架构与游戏完美兼容
这方面NVIDIA与AMD的思路和目的是相同的,但最终体现在架构上还是有所区别。NVIDIA的架构被称为SIMT(Single Instruction Multiple Threads,单指令多线程),NVIDIA并不像AMD那样把多少个运算单元捆绑为一组,而是以线程为单位自由分配,控制逻辑单元会根据线程的任务量和SM内部CUDA运算单元的负载来决定调动多少个CUDA核心进行计算,这一过程完全是动态的。
但不可忽视的是,软件预解码虽然大大节约了GPU的晶体管开销,让流处理器数量和运算能力大增,但对驱动和游戏优化提出了更高的要求,这种情况伴随着AMD度过了好多年,现在NVIDIA也要面对相同的问题了,希望他能做得更好一些。
GTX670频率:CUDA频率不再是双倍
除了CUDA核心数量大增之外,开普勒架构还有个很明显的改变,那就是CUDA核心的频率不再是GPU频率的两倍,现在整颗GPU所有单元的工作频率都是相同的,GTX680的默认频率达到了1GHz!
NVIDIA的上代产品,比如GTX560Ti,一些AIC的超频版本默认核心频率可达900MHz,CUDA频率是1800MHz。按理说如果新一代架构改变不是很大的话,在28nm的帮助下核心频率到1GHz没有问题,那CUDA频率应该可以到2GHz才对。而现在的情况则是CUDA的频率“被减半了”。
NVIDIA官方对CUDA与核心同频的解释是——功耗原因,为了尽可能的控制GTX680的功耗,不再让CUDA工作在两倍频率下。
对于这种解释,笔者并不理解,如果CUDA频率真能工作在2GHz下,性能提升两倍,此时功耗增长两倍又如何?如此增加功耗是值得的,并不影响GTX680显卡的“每瓦性能”。
所以,笔者猜测此次CUDA与核心同频,应该有别的原因,以下猜测纯属虚构,大家随便看看不要当真:
原因一:此次NVIDIA对S的结构进行了大幅度的调整,除了控制逻辑单元削减外,过于密集CUDA单元结构也发生了一些变化,导致CUDA单元或控制逻辑单元上不了更高的频率,所以现在就和AMD一样同频了;
原因二:保留实力。NVIDIA官方发言人在AMD发布HD7970之后曾表示:AMD GCN架构“南方群岛”核心的表现并没有超出NVIDIA的预期,一切尽在掌握之中。而Kepler架构则将比南方群岛要强出许多,因为本来NVIDIA为新架构设计的对手是AMD更强的新产品,但实际上南岛并未达到NVIDIA的设想性能。
原因三:确实是功耗问题,强行让CUDA工作在双倍频率下对GPU的电路设计提出了很高的要求,28nm新工艺目前可能还尚未完全吃透,上高频有一定的难度。
虽然CUDA频率达不到两倍,但NVIDIA通过加入类似Intel睿频的技术,一定程度上提高了工作频率,性能也同比增长,而且高于预期,或者说是对手不如预期。
GTX670显存:频率全面超越对手
我们先来回顾一下显存控制器的发展史:
NVIDIA:G80(384bit)-G92(256bit)-GT200(512bit)-GF100(384bit)
AMD:R600(512bit)-RV670(256bit)-RV770(256bit)-Cypress(256bit)-Cayman(256bit)-Tahiti(384bit)
384bit显存应该是高端显卡的标配
● GK104核心为什么只有256bit显存?
大家应该注意到了,NVIDIA近年来的高端显卡,很少有256bit显存的设计,现在就连AMD都升级到384bit显存,256bit已经很难在跻身为高端,为什么NVIDIA新一代的GTX680居然降级到了256bit?
***在其核心代号上面,GK104的定位就是取代GF104/GF114,它并非是NVIDIA最高端的GPU,显存方面自然不会用最高端的配置。
● GTX680、670显存频率弥补位宽不足,达到6GHz!
另外,之前我们反复提到过,AMD从HD4870开始第一次使用GDDR5显存,GDDR5的标准几乎可以说是AMD的人一手制定的,AMD历代GPU凭借GDDR5超高频率的优势,以较低的显存位宽很好的控制了成本。
而NVIDIA从GTX480开始也使用了GDDR5显存,但频率一直都上不去,GTX400和GTX500系列显卡的显存频率一直在4000MHz上下徘徊。NVIDIA的显卡在GPU频率方面超频能力还不错,但显存的超频空间几乎没有,即便有液氮的助力也无济于事。
现在,随着开普勒的发布,NVIDIA在显存频率上面终于反超AMD,重新设计的显存控制器突破了频率的桎梏,瞬间从4000MHz飙升至6000MHz,带宽提升达50%之多,这个幅度就相当于把256bit免费升级至384bit,显存带宽不再是瓶颈了。
GTX670四大特色技术和应用
● 更智能的超频:NVIDIA动态加速技术
/player.php/sid/XMzY5NDY5Nzgw/v.swf
这一代“开普勒”显卡特有的GPU Boost技术动态加速演示
● 更平滑的动作:自适应垂直同步
这项技术在运行的原理是根据帧率实时开启或关闭原本的垂直同步技术,取两者之长,达到让游戏运行帧率更流畅的目的。具体运行情况是这样:当检测到FPS低于60时,实时关闭VSync,让当前帧能够以能够达到的最高渲染速率进行,不至出现强制降低帧率从而出现严重卡顿的情况,而一旦帧率达到60,随机开启VSync,避免游戏帧率过高从而产生画面撕裂。有了NVIDIA Apdative VSync技术,你不用再纠结与垂直同步的开启或关闭,从而将可以得到更流畅的游戏体验。
●&更具效能的抗锯齿技术:FXAA和TXAA
FXAA在得到与MSAA相近的画面品质时,运行帧率却能高出一倍。TXAA是全新一代硬件渲染的抗锯齿技术,可以提供电影级别的画面品质,专为发挥GTX680强大的纹理性能而设计。TXAA将会通过HDR后处理管线从硬件层面上提供颜色矫正处理。目前TXAA分为TXAA1、TXAA2两个级别,TXAA1可以实现8x MSAA的效果,执行效率与2x MSAA相当,而TXAA2则会提供更高的画面品质。
●&更震撼的显示效果:单卡四屏
这样的视频输出配置在显示驱动的支持下最多可以达成四屏幕同时显示,并且使用两个DVI和一个HDMI接口就可以组成三屏系统(AMD Eyefinity技术在实现多屏显示必须要使用一个DisplayPort接口)。此外显示输出可以完美支持立体3D显示,这样一来NVIDIA 3D Vision Surround技术便可以用一张GTX680显卡完美实现,带来最极致的视觉体验。
GTX670游戏3D性能测试平台介绍
为了让测试平台与今天测试的主角NVIDIA GTX670显卡相配,我们特意选择了目前最新的高端的硬件配置与之搭配,确保能够最大化发挥出GTX670的实际性能,测试平台使用了Intel Core i7 3770K,8GB DDR3 1600内存。
主板方面我们选择了技嘉面向中高端的悍将Z77X-UD5H-WiFi主板搭载技嘉全新独家3D Power,数字电源回路模块提供处理器、内存、处理器终端电压(VTT)及内存控制器电压(VSA)实时调教与控制。Z77芯片继续沿用SNB采用的LGA1155处理器接口,向下兼容SandyBridge系列处理器,还原生支持USB3.0。扩展插槽中前两条PCI-E x16均支持PCI-E 3.0并可以拆分成双路x8模式。存储接口配备了四个SATA 6Gbps、五个SATA 6Gbps,后者的其中三个来自一对Marvell主控。mSATA依然在,且和其中一个SATA 3Gbps共享通道。
为能够全面衡量GTX670显卡的实际性能,我们不仅采用了多款权威测试软件检测显卡综合效能,还采用不同DirectX版本游戏来检验显卡在不同环境下的适应能力,同时,测试中还专门加入了Physx物理效能和曲面细分效率测试,接下来就一起来看看GTX670显卡在实际测试中的表现吧。
DX10理论测试:《3DMark Vantage》
软件介绍:作为最权威的DX10条件下显卡性能测试软件,3DMark Vantage可以全面衡量显卡真实图形性能,已成为业内最普及的测试软件之一。如果您想知道自家电脑的显示性能,不妨用它来进行测试,和我们的测试成绩进行对比。
3DMark Vantage所使用的引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的性能压力大增。
画面设置:3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。我们此次测试选择了Extreme(旗舰级)进行测试。
GTX670的性能十分惊人。在专门针对显卡DX10模式下图形性能进行测试的3DMakr Vantage软件对这一问题进行了充分说明,HD7970作为AMD的现任单芯卡皇,在本次测试中仅仅比次高端的GTX670高出几百分!
DX11理论测试:《3DMark 11》
接下来就是测试的重头戏,DX11性能比拼。时至今日,依然没有任何一个测试软件或者游戏能够取代3DMark在游戏玩家心目中的地位,因为3DMark的魅力就在于它所带来的不仅仅是惊艳的画面,更重要的是向广大玩家提供了一种权威、系统、公正的衡量显卡性能的方式。
● 3DMark 11的特色与亮点:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。
2、原生支持64bit,保留32bit:原生64位编译程序,独立的32位、64位可执行文件,并支持兼容模式。
3、全新测试场景:总计六个测试场景,包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试,全面衡量GPU、CPU性能。
4、抛弃PhysX,使用Bullet物理引擎:抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库,支持碰撞检测、刚体、软体,根据ZLib授权协议而免费使用。
在主要针对显卡DX11效能的3DMark 11中,GTX670甚至一举超越了HD7970,虽然删减了192个流处理,GTX670依然非常强悍。
Tessellation测试:《Heaven 3》
软件介绍:Unigine Engine最先发布了首款DX11测试/演示程序——Heaven Benchmark,其中大量运用了DX11新增的技术和指令,并主要针对系统Tessellation性能作出测试。
画面设置:新版本进一步强化了Tessellation技术的应用,细分精度更高,画面更上一层楼,为了更好的测试不同Tessellation设置下的性能差异,我们选择了4AA和8AA两种设定,将Tessellation设定为最高Extreme模式,并对和两种分辨率进行测试。
● 分辨率性能测试
● 分辨率性能测试
通过测试成绩统计可以看到,NVIDIA显卡在这个项目中更加强势,GTX670一举超越所有单芯A卡。
DX11理论测试:《石巨人》
游戏介绍:游戏引擎开发商BitSquid与游戏开发商Fatshark近日联合公布了一个展示DX11强大技术的DEMO。这个名为《StoneGiant》(石巨人)的DEMO,可以让玩家来测试自己PC显卡的DX11性能。BitSquid Tech即将提供PC平台的引擎,并且大概在今年第三季度将提供PS3和Xbox 360等其他平台的引擎。
画面设置:StoneGiant是一款技术演示Demo,画面做的非常精美,进入之后可以选择开启关闭Tessellation以及DOF(DX11级别景深)进行测试,这两项技术都十分消耗资源,尤其是同时打开时。其中Tessellation技术对画质的改善最为明显,但DOF仔细看也有不小的画质提升,所以我们这里将Tesselation和DOF都开启进行测试。
测试方法:游戏自带Benchmark。
● 分辨率性能测试
● 分辨率性能测试
这项测试与《Heaven Benchmark》一样,主要针对显卡Tessellation能力进行测试,在这个测试中玩家可以根据不同设置直观体验Tessellation技术为游戏画面带来的变化,测试中NVIDIA GTX670依然表现不俗,相对于GTX580提升非常大。
DX11游戏测试:《异形大战铁血战士》
游戏介绍:《Aliens vs. Predator》同时登陆PC、X360和PS3,其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注,是AMD大力推行的游戏之一,但是这样的主题难免让本作有很多不和谐的地方,暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志,表示不会为了通过审查而放弃电子娱乐产品发行商的责任,因为游戏要维持“异形大战铁血战士”这一中心主题,无论画面、玩法还是故事线都不能偏离。
画面设置***P原始版本并不支持AA,但升级至1.1版本之后,MSAA选项出现在了DX11增强特效当中,当然还支持Tessellation、HDAO、DirectCompute等招牌。该游戏要求不算太高,所以笔者直接将特效调至最高进行测试。
测试方法:游戏带Benchmark,其中测试画面颇代表意义,很好的体现了Tessellation异形身体以及HDAO等高级特效,希望这些特效能让系统发挥所有潜力。
● 分辨率性能测试
● 分辨率性能测试
作为A卡的优势项目,***P测试环节中HD7970终于扬眉吐气,战胜了GTX680,扳回一城。
DX11游戏测试:《地铁2033》
游戏介绍:《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。
画面设置:《地铁2033》虽然支持PhysX,但对CPU软件加速支持的也很好,因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT。
测试方法:选用第三方Benchmark程序,这是一小段地铁隧道中的战斗场景,场面复杂战斗激烈,对显卡提出了严峻考验。
● 分辨率性能测试
● 分辨率性能测试
地铁2033打造出了一个阴暗、充满危险的地下世界,复杂的环境让这款游戏在高画质下对显卡性能提出了极高要求,尤其是高分辨率下,即便像GTX680这样的旗舰卡也不能流畅运行游戏!本项目测试中,A卡占优。
DX10.1游戏测试:《孤岛惊魂2》
游戏介绍:自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。
画面设置:借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,虽然我们很难看到。
测试方法:游戏自带Benchmark工具,在和两种分辨率下,开最高特效分别进行4AA/8AA测试。
● 分辨率性能测试
● 分辨率性能测试
《Farcry2》营造出了广袤的场景,但对硬件的要求却并不是很高,在2560分辨率+4XAA+最高特效条件下,参与测试的显卡也都能非常流畅的运行这款游戏。
DX10游戏测试:《孤岛危机:弹头》
Crysis(孤岛危机)无疑是DX11出现之前对电脑配置要求最高的PC游戏大作。作为DX10游戏的标杆,Crysis的画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。Crysis还有个资料片Warhead,使用了相同的引擎。
画面设置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端显卡都只能在低分辨率下才敢开启DX10模式,如今的DX11显卡终于有能力单卡特效全开流畅运行。
测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,测试了、两种分辨率和4AA/8AA模式。这个程序会自动切换地图内的全岛风景。
● 分辨率性能测试
● 分辨率性能测试
《Crysis》作为著名的“硬件杀手”,遇到GTX670也是乖乖就范。此外这款游戏中A卡整体表现也不错。
DX11游戏性能测试:《孤岛危机2》
& 《孤岛危机2》是《孤岛危机》的续作,游戏采CryENGINE 3引擎所制作。在游戏内容上与一代也有很大变化,已经从秘密的丛林作战转向了公开、大规模的现城市战争。故事发生在距一代3年后的2023年。外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。
CE3拥有不逊于CE2的画面表现,并且带来了诸多的新特性和强大的SandBox3编辑器,同时新引擎也能适应目前的PS3/XBOX360家用机平台,带来家用机上的高水准发挥,同时代表作Crysis2将登陆PC/XBOX360/PS3平台,引擎支持DirectX9/DirectX10/DirectX11,DX11版本仅PC,且要下载补丁。由于是一款NVIDIA的THE WAY游戏,所以此游戏DX11版本优化了N卡。
● 分辨率性能测试
● 分辨率性能测试
打上高级纹理补丁,Crysis2的显存占用非常惊人,而本作中GTX670表现不错,继续领先HD7970。
DX11游戏性能测试:《尘埃3》
赛车游戏中,轰鸣的发动机声、风驰电掣的急速快感,足以让无数玩家肾上腺素飙升。也许正是如此,才使得《科林麦克雷:尘埃3》在众多游戏中备受玩家青睐。
《尘埃3》采用与《F1 2010》同样的Ego引擎,拥有更加拟真的天气系统及画面效果。游戏将包含冰雪场景、动态天气、YouTube上传、经典的赛车、分屏对战、party模式、开放世界、更多真实世界中的赞助商和车手等特点。
相比首款DX11游戏的《尘埃2》,《尘埃3》在诸多DX11游戏特效的力助下,游戏画质表现更加出色。无论是日出还是日落,下雨还是干燥,看上去都非常逼真。背景的烟花和观众让游戏代入感非常强。车身会随着比赛的进行染上泥土或者雪,一辆崭新的赛车或许会在比赛完成之后,变成一辆被泥土覆盖的“垃圾车”。
图像方面,《尘埃3》是该系列至今为止最漂亮的一款。《尘埃3》中的驾驶感相当不错,6种调整选项也足以应付各种地形。而且,在芬兰、密歇根、挪威、洛杉矶、肯尼亚和摩纳哥驾驶赛车狂飙真的是一种享受。赛车会对相当细微的操作做出回应,在雪地或泥地中,这一点尤其重要。而当你的对手把雪花和泥浆弹到你的挡风玻璃上时,你只能依靠自己的直觉和细微的操作不至于翻车。而游戏中,雪花、雨滴和夜晚驾驶不仅仅是外在的装饰而已,和现实生活一样,你需要各种赛车配件来应对这些情况。
● 分辨率性能测试
● 分辨率性能测试
依然是GTX670的showtime,在这些重量级选手面前,尘埃3已经完全难不倒他们了。
DX11游戏性能测试:《战地3》
由EA DICE工作室开发的《战地3》采用了最新的“寒霜2”引擎,完美支持DirectX 11,并且拥有强大的物理效果,最大的亮点还是光照系统,其渲染的场景已近乎乱真的地步,视觉效果堪称绝赞。游戏还支持即时昼夜系统,为玩家营造一个亲临现场的真实环境。
寒霜2引擎最大的特点便是支持大规模的破坏效果。由于考虑到游戏的画面表现以及开发成本,DICE放弃了以只支持DX9的WINDOWS XP操作系统。另外由于该引擎基于DX11研发,向下兼容DX10,因而游戏只能运行于WINDOWS VISTA以上的的操作系统。
在《战地3》中,“寒霜引擎2”内置的破坏系统已经被提升至3.0版本,对于本作中的一些高层建筑来说,新版的破坏系统将发挥出电影《2012》那般的灾难效果,突如其来的建筑倒塌将震撼每一位玩家的眼球。
《战地3》采用了ANT引擎制作人物的动作效果。在此之前,ANT引擎已在EA Sports旗下的《FIFA》等游戏中得到应用,不过在FPS游戏中使用尚属首次。相较于Havok等物理引擎,用ANT引擎可以花费较少的精力制作出逼真的效果。举例来说,战士在下蹲时会先低头俯身、放低***口,而不是像以前的游戏那样头、身、***如木偶般同时发生位移。此外,ANT引擎也可以让电脑AI的行动更加合理。但这款大作目前并不能良好的兼容120Hz3D以及红蓝3D模式。
● 分辨率性能测试
● 分辨率性能测试
&寒霜2引擎年度大作战地三,是为数不多的画面可以挑战Crysis的游戏大作,而对核心和显存的要求已经超越了Crysis!
PhysX特效专项测试:《BatmanAC》
在经历了两年前阿卡姆疯人院带来的震撼后,Rocksteady终于在今年年底带来了蝙蝠侠的续作——阿卡姆之城。这款游戏也在上市之初让我们见识出了正统版权的威力,有华纳兄弟的赞助与发行,完全再现电影和小说中的原著桥段不再是梦,100%的高还原度让玩家犹如身临其境,再现了一个荧幕上真实的蝙蝠侠或许也是这部游戏的成功所在。
&& 《蝙蝠侠:阿卡姆之城》仍然建立在《阿卡姆疯人院》的气氛上,不过这次上升至阿甘之城——高谭市内戒备森严的,关押了大量暴徒的监狱之中。而且新作还汇集了众多明星参与的配音阵容以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了一游戏特点,让玩家们拥有像《蝙蝠侠前传2:黑暗骑士》一般的终极游戏体验。
&& 阿卡姆之城的画面,绝对是当今次时代游戏中数一数二的,但是其开发引擎却依旧是虚幻3,这着实让许多玩家感叹,到底虚幻3引擎还有多大潜力可以发挥。虽然虚幻3引擎目前来看最大的问题就是画面普遍油腻感十足,但是在阿卡姆之城中,少许的油腻感却成了点睛之笔,让蝙蝠侠更加贴近漫画、电影。
除了虚幻3的引擎外,蝙蝠侠从上一代作品中就加入了NVIDIA的PhysX物理加速引擎。在游戏的细节中,更加贴近真实效果,烟雾、灯光、人物的衣服、报纸等等细节全部通过PhysX物理引擎计算,游戏中的破碎、打击效果随之表现的也不在那么匪夷所思。但是,凡事都有两面,真实的受力表现换来的则是大量的资源占用,这也使得蝙蝠侠这个虚幻3引擎的游戏一下成为了硬件杀手,如果达到最佳游戏表现,恐怕非GTX580这样的旗舰单卡莫属了。
● 分辨率、PhysX high性能测试
● 分辨率、PhysX off性能测试
● 分辨率、PhysX high性能测试
● 分辨率、PhysX off性能测试
PhysX的确是个好技术,可惜支持PhysX的游戏大作目前真没几款能拿得出手,Batman系列算是凤毛麟角。虽然这样,我们还是详细的测试了这款争议游戏,以获悉HD7970和GTX670的物理性能差距,当然,这个项目的测试成绩不会计入总评。
高端也环保:GTX670温度、功耗测试
对于高端显卡来说,散热、功耗与性能的平衡永远都是个问题,GTX670表现如何呢?接下来我们就通过使用Furmark对显卡进行满载来验证一下GTX670的外部特性。
从拷机测试我们可以看到,GTX670待机温度仅仅41度,而满载温度最高位81度,这个成绩在旗舰显卡,尤其是双芯显卡中算是非常出色了。
● 平台闲置功耗测试
虽然GTX670核心默认频率就达到了915MHz,而且可以自动超频到1GHz以上,但功耗控制的非常理想,GTX670+i7 3770K+Z77这样的顶级平台闲置功耗仅仅70W左右!
满载功耗也是控制的非常不错,Furmark程序最高让这个平台达到了244W的功耗,和NVIDIA官方宣称的显卡170W TDP相吻合,相对于AMD显卡更是优势明显。
全文总结:性能和效率的革命
从上面20多项性能测试我们不难发现,NVIDIA次高端显卡GTX670是的性能表现非常出色,这里小编将所有测试成绩汇总于下表。
(点击可放大观看原尺寸图片)
也许大段的性能帧数看起来过于繁琐,这里为了方便大家统计,小编做了一下的柱状图。
如果将GTX580的性能表现定义为单位1,那么其他显卡的性能如上图所示,GTX670的性能是GTX580的1.26倍。(统计项目不包含功耗和Batman2测试成绩)
随着绿色环保理念的深入人心,能效比出现在了大大小小的家用电器上,而电脑硬件厂商近年来对能效比的重视程度也是与日俱增。作为评价显卡优劣的新标杆,本文的最后我们将参加测试的显卡能效比做出数据分析。
(上图数据通过总性能和整机满载功耗的比值计算得到,仅供参考)
通过上图,我们可以直观的看到Kepler架构、28nm工艺的威力,相对于上一代的旗舰显卡GTX580,GTX680和GTX670的能效比增加了百分之七十以上!而GCN架构的HD7970和HD7950则相形见绌。
全文总结:
HD7970和GTX680相继发布之后高下立见,GTX680以其卓越的性能和良好的功控为人称道,而这次GTX670的测试让我们再一次领略了开普勒的真正实力!
在Fermi时代,NVIDIA从科学计算和CUDA应用角度考虑,设计出了核心庞大、功能完备的GF100芯片。但是鱼与熊掌不可兼得,功能全面实际上让执行效率收到一定程度的影响。得益于核心庞大数量的晶体管,GTX480、580的性能首屈一指,但功耗发热则无优势可言。
这样的结果就是,NVIDIA在服务器领域推出了全新的Maximus,在高性能计算领域更上一层楼。但一些实用至上的消费级用户在Fermi时代选择了游戏效能更佳的AMD显卡。
新的较量,新的开始,在如今的28nm时代,A/N两大阵营对产品的侧重点再次做出调整。从GK104的架构解析我们不难发现,NVIDIA这次显然更加注重消费级市场,注重游戏性能。相对于Fermi,Kepler的架构设计几乎可以说是推倒重来,削减不必要的模块,而将影响游戏性能的流处理器数量翻了两番。反观AMD这边,则跟进了Fermi的设计理念,试图将HD7970定位成一款全能的产品。
其次,虽然都是28nm工艺,AMD为了以快取胜的市场策略,避重就轻的选择了容易达成、但是效果欠佳的方案,这也是HD7970最终在能效比上大幅落后于N卡的原因之一。
在本文发稿之前,有消息报道AMD将推出高频版HD7970以对抗开普勒,但这种做法对于能效比的提升能有多大帮助?256Bit的GK104已经让AMD疲于应付,那传说中的GK110面世之后又将如何抵挡?众所周知,工厂超频是把双刃剑,这最后一根救命稻草能否帮助AMD挽回颓势,我们拭目以待!■
浏览本文的用户还购买了
延伸阅读: &&&&
扫一扫 关注泡泡网官方微信
也可搜索官方微博号:PCPOPWX
一周热文 今日热文 高清图文
推荐文章推荐产品
产品号苹果手机There is no row at position 0. 有误产品号荣耀6There is no row at position 0. 有误产品号三星A5There is no row at position 0. 有误
请您留下希望的价格和联系方式开团前,我们会通知您。
心理价格:元
邮 箱:@qq.com
手 机:
* 手机/邮箱任填其一