Orbis vs Durango:次时代主机硬件分析(Eurogamer.net Digital Foundry)
来源:http://www.eurogamer.net/article ... is-durango-vs-orbis
下一场主机大战尚未开始,战线已经拉开,微软与索尼的处理火力已成既定事实。这是Durango(新Xbox开发代号)对阵Orbis(新PlayStation开发代号),但是这主机之间的针锋相对与过去并不完全相同。支持两大次时代主机的基础技术是由同一帮人设计的(AMD公司),因此二者的基本设计几乎完全相同。两大主机的不同之处相比过去的主机时代来讲更加渺小:简单来说,索尼与微软面对着相同的挑战,向同一帮人寻找解决方案,因此产生了很相似的终端产品。然而,Durango与Orbis之间仍然有不同之处,而它们的不同之处也反映了自家公司如何看待家庭主机在未来的转变。
我们不会在两大主机已知的相似处上作过多描述分析,但是我们已经提到,下一代Xbox与PlayStation运用了相同的CPU--- 一个1.6GHz八核的AMD处理器,架构基于AMD公司其即将到来的低能耗、高性能的‘捷豹’架构。从图形处理方面,AMD同样在为两家公司提供相同的技术:运用到十分受欢迎的Raedeon HD 7xxx系列显卡的‘GCN核心’。
在此我们能够看到二者的第一个不同点:GPU的渲染完全是关于将所有运算处理的负担分散向许多个核心,像是新Xbox有12个这种‘处理单元’(CUs),而Orbis(新Playstation)有18个---这是一个50%的优势。过去两周这些数据被多方质疑挑战,但是我们的Orbis的资料来源确定了索尼方面的资料真实性,而SuperDAE的泄漏---与背后确认他泄漏的内容—则确认了Durango的处理单元数。这资料已经是九个月前于Durango beta研发时期的事情,理论上硬件能力可以有所改进,但实际上这几乎是不可能的,你不能给主机加入更多的零件而不几个月几个月地推迟研发进度。
那么这GPU上的差异能够转换成巨大的优势?VGleaks所泄漏的Orbis 的内部配置资料---再次的与主机制造商文件不同之处(啥?)---声称其中4个处理单元是预留给计算处理功能,很有可能地将新Playstaion的书面上的优势从50%变为16%。然而,尽管计算处理能力常常被运用到物理运动方面的计算之类的东西,这并不能够阻止程序员将指定的画面渲染处理细节分到这四个计算处理单元---例如‘正当防卫2’运用了英伟达自有的计算处理方式‘CUDA’,来提高水面的效果,而‘战地3’的一个核心要素---运用延迟渲染方式来支持其华丽的光影效果---是由DirectX 11计算处理的渲染代码来产生的。
差不多可以肯定是由微软官方文件泄露出来的主板结构图。复杂的设计(例如HDMI输入接口)说明了Durango不只是一台玩游戏的主机。
Durango运用到与PC相似的方式,即让开发商选择如何分配GPU的资源来处理画面渲染或者计算处理。但这里可以发现一个潜在的瓶颈:对于微软的新主机来说,渲染和计算这两样加起来会争抢12个Raedon GCN核心,而Orbis有着专门的计算处理单元并且同时在处理单元数量上仍然占据着画面渲染的优势。
对于其他资料的分析同样给Orbis提供了更大的优势:相比于Durango的16个,索尼的硬件上有着令人惊讶的32个ROP(渲染输出单元)。ROP能够将像素与纹素(纹理元素)转变成最终画面然后送往显示装置:通俗点讲,越多ROP,就能产生越高的分辨率(而且硬件抗锯齿能力同样与ROP有关)。16个ROP足以支持1080p,32个就是多余的,但它可以很好的运用到例如3D 1080p输出,或者甚至是4K分辨率。即便如此,我们的来源资料人仍称Orbis主要被设计为最大输出1080p分辨率。
对于秘密材料的争论
人们在争论着:仅仅根据这些资料来对比Durango和Orbis是不现实的;由于主机商对硅芯片设计的控制远远大于这些基础配置所能够描述的范围,这些芯片可以加入更多主机上自定的‘秘密材料’。
资料内挖掘的基础的每秒一兆次浮点运算值---Durango的1.23TF和Orbis的1.84TF---被普遍断定为无用,而在某种意义上这是对的。不过,当你看到AMD为其所有的GCN硬件准备的配置文件时,你会发现许多相近的矩阵基于同一个非常简单的从运行速度和CU数的方程式。It's not the be-all-and-end-all of processing power of course, but these are accurate measurements used by AMD itself in giving a broad assessment of the raw computational power of the parts it creates.你会发现这些次世代主机零件与其相近的PC零件是比较接近的---简单来说,这些每秒一兆次的数字单独来看并不会有什么用处,但是它们在比较基础硬件能力上用处颇大。
但是这不是说Durango跟Orbis没有定制零件。他们有这种东西,但尽管如此我们仍然能够看到两个系统之间很大的共通性:二者都有专门的硬件压缩跟解码器(我们能够期待两个主机都能够在不影响游戏性能的前提下录制并分享游戏视频),而两者亦都有定制的声音处理器以及,对用硬件解压被‘LZ压缩算法’压缩的材料的支持(当做是对无损压缩例如‘zip文件’的支持)。
Durango泄露出来的画面处理核心的结构图。
我们却能够在这里看到Durango仅有的令人惊讶的增强。其‘数据转移引擎模块’执行硬件压缩以及解压(以及对JPEG的支持---或许是来支持Kinect相机的处理流),同时也支持‘纹理混和技术’。然而,这里主要的运用结论在于,‘数据转移引擎’的核心功能明显设计得以从一个比起Orbis更加复杂(而且更加慢)的RAM(内存)的设计中提取其最佳表现。另外,别的定制硬件大部分是用来减轻CPU的负担,而不是增强GPU的表现,因此那些希望通过额外的‘秘密材料’让Durango弥补Orbis在理论上的图像处理优势的人恐怕要失望了。
确实,‘数据转移引擎’的许多项处理任务--- tiling/untiling纹理材质、无损解压、材质解压等等---在ps3上都分给了其cell 上的多个SPU。根据VGLeaks上的带宽数据---约25GB/s,一个可信的数字---同样的大致与SPU的性能相近而执行相同任务。所以基本上,你可以把Durango的这部分的‘秘密材料’当成是八核的AMD CPU旁边搭建了功能指定的两三块SPU。 Orbis自己定制零件本身就能够处理这些功能,而至于剩下的,它也拥有Durango所缺乏的,可完全自由编写的计算处理模块(除非拿去部分渲染的资源)。
Durango的‘数据转移引擎’模块的存在目的都指向了两个次时代主机的另一个主要区别:内存,以及数据如何在系统中转移。
内存:容量 vs. 带宽
Durango是一个内存巨兽,比起索尼这竞争对手‘仅有’的4GB,拥有8GB的内存。这是一个很有雄心的举动,而也因为微软对新Xbox的抱负---不仅仅是一个游戏机,它的硬件可以给多媒体功能预留极大量内存,并且传言声称主机甚至可以在游戏时同时运行应用和多媒体软件---变得至关重要。
这里只有一个问题。将现今最快的8GB内存塞进一台主机里面逻辑上是根本行不通的。XBOX360的一个对PS3的根本优势是拥有一个统一的512MB GDDR3的快速内存模块GDDR5是现在内存最快的标准,主要运用到PC的显卡上,但问题是这样的模块只能有比较限制的大小---最大而最难生产的仅仅是512MB一块。将16块这样的内存在主机主板连结(菊花链?)在一起根本是行不通的。索尼选择了一个更紧凑的系统—更少内存模块,但是全部都非常非常的快。这意味着它保留了单一的一个GDDR5组以拥有基本的带宽优势,但是被限制到4GB(传闻称其将升级到6GB或者8GB,但是这个可能性非常小)。
微软采用8GB内存的方式是退而求其次,采用便宜一点的DDR3模块---与现今的PC及Wii U一致。这产生了一个问题---即带宽问题。想象一下,把数据当成是水管中的流水;水管越粗,水在任何一点的流速越快。DDR3只能够处理DDR5能够处理的数据大约三分之一,因为DDR3的‘水管’远远细于DDR5的。微软的解决方案?给Durango的图形核心直接装上32MB的高速内存(ESRAM),但同时可以从CPU上控制。这一点内存可以与DDR3同时运行,合起来的有效带宽就能够上升到170GB/s—这个数据就能够与Orbis的GDDR5模块组的速度相近。
Durango's Data Move Engine工作顺序示意
这些数据对于游戏开发商开发游戏有什么意义呢?其实,无论微软如何调整处理,那32MB的ESRAM到头来只是一种打补丁的做法,远远不及Orbis的单一模块组那么迅速而效率高。但是,虽然Durango的劣势很明显,并不意味着会对他的发展造成毁灭性的影响。在于游戏制作者的交谈中,我们得知游戏里面不是所有内容都会用到超高速内存。游戏系统还是会基于DDR3制作,但当发生内存带宽限制的问题,这些内容会被转移到拥有足够带宽的ESRAM。
Durango将基于一个更高级版本的DirectX运作---内部称之为DirectX 11.x,这也缩小了它跟Orbis的差距。关键的渲染功能将很有可能被微软向ESRAM处理的方向优化。
|