笔记本 频道

能否与迅驰抗衡?AMD移动版K10平台剖析

  【IT168 评论】11月20日,AMD推出了让用户期待已久的K10 Phenom X4桌面处理器,这令众多关注AMD的笔记本用户激动不已。因为桌面版K10处理器的发布,意味着AMD 08年笔记本战略核心,Puma平台中最重要的组成部分——代号为“Griffin”的移动处理器,已经开始逐渐揭开神秘的面纱,从纸面转化为实际产品浮现在世人面前。

AMD Turion64 X2移动处理器

  “Griffin”处理器所代表的“Puma”平台框架,早在今年5月起就已经逐渐为世人所知。不过作为笔记本领域一个新框架、新面孔,要等到08年6月才会面市,因此“Puma”平台并未像英特尔“迅驰”平台这样享有广泛的知名度和用户认同度。

  注释:一款处理器从理论到上市,通常要间隔几年,在这段时间,会给这个处理器起一个研发代号,上市后才会有具体型号。「Puma」就是AMD 08年构建的移动平台代号,「Griffin」是「Puma」平台上处理器代号,处理器是整个平台最重要的部分,因此有时两个代号也会混用。

  在2003年英特尔刚刚提出“迅驰”概念的时候,AMD高层还曾经迅驰技术大加抨击,认为英特尔公司推出的这一技术可以称为“垃圾”,同时暗示英特尔公司用金钱误导了整个市场。为什么转眼4年之后,AMD的态度出现180度的大转弯,开始提出自己的移动计算品牌呢?

  其实,迅驰的成功案例就已经说明:将性能不俗的CPU、不错的芯片组产品以及无线网络适配器搭配并统一进行宣传和销售,这样的策略带来了强劲的销售。到现在,不少消费者认为,印有“Centrino ”标志的笔记本才是好的。当然,英特尔的这一做法一直有褒有贬。贬主要来自于其竞争对手,批评迅驰让消费者必须照单全收,无法选择最好的硬件产品。但是我们都不得不承认迅驰的成功,移动产品平台化推广为英特尔带来了巨大的效益。

  AMD于2006推出64位双核炫龙处理器以来,处理器的技术优势一直保持到英特尔酷睿上市。可是卖产品的不如卖品牌的,从市场反应来看,消费者对“迅驰”这种移动平台的接受程度远高于单一的处理器产品,英特尔也占据了笔记本电脑大部分市场份额。

  眼红Intel的成功,AMD也有心在移动平台方面做出一番作为,但是无奈由于缺乏芯片组支持和成熟的图形处理、无线网络适配器等重要部件,一直是有心无力。直到成功收购ATI之后,AMD也拥有了强大的芯片组及图形处理器的研发能力,终于开始向平台化迈出自己的脚步。AMD的第一款移动平台代号为“Trevally”,就是目前的主流AMD移动产品,包括Socket S1接口的炫龙64 X2处理器、RS690T芯片组以及SB700南桥芯片。

  而AMD在笔记本平台方面的第二次重拳出击,就是下面要介绍的“Puma”平台。“Puma”到底由什么组成?与“迅驰”相比有哪些优势,下面我们就一同来看看。

  移动版K10:Griffin处理器

  AMD的“Puma”移动平台包括处理器、ATi芯片组、无线技术。其中研发代号为“Griffin”的处理器就是其中的核心产品。

  AMD Griffin处理器基于最新的K10微架构为基础全新设计的,拥有与Barcelona/Phenom相同的共性,内核微架构拥有大量的改良,其中包括指令预取的优化、引入乱序指令加载机制、提升TLB容量、堆栈优化、提升分支预测性能等等,这些措施虽然未能增加指令解码的并行度,但对指令解码的效率有明显的增进,达到提升执行效率的目的。

  128位SSE 5指令支持是Griffin的主要改进点之一,相对于64位SSE 3指令的Turion 64 X2,Griffin在SSE指令处理时可以获得双倍的效能。从实际应用来看,将SSE单元扩展到128位对多媒体性能的提升效果极其明显,通过对应的软件优化,在三维渲染、高清播放、视频编解码方面都有非常显著的性能提升。但是,传统的SSE指令标准向来是由英特尔把持,这次AMD的反客为主显然引起SSE指令的设计者的不快,因此英特尔已经公然宣称不会支持和兼容AMD推出的SSE指令,未来的SSE 5指令标准之争还将扑朔迷离。

Griffin处理器集成内存控制器

  整合内存控制器仍是AMD在处理器—内存连接架构方面的优势,整合内存控制器设计令Griffin可拥有更快的内存访问,虽然它最高只支持双通道DDR2-800,未加入DDR3的支持,但更快的访问延迟和128位总线足以让它在内存子系统性能上超越Montevina平台。另外,Griffin的HT总线也更新到3.0版本,总线配置为2.6GHz频率和16bit,这样就可提供多达20.8GBps的传输带宽,保证GPU可以同内存系统快速通讯。

Griffin处理器的HT总线也更新到3.0版本

  Griffin并没有一成不变地沿用K10架构,AMD从移动应用的需要出发对Griffin进行设计上的裁剪。首先,K10架构的Barcelona配备了2MB的三级缓存,但Barcelona针对的是服务器应用,大缓存可以有效提升性能,但“Puma”平台专为办公、多媒体、互联网为主的移动应用设计,三级缓存对性能的提升颇为有限,但成本和功耗的增加却颇为可观,因此Griffin没有配备三级缓存,而是选择对二级缓存扩充,令每个核心都独占1MB容量,这样Griffin的二级缓存总量提升到2*1MB,高于当前的Turion 64 X2。当然,Griffin在这一点上与6MB共享二级缓存的Penryn存在相当的距离,毕竟Penryn的45nm制造工艺比Griffin领先了一代。

  更先进的节电设计:现行Turion 64 X2的TDP指标为35瓦,考虑到已包括CPU与内存控制器,实际理论功耗其实略低于迅驰。但Turion 64 X2机型的电池时间往往不够理想,主要原因是Turion 64 X2处理器设计框架决定,也跟AMD平台机型主要面向低端用户,厂商为了拉开产品档次,可以控制电池时间差异有一定的关系。这种情况在Puma平台中有希望获得根本性的改变。AMD没有将Puma定位为高性能移动平台,而是走长效电池和性价比路线,以便它能够占领消费市场之余,进入到英特尔霸占的传统商用领域。这样,作为Puma平台的核心,Griffin处理器的节电特性就显得非常重要,AMD也为其引入前所未见的众多节能设计。

  首先,处理器的处理内核与I/O组件(包括内存控制器、Crossbar和HT3总线)实现供电分离,也就是内核与I/O组件分别拥有自己的供电线路和电源管理系统,实现相互隔离。这样做的好处显而易见:过去Turion 64 X2的CPU核心与I/O组件都是统一供电,在显卡与内存之间进行数据交换时,CPU核心同步工作在一个频率,额外消耗了不少电力,这也是Turion 64 X2平台电池性能不佳的重要原因之一。

  Griffin的模块分离式供电设计很好地解决了这一问题,若显卡需要与内存交换数据,只需要唤醒处理器中的I/O组件,两个CPU核心(或一个核心)都可以保持极低耗电的睡眠状态,这样就成功地避免了不必要的能源浪费。这项设计可以显著提升硬件多媒体解码(例如DVD回放)的电池性能,在这类应用中,GPU承担了绝大多数计算任务,而CPU可以一直保持在停步(IDLE)状态。当然,英特尔迅驰平台就没有这样的困扰,因为它们都没有采用CPU整合内存控制器设计,显卡与内存交换数据与CPU无关。

Griffin两个核心的频率都可以12.5%的步幅逐级降低

  其次,Griffin两个核心的电压也可以独立控制,每个核心的工作频率和电压都可根据任务所需、独立地动态调节,以实现能源利用的非常好的化。Griffin一共可提供8个不同的频率档和4个电压档,如上图所示,最顶端表示CPU核心以全频率和标准电压运行,之后每个核心的频率都可以12.5%的步幅逐级降低,最终可达到1/8标准频率的最低点。

  Griffin在节能方面比酷睿2处理器胜出的地方在于,两个核心的频率和电压可以被独立地控制,例如一个核心可以工作在V0电压的全频状态,另一个核心可工作在V1电压的低频状态,这种调节完全是根据任务所需动态进行,如果CPU只是处理单线程任务,那么另一个核心可以进入到深度睡眠的节能状态——尽管酷睿2处理器也可以支持两个CPU核心的独立频率控制,但却无法对核心电压进行独立调整,因此在这一点上,Griffin具有更出色的能源效率。

  从酷睿2开始,英特尔为移动处理器引入分离式前端总线设计:在正常模式下,前端总线为64位,如果依靠电池运行,处理器的前端总线将降低为32位,以此降低总线部分的能耗。Griffin所采用的HT 3.0总线同样支持类似的机制,它提供了X16、X8、X4、X2和停止等5个状态,如果节能模式开启,Griffin会与配套的RS780M北桥协调,共同将总线的位宽动态降低,这样HT传输系统的能耗就可以被有效削减。值得一提的是,HT 3.0的总线位宽配置同样是根据传输任务需要动态进行,在不影响性能的前提下能将总线能耗降到最低点。

Griffin处理器每个CPU核心都被配置了热量传感器

  Griffin的温度控制能力也获得很大程度的增强:每个CPU核心都被配置了热量传感器,同时Griffin的温控电路也可侦测内存系统的温度(要求在内存附近安装一个温度感应器),通过预先设定好的温度限制,Griffin处理器可以降低CPU与内存的频率和电压,从而达到降温的目的。这一功能不仅能够保证硬件的安全性,而且可以提高笔记本电脑的使用舒适度—从这里我们也可看出,Griffin的节能和温控机制堪称“武装到牙齿。”

  RS780M北桥与SB700南桥:强劲集成显卡

  Puma平台的芯片组为RS780M北桥与SB700南桥的组合,RS780M北桥包括HT 3.0控制器、PCI Express控制器和集成图形两个部分,其中HT 3.0控制器负责与Griffin处理器连接,规格与Griffin相匹配;PCI Express总线支持也更新到2.0版—相比现在的PCI Express 1.0,2.0版总线将传输频率提升到5GHz,这意味着数据带宽又增加了一倍。RS780M可提供1条带宽达16GBps的PCI Express X16图形接口和4条PCI Express X1总线,后者用于与SB700南桥的连接,总带宽也达到4GBps,对于南北桥总线而言,这是个很宽裕的指标。

Puma平台搭配的RS780M芯片组功能表

  RS780M的集成图形进入到DirectX 10时代,它所集成的GPU即AMD最近发布的Radeon HD 2000系列。Radeon HD 2000基于统一渲染架构,虽然3D性能并非其特长,但对付迅驰的集成图形还是没有任何问题;其次,Radeon HD 2000集成了UVD视频引擎,可以为H.264、VC-1提供完整的硬件加速,大幅度降低CPU的占用率,这意味着Puma平台在播放高清视频时,CPU还能够保持低频低电压的运作,有助于降低平台的发热并提高电池续航力。此外,Radeon HD 2000已原生支持HDCP和HDMI输出,为即将到来的蓝光/HD DVD播放作好了充分的准备,同时RS780M内建了两个显示控制器,除了支持常见的DVI、D-Sub、HDMI接口外,还可支持最新的DisplayPort接口输出。Radeon HD 2000的另一个优点在于低功耗,这也将进一步提升Puma平台在发热和电池续航力方面的优势。作为对比,我们来看看英特尔平台方面,当前主流GMA X3100集成显卡性能只有同等AMD集成芯片组X1250显卡的60%,无法与之在游戏性能和高清播放性能方面抗衡。

  RS780M将与SB700南桥配合,SB700规格强悍,它提供了6个SATA II、一个并行ATA接口、14个USB接口、HD Audio高保真音频和多个2.0版的PCI Express X1接口,功能丝毫不逊色于英特尔的ICH9M。但是从M690T芯片组的用户反映来看,还是存在USB传输性能低下问题,预期在未来版本中得到改善。此外,SB700可支持一项名为“HyperFlash”的闪存加速技术,它与Intel Turbo Memory技术的区别在于:HyperFlash采用NAND闪存专用总线来挂接闪存模块,而Intel Turbo Memory则是采用PCI Express X1接口来挂接闪存模块,笔者认为两者之间并没有明显的性能优劣之分。

  RS780M芯片组将采用先进的55纳米工艺制造,这意味着芯片组的功耗将进一步降低。事实上,在移动平台中,芯片组的能耗已是越来越不可忽视,如Santa Rosa平台的965GM芯片组TDP(散热设计功耗)高达14瓦,Merom核心Core 2 Duo处理器的TDP为31瓦,两者总计达到45瓦之多。AMD未披露RS780M的能耗指标,但现行RS690系列发热量也不可小觑,希望改进的55纳米制造工艺,能令RS780M芯片组的功耗指标令人满意。但笔者认为,芯片组工艺技术没有突破的前提下,笔记本散热系统改进更能显著改善笔记本的发热状况。

  自由切换的双重显卡:PowerXpress混合图形技术

  PowerXpress混合图形技术可谓是Puma平台的杀手锏,PowerXpress的实现者仍然是RS780M北桥。众所周知,3D性能和电池时间一直都是笔记本电脑的矛盾:采用独立显卡的机型,虽然可拥有更强的3D性能,但电池时间要少得多;而集成图形的笔记本机型,虽然电池时间上具有优势,性能又难如人意。这对矛盾在商用笔记本领域中尤显突出,

  索尼SZ系列商用机一直用双显卡的设计来解决问题,即同时配备集成图形与独立显卡,通过一个硬开关进行切换:在电池模式下采用集成图形,外接电源时则改用独立显卡。这种设计很好地解决了性能与电池时间的矛盾,但它的不足在于显卡的切换都要求先关闭系统,在关机状态下调整开关后再重启,用户的任务将被迫中断。

PowerXpress技术 在使用电池和使用电源时可以在集成显卡与独立显卡间切换

  Puma平台的PowerXpress技术可彻底解决这一难题:PowerXpress允许RS780M的集成图形与外接显卡快速切换,如果用户拔掉电源依靠电池运行,那么PowerXpress技术会随即切换到集成显卡模式,独立显卡则自动被关闭,用户无需重启系统即可完成显卡转换。显然,PowerXpress技术完美地解决了图形性能与电池时间的矛盾,令笔记本电脑可以二者兼得,这项技术也让Puma添色不少,它的不足在于只能支持AMD的独立显卡,如果OEM厂商选择nVIDIA的移动GPU产品,PowerXpress技术便无法生效。

  实际上,笔者从某些笔记本厂商那里了解到,AMD早已将PowerXpress混合图形技术提供给笔记本厂商,因为驱动程序的问题未解决,因此没能马上采用。

  更为自由的平台组合:“Better By Design”

  可以说,相比较Intel迅驰平台的一些硬性规定,“开放性”是AMD新移动平台的优势所在。从此前的单一移动处理器到现在的整体移动平台布局,AMD正在不断完善着自己产品体系,同时也并没有忘记自己传统的优势理念。因此在“Puma”平台中,AMD强调的是“开放性”。

  简单来说,配合Puma平台可以采用ATI/NVIDIA独立移动图形处理器,以及Atheros、Broadcom、Marvell、Qualcomm、Realtek等厂商任意一家无线网卡组成的笔记本电脑系统。自由度相当大,而且不会像英特尔“迅驰”平台那样,因为更换了无线网卡品牌而失去“迅驰”的认证标志。

左为AMD+ATI+Atheros平台 右为AMD+nVIDI+Broadcom平台

  在英特尔一家独大的市场局面下,可以说,AMD“Puma”移动平台架构拥有英特尔“迅驰”平台无法比拟的的包容性和开放性,最大程度的整合了全球半导体产业的各领域的非常先进技术和解决方案,谋求互惠双赢的市场格局。它不但拥有比“迅驰”平台更高的硬件规格,更为灵活搭配的解决方案,而且拥有更出色的性价比优势。

  AMD的“Puma”开放式平台战略与英特尔“迅驰”封闭式平台战略,在激烈的市场竞争中,究竟谁能够最后胜出?现在的关键问题就是:“Puma”什么时候才能从规格转化为实际的产品,现在的资料都是AMD自己公布的,当然怎么看都 好,可产品出来后到底如何,我们也不得而知,我们只能期待……

0
相关文章