当前位置: 首页 >> 热门技术 >> 从上市到普及,四核之路何其远(下)
从上市到普及,四核之路何其远(下) -
【IT168 特稿】上篇介绍了四核的价值、定位与应用领域,下篇将阐述多核软件方面的问题,并对2007年四核推广做出展望和估计。
软件扯了四核的后腿?
随着双核、四核的出现,针对多核的并行化软件也受到了越来越多的重视。因为只有在软件能够充分利用多核处理器的特性时,多核CPU优势才能发挥出来。当前,多核处理软件总体滞后于硬件,软件开发商面临技术和商业问题,软件界缺少为多核处理器进行高效编程的标准工具,缺少开发并行应用所需的技巧。
1)多核软件的产业环境
对此,英特尔顾凡认为,服务器与台式机、笔记本电脑所面临的软件环境截然不同。从早期的SMP时代,到“SMP+多线程”时代,服务器商业应用软件早已为并行化计算做好了准备,可以发挥四核硬件平台的优势。诸如Microsoft Windows XP、Windows Server、Microsoft Vista、Microsoft Office 2007及多种Linux软件产品都已经实现了线程化,以便通过利用最新的四核处理器来提高性能。另外,针对大量存在的行业ISV,为了帮助其尽快的实现从单线程应用向多线程应用的转变,英特尔也投入了大量资源,向业界提供编译器、应用程序分析和调试、数学函数库等软件工具。
然而,问题似乎远没有这么简单。
国家863计划高性能计算机评测中心副主任、清华大学计算机系副教授陈文光认为,多核处理器延续并加重了以往并行计算给软件编程带来的挑战,同时也带来新的机遇。多内核处理器对软件提出的最大挑战在于并行应用的开发,包括需要开发新的编程模型如X10、Tra actional Memory,优化现有的编程模型如MPI和OpenMP,以及解决并行程序调试中的开销问题。
陈文光进一步介绍说,线程级并行、共享缓存、非一致的内存访问开销等特性在以往的SMP、NUMA等体系中已经出现,并不是多核带来的新东西。但在SMP系统中,两个芯片之间的通信会受到系统总线带宽的限制,而多核处理器的内核间的带宽已经大大增加,通信延迟大大减少。为了有效地利用这种优势,就需要开发新的编程模型或对现有的MPI、OpenMP等进行优化。另外,从市场的角度来看,多核的普及使得并行系统的价格门槛大大降低,拥有多处理器(核)系统的用户范围大大扩展,所以需要业界开发更多并行的应用软件。但对于不同层次的软件,从底层的OS和Hypervisors、系统库、中间件一直到最上层的应用软件和框架,多核带来的挑战和问题是不一样的,因此需要区别对待。
2)现有部分软件对多核有限定
宝德科技程佶也认为,虽然服务器、HPC领域的多数软件系统已经能够很好地发挥四核硬件平台的优势,但有部分软件还是对多核有所限定,甚至在HPC领域,有些软件的代码也没有对四核系统进行优化和编译,从而使得同档次双核系统与四核系统的性能表现相差无几。因此,他建议用户在选购多核硬件系统时,还是需要对相关操作系统和应用软件进行考察,比如有些国外的HPC软件在国内采用总代方式销售,没有原代码,只是应用程序,因此用户无法对多核系统做出优化。
3)多核软件计价问题
另外,我们也注意到,虽然英特尔和AMD也在大力呼吁软件厂商以实际CPU SOCKET数来收费,并得到了微软、Novell SuSE Linux、Sun等厂商的支持,但针对多核CPU的软件许可收费方式也远未统一。IBM将根据不同情况做出许可决定; BEA的做法则是先将两个核心视为单颗处理器,之上每增加两个核心视为0.5个处理器(如四核处理器将被看作1.5颗处理器);Oracle的计价方式则更为复杂,共有三级系数值模式新版授权方式:针对英特尔和AMD的多核处理器,每个核心视作0.5个处理器;针对Sun的Ulta ARC T1,则看作0.25;其他多核处理器则是0.75。
可见,增加的软件费用有可能会抵消潜在的性能提升价值。由于多核CPU不是线性可扩展,即每增加一个核,并不会获得100%的性能提升,如此一来,翻倍的软件成本将导致较低的总性价比。同样,如果将多核系统用于虚拟化环境,那么软件厂商针对多个虚拟化实例的软件许可政策也值得用户留心。
4)情况多样的实际应用
而用户的实际情况可能更加复杂。比如,有很多用户还在使用老版本的Linux操作系统,如Redhat 9、Free D 5.1等,这些老OS在软件驱动等组件方面不能支持多核;用户的使用习惯也是一个问题,在从单核平台切换到多核平台时,原有的应用软件测试、代码优化都需要一个过程。为此,程佶表示,宝德已经尽可能向多核平台切换,但还是保留了一定比例的单核产品,以满足不同用户的现实需要。
可预见的未来
不过,在可预见的一段时期内,核心数量的扩展似乎没有限制。英特尔近期宣称研制成功了80核心的原型芯片,其功耗比当前的四核设计还要低。该芯片可能会在5-8年后实现商业化。而其他厂商则已经开始在市场上提供4核以上的处理器产品了。
2005年底,Sun推出了它的第一款多核心 arc处理器,代号Niagara。该芯片拥有8个核心,每个核心可执行4条独立线程,即Niagara总的可执行32条线程。到今年年中,Sun计划推出Niagara 2,同样是8个核心,但每个核心可执行8条线程,即总的线程数可达64条。Sun同时还计划在2008年中期发布其Rock处理器,这是另一款基于 arc的处理器,拥有16个核心。 处于多核时代前沿的还有另一家名为Azul Systems的美国公司,该公司早在2005年就发布了拥有24个核心的Vega处理器及相应的服务器产品。去年12月份,Azul又推出了新的服务器,采用其最新一代的拥有48个核心的Vega 2处理器,面向大型网络集群处理领域。
Vega 2由48个64位处理核心组成,由台积电使用90nm工艺生产,内含8.12亿个晶体管。16颗Vega 2可组成一个包含768个核心的计算系统,同时可使用768GB内存。Azul之前的产品是Compute A liance系统,拥有16颗64位24核心处理器,整套系统共计384个核心,搭配Java应用程序使用可加快运行速度并提升效率,并且无需传统服务器的复杂安装,只需简单插入处理器即可实现联网处理。

多核系统的早期用户
多核的快速发展是否超出了用户的需求?对此,业界同样不乏置疑。下面我们来看看几个早期多核用户的看法,在他们看来,多核确实帮上了大忙。
1)用Vega 2多核服务器扩展架构
CitiStreet LLC是首批中采用基于Vega 2的Azul Compute A liance服务器的用户。目前,CitiStreet LLC拥有7台这样的服务器,每个系统拥有两颗48核心的处理器,这些服务器应用于生产、灾难恢复及测试等环境。CitiStree 的CIO Barry Stra ick表示,这些服务器允许该公司可以快速地扩展基础架构,以满足高速发展的要求,同时比原来使用的双核至强服务器提高了100%的性能效率。
2)用SUN新多核服务器实现整合
Concentric 是一家Web和e-mail主机服务提供商,去年底,该公司将系统从老的单核 arc服务器迁移到了新的Sun Niagara服务器上。Concentric总裁Barbara Branaman说,每一台新的服务器可以替换原来的8台老系统。他表示,“我们一直在寻找方法来实现整合,这无疑会帮助我们节省能源消耗成本。新的服务器可以在保持占地空间和电力成本不变的情况下获得更强的处理能力,对我们来说,这是个很大的优势。”
到目前为止,Concentric已经部署了9套Sun Fire T2000 和T1000的Niagara服务器。该公司计划再增加5套系统,并期待即将到来的Niagara 2服务器能带来更进一步的性能提升。
3)用多核系统来提升虚拟化密度
The Charlotte O erver则是一家传媒机构,计划年底引入基于四核至强处理器的服务器,该机构的IT架构经理Geoff Shorter希望这能大大地增加虚拟化部署密度。目前,该机构已经开始将一些关键应用迁移到双核至强服务器上的虚拟化环境,Shorter借此可以在每颗处理器上运行7-12个虚拟服务器。他相信,如果采用四核系统,每个处理器可以开通15-30个虚拟服务器。“每10台硬件服务器需要花费5万美元,而如果在一个硬件节点上运行10个虚拟服务器,将可以节省12000美元。”
现实问题:带宽、软件及其他
然而,现实情况是,虽然多核优势明显,但其发展并非一路坦途——网络带宽、软件许可证、软件优化等都是困扰多核产业的现实问题。
1)网络带宽问题
Gartner的Reynolds警告说,简单地向多核系统迁移并不能保证效率。IT管理人员首先需要确保有足够的网络带宽,来应对增加的处理器核心,同时,还需要确保应用已经得到优化,以最大限度地利用多核环境。他调侃道,“IT管理人员并不会因为电力成本过高而被解雇,但如果他们无法满足所在单位的计算需求,则有可能会丢掉饭碗。”
2)软件计费
Reynolds还谈到,如果向拥有多核服务器环境迁移,商业用户还需要认真的评估软件许可证方面的影响。虽然微软已经明确表示会继续按照socket数目而不是处理器核心数目来计价,但其他应用软件厂商的收费策略还没有这么清晰。“当用户从双核转向四核系统时,要确保不会产生过大的许可证升级费用。”
然而,芯片厂商则声称许可证成本已经不是什么大问题。AMD 的Opteron营销主管Pat Patla表示,“最大障碍主要是从单核向双核迁移阶段,但现在,我们看到,市场上大多数许可证策略已经比较明确。”戴尔服务器产品集团的高级经理Stori Waugh说,该公司正在和所有主要的应用软件和操作系统厂商紧密合作,以推进“按socke计价,而不是按核心收费”的策略。目前,已经有多达90%的软件厂商同意按socke计价的模式。
3)老版本应用软件的效率
另一个问题是,如果应用软件是针对早期硬件设计的,则如何保证这些软件在全新多核环境中的效率。处理器厂商认为,早在当初从单核转向双核系统的阶段,绝大多数应用软件就都已经针对多核环境进行了优化处理。Brookwood也认同这一点,但他也表示,针对处理器的更新换代,软件厂商仍然需要做不少优化工作。
虚拟化软件介于第三方软件厂商和芯片制造商之间。过去两年,AMD和 Intel发布了带有硬件辅助虚拟化特性的X86双核处理器。Vmware和微软等公司也在继续优化各自的虚拟化软件,以更好地利用最新的处理器。
另外,多核联盟(Multicore A ociation )与嵌入式微处理器评测协会(Embedded Microproce or Benchmark Co ortium)主席Markus Levy指出,“甚至当英特尔推出16核心,还需要额外的加速技术。当我们增加的核心数越来越多,我们就会发现,通用处理器仅仅是对某些任务有效,而其他一些任务则需要特殊的加速技术。”
综上所述,我们不难看出,多核已成为芯片厂商继主频之后用来提升性能的新途径,但多核演变之路还只是刚刚开始。虽然英特尔和AMD在X86领域受到更多关注,但SUN、IBM、 Azul等非X86架构芯片厂商在多核化之路上走得更早、更远。不过,目前还没有人确切地知道,多核最终会朝哪个方向发展。而对最终用户来说,在向多核环境切换的过程中,网络带宽、软件许可证等却是不容忽视的现实问题。
07年,四核想走多远?
多核化的趋势已广为接受,四核的价值优势无庸置疑,但四核所存在的问题同样不容忽视。那么,2007年,四核会走多远呢?似乎没有人知道确切的答案。
早在去年11月的至强5300发布会上,英特尔就曾宣布在随后的三个季度中,四核CPU的出货量要达到100万颗以上。英特尔顾凡也曾透露,预计到2007年中,四核CPU在双路服务器中的份额将接近40%。显然,野心勃勃的英特尔并不满足于市场的渐进式增长,而是希望通过新技术来推动整体应用模式的改变,从而带动整个产业实现跨越式的、结构性的成长。但业界也不乏质疑之音:四核上阵,不过是英特尔和AMD之间竞争的产物,跟应用存在明显的脱节,现在谈普及不过是一句空话。
那么,服务器厂商又是如何看待的呢?
虽然各大主流厂商都推出了四核产品,但那不过是拜“平滑升级”策略所赐,厂商对四核的真实推广力度不一。戴尔大中华区企业产品市场总监萧政夫表示,到2007年底戴尔所有服务器产品将转向多核处理器。SGI大中华区市场总监张玲玲则透露,到2007年底,预计四核系统的销售比例可达到20%左右。宝德科技程佶则对记者说,当前,单核、双核与四核产品在宝德服务器产品线中的比例大致是2:6:2。截止到2007年底,预计四核产品在宝德服务器总销量中的比重会占到50-60%。目前宝德已经在中科大、吉林大学以及北京一些科研院所中拥有成功案例,四核CPU销售数量已达到700-800颗,大多是用于HPC领域。
航天联志服务器产品经理王宝的看法相对更加谨慎。他说,联志虽然在06年底就已为四核做好准备,但考虑到四核普及还需要一段时间,因此联志计划到07年年中才会发布2款四核产品。目前双核产品已经占据到联志出货量的98%,单核产品已经基本停止出货。他还表示,虽然四核是趋势,但由于价格偏高,软件滞后,客户认知需要时间,很多实际应用用不上四核系统,以及服务器超前于网络发展等多方面因素,四核服务器不会很快占领市场主流,四核产品从面市到普及应用还有很长一段路要走。
遗憾的是,包括IBM、HP、DELL、浪潮、曙光等大厂都拒绝透露四核服务器的预期销售比例。如此看来,要破解四核市场迷局,确实还要一段很长的时间。
附:X86四核系统上市时间表
- 2006年11月14日,英特尔发布首款针对双路系统的四核至强5300系列处理器(代号Clovertown)。
- 2006年11月,宝德发布14款支持至强5300的服务器——PR4710D、 PR2700D、 PR2710D、 PR1700D、 PR1750D、 PR4510D、 PR2510D、 PR1510D、 PR4310D、 PR2310D、 PR1310D、PT6710D、PT6510D、PT6310D。
- 2006年11月,浪潮发布6款支持至强5300的服务器——NF190D、NF280D、NF380D、 370D、NL230D、NL380D。
- 2006年11月,联想发布6款支持至强5300的服务器——万全T/R280、T/R350G6、R510G6、R520G6。
- 2006年11月,戴尔发布6款支持至强5300的服务器——PowerEdge 1900、1950、2950、2900、SC1430和1955刀片服务器。
- 2006年11月,IBM推出4款支持至强5300的服务器——System x3550、x3650、x3400、x3500和BladeCenter HS21刀片服务器。
- 2006年12月,AMD对外展示了业界首个“真四核”x86服务器处理器——直接在同一硅片上整合四颗处理核心。
- 2007年1月份,英特尔发布针对单路系统的四核至强3200系列处理器。
- 2007年2月,HP发布9款支持尔至强5300的服务器——HP ProLiant ML150 G3、ML350 G5与ML370 G5塔式服务器;DL140 G3、DL360 G5与DL380 G5机架优化服务器;以及BL20p G4 、BL460c 与 BL480c刀片服务器。
- 2007年,英特尔还将推出针对四路以上系统的Tigerton四核处理器,将采用Caneland新平台,相应芯片组、内存和前端总线都会有较大改变。
- 2007年中,AMD将发布针对2-8路服务器和工作站市场的四核皓龙系列处理器(代号为Barcelona)。
|