世界对于计算性能的要求永无止境。双核尚余音绕梁,四核已横空出世。现在浪潮全线双路服务器都支持四核英特尔至强处理器5300系列,可最大限度提升服务器性能,及可靠性和通用性,并降低拥有成本。
受益于酷睿
根据业界著名的摩尔定律,每隔 18-20个月处理器的性能就会翻倍的处理器出现。自2002 年起,通过提高处理器频率改进性能的方法开始步入穷途末路之境。而多核技术给处理器的性能的提升开辟了一条新的道路。将多个内核整合在一起,让每个内核在较低的频率下运行,从而各个单内核的功耗下降而且分摊到多个内核上。由此得到的结果就是多核性能大幅超过单核处理器。继今年6月英特尔发布酷睿架构和至强5100系列双核处理器后, 11月英特尔发布了四核至强处理器5300系列。
与5100系列处理器一样,5300系列四核处理器采用了酷睿架构,运行在Bensley平台上。因此对于购买了Bensley平台的客户而言,可以直接将服务器由双核升级为四核。
5300系列(Clovertown)采用两颗Woodcrast芯片封装在一起的做法。尽管这点颇受AMD的攻击,但是其性能比5100系列处理器还是有了40%~60%的提升,而功耗仅为120W和80W。这显然受益于酷睿的优秀架构。
谁需要四核
1. 渴望更高计算性能
2. IT预算日渐紧张
3. 需要更高的计算密度
4. 有过多设备需要管理
上述是英特尔对四核目标客户的描述。由于5300系列至强处理器拥有更好的性能功耗比并支持虚拟化技术,因此非常适合大型数据中心进行设备优化。随着3G通讯、WI-FI等通讯技术的普及给电信增值业务带来更多的发展机遇,更多的IDC(数据中心)将采用多核X86服务器。在英特尔的四核产品发布会上,来自上海电信的客户和百度的CIO就四核处理器给予了高度的评价。而就在同一个月,浪潮也获得了大陆地区第一份四核服务器订单。首批四核服务器将落户于中国科技大学生命科学院,承担高性能科学计算应用。
超越四核
随着通讯技术和信息技术不断发展,应用的计算密集度将在未来十年狂飙猛进。因此,有人预测未来将是 “万亿次时代”(teraera)——一个人们需要万亿次浮点运算能力(每秒万亿次浮点运算)、万亿位(每秒万亿位通信带宽)和万亿字节(1024GB)的数据存储来处理信息的时代。在四核的发布会上英特尔亚太区总经理杨旭声称为了英特尔也许会推出拥有100个内核的处理器。英特尔声称目前正在进行万亿次级计算研究计划——用数十个(甚至上百个)高能效内核和精密内存层来构建和设计系统,听起来真的激动人心。
AMD公司在宣称明天第一季度推出类似的处理器产品,性能大致于5300系列至强处理器相当。
多核处理器的一个立竿见影的优势在于针对多任务应用改善操作系统能力。例如,在后台进行病毒扫描的同时,在前台运行文字处理应用,操作者能够明显的感觉到系统的迟钝——敲击一个按键后,要经过一段时间延迟,屏幕上才会显示出对应的字母。而在多核处理器中,操作系统可以将任务分配到不同的内核,操作者就不必面对这慢吞吞的屏幕叹气了。
特性
优势
四核处理能力
ü 最大限度提升性能和性能功耗比,每平方英尺获得更出色性能,以支持数据中心基础设施和高度密集型部署。
ü 提高多线程应用和繁重的多任务环境的性能和线程扩展空间,并通过虚拟化和应用响应能力帮助提高系统利用率。
大型 8 MB 模上二级高速缓存
ü 增加二级高速缓存到内核的数据传输效率,最大限度提高带宽,并降低延迟。
ü 高达 4 MB 二级高速缓存可分配到一个内核中。
1066 和 1333 MHz 的系统总线
ü 快速、专用前端总线可增加吞吐率。
虚拟化技术
ü 全新处理器硬件增强支持基于软件的虚拟化,并能够支持包括 64 位操作统和应用在内的更多环境移植到虚拟环境。
64位架构
ü 出色的灵活性,支持 64 位和 32 位应用及操作系统。
动态节能技术
ü 帮助降低平均系统功耗,并潜在减少系统噪音
处理器型号
主频
高速缓存大小
前端总线
电源
按需配电
四核英特尔至强处理器X5355
2.66Ghz
8MB
1333
120瓦
支持
四核英特尔至强处理器E5345
2.33 Ghz
8MB
1333
80瓦
支持
四核英特尔至强处理器E5320
1.86 Ghz
8MB
1066
80瓦
支持
四核英特尔至强处理器E5310
1.60 Ghz
8MB
1066
80瓦
不支持
四核英特尔至强处理器E5335
2 Ghz
8MB
1333
80瓦
不支持
附:浪潮服务器NF380D
浪潮英信NF380D服务器基于全新的浪潮智能弹性架构IFA+,是一款的性能卓越的5U机架式服务器。极强劲的计算、存储和输入/输出性能,使其适用于对处理速度、运算能力有较高要求的应用环境,完全胜任关键业务7×24小时不间断运行的需求。
典型应用
特别适于担当政府,大中型企业,高等院校等行业的大型网络的中间层或后端资源服务器。例如,企业ERP、CRM管理、外汇管理、税务数据大集中、教育城域网、远程教育、数字图书馆等
产品特色
强大的性能
支持英特尔®四核至强™处理器,兼容64位与32位应用,提供强劲的计算性能。
多段PCI总线,完全消除I/O瓶颈,令数据传输效率激增。
可信
高性能和可靠性的全缓冲式内存(Fully-Buffered DIMM),支持内存镜像和内存热备等高级内存容错特性。
SAS RAID6提供更好的磁盘数据保护能力。
智能
可扩展的管理架构为用户提供多样化的管理方案,满足不同客户的多变需求。
即时远程管理技术让异地管理服务器轻松、便捷、省心。
弹性
多达7条PCI插槽,兼容PCI-E、PCI- X和PCI设备,保护用户的即有投资。
支持Intel虚拟化技术,通过增强虚拟化解决方案的可靠性、可支持性、安全性和灵活性,可改进现有纯软件虚拟化解决方案。
主板:

IntelS5000VSA主板展示
本次组装与测试选择了IntelS5000VSA作为主力,实际上,在主板的选择上,笔者也是费了一些心思:除了考虑选择特定版本号以及相对应的BIOS版本的主板来满足四核CPU的支持外,对于本服务器整体系统的协调性考虑更是笔者系统设计的重点。
在IntelS5000VSA这款主板外,我们还测试了泰安(TYAN)、超微(Supermicro)等多个牌子、型号的主板,证实市面上已经有多款型号可以正式支持四核CPU,但是更多原本支持双核的主板却不能完成四核CPU的支持工作,需要组建四核至强服务器的朋友,在确定方案的时候,还要注意咨询一下厂家,以确认是否能支持四核CPU。
内存:

威刚1G DDR2 FB-DIMM ECC,频率667MHz
内存的选择,在诸如WEB服务器、数据库等稳定性高要求的具体应用中,是非常重要的。作为全球第三大内存厂商,威刚凭着良好的品质和一贯的高性价比策略,旗下的万紫千红、红色威龙等桌面版在PC内存市场上大受欢迎,在服务器市场上,威刚也推出了配合双核至强使用的FBD内存以及其他的ECC REG内存。2条单根1G的FBD 667内存,一共2G容量,并组成双通道。
硬盘:

性能惊人的桌面版万转硬盘:西数猛禽

西数猛禽近观可见参数与序列号
西数猛禽无疑是性能最强的SATA硬盘,另一方面,它也是面向7×24工作环境设计的,具有高达120万小时的平均故障间隔时间,可靠性也远远高于普通桌面版硬盘。
电源:

台湾新钜2U 510W电源

铭牌近观清晰地显示相关参数
110V~240V全兼容性,铭牌标称相当详细,甚至连保险丝规格都清楚明白的标明了。
对一个服务器来讲,电源的重要性不言而喻。作为整个系统的能源供应系统,高品质的电源是整个系统7×24不间断运作的坚强后盾。这里我们用的是台湾新钜(zippy)的2U 510W电源。新钜和台达、亿泰兴被并称为全球三大服务器电源厂商,为多家国际品牌服务器提供OEM,品质极为可靠,当然,价格也比其他的贵一些。但在服务器上,象电源这类的关键性配件,增加几百元的投资,换来更高的可靠性,算起来还是很值得的。
机箱:

外观可见2U机箱充足而有序的空间布局
这个机箱是个2U机架式服务器机箱,可以接6个硬盘+1光驱+1软驱,支持热插拔(需另加相应热插拔背板),为了避免AD嫌疑,在这里就不亮外观照片了,大家可以看看内部构造。
第二部分:系统组建
主板安装
OK,配件起了,就可以开始安装硬件了。先安装主板。在安装主板的时候,要注意机箱的螺丝位柱和主板上的螺丝孔要一一对齐,不要放置多余的螺丝柱,以免造成短路。另外,把主板安装在机箱里面之前,千万要记住先安装CPU底座支架,而且不管当前使用的是一个CPU还是两个CPU,都要将两个支架都安装上去,要不然到升级为双CPU时候,发现CPU风扇没办法装上去,又要拆主板出来就更麻烦了。

主板下端CPU底座支架示意
在安装底座支架的时候,要注意中间有两个与主板PCB板接触的支撑,上面是带有一层绝缘膜的,安装的时候千万不要撕掉!很多人在安装配件的时候,会习惯性的清除掉配件上的保护膜、包装膜等,但是这里的这个绝缘膜,就千万不能撕掉,否则就很有可能会造成短路。很多初次接触服务器的朋友,就是经常在这些细节上吃了亏,明明配件都是好的,装上去就是不稳定,甚至点不亮,空在那里郁闷半天。其实这些小细节,正规做服务器的商家在技术员培训的时候,都有专门的培训过,不会犯这种低级错误。普通网友,则只能靠自身的经验积累了。或者多了解一下网上这方面的介绍,也能少走很多弯路。

CPU底座支架近观
CPU与内存安装
主板安装上去之后,接下来就可以安装CPU和内存了。为了测试单CPU和双CPU的性能差别,我们先上了一颗CPU。安装的时候,小心注意方向,对准位置即可,由于CPU插座上的触脚非常容易弯曲,所以千万不能野蛮操作。

双四核CPU安装完毕
上内存的时候,则要注意内存的位置。PC主板上的内存插槽数量比较少,对内存的插法也比较宽松,限制较少,但是服务器主板就相对有很多讲究了。细心的网友可能已经发现Intel S5000VSA这块主板上,8根内存插槽,其中有2根是蓝色的。根据Intel的官方说明,内存应该先插A1(靠近北桥的蓝色插槽),然后插B1(中间的蓝色插槽),这样才能实现双通道。如果在A1上没有内存,则可能点不亮机器,而如果不是A1B1这种插法,则不能实现双通道,只能运行在单通道状态下,性能会有一定的下降。至于下降差距,我们在测试的时候,也有相应的测试,大家可以参考后面的测试数据。

内存的正确插入方式
再装上硬盘光驱,基本上硬件安装就完成了。
由于Intel S5000VSA这块主板上是没有软驱接口的(Intel从来就是那么激进滴……),而要在做了RAID的硬盘上安装系统,必须用到软驱来加载驱动,所以我们在安装的时候找了一个USB软驱,以便能安装驱动。
在通电点亮机器之前,需要再次检查一下硬件安装状态,例如接线是否正确,插件是否稳固,螺丝是否上紧、机箱内部有没有杂物等等,这虽然是小细节,不过养成良好的自我检查习惯,对服务器的顺利安装,大有帮助。在安装完系统之后,要将线缆整理、捆扎好,这个不单单是美观问题,而是一个必需的步骤。首先,将线缆捆扎好,可以保证机箱内的空间,有利于散热气流的顺畅,特别是在1U、2U这类空间比较小的机箱内,散热是一个很重要的问题。再次,散乱的线缆、接头容易碰触到风扇等部件,轻则造成风扇停转,重则导致风扇短路烧毁,所以不能放任不理。

完成安装的机箱内部全景图
至此,硬件部分就基本完工了,下面我们来看看他的性能表现。
第三部分:系统测试
1、测试环境:Windows 2003 SP1简体中文企业版 ,所有驱动均安装齐全。
2、系统信息:
EVEREST检测:

PConline水印之上8个核心历历在目
CPU-Z检测:

CPU-Z测试数据之CPU

CPU-Z测试数据之Cache

CPU-Z测试数据之Mainboard

CPU-Z测试数据之SPD
1.38版的CPU-Z已经能正确的认出E5320的CPU,主板和内存的信息也正确无误。
3、性能测试
1) CPU理论性能基准测试:Sisoftware Sandra 2007 ,Super PI
SiSoftware永远是处在技术领域的最前沿,是在像多核心,Wireless MMX,AMD64/EM64T,IA64,NUMA,SMT(Hyper-Threading),SMP,SSE2,SSE,3DNow! Enhanced,3DNow!,Enhanced MMX和MMX这些新技术出现时最早提供基准测试的软件商之一。Sandra是一个非常有现实意义的合成基准测试,它放弃了使用含义模糊的指数,改为采用有实际意义的性能数字,例如像每秒执行指令数或每秒字节数等。新版本的SiSoft Sandra 还针对性的推出了32位和64位版本,两个版本完全整合在一个安装程序中。
SuperPI是由东京大学Kanada Lab.所制作的一款通过计算圆周率的来检测处理器性能的工具,在测试里面可以有效的反映包括CPU在内的运算性能。不过遗憾的是,SuperPI并不能支持多线程,E5320空有多个核心,却无用武之处。

CPU理论性能测试
由于Sisoftware Sandra的CPU测试项目测试的是“纯粹”的CPU计算能力,所以双路E5320基本上都是2倍于单路E5320的成绩,当然,这只是理论计算上的差距。在另一款测试软件:SuperPI里面,情况就完全不同了,由于SuperPI只能利用一个核心,所以单路和双路的成绩,完全一致。不过尽管只能利用一个核心,28秒的优秀成绩,也足够体现出E5320强大的计算能力了。
2)内存性能测试:Sisoftware Sandra 2007 ,EVEREST 2.2

在Sisoftware Sandra内存性能测试里面,单通道和双通道的理论性能相差很远,但是在EVEREST里面,则是另一番光景。从这里也可以看出各个测试软件偏重性不同,导致测试结果也大有区别。
以绝对值来看,这个成绩普遍比过去单核平台有15%左右的提升,高达667MHz的FBD内存显然是最大的原因。从实际应用来看,单通道性能会大约比双通道低5%左右。支持双核至强平台,另外还有一款5000P,可以支持四通道的内存,内存性能将会更强一些。
3)科学计算性能测试:ScienceMark v2.0 32bit
ScienceMark v2.0是一款用于测试处理器在科学计算应用中的性能的软件,可以体现处理器整数运算和浮点处理能力。Sciencemark本是被设计出来用以模拟真实科学应用环境的,通过对计算水分子总能量、钷元素求量子解、氩原子分子动力学模拟等项目测试计算机内存、仿真分子动态效能和浮点精准效能。在下图中我们看到的是ScienceMark测试所取得的最后成绩。由于ScienceMark仅仅能支持2个线程,所以一颗E5320和两颗E5320的成绩基本一致,也和5120的测试成绩一样。

科学计算性能测试
4)应用实际环境测试:3DMAX 8.0,CINEBENCH 9.5
桌面实际应用里面,能充分利用8个核心的软件比较少见,但在图形工作站领域里,由于对性能的渴求,所以对多线程的利用大大的超前于普通应用,所以我们用了两款常见的图形软件来测试E5320的性能。
3DMAX 8.0:

3DMAX 8.0对系统进行图形工作站适应性测试
为了有更好的比较性,我们采用了在网上广为流传的玻璃马模型,并搜集了网上其他网友的测试成绩,一并列出来,以方便各位朋友能更直观的对比。

玻璃马模型渲染时间测试(越短越好)
从上图可以直观的看出来,仅仅单颗E5320,性能就已经远远高出双路单核至强3.0G,几乎达到了双路单核至强3.0G两倍的性能,多个核心的优势,在这里一览无遗。双路E5320比单路E5320提升的幅度也达到了50%之多,E5320的四个核心,在这类为多线程优化过的软件里大展身手。
CINEBENCH 9.5:

CINEBENCH对8个核心都能充分利用
CINEBENCH是一款基于一个3D设计软件 ——CINEMA 4D的免费测试工具,是基于实际应用的专业3D软件包。CINEBENCH 9.5测试包括CPU子系统和图形性能两大部分,CPU部分又分为单CPU(线程)和多CPU(线程)2个子项目,并给出单线程和多线程结果的提升比率,非常直观。由于对CPU性能测试比较准确,更是少见的支持多核CPU的软件之一,所以现在也常常被用于服务器CPU测试。Intel官方在演示E5320的时候,就多次利用这个测试软件,由此也看出这个测试软件的权威性。

E5320的CINEBENCH 9.5测试
E5320在CINEBENCH 9.5里面如鱼得水,双路E5320在CINEBENCH 9.5里面的渲染时间仅仅用了15秒,是笔者所有经历的测试中最高成绩,可以说,四核的出现,使得这类依赖CPU性能的软件大受裨益,E5320也可以说是为此而生。
总结:
从上面测试我们可以看到,对于双核以至多核心,软件的作用至关重要。
对日常使用的软件、游戏来讲,多核心暂时还没有得到软件的充分支持,而在服务器、工作站领域里,由于对性能的更多渴求和应用的更高需要,大多数软件已经对多线程有着良好的支持。也正因为如此,所以尽管双核至强和双核酷睿基本是同一时间发布,但是双核至强的普及速度就远远高于双核酷睿。
四核处理器的情况也与双核类似:桌面版的四核酷睿QX6700发布以来,一直都属于厂家、媒体、专业测试机构测评室内的“专用测试”CPU,而四核至强,则自发布当日起不到十日,已传出多家厂商统计的每公司百数为基数的定单量。时间发展到今天,陆续从厂商、渠道报出的市场数据显示,四核至强在实际应用中正发挥其关键应用的高性能支持作用。
这次我们测试的这个四核至强E5320,实际数据显示出,其性能确实远超过双核地强悍,而被英特尔寄予厚望的“四叶草”,终究没有让无数的“至强迷”失望。
最后,我们可以看到,四核平台的优势领域在于对CPU子系统要求较高的高端应用,例如中大型数据库、计算中心、交易系统、渲染服务器等。
另外,文章起始笔者曾提到,英特尔为自己定下的2007年目标是,在年底前实现四核至强服务器出货量占据整体产品线出货量的40%,结合不断从英特尔公司内部传出的将“价格战”进行到底的市场战略,我们可以预计,2007年下半,甚至在成本因素排行服务器采购考虑因素前三的主流DIY市场中,也会越来越多地见到四核服务器的身影。


