首页 -> IT文摘 -> IT技术 -> 正文
服务器硬件优化探讨(二)

作者:www.linkwan.com 林和安 林育宗

上期笔者就影响服务器稳定与安全之因素进行了探讨,主要介绍了服务器的电源供应、散热系统、主板选择。本期主要介绍一些CPU最新发展和选用服务器CPU的经验供大家参考。

一、主频不再作为CPU性能的衡量标准

众所周知CPU是服务器的心脏,一台服务器所使用的CPU基本决定其性能和档次。曾几何时我们以CPU主频(核心时脉频率)判断CPU性能的高低,Intel的CPU也以高主频策略占据了更多的市场。多年以来,Intel一直恪守着“摩尔定律”主频决定一切的原则,从MHz到GHz,工程师们最关注的就只有一件事:如何提高CPU的工作频率。

随着CPU科技的不断发展,主频已经发展到近4GHz,晶圆制程也从180纳米、130纳米、逐步转到90纳米甚至65纳米。随着主频的提升,制程的缩小,CPU发热问题也越来越突出。近期Intel放弃了开发更高主频率的CPU,转向发展双核心甚至多核心CPU,主要是大功耗电晶体所带来的散热问题未能解决,所以4GHz Pentium(P4) CPU尙未推出市场。

Intel Pentium 4 处理器

二、散热问题成主频提升瓶颈

CPU是服务器的核心,也是“热心”(发热的中心),高温时CPU会自动将工作效率降低,所以CPU的温度对于其性能至关重要。

然而解决CPU的散热问题谈何容易!试想当年的Pentium MMX 200MHz,用的只是一个小风扇。而现在的发烧友都在使用水冷、干冰制冷、甚至有些超频发烧友在使用液氮制冷,可见CPU的发热量增长是多么的大。

Prescott核心CPU的发热量走势图

随 着集成的电晶体增多,CPU的功耗和发热量都增加了。按过去的经验,通过采用新的制造工艺,可以将功耗降下来:比如从180纳米过渡到130纳米之后,Tualatin核心比Coppermine核心的功耗有了明显的下降。但130纳米到90纳米,功耗递减的规律失效了。例如旧型130纳米P 4 3.2GC Northwood 才82W,新型90纳米P4 3.2GE Prescott功耗值达到103W。

制程的缩小会减少CPU核心所占用的面积,但其他相关部件就可能会增大,而且这种减小与增大幷不是一个线性的关系。减小面积也需要降低晶片的工作电压,例如,130纳米的Hammer处理器其工作电压为1.5V,90纳米的Hammer需要在1.4V下工作,而90纳米的Prescott则只能在1.2V的电压下正常工作。一颗晶片的功耗由电路工作中产生的动态功耗以及由漏出电流造成的静态功耗构成。电压的降低意味着晶片的电晶体动态损耗会降低,但是减小面积的同时暂态泄漏电流就会增大,而且随着电晶体面积的减小,这个漏电电流会以几何级数增长。在以前的制造工艺中,漏电电流几乎可以忽略,比如在0.25纳米制程的晶片中,你几乎无法检测到漏电流的存在,但是到了90纳米时代,晶片的线宽缩小,电晶体的栅极变得越来越薄,漏出电流越来越大,所以漏电所造成的影响就已经成为电能消耗的首要因素,而同时也正是由此引发了发热过巨的大问题。

制程的缩小使得CPU核心可容纳更多的电晶体,所以Intel在提升主频的同时也增加了L2缓存(Cache)数以提升整体性能。CPU的电晶体数目骤增导致了其总功耗的增长,这是CPU发热增长的第二个原因。Prescott的核心面积比Northwood小了25平方毫米,却比后者多容纳了7000万个电晶体!多出的7000万个电晶体工作时释放的热量可想而知。4GHz的Pentium4处理器,虽然主频是顶级,但是功耗却一定不低,据说满负荷工作会达到200W!我想这才是Intel放弃4GHz处理器发布计划的原因吧。

三、双核心架构及增加缓存成新宠

Intel将CPU的架构从单核心发展到双核心,主要是因为目前CPU运算核心发展已达极致,而依靠增加主频方式导致CPU发热量大增,性能却不见得同步成长。现在各个厂商都把提升CPU性能的希望寄托了在双核心甚至是多核心上,增加缓存(Cache)也是办法之一。

谈到双核心处理器,相信不少朋友会问:双核心技术与超线程(Hyper-Threading)有何不同呢?毕竟以前Intel的P4利用超线程技术已经实现了“双核”的功用。从原理上来说,超线程技术可以让单CPU拥有处理多线程的能力,而物理上只使用一个处理器,但作业系统等软体将其识别为两个逻辑处理器。虽然支援超线程的P4能同时执行两个线程,但在执行多线程时两个逻辑处理器均只能交替工作,因此,超线程技术所带来的性能提升远不能等同于两个相同主频处理器带来的性能提升。如果要让处理器资源真正实现幷行处理模式,还需要处理器引入物理双内核设计!在作业系统看来,它是实实在在的双处理器,可以同时执行多项任务。理论上说,双核心处理器的性能几乎比单核心处理器高50%—70%。而且增加硬体核心幷不需要增加太多晶体管,也可通过削减二级缓存的容量以保持适当的电晶体规模,因此也不会带来过多的功耗负担。

双核心CPU内部结构

增加缓存也是近年来提升CPU效能的主要办法,但这样做会否增加CPU的功耗?研究发现,提高主频带来的功耗增加是以平方计算的,相比之下,增加缓存只会增加少许电压,如由1.4V提升到1.45V,电压的增加以倍数计算,容易控制。

事实上在面临散热等问题瓶颈后,Intel已逐渐加大缓存容量以增加性能。不但P4处理器L2缓存由Northwood核心的512KB提升到Prescott核心的1MB后,又推出搭配2MB版本的6系列P4,平价处理器Celeron在导入Prescott核心后,L2缓存也从原本128KB加大到256KB。Intel新近推出处理器的顶级产品P4至尊版(P4EE,P4 Extreme Editon)3.46GHz主频、1066MHz 外频,更在其中加入了2MB L3 Cache。这种以前只是在XEON处理器上拥有的技术现在也已经走入平民化玩家层次,对于一般的服务器应用应有不少帮助。过去无论是Intel还是AMD都只是把Cache缓存的重点放在了L2 Cache上,容量一再进行提升。为了凸显P4 EE的与众不同,Intel赋予它多达2MB的三级缓存,加上512KB的二级缓存,P4 EE的缓存多达2.5MB,但L3 Cache到底有什么作用? 从处理器的工作原理来看,容量较小的L2缓存在纯数学运算中是肯定要快于容量较大的L3缓存的,而L3 Cache又远大于实体记忆体的资料交换速度。我们要注意Intel在P4 EE上的L3 Cache不仅仅是容量上单纯的提升,重要的是它的运行速度是和CPU外频一样的,最大程度的保证了CPU工作时和记忆体之间的资料交换速度,保证了单周期内和二级缓存之间的延时一致的,在资料的不断调用过程中幷不会因为延时的问题造成不必要的等待和性能损耗。

四、外频提升功耗不会显著增加

CPU性能的发挥,不单要看CPU主频及Cache大小,外频的影响也很关键,因为关系到CPU与RAM、显卡等设备交换资料的速度。例如: Intel最近推出P4 3.46GHz 主频(内频)、1066MHz外频的CPU,CPU实际执行频率(内频)3.46GHz =FSB 266.7MHz ×13倍频系数,外频1066MHz = FSB 266.7MHz ×4倍速度运作。提供8.5GB/s的频宽,可充分发挥Dual DDR2 533高频宽的优势,支持新一代的PCI-Express×16图像埠(其8GB/s频宽已经超出800MHz外频的极限)。

虽然外频是如此重要,但要增加外频却比内频困难。Pentium处理器刚推出时,内外频都为66MHz,而现在P4内频 3.6GHz外频只有800MHz,可见CPU内频提升了54倍,外频只提升了12倍。外频提升困难主要是因为牵涉太多的设备,不像内频提升只考虑CPU内部的设计为主,且随着高外频出现的EMI(电磁干扰)问题,比较难以解决。Intel与AMD推出Differential Bus Clocking,取代Single End Clocking,令工作频宽更易提升。此外,AMD更引入DDR技术,其后Intel更有QDR技术,令外频在FSB 100MHz的时脉下,产生400MHz的资料传输效果。

传统外频除了难以提升频率外,在读写效率方面亦然。现在的外频在读写资料时是单向的,而新一代的周边系统如PCI-Express显示卡已经提供同时上传、下载功能,所以AMD采用扩充性高的HyperTransport技术优化外频,令CPU对外频宽大大提升,在执行效率方面也比传统外频先进,可同时进行读取和写入工作,期间不用进行切换。Intel采用PCI-Express,亦可实现先进的双向传输功能,达到16GB/s以上的频宽,满足CPU对外频的要求。

外频的增加会否增加功耗呢?从800MHz到1066MHz外频,Intel的P4 EE CPU功耗增加十分轻微。P4 EE 3.46GHz的功耗为110.7W,比P4 EE 3.4GHz的109.6W轻微增加1.1W,现在明白为何Intel刚放弃了4GHz主频而能马上推出更高外频的CPU了。

五、向65纳米制程迈进

目前Intel要确保其双核心计划能顺利实施有一个至关重要的前提——采用更先进的生产技术。多核心尽管带来了更为强大的性能,但是也同样加大了功耗。目前部分主流CPU已经使用90纳米工艺制程,但正如上文所述,功耗过高的问题未能解决,所以正加紧开发新的工艺制程,功耗过高的问题会渐渐改善。CPU的性能完全依赖于其内核晶片的电路结构,更高的性能意味着电路更加复杂精密。但如果工艺制程不改进,电晶体数量增加到8倍后,体积和功耗也增加到8倍(发热量也增到8倍),而可供散热的表面积仅增加到4倍。所以在不改变工艺制程的情况下单纯增加电晶体的数量是不可取的。Intel 65纳米工艺在单元尺寸不变的情况下,集成电晶体数目却超过了5亿个,其中1平方毫米大小的晶片上电晶体数目已经达到1000万个!决定CPU价格的主要因素是晶片的尺寸,技术的进步带来了性能的提升,但成本却可能更低。

Pentium4处理器的核心显微照片

在 开发65纳米工艺制程过程中,Intel最重视的一点就是在提高工作速度的同时降低泄漏电流以解决散热问题。为此,Intel在制造技术和电路技术方面均采取了降低泄漏电流的措施。在制造技术方面,通过采用90纳米工艺开始引进的“应变硅”核心技术而得以改善。具体而言,nMOS电晶体外形成了一层Si3N4膜,pMOS电晶体则在源极和漏极中采用了SiGe材料。由此就给电晶体沟道部分施加了拉伸应力,从而就能提高载流子的迁移率。结果,作为65纳米工艺,与不使用应变硅相比,可将工作速度提高约30%。另外,与90纳米工艺相比,65纳米工艺电晶体在工作速度相同的条件下,能够将泄漏电流减少到原来的1/4左右。 在电路技术方面,配置了一个用来切断泄漏电流流向缓存(SRAM)的开关。通过在SRAM元件与接地线之间插入nMOS开关电容器,切断空闲SRAM元件的电源。由此可将SRAM的泄漏电流降低到原来的1/3左右。

六、近期服务器CPU的选择建议

基于散热问题以及即将在2005年上市的双核心处理器进程影响,Intel已于近日正式宣布放弃4GHz Pentium(P4)处理器上市计划,并在11月1日已推出P4 EE 3.46GHz 主频,采用1066MHz外频、130纳米、内建2MB L3,而90纳米、2MB L2的Intel P4 EE则预计在2005年1季度推出。

随着制程技术的进一步提升,以双核心甚至多核心及加大L2/L3、外频及64bit来提高CPU性能,正成为当前服务器CPU发展趋势。目前准备更新服务器CPU的朋友,笔者建议仍采用价格适中的旧型130纳米P 4 3.2GC Northwood,待2005年下半年双核心65纳米制程推出如热量问题得到解决,2006年才是采用新CPU更新服务器的时候。

本专题相关文章

服务器硬件优化探讨(一)

服务器硬件优化探讨(二)

服务器硬件优化探讨(三)

服务器硬件优化探讨(四)

文章搜索

覆盖全国各省会城市及海外城市的网速测试
→选择要测试的地区
→选择目标测试点
>> 测试点注册