高性能计算(High Performance Computing,HPC)设备计算能力出众,与此相对应,其“耗电能力”也是“首屈一指”,可谓是IT行业的耗电大户。北京市气象信息中心主任刘旭林给记者拿出一份信息中心新的HPC系统运行用电情况的报告。报告显示,空载情况下,HPC设备加上照明、制冷、安防等设备的耗电量达到了327千瓦;满载情况下,达到415千瓦,折合成电费每年大约需要300万元。
能耗让HPC很无奈
北京市气象部门担负着2008年奥运会期间主要的气象数值预报服务。一流的奥运会需要一流的气象服务,奥运气象服务是举办有特色、高水平奥运会的重要保障。由于全球
气候变化的影响,与往届奥运会相比,北京奥运会期间天气更加复杂,而赛时、赛场和城市安全运行对气象保障要求更高。因此,北京奥运气象服务面临十分严峻的挑战。而北京市气象部门是向奥组委立下“军令状”的,保证要为2008年奥运会提供精细化的气象预报服务。
具体精细到什么样的程度,刘旭林解释,就是要实现以一平方公里为单位的实时数值天气预报。刘旭林告诉记者,“为此,北京市气象信息中心专门花费4000万元添置了一套IBM的HPC系统,计算能力达到9.8万亿次/秒,能够为奥运会期间的气象预测提供有力的数据支持。该系统将提高北京市区的精细化天气预报业务水平,完全满足奥运会要求的场馆周边天气变化数值的预报要求。”
说到能为2008年奥运会提供高质量的精细化气象服务,刘旭林充满了自信和骄傲,但是说起整个HPC系统的能耗,一下子他又平添了些许无奈。“我向领导汇报,信息中心的HPC的电费要将近300万元,领导一听当时就急了。根本就没有这笔预算,一年要300万元上哪儿去找?然后赶紧打报告,组织各方讨论,协调解决。”刘旭林说。
高性能计算起源于科学计算,我国的高性能计算事业就是伴随着“两弹一星”工程成长起来的。在HPC发展早期,由于主要以科学计算为主要应用领域,解决面向科学的重大挑战性问题,所以人们把注意力更多地集中在了它的计算能力上。
如今,HPC在我国已经广泛应用于地质勘探、气象预报、航空航天、环境问题、材料科学、生物科学等方面。而目前关系到企业应用的商业计算正在不断增加,上海超级计算中心副主任袁俊曾向记者表示,“上海超级计算中心的HPC投入应用后,为上海市的气象、环保、船舶、汽车、飞机制造、建筑、钢铁、石油、机电、生物医药、基因研究等各行各业提供了有力的高性能计算服务,为上海市带来了巨大的社会效益和经济效益。”
正是在上海超级计算中心这样的单位的带动下,越来越多的高性能计算中心如雨后春笋般涌现出来。据上海大学计算机学院徐炜民老师介绍,光在上海高校系统,上海大学、复旦大学、上海交通大学、华东理工大学、华东师范大学、上海电力学院等院校就都已经或者正在建设各自的高性能计算中心。
目前,上海大学拥有一套含197个CPU节点的高性能计算机,作为校内主管高性能计算教学和科研的负责人,徐炜民曾经抱怨,HPC的教学和科研并没有得到校内各方的有力支持。但是学校领导对此却振振有词:“还不支持?每年60多万元的电费都交了,这还不叫支持?”对于一个普通高校的计算机学院而言,每年60万元的电费已经不是个小数字了。但是如果和北京市气象信息中心相比,上海大学的抱怨也只能算是“小巫见大巫”。
赖能和是中国石油集团研究院数据处理中心的总工程师。据赖能和介绍,他所在的东方地球物理公司(BGP)主要以地球物理勘探业务为主,国内业务分布在12个省区15个油田,国际业务分布在全球27个国家。BGP在全球地球物理公司排名第四位,陆上地震勘探排全球第一位。
据赖能和透露,BGP之所以具有如此强大的勘探能力,HPC在其中发挥了重要的作用。目前,BGP的HPC具有的CPU数量已经从2001年的134个增加到了12270个,其中10722个用于地震处理,1264个用于地震软件研发,156个用于地震采集,计算能力已经达到了100万亿次浮点计算。2008年之前,BGP的HPC所含的CPU至少要达到1.5万个,运算能力突破100万亿次/秒;到2010年,预计CPU总数将达到2万~2.5万个,处理能力要达到160万亿次/秒~180万亿次/秒。
“CPU和计算能力的增加,直接给BGP带来的就是能耗增加。”赖能和给记者算了一笔账:如果增加10000个CPU,考虑到空间、照明、人员等环境因素和制冷设备冗余,光是大功率的专业空调就需要新增22台。目前,10240个CPU所耗的电费每年大约为970万元,每天将近2.6万元。如果将来增加到2万~2.5万个CPU,加上机房制冷空调、UPS等设备的能耗,那时的电费真可谓是一个“天文数字”。
赖能和表示,计算能力和能耗的增加也是目前石油勘探行业的发展形势所迫。一方面,要确保国家能源安全,这一任务非常艰巨;另一方面,近年来随着油气勘探开发的不断深入,勘探开发的技术难度越来越大。油气公司为了解决复杂地表及地下地质构造成像问题,提高地震资料成像精度和勘探开发效益,减少勘探开发风险,加大了地震叠前偏移处理技术的推广应用力度,所以勘探公司必须大幅度增加自身的计算能力。