“黑科技”解密数据中心的能耗指标(PUE)

2017年,全球各地约有800万个数据中心(从小型服务器机柜到大型数据中心)正在处理数据负载。这些数据中心消耗了416.2太瓦时(1太瓦时约为10亿千瓦时)的电力。这相当于全球总用电量的2%,预计到2020年将高达全球用电量的5%。

现代生活离不开数据,但随着数据流量的增长,数据中心的大量建设,人们在通过数据创造了一个更美好的世界的同时,将面临对数据中心日益增长的资源和电力需求。数据中心平均消耗的功率是大型商业写字楼的100倍以上。一个大型数据中心使用相当于一个美国小城市的总电量。为服务器供电和冷却所需的电能占到数据中心总运营成本的40%,因此数据中心的能源低效问题不容忽视。

“黑科技”解密数据中心的能耗指标(PUE)

机房内景照片

近期,小智团队接触了几个数据中心供电及能耗优化的项目,其中数据中心对电能的需求让人吃惊不小,如此巨大的电力负荷需求,实属“高耗能”产业,联想到比特币的“矿机”,异曲同工。也难怪在数据中心的项目审批与立项中,政府职能对其能耗指标如此关注,小智查阅了有关资料,让我们共同走近数据中心的能耗指标,也解密一下其中常见的“套路”与“黑科技”。

数据中心的能耗,分IT设备能耗,空调能耗和供电能耗三部分,其中IT设备能耗又可分为处理器能耗和存储能耗两部分。根据TGG(绿色网格,非盈利组织)在07年所做的测算,当时的数据中心,耗费在空调设备和供电设备上的电能普遍超过了IT设备本身的耗电。数据中心的电力消耗明细及占比,如图1所示。

“黑科技”解密数据中心的能耗指标(PUE)

图1 数据中心的电力消耗明细及占比

PUE是Power Usage Effectiveness首字母缩写,定义为数据中心总耗电与IT设备耗电的比值,是数据中心常用的衡量能源利用率的指标。含义其实是指从用电来讲,用于服务器计算的电力产出与数据中心总投入电能的比值。工信部亦对其规定了计算公式和详细取值点,PUE= (PM1+PM2-PM4)/PM3。不难看出,PUE的计算结果是一个恒大于1的数值,且PUE越大表明数据中心为实现IT设备运行所消耗的电能越大。近年来,节能减排大行其道,作为能耗大户的数据中心也被一再被严格要求,新建大型数据中心全年平均PUE值需达到1.5以下,改造数据中心全年平均PUE值需下降到2以下。

“黑科技”解密数据中心的能耗指标(PUE)

图2 工信部规定的PUE具体算法和取值点

2015年工信部的《国家绿色数据中心试点工作方案》披露,中国数据中心PUE普遍大于2.2,而美国的数据中心平均PUE已降到1.7以下。早在2013年底,作为当时国内数据中心最集中的地区,北京市十部委就已经联合发文,禁止PUE大于1.5的数据中心建设投产,2014年3月,工信部发布《关于进一步加强通信行业节能减排工作指导意见》,规定从2016年开始,新建大型数据中心的PUE值必须小于1.5。但这个要求根本未能落实。

当PUE成为节能指标后,业界先后出现了很多数值小于1.20,甚至小于1.10的数据中心,亮眼的PUE数值被用于彰显其技术的先进性和强大的运维能力。爱刨根问底的朋友们,肯定想过问过推理过,这些披露的数据是否合理呢?到底是采用了哪些”黑科技”使得PUE数值能够降低如此之多呢?PUE数值是否能够真实反映数据中心节能效果呢?

解密”黑科技”之前,咱们先看看都是哪些系统消耗了数据中心的电能。在此,你大可将数据中心想象成一个巨大的组装式机箱。数据中心(机箱)是承载了IT设备的特殊建筑,制冷(散热片和风扇)、供配电(机箱电源)以及其他辅助系统组成的基础设施为满足IT设备正常运行提供了温度适宜的室内环境、可靠稳定的电能,

因此除了IT必须消耗的电能外,制冷和供配电系统的耗电是数据中心主要能耗大户,如下图3所示。

制冷系统耗电与选址地点、系统方案、以及运行要求相关,与当地全年气候变化息息相关,供配电系统耗电通常以供电效率损失和配电损耗为主,供配电架构确定后供电效率和损耗即确定,只要其他系统用电就会有一定的损失。这么一说之后,相信大家都能明白,PUE数值的计算结果受多因素影响,而且不可能无限降低。

“黑科技”解密数据中心的能耗指标(PUE)

图3 某调研机构基于传统数据中心建立的PUE分布统计

让我们来看看,数据中心能耗的计算“套路”与“黑科技”,也让我们的投资方与运营方能够把握故事的要点,毕竟这是真金白银的投资。

“黑科技”招式1:模糊PUE计算公式

一些规划了光伏发电数据中心,会在计算公式的分子中减去光伏发电量,(总用电量-办公用电-光伏发电)/IT设备用电量=全新的PUE值 ;如这两年一个据称PUE小于1.1的小型实验数据中心。这样算来,如果光伏发电量足够大,PUE岂不是可以小于1?数据中心基础设施不耗电,还可以盈利?这算不算终极大招?还有某些数据中心以制冷部分的PUE作为整体PUE进行公布,这样确实可以博得眼球。

“黑科技”招式2,模糊全年平均PUE的概念

通常我们所说的PUE为全年平均PUE,如果选择公布季度、月份、周、天或小时发布能效数据,应对其能效周期加以说明,而只有全年平均PUE才具有参考价值。某模块化数据中心所说的1.10,都是在短暂时间内统计出来的数据,用于评价数据中心节能效果相对片面。

“黑科技”招式3,模糊数据中心运行条件

各家数据中心室内温度条件要求不一,有23℃的,有27℃的,有的甚至能达到35℃,运行温度越高,制冷系统的耗电越少,与之相匹配的供配电损耗也越少,PUE计算公式中分子的减少确实可以实现整个PUE数值的减小。但其实这句话只说了一半。运行温度的提高,不仅仅对基础设施产生影响,还会对IT设备产生影响。在IT设备需求不变的情况下,提高基础环境的运行温度,会提高IT设备散热难度,从而需要IT设备散热风扇消耗更多的功耗去满足其散热需求,而这部分功耗是计算在PUE的分母中的。过度提高运行温度大大的增加PUE的分母,确实可以降低PUE数值,但是很有可能同时也增加了数据中心总耗电!

“黑科技”招式4,模糊散热系统架构

数据中心和散热相关的系统包括制冷系统中的机房内部分和IT设备散热系统,两者接力共同冷却电子设备。近些年国内外均出现将机房内部分风扇取消,而增加IT设备的风扇转速,来替代机房风扇。这种将机房冷却系统的电能消耗转移到IT设备的做法,也是大大增加了PUE的分母,虽然PUE降低了,但是数据中心同样是不节能的。 如下图4所示,机房通风的风机取消而增加IT设备的风扇。

“黑科技”解密数据中心的能耗指标(PUE)

图4 机房通风的风机取消而增加IT设备的风扇

仅以PUE作为节能指标,还能不能真正准确的反映数据中心节能效果?这个问题就像是使用单一维度的KPI指标,能否提高员工的工作效率一样。如今的数据中心选址地点不再集中、运行条件不再苛刻、系统架构不再单一,这些均与PUE概念提出时的情景不同,只能说PUE可以反映数据中心在限定条件下的电能利用效率,而不能直接评价其节能效果。现如今,单一的PUE指标已经不足够,需要综合考虑选址地点、运行条件、系统架构、运行负载等多方面因素后,在限定条件下,以统一的标准计算的PUE可以作为数据中心运行效果的指标。


分享到:


相關文章: