数据中心国外从1997年开始大量数据中心的建设,国内是从2000年开始,但是数据中心的建设过去一直没有标准。大家知道,2005年颁布了美国ANSI/TIA-942的标准,,我们国家08年有一个GB50174的标准,有了国内、国外更多的规范,可以获得一些指导性的意见。
经济技术的发展促进了数据中心事业的发展,发展的速度也是非常快,包中大型的数据中心越建越多,每年都可以听到有新的大型数据中心建设在开始,比如像天津的超算,深圳的超算,还有济南的超算这样一些国家大型数据中心。还包括像前些日子听到的,在重庆要建一个10平方公里的云计算中心。像这样一些大型数据中心的发展,说明国内数据中心事业的发展的确有一个突飞猛进的发展。
数据中心成为新经济(基金吧)的一项标志,从各行各业,无论是工农业、企业、商业,包括国防一直到人们的日常生活当中,都受国际互联网的应用,同时它的背后就是数据中心在强有力的支持。刚才很多专家已经谈到了这方面的论点。
打造绿色数据中心已经成为时代的一个潮流,节能、低碳、环保是我们数据中心发展的一个方向,安全、可靠、可用、可信是一个基础,数据中心的建设不可能离开这个基础而单纯的只是向节能环保这个方向去努力。
科学管理在数据中心的应用方面的确还是一个新的课题,建设一个数据中心有相应的一些标准、规范,大家很容易去理解它,并且有一些相应的数据中心的建设部门、供应商,他们可以提供相当完整的基础设施方案。但是真正把一个数据中心用好,能够把它管理好,确实是我们遇到的一个比较新的课题。数据中心的应用包括运行维护、能效管理、人员培训,还有专业化的服务。
数据中心的供电系统结构是以目前是以UPS电源为核心的低压交流供电系统,包括输入电源系统以及以UPS为核心,帮助UPS输入、输出配电一直到负载之前的供电系统,包括配电、配电柜、电压其、电缆等。
在数据中心当中,目前的供电系统应用2N也好,N+1也好,这样的系统的应用是非常多的。建立两套独立的UPS系统,形成UPS。通过UPS输出的配电达到负载的列头柜,进入每个机架。这是最常见也是最普及的供电模式。对于一些比较重要的负载来讲,还可以通过STS,通过负载列头柜来实现二次性的双母线的负荷,也就是把原来的双母线变成一套与原来不基本一样的复合双母线为一些新的负载去配电。比如金融行业,有一些生产性的负载,都是采用了区域3、区域4这样的供电诺士。STS的系统来讲,它的可靠性、可用性以及可维护性都会得到一个比较好的发展。当系统容量增大的时候,我们也可以在系统的建设上预留一定的安装接口。
供电系统设计和配置中存在一些问题,有一些和后期的运行管理有密切关系。一是供电系统可靠性、可用性存在的问题:负载对供电可用性的要求越来越高,可用性按照我们的理解,负载计算机可以正常运行的时间与总时间之比,这个正常运行时间里面应该包含有降级使用的时间。什么叫降级?比如说UPS是2+1冗余的,换了一台,现在没有冗余了,但是你的计算机依然能够正常供电的,这种就是属于降级使用。降级使用的时间应该在可用时间或者正常运行时间之内,如果要不把它包含在可用时间之内,就会带来很多将来在运维管理方面的误导或者观念上的混淆。
负载对供电质量的要求降低,为什么?是因为目前来讲,我们的计算机负载输入范围变宽了,比如说电压,从原来5%,现在放宽到10%,频率从原来的1%,现在也放宽了。
负载对供电连续性的要求有所提高,但是对于供电瞬间的间断时间要求也是降低了。刚才很多专家都已经讲到,从CBEMA这条曲线规定计算机的供电电压等于零的时间是10个毫米,后来后来的曲线公布出来的电压等于零的时间已经放宽到20毫米。所以计算机对供电要求不是很苛刻。
作为电源系统来讲,如果单纯来提高某一个设备或者某一个装置的可靠性,现在来讲已经很难了。大家可以理解,比如断路器我们可以选择一些比较好、比较知名的品牌,但是你要让这个断路器各项性能能够再提升一个台阶,它的机械强度、短路电流的承受能力等等再要增加的话很难。UPS也一样,发展到现阶段,如果让UPS的MTBF再成倍的提高也不可能。在这种情况下,改变设备可靠性已经比较难,所以如果要想使负载获得更高的可用性,只有从系统架构上去提高它的可用性。
经常大家说各个厂家的设备都差不多,这也说明我们的产品已经成熟化,市场化,甚至就是一个通用设备,跟电视机一样,你的电视机可以接录像机,可以接数码相机。
当电源设备仍然占据一定比例,成为单路径故障点。所以在这方面还有可以进一步改进的。双电源供电系统日趋成熟,但是配置结构相对复杂,不光是设备的种类多,而且包括供应商也很多,这个时候可能就会出现众口纷纭的情况。这个“口”不光五流传,大家有一个口碑,而且各个供应商之间的接口也是非常重要值得我们探索和深思的。
我们在这提出来一些问题,并不是说一个专门的研讨会去研讨它的技术,只能说我们去提供一种解决的方向。比如说我们可以通过冗余来改变系统的可维护性,一个系统不可能不对它进行维护,任何设备、电缆、断路器、UPS、ATS都是需要维护的。
用双总线来增强故障容错的能力,避免天灾人祸。比如像很多重要的行业,自从四川大地震以后,包括日本地震以后,要求UPS也拿去做震动测试,震多长时间,按照多少级来震,这些实际上是对产品品质的监测,但是对于系统来讲,我们是一个基础设施,所以还是以双总线的形式去做是一个比较好的选择。
模块化,大家有的时候都是考虑到UPS产品自身的模块化,认为UPS是有一个一个的抽屉插入的。这个观念比较局限化,在大的系统里面,不可能采用一个10千瓦、20千瓦的模块去拼接一个计算机系统。现在经常遇到的中大型数据中心变压器2500,UPS2400,这样一个大的系统要用10千瓦、20千瓦去拼的话,节点就太多了。
可管理性,刚才大家也提到了很多,包括一些新的设备和仪器,它不仅是对于设备、系统的管理,可管理性应该还包括人员的管理。在942当中,对于人员的培训、管理、服务提出了很明确的要求,但是大家往往看的比较多的、关注比较多的是空调应该怎么配,UPS怎么配,接地怎么做,但是真正对于人员的管理、对于人员的培训重视的程度不够。所以我们要避免一些人为的故障,预见一些问题的隐患,其实跟人员的培训还是有密切关系的。
系统的集成化,提高系统的可用性。我们所说的系统集成化并不是说所有设备的罗列,而是希望从供电设备的制造商和渠道商来讲,能够做到统一化。有的数据中心可能为了平衡关系,空调是一个厂家,UPS一个厂家,甚至谐波治理是另外一个厂家,有负载电路柜的供应商等等,一套电源系统结果弄的十几个供应商,出了问题之后,大家就该相互推诿了。在工程设计和施工的规范化,采用的是比较专一的供应商的话,工程设计和施工方面有一个按照他比较规范的行为去做这样的事情。