如今,人工智能遍布数据中心——帮助管理和保护网络、过滤警报和移动工作负载。然而,在将人工智能应用于运营技术问题上,而不是应用于IT方面,该行业一直进展缓慢。具体来说,在冷却领域,有时负责多达三分之一的服务器群的总功耗。
你可能听说过谷歌使用DeepMind开发的基于深度学习的推荐引擎,以“持续”减少其数据中心40%的冷却能耗。2018年,该公司又进了一步,允许算法在人类监督下自动做出调整。
鉴于该行业对排放的担忧,以及对人工智能的热情,人们可能希望这一发展到目前为止会得到更广泛的应用。
缓慢的开始
不幸的是,这类系统的创建需要数据中心的深厚技术专长和尖端的机器学习研究相结合;我们必须记住,DeepMind是一家预算看似无限、没有商业产品的“登月工厂”。
由于数据中心代表着谷歌的核心业务,该公司不太可能与业界分享它的发展成果。将机器学习引入空白区管理是现有数据中心软件供应商的责任。
由于人们普遍不信任人工智能技术,这个过程一直很缓慢,但在过去两年中,谷歌内外都出现了一些有前景的案例研究。数据中心运营商报告称,人工智能确实减少了他们用于冷却的能源,减少了他们的能源账单和碳足迹。
冷却设备的实时控制为机器学习模型提出了一个合适的问题,因为机器学习模型在决策中可能会考虑比人类团队多得多的数据,并且可以产生看起来非传统甚至反直觉的解决方案。有大量的数据可以提供给这些模型:与其他一些工业环境不同,数据中心已经塞满了传感器,可以很容易地添加更多。
2020年底,德国工业巨头西门子(Siemens)发布了一份白皮书,强调了基于人工智能的降温技术的一些好处。该公司表示,随着IT负荷的变化,机器学习使冷却系统能够实时调整其输出,使设备冷却需求与冷却输出相匹配。
这是一个有价值的目标,因为它通过避免数据中心普遍存在的过度冷却问题直接减少了能源使用。这个行业喜欢过于谨慎。
用于冷却的人工智能还可以最大限度地减少对工作人员监督和现场人员的需要,允许员工被分配到其他关键任务,并减少需要访问的人数,这在流行病期间,在现场访问受到限制时非常重要。
西门子自己的人工智能冷却方法结合了两种产品:DemandFlow主要关注冷冻水输送的监测和控制,还有一个叫做“空白空间冷却优化(WSCO)”的平台,它收集温度和送风传感器数据,并计算出所需的气流调整,以维持机架每个通道的正确温度。
去年12月,该平台被部署到巴黎的第一个四级认证数据中心,为法国国有银行CaissedesDép?ts建造。该设施预计将以1.2的电力使用效率(PUE)运行。
西门子的WSCO是与一家名为Vigilent(原名FederspielControls)的迷人公司合作开发的,这是一家位于奥克兰的小型公司,专注于一件事,而且只专注于一件事——关键任务冷却。
Vigilent开发了一个动态冷却管理系统(并申请了专利),该系统由监督学习提供动力,可以控制设备,就像DeepMind开发的系统一样。
该软件通过不断分析传感器数据来了解环境变化,并根据历史行为提出建议。它可以建立建筑物中每个crh单位的贡献,并指出哪些是浪费他们的冷却努力。
Vigilent承诺与Google实验中看到的节能水平相似,声称在500多个安装中的冷却功率平均降低了38%。该公司不仅向西门子提供机器学习技术,而且还向众多DCIM和BMS软件供应商提供服务,例如ABB,日立Vantara和施耐德电气。
另一家引领人工智能进行自动冷却管理的企业是中国企业集团华为(Huawei)。去年,该公司推出了iCooling,这是一项基于云的服务,使用深度学习来处理传感器数据,找到不同设备和系统的参数之间的关系,并将泵、制冷机和冷却塔的输出与IT负载相匹配。
该公司声称,当部署在其自己的云数据中心之一时,该服务将用电效率(PUE)提高了8%。当中国移动试用iCooling时,它将其位于中卫的设施的总耗电量削减了3.2%,即40多万千瓦时。随着该系统继续从数据中学习,预计它将产生更大的节能效果。
关于人工智能用于数据中心冷却的讨论与围绕人工智能用于可持续性的更广泛的辩论息息相关:凯捷研究公司(CapgeiniResearch)最近的一份报告估计,人工智能的创新应用可能在未来三到五年内将全球温室气体排放量减少16%。
凯捷在报告中确定了一些积极的人工智能使用案例,并指出,在不中断业务运营的情况下识别缺陷和预测设备故障的能源优化平台和算法将产生最大的影响。
随着人工智能在其他行业的成功部署,用于冷却和其他数据中心基础设施管理的人工智能将是下一件大事——这只是将理论转化为实践的问题。
西门子在白皮书中警告称:“人工智能有望在未来几年重塑数据中心的运营。”“然而,数据中心需要在今天做好准备,才能在明天发挥作用。”