新闻

数据中心面临‘耗能’和‘运维’两大难题,创新奇智提出AI新思路

2020-07-15e-works 张瑾

2374阅
新基建风口下,从政策到产业层面,数据中心引起广泛关注。但随着市场规模的快速增长,能耗和运维成为数据中心行业的两大发展难题。

    2020年,“新基建”火了!数据中心成为“新基建”的重要发展项目,引起业界高度关注。中央明确表示要加快信息基础设施建设步伐,包括大力发展以数据中心、智能计算中心为代表的算力基础设施建设,以人工智能、云计算等为代表的新技术基础设施,而在整个信息产业中,数据中心作为云计算的基础,处于产业链条极为上游的位置,为各种计算服务提供基础支撑,可以说数据中心是基础的基础。

    市场规模大VS管理水平低,数据中心的发展之痛

    云办公等数字经济的崛起、网民规模持续上涨、大数据与人工智能对存储和计算提出更高需求、超大规模组网等因素叠加,推动我国数据中心市场规模高速增长。

    据中国信息通信研究院发布的数据显示,近三年我国数据中心市场规模增速均在30%左右,去年全年市场规模超过1000亿元人民币。长远来看,5G、物联网、工业互联网和传统企业上云将持续利好数据中心行业发展。

    但是,高速成长的背后,我国数据中心的短板也逐渐凸显,能耗过高、运维管理水平低,成为制约数据中心发展的主要因素。

2020年中国数据中心行业发展洞察报告

《2020年中国数据中心行业发展洞察报告》(图片来源于艾瑞咨询)

    痛点1:能耗过高,能效亟待提升

    数据中心一直占据“能耗大户”的称号。大量的服务器、存储设备、交换机以及千亿级别的芯片在运行过程中消耗大量风、水、电资源。数据显示,2017年全国数据中心总耗电量达到1200-1300千瓦时,超过三峡大坝和葛洲坝电厂发电量之和,预计2020年总耗电量将达到2900多亿千瓦时。

    2019年2月,工信部、国家能源局等多个政府部门,共同发布了《关于加强绿色数据中心建设的指导意见》,要求到2022年,数据中心平均能耗基本达到国际先进水平,新建大型、超大型数据中心的电能使用效率值达到1.4以下。尤其北上广深等一线城市资源紧俏,数据中心节能降耗更是成为硬性指标。

    痛点2:严重依赖人工,运维管理水平低

    谷歌、微软、Facebook等国际先进的数据中心,通常以统一的系统、流程以及信息化手段,由一个团队管理若干个数据中心,达成对整个数据中心日常运维统一高效的管理。但是我国很多数据中心的运维仍然是“以人为主”,整体运维水平强烈依赖于管理者的经验。

    随着云、SDN、NFV等技术在数据中心加速落地,转控分离、三层解耦以及统一编排等技术的引入使得数据中心业务逻辑愈加复杂,故障排障难度大幅提升,再加上更高的SLA(Service-Level Agreement)要求和有限的IT运维成本,数据中心对运维的要求越来越高,单靠人工很难满足,传统运维模式已难以为继。

    AI驱动的数据中心一体化解决方案

    如何助力数据中心行业摆脱规模成长之路上的烦恼?创新奇智提出了基于人工智能技术的数据中心一体化解决方案,实现从底层智能化算力建设到智能运维管理到顶层智能化服务的全流程覆盖。

    事实上,作为一家致力于人工智能商业化落地的AI公司,早在2018年,创新奇智已经开始进行数据中心AI应用的研发和实践。两年多以来,创新奇智和IDC运营商及诸多自建数据中心的企业建立了良好的合作关系以及行业生态,用AI为数据中心赋能。

    PUE能效管理

    针对数据中心的高能耗问题,创新奇智提供基于Orion自动化机器学习平台的PUE(Power Usage Efficiency)能效管理系统。该系统是以AI模型为核心的软件系统以及微服务架构,经由模型输出不同设备的策略来调节不同设备的工况,通过策略加控制的方式,实现整个数据中心节能的目的。

    该系统中的AI模型分为预测模型和决策模型两部分,预测模型通过神经网络、深度学习等AI算法对数据中心所有的关键参数进行建模,实现基于预测模型输出某一些关键工况的参数或者环境参数的预测结果。再将以上预测模型得出的结果输入决策模型,决策模型根据预测结果输出在不同的设备上需要输出的操作策略,从而调节不同设备的工作状态,达到整体最佳的节能效果。

某数据中心采用创新奇智能效管理方案后的能效对比

某数据中心采用创新奇智能效管理方案后的能效对比

    例如,某大型数据中心上线了创新奇智PUE能效管理解决方案以后,单个数据中心最直接的受益表现为:

  • 纯软件交付,不影响数据中心基础设施;
  • 整体降低能耗达到3%-5%;
  • 电量节约/天 2000度-3000度;
  • 电费节约/年  近百万

    IT设备健康预测管理

    预测性维护是创新奇智为数据中心提供的另一套系统,通过把硬件和传感器采集到的数据接入到软件系统,在Orion自动化机器学习平台的支持下,对数据中心关键设备进行7X24小时的集中监控、状态跟踪、故障定位及预测分析,实现精细化检测和dashboard可视化管理,提前感知设备工况,变被动运维为主动运维。

    基于AI预测分析的智能化运维,对数据中心企业来说,最显著的收益是降低因故障造成服务器宕机而导致的经济损失,可以想见,如果一家大型银行或证券公司的服务器宕机10分钟,将产生多大损失!!!另一个收益是减少对人力的依赖,提升整体运维能力,也为数据中心本身的存量改造和新量建设后的运维管理提供智能化的保障。

    创新奇智ABC一体机

    除了软件系统外,创新奇智还提供软硬一体化的产品 - 创新奇智ABC一体机,从底部算力层面满足企业的智能化转型需求。A是AI,B是Big Data,C是Cloud,将ABC三个层次的能力融合到一个硬件设备中统一输出,能够让数据中心内部的IT设备以及它所承载的服务对象变得更加集约化和一体化,便于对数据中心进行多云管理、容量规划、资源调配、运维跟踪等集中管理。

    值得一提的是,除了能够对IT设备及计算资源更智能化管理外,创新奇智ABC一体机内置自研Orion自动化机器学习平台,支持AI开发能力,提供更多业务层面的智能化服务,比如集成智能核保、智能合同比对、能效管理等多种AI算子。使用者只需调用相关业务模型,即可快速完成开发部署。

    小结

    数据中心作为最底层的信息化基础设施,在运行海量数据的同时也带来了惊人的能源消耗和运维问题。随着数字化的发展,数据中心的规模势必还会继续增长,其中的关键是如何利用现有技术和手段使其能够健康有序的发展,而具备自主学习、自主进化能力的AI技术为这一现状带来了新的解决路径。

    从创新奇智在数据中心的实践案例可以预见,人工智能在未来数据中心建设、运维和管理中将发挥更加积极的作用,推动数据中心朝着智能化、绿色化发展。

责任编辑:张瑾
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。
读者评论 (0)
请您登录/注册后再评论