文章

面向复杂计算场景的智能+数控系统算力平台技术

2022-04-26陈吉红 杨建中 周会成

177阅
数控系统大数据的接入呈现几何级数增长的同时,数字孪生模型所描述的对象也趋于复杂化,这对数字孪生模型在数控机床领域应用带来了沉重的计算负担,在单个数控系统上完成这些计算已经不现实,需要扩展其算力平台,以处理复杂计算场景下的计算。

    数控系统大数据的接入呈现几何级数增长的同时,数字孪生模型所描述的对象也趋于复杂化,这对数字孪生模型在数控机床领域应用带来了沉重的计算负担,在单个数控系统上完成这些计算已经不现实,需要扩展其算力平台,以处理复杂计算场景下的计算。如图1所示,为了提升智能数控系统算力,主要从云端、雾端和边缘端进行算力的扩展,三者相互促进、相互融合,共同提升计算效率。

边缘端、雾端和云端算力平台

图1 边缘端、雾端和云端算力平台

    1. 云端、雾端和边缘端三层立体式算力平台 

    1)云端算力平台

    云计算平台是通过互联网对大量的数据进行分布式计算的平台,具有容纳性强、运行速度快等特点。在对大量的复杂型数据进行处理时,云计算将按照一定的准则把不同的数据分布到不同的计算机中进行处理,这不仅拥有在短时间内处理大量的数据信息的能力,还能够提升数据处理速度,特别适合数据密集型的计算处理。如前所述,智能数控系统正面临着海量数据和复杂计算模型的巨大压力,而相比于边缘计算而言,云计算具有更加强大的存储和计算能力,更适合于模型的训练过程,是与边缘计算能力同等重要的计算平台。

    常见的云平台有Hadoop、Spark、Flink。

    (1)Hadoop平台。Hadoop提供了可靠的、可扩展的、分布式的计算能力,通过集群的方式解决PB规模以上大数据的存储和分布式计算的问题。使用者可以放心的将大规模数据集存储在HDFS文件系统中,并使用MapReduce并行编程模型来快速处理存储在HDFS中的数据。

    (2)Spark平台。Spark具有计算的中间输出结果可以直接缓存在内存当中,不再需要像MapReduce那样频繁读写本地磁盘的特点。因此Spark在分布式迭代运算方面的速度要远远优于经典的HadoopMapReduce框架。Spark的核心思想是将数据抽象为弹性分布式数据集,与普通数据集不同,弹性分布式数据集(Resilient Distributed Datasets, RDD)达到数据的并行处理的目的是采用分区存储数据的形式。因此,Spark处理数据的过程即是先由需要处理的数据创建RDD,然后对RDD进行相应的转换和行动操作并最终得到运算结果。

    (3)Flink平台。随着信息数据的越发丰富,人们很多时候对数据反映信息的获得的时间要求越来越短,在这样背景下产生一个实时计算平台Apache Flink,其支持分布式流计算和批量计算两种方式。ApacheFlink是一个分布式的计算系统。dataflowFlink是最根本的计算模型,最后的批处理和实时流计算都要转化为dataflowgraph来进行计算。数据流计算模型定义了一些基本的数据操作、基于窗口操作以及触发器操作等,这些操作都能描述批处理、微批处理和流模型甚至混合处理模型。

    云麦平台是一个用于机床行业的大数据并行处理和计算的云计算平台,集成了Spark、Flink等主要的学习平台,其主要构架为数据采集与存储模块、数据处理模块以及应用模块,(图2),其核心模块是大数据的分析和处理。大数据处理模块一方面进行大数据分布式计算,另一方面封装了机器学习、深度学习和信号处理的等相关算法,提供了大数据分析与挖掘的重要工具。

云麦平台架构

图2 云麦平台架构

    云端算力平台在数控机床中的典型应用主要是解决本地控制器的存储和计算能力不足的问题。叶瑛歆提出采用云计算的架构,解决智能加工工艺规划中涉及的神经网络的复杂计算问题。重庆大学利用云计算与合贝叶斯网络推理技术相结合,解决不确定多阶段多目标优化决策问题,提出机床装备资源优化选择方法。不仅智能加工工艺规划需要处理复杂的计算,其他涉及使用深度神经网络、复杂物理模型的方法均需要较强的计算能力,云端算力平台将在这些智能化的应用中发挥重要的作用。

    2)边缘端算力平台

    《边缘云计算技术及标准化白皮书(2018)》中提出边缘计算是一种将主要处理和数据储存放在网络的边缘节点的分布式计算形式。边缘计算产业联盟对边缘计算的定义是指在靠近物或数据源头的网络边缘侧,融合网络、计算、储存、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷连接、实时业务、数据优化、智能应用、安全与隐私保护等方面的关键需求。国际标准组织ETSI的定义为在移动网络边缘提供IT服务环境和计算能力,强调靠近移动用户,以减少网络操作和服务交付的时延,提高用户体验。虽然这些定义虽然表达上各有差异,但基本都在表达一个共识:在更靠近终端的网络边缘上提供服务。

    自2018年,在人工智能的推动下,“边缘计算”首次出现在Gartner发布的“十大战略技术趋势”中,并迅速成为年度最热科技词汇。而随着5G技术的逐渐成熟,为边缘计算的技术描绘了更加宏伟的蓝图。边缘计算技术正在被前所未有的关注着。当前边缘计算在制造业的应用仍处于提出概念阶段。图3所示是西门子提出的工业边缘平台,西门子将其视为数字自动化的下一代。

西门子边缘平台架构图

图3 西门子边缘平台架构图

    目前的智能数控系统正面临着海量数据和复杂计算模型的巨大压力,而边缘计算则一方面为数控系统扩展了终端的计算能力,保证低延时的服务响应,另一方面通过边缘端针对性的数据计算与降维,也为雾端、云端降低了数据流量和计算负担。因此,边缘计算模块通过更快、更安全、更高效的计算,有效提升了数控系统的算力。

    边缘计算技术目前方兴未艾,未来有可能给机床智能化领域带来深刻变革。边缘计算模型将逐步打破数控系统单一以IDC(internet data center, 网络数据中心)为中心的云计算模型,并最终形成云计算与边缘计算互补的局面。随着海量智能设备在存储、计算、安全、传输等方面能力的升级,“云-网-端”基础设施资源配置将趋于下沉,“端”的作用会变强。边缘计算将会引领计算模型“去中心化”的趋势,协同计算将是未来技术的发展方向。海量边缘计算终端将对人工智能、机器学习等技术产生影响,将促进微内核技术的发展,方便算法、模型等将会嵌入到海量设备的固件当中,使前端智能更具发展前景。

    3)雾端算力平台

    雾计算是一种介于边缘计算与云计算之间的平台,能够分配从云到边缘端这一连续区域内任何地方的计算、存储、控制和网络的资源和服务,是对边缘端计算服务的重要补充。其可以在边缘计算的基础上,使得智能数控系统的算力场景及算力层次更加丰富与灵活,更好地处理智能数控系统所面临的复杂计算问题。

    相对于边缘计算,雾计算更靠近云端,具有一定的层次性,可以在云端和边缘端之间进行多层的部署,而边缘计算则比较单一,主要就是指靠近终端的计算设备,在智能数控系统中,总线级智能模块即属于边缘端计算模块,网关级智能模块即属于雾端计算模块。相比传统云计算的服务方式,雾计算具有扩展性强、低延时、低带宽、低能好和系统安全的特点。

    在智能制造领域,云端计算平台主要用于进行复杂的运算和大数据的存储和分析,相比于边缘端和雾端而言,具有最强的存储和计算能力,但是由于体量过大,导致数据的存储和计算是以巨大的硬件资源、网络资源为前提的,在实时、半实时任务的应用场景下显得不合时宜。相反,针对实时的应用场景,采用边缘端计算平台,则具有先天的优势。而在云端计算和边缘端计算进行折中,对计算、存储和带宽的要求适中的情况下,雾端计算则将发挥巨大的作用,且由于雾端计算平台可以具有多层次的丰富结构,在进行服务的部署时具有更好的弹性。因此,智能制造环境下,针对资源需求适中、服务复杂、实时/半实时的应用场景,雾计算将会是较优的选择。

    2. 协处理器芯片 

    作为通用处理器的CPU芯片在计算性能和能效上越来越难以满足日益庞大、多样化的数据处理需求,例如主流的深度学习算法CNN训练时的数据访问量很大(数百万神经元和上亿的参数),分布在多核上处理时,对多核之间通讯和内存访问带宽都提出了很高的要求,已经超出了通用CPU的设计要求。因此,借助由GPU、FPGA、NPU和ASIC等协处理器与CPU一起组成的异构计算平台来提升计算性能,已成为当下学术界和工业界的研究热点。

    图4展示了GPU芯片与CPU芯片的差异,CPU的控制单元(Control)和缓冲(Cache)相对于GPU而言占据了较大的芯片空间,表明CPU针对通用任务、复杂逻辑具有更好的性能,但是也可以看到GPU的计算逻辑单元(Algorithm Logic Unit, ALU)相对CPU要多很多,表明GPU具有较好的并行处理能力。

CPU芯片与GPU芯片对比

图4 CPU芯片与GPU芯片对比

    上述以GPU为例,介绍了其与CPU的差异,与GPU类似的协处理芯片还有FPGA、ASIC、NPU等。表1对它们的优缺点进行了比较。

表1 协处理芯片优缺点比较

协处理芯片优缺点比较

    通过CPU和上述协处理器建立异构计算平台,一方面,可以加速计算速度,尤其是适用于可以进行并行计算的场合,另一方面,可以让深度学习在轻量化的平台上(如数控装置、手机等)进行部署。如图5所示,武汉华中数控股份有限公司在2019年的北京国际机床展上发布了基于NPU芯片的边缘端智能模块,服务于华中9型数控系统,为其提供总线级的边缘算力,解放数控装置端的计算负载。

基于NPU芯片的边缘端模块

图5 基于NPU芯片的边缘端模块

      注:本文改编自:《新一代智能化数控系统》(作者:陈吉红,杨建中,周会成)

责任编辑:杨培
读者评论 (0)
请您登录/注册后再评论