总19期
Focus    焦点
Focus    焦点
AI基础设施:工业互联网智能化的基石
文/ I2R 徐心平 王巽冬
分享

AI技术的应用如今在各个行业领域已经如火如荼,但是在工业互联网领域一直缺少杀手级的可规模应用的场景。但工业互联网要迈向智能化,实现智能制造,AI技术是核心技术之一。如何推动AI技术使能工业互联网智能化,是本文重点阐述的问题。

工业互联网融合AI技术是大势所趋

AI技术从互联网渗透到工业领域,和工业互联网相互融合,是工业制造4.0实现智能制造的必要条件,是大势所趋。但是目前阶段始终缺少可规模化的杀手级工业AI应用,作为智能制造先决条件的AI技术将如何参与工业互联网,充分发挥价值呢?

工业互联网是全球工业系统与科学计算、分析、感应技术以及互联网连接融合的结果。基于工业互联网提供的基础设施,智能制造通过网络技术将机器设备关联起来,采集大量工业数据并标注处理,利用AI技术和人类专家进行训练,生成推理模型,再利用推理模型在制造过程中进行分析、预测、判断、规划和决策等智能活动。

在这个过程中,人、机器设备与智能系统通力合作,延伸和部分取代人类专家在制造过程中的脑力劳动,取代工人在生产线上的部分体力工作,取代大型机器设备维护中的部分人力工作。一方面增加了工业制造的自动化程度,另一方面也大大提高了工业生产的智能化和高度集成化。

当前,AI技术在工业制造领域已经收获了一些成果和实践,主要集中在智能质检和生产设备的预测性维护。其中,智能质检是AI在工业制造领域成熟度最高的应用,利用图像识别与深度学习技术可以解决传统质检的人工成本高且无法长时间连续作业、只能抽检且缺陷检出率不高等痛点,大幅提升产品质检效率和缺陷检出准确率,在降低人工成本的同时确保出厂产品的合格率。

同时,AI技术的落地基础取决于工业的数字化程度,根据中国信通院的测算,2018年中国工业数字化经济的比重仅为18.3%,尚不足20%。随着工业互联网的普及,工业数字化必将快速发展。未来五到十年,AI技术落地工业制造将进入高速发展期。

AI技术使能工业互联网的关键问题

要实现AI技术在工业互联网领域的应用使能,我们经过研究,认为需要面对和解决以下三个维度的关键问题:

1.适合AI的基础设施平台

AI基础设施平台包括训练平台和推理平台,这两个AI场景对于硬件和软件平台的技术要求非常专业,涉及到高性能的ICT技术(包括芯片技术)、众多的计算框架,以及基于工程数学的大量算法模型的迭代开发和基于计算框架的算力资源的管理调度。整个底层技术生态复杂而多样,需要具备综合ICT技术能力和实力的公司才能提供合适的AI基础设施平台方案。

2.应用AI的工业数据处理

工业领域的数据有行业属性,采集(ETL)和处理过程(标注)具有工业特色。比如在工业智能视觉自动化检测场景中,需要检测的产品零部件大大小小不一,图片采集的场景和标注具有行业特性,质检流程和标准也不同,这都需要一一研究和实现。

3.工业大数据的AI算法模型开发和智能边缘部署

我们知道AI算法开发最重要的是要解决“数据+特征+模型”的问题。

工业大数据非常复杂多样,处理算法模型开发过程中的特征工程在工业界是巨大的难关,需要对机器学习以及深度学习的技术如何结合业务有较深理解;不同的算法,要使用不同的特征工程达到同一个目标。

而开发并训练好的模型也需要和具体要解决的业务在工业边缘侧进行推理落地,开发AI应用系统,对接原有的工业业务系统,以做到使能,取得预期的效益。这也需要进一步针对模型在工业边缘侧进行推理部署,开发工业AI应用系统,需要熟悉相关工业互联网领域的应用和业务流程,解决边缘侧AI模型的统一部署问题。

实际上,AI使能工业互联网要解决的上述三个维度的问题,也正是AI领域三大要素: 算力、数据、算法在工业互联网领域的具体体现。

AI基础设施技术是工业互联网实现智能化的基石

图1 工业互联网产业生态布局

从图1可以看出,工业互联网产业是一个典型的橄榄型布局,由上到下分别提供应用、平台和基础设施。其中平台层的数据处理、清洗和应用准备等环节中,集中了大量的厂商。但是,基础设施尤其是AI基础设施相对薄弱,使得AI技术在工业互联网中规模化应用十分困难。

关于AI基础设施技术,包括AI底层硬件(计算力、网络和存储)、计算框架、平台领域,仍然有很多需要优化和发展的技术,以待研究和实现,来适应工业领域中各种场景AI模型的训练要求。

图2 面向工业互联网的AI解决方案

从现有数据学习(即训练过程),和将学习好的能力快速应用到新数据(即推理过程),是AI技术落地工业互联网的两个重要过程。

综合考量训练和推理过程所需的硬件资源、响应速度、部署环境等因素,工业互联网的AI基础设施,需要分别部署在数据中心以及边缘,以满足不同的业务需求。另外,基于推理的结果,可以开发和实现各种工业智能应用。

那么,AI基础设施建设的优劣将直接决定了工业互联网实现智能化的程度。

图3 AI基础设施架构图

如图3所示,AI基础设施主要包括AI基础设施平台以及AI基础设施资源池,平台侧整合底层资源,统一协调调度;AI基础设施资源池提供计算、存储、网络等必要的硬件资源。

那么,如何建设助力工业互联网智能化的AI基础设施呢?AI基础设施训练平台、AI基础设施边缘平台以及AI基础资源共享,或成为其重要核心点。

1.AI基础设施训练平台

算力对AI技术落地工业互联网是至关重要的。而算力离不开AI基础设施平台。

AI基础设施平台系统是一个典型的科学计算应用系统,那么科学计算是什么?它有两个重要特征。其一,科学计算应用需要复杂的工程数学进行计算处理和大量的算力支撑; 其二,底层ICT基础设施需要集群并行处理,单机高算力和多机并行集群计算,以满足算法模型迭代计算的时效性需求。

1) 用于科学计算应用的高性能的AI基础设施资源池

2) 资源灵活申请、完整编码和运行环境,资源自动释放

3) 大数据的存储和处理,形成数据资产

以上正是一个AI基础设施平台需要关注的。

2.AI基础设施边缘平台

在边缘侧的AI推理系统,更多的是解决算法模型的推理部署和应用问题,除了在模型推理部署中要实现支持多种加速芯片的边缘服务器,优化模型和计算性能,支持多种计算框架的模型格式,以及支持多种内置和对接第三方模型算法的模型库外,还要有针对工业场景下的工业数据接入和处理功能。此外,要实现和具体的原有工业业务系统对接以及AI应用系统对接,也需要针对分布在边缘侧的AI边缘计算设备进行资源管理和调度。

3.AI基础设施资源共享

企业在引入AI技术解决具体业务过程中,很多开发者懂业务懂算法,但是对高性能的AI基础设施领域知识以及部署环境了解甚少,往往需要专业IT人员支撑和运维。另外一般AI基础设施的规模较大,孤岛式建设和利用模式造成很大的资源浪费。很多高性能的AI基础设施资源在单一业务开发和应用的空闲时间无法及时给另外的项目使用。

那么解决AI基础设施资源共享的关键问题在哪里?从上面的分析可以看出,解决高算力AI计算资源共享的需要兼顾以下两个方面:

一是技术实现,平台首先要支持有复杂数学计算和高性能并行计算的软件环境和应用,配合硬件环境一起,才能提供专业完整的AI训练和推理系统。因此落地实现中要解决涉及大量的数学计算,和并行计算的开发和应用环境依赖技术问题;

另一个方面是使用,算法工程师通过AI平台申请AI资源后,要上传大量训练数据,利用算法开发模型之后,要利用计算资源进行大量迭代计算,需要反复在客户端快速呈现每一次迭代计算的计算结果。

如此一来客户端和AI系统之间的网络带宽是很大的挑战,这也是公有云模式难以支撑的(公有云模式,用户客户端是通过Internet连接AI系统,数据流转带来的带宽问题和AI算法模型的显性代码带来的核心技术保密问题是致命的挑战)。私有云模式下,算法工程师可以采用专线或者在AI平台系统局域网内使用客户端连接AI系统进行训练,从而确保使用带宽的充足、数据流转的方便和算法模型的安全。

结束语

新华三把工业互联网融合AI技术作为重点,研究工业数据和AI技术,打造工业互联网融合AI的方案,提供工业AI智能体方案,为工业客户建设AI计算平台,为工业客户的AI应用使能。作为数字化解决方案领导者,新华三将持续在AI领域的投入,为工业互联网使能,加速实现智能制造,与工业互联网客户携手引领AI时代。

注: I²R(H3C Industrial Internet Research)新华三工业互联网产业研究院,是紫光集团核心企业新华三集团在工业领域成立的数字化转型专业服务机构,聚焦国际国内工业领域发展趋势,重点打造工业互联网产业技术体系,开发并满足客户工业场景需求的端到端产品和解决方案,并提供具有战略意义的数字化转型与工业互联网建设咨询服务。

分享到
关闭