总18期
Lecture Hall    讲堂
Lecture Hall    讲堂
H3C SeerBlade—开创网络智能化未来(下)
文/陈伯超

SeerBlade拥有业界靠前的AI运算性能,但这只是实现网络AI化的基础能力,还需要一套完整的体系和AI运作流程,才将硬件性能充分发挥。

构建网络自身的知识体系

新华三通过SeerBlade产品提出的是网络能够通过自身对业务流的感知和分析,生成一套自己的知识体系,从而能够站在网络的角度主动提出对业务的理解,形成和控制层软件的双向交流。

图1 SeerBlade网络知识体系

网络拥有自身的知识体系,具有非常深远的意义:一方面,网络可以依靠INT等高级可视化技术向控制层告知自身的详细工作状态,便于控制层制定精细化的网络资源分配方案;另一方面,控制层也可以根据网络的反馈来判断现行策略的有效性和合理性,评估是否需要刷新策略。当网络中每台设备都具备丰满的知识体系时,即使没有控制层,这些设备之间也可以通过相互的交流和计算,自动搭配出适用于业务的路径和资源分配方案,这种类似神经网络的实现,便是网络智能化的理想目标。

完善的AI运作流程

前面提到,SeerBlade中集成了网络、计算、存储的核心组件,这些组件网络知识体系的构建过程中,该如何相互协作呢?新华三设计了一套完善的流程,让每个组件都能发挥其较大的价值。

图2 SeerBlade运作流程

整个SeerBlade基于x86架构构建,CPU/GPU/SSD组件位于架构核心区域,通过PCIe总线相互连接,网络组件通过专用加速通道向x86平台传送网络流量。整体运作流程如下:

1. SeerBlade上的网络交换芯片从S12500交换机的背板引流,通过与x86平台相连的专用通道将数据发送至CPU。

2. 采用Intel可扩展架构的高性能CPU上运行Comware V9新一代网络操作系统,由于Comware V9基于原生Linux系统开发,可支持DPDK加速技术,能够大幅提升x86平台的网络吞吐能力,因此可以与交换芯片之间实现高速的数据传输。

3. 利用Comware V9的容器化架构,SeerBlade上可以同时运行多个场景化的AI运算程序(包括DC、园区、广域等),主要作用是对CPU接收的数据流进行采样和特征提取,将提取的特征发送至GPU进行基于AI的深度训练。

4. GPU上运行的是场景化AI算法脚本,面向不同场景的数据特点和业务需求,对流量特征进行深度训练。训练模板可以由上层分析器(SeerAnalyzer)根据用户意图生成,或者采用本地预置的标准模板。

5. 数据训练成果将上传至上层分析器,用于分析器生成新的网络策略;同时也将保存在本地SSD存储中,用于后续类似训练任务的历史数据支撑。

整套流程包含训练数据的采集、传输、训练、成果输出等完善的流程分配,成为SeerBlade能够执行高效AI运算的有力保障。

网络专用AI算法

任何AI应用,其核心都是高效的AI算法,SeerBlade采用的算法是由新华三与国内研究网络科技的权威院校—中国科学技术大学联合开发的网络专用AI算法,其计算方式和运行效率都是业内高水准。本文将重点介绍SeerBlade利用AI对未知流量进行的智能识别和智能安全检测两个方面的功能。

1. 流量智能识别

在传统网络的管理运维中,我们只能针对已知的业务流量制定策略,对未知流量只有其达到一定规模,显示出明确特征之后,才能够刷新对它的策略。而SeerBlade则可以在未知流量产生之时,就通过精细的特征分析,识别出他的业务类型。

AI识别的特征包括报文统计特征和内容特征两类,报文统计特征参见报文统计特征内容表。

1 报文统计特征内容表

报文内容特征主要指根据报文的Payload内容执行图形化分析。将报文的Payload内容转化为二维灰度图像,可以利用GPU对图像并行处理的先天优势,快速识别报文的内容和协议特征,对业务的类型有初步的识别。

在完成统计特征和内容特征的采集之后,再通过再生核希尔伯特空间中的核嵌入算法,将协议的统计特征嵌入到内容特征的二维图像之中,形成一个新的虚拟图像。

图3 内容特征图形化分析流程

这个虚拟图像中蕴含了业务流量的所有特征,GPU将使用CNN(卷积神经网络)对图片进行分类处理,得出该图像属于某一特定分类的概率的数字。这就是SeerBlade对于未知业务流能够进行智能识别的基本原理。

2. 智能安全检测

智能安全检测的实现与流量识别类似,首先提取流量的精细特征,然后采用RMSE(均方根误差)将流量特征与已知攻击流量的特征进行比对。

图4 智能安全检测分析流程

Root mean square error (RMSE)+Pearson correlation coefficient (r)+Nash-Sutcliffe coefficient (E) - 云卷云舒 - 飞龙在天的小窝儿^_^

RMSE是观测值与真值偏差的平方和观测次数n比值的平方根。

在实际测量中,真值(model)就是指已知的攻击特征,观测值为待检测的流量特征(obs),对比次数为n。方根误差对一组测量中的特大或特小误差反映非常敏感,所以,均方根误差能够很好地反映出测量的精密度,也是为什么SeerBlade采用这种算法作为安全检测的原因。

如果未知流量不匹配现有攻击特征,但其行为又存在异常的话,SeerBlade将把流量风险系数和详细数据交给控制层或网络管理者进行决策,一旦被判定为攻击流量,则会更新本地的攻击特征库,并将该未知流量的特征作为新的样本保存,实现检测模型的增量更新。

SeerBlade+SNA,引领网络智能化

SeerBlade的功能虽然强大,但其本身仍然只能作为网络中的一个节点存在,并且很多功能的实现需要北向控制层和南向网络设备层的配合。因此,新华三发布的SNA网络架构中,除SeerBlade外,还包括了集成AI能力的引擎和分析器,以及全套智能网络产品,实现了覆盖全网的智能化软硬件体系,引领了网络智能化进程。

先知网络架构(SeerNetwork Architecture,简称SNA)是新华三推出的下一代智慧网络架构,先知网络中心(SNA Center)是先知网络架构的核心组件,它具有对网络进行全局统一管理、控制和智能分析、业务编排的能力。SNA Center拥有全局视角,能够解决不同网络管理域之间的协同问题,从而简化运维、降低OPEX。同时,SNA Center可以实时感知网络状态,基于用户意图或网络状态分析实现业务自动化部署和风险预测,让网络更加智能,能够更加简洁、智慧、高效的为业务服务。

图5 先知网络架构

SeerBlade工作在SNA架构的底层设备层,通过自身的AI能力,向SNA控制层准确传达网络当前的业务流状态,预测未来的趋势,为SNA Analyzer持续提供充足可靠的分析基础数据支撑,让SNA Center为网络做出全生命周期的管理运维决策。同时,SeerBlade自身还具备对全网设备关键器件工作参数的采集和分析功能,可以为网络故障提供智能定位和提前预警的功能,也可以让SNA Center提供更全面的业务保障能力。

智能网络产品

SeerBlade的AI运算需要大量的分析基础数据,而SeerBlade本身工作在S12500交换机上,位于网络的核心层或高级汇聚层,如果业务流量没有经过S12500交换机,就需要依靠其他智能网络产品的边缘采集能力。

图6 新华三智能网络产品

新华三目前的智能网络方案中,提供了交换机和路由器两大系列的AI inside智能网络产品,这些网络产品具备几大特点:

1. 支持INT/Telemetry深度可视化技术。可以将自身转发流量的精细状态(包括时延、队列、抖动等)进行收集,上传给SeerBlade作为边缘流量的分析数据。

2. 支持gRPC协议。可以高效上传设备工作状态(如CPU/内存使用、温度、功耗等),利用gPRC精简的结构化数据报文,可以让SeerBlade在几秒内就收集全网设备的工作状态,便于进行全网硬件的智能运维。

3. 采用开放性的Comware V9操作系统。可以使用内置的采集功能,或客户定制化的第三方采集器进行灵活的采集功能。

4. 基于X86开放架构的控制平面。具备本地处理能力,可以对边缘数据进行预处理后上传,减轻SeerBlade的运算压力。

通过上面全套智能网络设备的配合,SeerBlade可以更全面掌控全网每个角落的业务分布情况,每台设备的状态变化,成为全网的智能管理核心。

结束语

SeerBlade是一款划时代的产品,不仅因为它具备先进的硬件架构设计、精密的制造技术、高效的AI算法,更因为它的出现让网络设备第一次具备了智能计算的能力,摆脱了简单重复转发、逐渐脱离业务的现状。

智能网络的未来需要每台设备都参与其中,实现类神经网络的分布式自主运算能力,SeerBlade的出现铺平了通过智能网络的道路,开创了网络智能化的未来。

分享到
关闭