总第7期
2016年6月刊
Solution    方案
Solution    方案
SDN与NFV技术在云数据中心的规模应用探讨
文/中国电信江苏分公司 赵辉
分享

摘要:以云数据中心为切入点,首先对SDN领域中的叠加网络、SDN控制器、VxLAN三种重要技术特点进行了研究,接下来对NFV领域中的通用服务器性能、服务链两类关键问题展开具体分析。最后,阐述了前期开展的SDN/NFV技术试验工作进展及相关结论,并对VDC应用产品进行了展望。

伴随着云计算技术的兴起,数据趋于大集中,传统电信系统网络架构成为阻碍云数据中心发展的巨大桎梏。为满足数据中心在云计算环境下的虚拟网络资源调度和共享需求,未来的数据中心资源池运营需要解决以下关键问题:

  • 用户需求的快速响应。云资源池内部网络设备多,网络特征复杂,采用点对点手工配置,将会延迟用户需求的响应速度。
  • 清晰的网络拓扑视图。云资源池本身的网络拓扑难以清晰呈现,特别是租户网络与云资源网络无法呈现对应关系,导致运维复杂。
  • 灵活的资源共享与调度。资源池很难实现相互隔离的多租户环境,而且在跨数据中心组网时很难实现网络资源的灵活共享与调度。
  • 动态感知租户的网络资源需求。不同租户的网络流量、安全策略、性能要求等不同,资源池网络无法动态感知租户的需求,造成资源浪费或过载。

SDN(Software Defined Network,软件定义网络)、NFV(Network Function Virtualization,网络功能虚拟化)等技术可增强网络差异化服务提供能力以及云、管、端协同组网能力。因此,在云数据中心中规模引入SDN/NFV技术可以有效解决上述问题,同时基于SDN/NFV技术的云数据中心组网也是电信网络未来演进的重要方向。

一、 SDN重要技术

在诸如骨干网、数据中心、企业网、城域网边缘、接入网等众多网络环境中,数据中心是最早遭遇传统网络技术束缚的地方,也是SDN技术最早进行商业化应用的场景。为了满足日益增长的互联网服务需求,数据中心逐步向大型化、自动化、虚拟化、多租户等方向发展,在网络性能和灵活性等诸多方面遭遇挑战。在满足虚拟化和多租户的按需灵活组网需求时,特别是IaaS服务的基础设施构建时,SDN技术成为首选方案。

SDN不应被定义为一种网络技术,更为准确地说法是,SDN是由多种重要技术、解决方案形成地一种下一代网络体系架构,本节将重点讨论云数据中心组网中采用的三种SDN重要技术:叠加网络(Overlay)、SDN控制器、VxLAN。

1. 叠加网络(Overlay)

传统IP网络由物理网元(如路由器、交换机)及其链路组成,是一种典型的Underlay网络。叠加网络是指以现行的IP网络为基础,在其上建立叠加的逻辑网络(Overlay Logical Network),屏蔽掉底层物理网络差异,实现网络资源的虚拟化,使得多个逻辑上彼此隔离的网络分区,以及多种异构的虚拟网络可以在同一共享网络基础设施上共存。根据上述内容可知逻辑网络叠加层的概念并非由SDN发明,VLAN(虚拟局域网)就是典型的代表,但在云数据中心网络领域,叠加网络已成为当今SDN发展的重要动力之一。它的主要思路可被归纳为解耦、独立、控制三个方面[1]。

解耦:是指将网络的控制从网络物理硬件中脱离出来,交给虚拟化的网络层处理。这个虚拟化的网络层加载在物理网络之上,屏蔽掉底层的物理差异,在虚拟的空间重建整个网络。。

独立:是指叠加网络方案承载于IP网络之上,因此只要IP可达,那么相应的虚拟化网络就可以被部署,而无需对原有物理网络架构(例如原有的网络硬件、原有的服务器虚拟化解决方案、原有的网络管理系统、原有的IP地址等等)做出任何改变。

控制:是指叠加后的逻辑网络将以软件可编程的方式被统一控制。通过应用该方案,网络资源可以和计算资源、存储资源一起被统一调度和按需交付。以虚拟交换机为代表的虚拟化网络设备可以被整合在服务器虚拟化管理程序(Hypervisor)中统一部署,也可以以软件方式部署在网关中实现与外部物理网络的整合。这两类部署方式正代表了业界目前在叠加网络方案中两大主要流派(前者是以VMware为代表的“软”派,后者则是以阿朗为代表的“硬”派)。从运营商视角来看两大流派,以云数据中心为代表的IT类部门更倾向于“软”派部署方案,以传统大网为代表的IC类部门则更接收“硬”派部署方案,而华三作为“软”、“硬”两派方案兼顾的设备商,为运营商提供了更加全面且灵活的解决方案。

2. SDN控制器

控制和数据平面的分离应是SDN最基本的原则之一,其思想是将网络设备的控制平面迁移到集中化的控制器中,利用标准化的南向接口替换了网络设备中的控制平面,并在控制器中增加了可编程的北向接口供上层调用。理想化的SDN控制器应是一个提供如下功能的软件系统集合[2]:

  • 网络状态管理。对于网络状态的管理与分布可以使用一个数据库实现,它负责保存来自于被控制的网元设备和相关软件的信息。
  • 高级数据模型。这个数据模型描述被管理的资源、策略和控制器提供的其它服务之间的关系。YANG建模语言可以用来构建这个数据模型。
  • 使用RESTful(REpresentational State Transfer,表征状态转移) API来将控制服务提供给应用程序使用,为控制器与应用程序间的交互提供便利。
  • 安全的控制会话,即控制器和网元设备中相应的代理之间的TCP会话。
  • 一个基于标准的、用于在网元设备上配置应用程序驱动的状态协议。
  • 一个设备、拓扑和服务发现机制,一个路径计算系统。

目前,在云数据中心SDN解决方案中,对于控制器的选择分为两大阵营,一个是由商业公司主导的封闭式SDN控制器,这其中有NSX Controller(VMware)、VCFC(H3C)、Contrail(瞻博)等多种产品。另一个则是由开源社区推进的开放式SDN控制器,包括NOX/POX(Nicira)、Ryu(NTT)、Floodlight(Big Switch Networks)等开源项目。从实际应用情况来看,无论是商业SDN控制器还是开源SDN控制器,都存在各自的优缺点。VxLAN

VxLAN(Virtual eXtensible Local Area Network,虚拟可扩展局域网)是一种网络虚拟化技术,目标在于改善现有VLAN技术在部署大规模云数据中心时遇到的扩展性问题。和VLAN类似,VxLAN也是通过逻辑网络实现对多租户的彼此隔离,同时由于VxLAN采用24位标示符,它所标示的虚拟化空间数量可以到达1600万个,远超VLAN所标示4096个数量限制,VxLAN报文封装格式如图1所示:

图1 VxLAN报文封装格式

通常VxLAN的运作依赖于VTEP(VxLAN Tunneling End Point,VxLAN隧道终端)组件,该组件可以为终端系统提供二层以太网服务所需的所有功能。。

二、 NFV关键问题

NFV和SDN都是近些年为了满足新的应用需求提出的下一代网络技术,总体而言,它们各有侧重,分别从不同的角度去解决不同的网络问题,同时它们又有着非常密切的关系。虽然两者都能够改进网络的整体可管理性,但是它们的目标和方式有所差异。SDN通过将控制平面和数据平面分离来实现集中的网络控制,而源自运营商需求的NFV技术则是通过软硬件分离,实现网络功能虚拟化,其关注的重点是优化网络服务本身[3]。NFV与SDN关系如图2所示。

图2 NFV与SDN关系

业界普遍认为若要NFV技术真正实现商用,有两个关键问题是必须要关注的,它们分别是与硬件相关的通用服务器性能问题、与软件相关的服务链问题,下文将重点讨论这两个关键问题。

1. 通用服务器性能

通过在云数据中心中引入NFV技术,可以将路由器、防火墙、负载均衡器等任何类型的网络功能运行在共享的通用服务器上,并将它们按需划分为虚拟机软件实例。这样做的好处是可以有效地降低投资成本(CAPEX)和维护成本(OPEX)[4],并缩短业务部署与上线时间。但同时我们必须面对一个较为棘手的问题,即通用服务器能否完全代替旧有专用硬件网络设备?

我们知道ASIC、NP、CPU三类芯片构建了IT架构的基础。ASIC和NP基于Pipeline模式的传统做法,对网络报文的转发和处理可以达到很高的性能,但业务固化,应用灵活加载的能力欠缺。新IT融合架构的本质在于“面向应用”,因此以x86架构为代表的CPU通用架构异军突起,得到了广泛的关注。CPU在计算能力上优势明显,适合处理L4-L7层业务,但短板是没有专用的数据面操作系统,导致I/O转发能力弱。而英特尔公司在2013年正式推出的DPDK(Data Plane Development Kit,数据平面开发套件)技术可以有效弥补这一短板。

2. 服务链(Servcie Chain)

随着云业务的交付,尤其是面向多租户的环境,网络业务越来越复杂化。数据报文在网络中传递时,需要经过各种各样的业务节点,才能保证网络能够按照设计要求,提供给用户安全、快速、稳定的网络服务。这些业务节点(Service Node),典型的有防火墙、负载均衡、入侵检测等。随着SDN以及NFV的不断推进,服务链变得更加重要。传统的网络用专业硬件承载单独功能,再将其部署在物理网络中,作为一种固化的网络拓扑。随着业务编排和服务链的引入,网络可以被抽象。运营商可以面向业务流定义所需要的网络功能以及业务流处理方式。通过SDN控制器,把多个NFV软件化的业务功能模块链接在一起运作,实现业务的灵活调度,服务链是多业务整合的关键,也为个性化应用的平台开发打下基础。

三、 基于SDN与NFV技术的云数据中心应用场景

随着技术的逐步走向成熟,越来越多的运营商、互联网公司和企业在SDN/NFV相关领域开展实验网络部署、测试和验证活动,在SDN/NFV的需求场景识别、产品验证和商业准备等关键环节均取得了明显进展。AT&T在2013年启动的Domain2.0计划,旨在通过SDN/NFV技术将网络基础设施从以硬件为中心向以软件为中心转变,实现基于云架构的开放网络。与传统电信运营商的SDN网络商业诉求不同,互联网公司作为技术的先行者,在SDN商业化进展相对领先。如Google宣布通过部署SDN能够将数据中心之间的链路利用率提升至90%以上,并于2014年4月宣布推出基于SDN和NFV技术的Andromeda虚拟化平台[5]。

1. 试验进展与结论

中国电信江苏分公司从2014年开始积极探索SDN/NFV技术在云数据中心等领域的应用,重点关注机房资源碎片化、非核心区域机房闲置率较高、网络资源无法按需分配、网络架构难以灵活调整、网络配置过于复杂等多方面问题,通过在省内不同城市的云资源池中试点部署部分厂商的解决方案,实现了跨数据中心大二层网络架构,总结并提出了基于SDN/NFV技术的云数据中心组网方案,试验环境拓扑如图3、4所示:

图3 基于SDN/NFV技术的云数据中心网络架构(厂商A)

图4 基于SDN/NFV技术的云数据中心网络架构(厂商B)

在SDN领域,试点工作主要围绕基于SDN+VxLAN技术的跨数据中心大二层组网展开,分别对跨机房东西向、南北向互通以及虚拟机在线迁移等多个功能场景进行了验证,虽然各厂商提供的方案略有差异,但从试验结果来看,均能达到预期效果,各类基础功能场景及价值结论如表1所示:

SDN+VxLAN技术基础功能场景

技术价值

跨机房相同网段东西向互通场景

可以把运营商分散在多个数据中心的零散服务器集中管理,便于提高资源利用率

跨机房不同网段东西向互通场景

可以将两个部署在不同数据中心的业务系统通过私网IP地址实现互通,有效节约公网IP地址资源

同机房南北向互通场景、跨机房南北向互通场景

可以实现多个数据中心托管服务器出口集中控制(网关)和按需部署增值业务(业务链、负载均衡等),避免各个数据中心重复投资

虚拟机跨机房在线迁移场景

可以实现业务系统双活、主备等容灾备份需求,提升系统可靠性

表1 SDN+VxLAN技术基础功能场景及价值总结

同时,我们充分利用同城两个云资源池(位于不同机房)间已具备的光纤直连环境,与多厂商提供的SDN+VxLAN解决方案开展性能对比测试工作,分别对网站、FTP、视频、数据库等四类应用系统业务场景进行了模拟,测试结果如表2所示:

解决方案

网站类

FTP类

视频类

数据库类

访问时长(秒)

上传/下载速率(MB/s)

丢包率(%)

TPM/TPS(个)

光纤直连

(20公里以内)

0.71

581.1/244.3

<3%

6829/115

厂商A

0.56

90.4/82.7

<3%

5866/99

厂商B

0.51

90.9/108.2

<3%

7113/120

厂商C

0.58

51.6/13.5

<3%

6754/114

表2 光纤直连与各厂商大二层互联方案性能测试结果

在NFV领域,我们提出了基于NFV架构的网络自助式云化流程,并依托相关IT支撑系统对部分厂商NFV功能进行二次开发,目前已完成虚拟防火墙、虚拟负载均衡器、虚拟DHCP等三类虚拟网元功能开发,相关配置界面如图5、6所示。

图5 虚拟防火墙自助式配置界面

图6 虚拟负载均衡器自助式配置界面

2. VDC应用产品展望

在开展上述技术验证工作的同时,我们计划以云计算和传统数据中心资源整合为切入点,结合IDC产品的特性,面向政企用户推出一类基于SDN/NFV技术的创新产品——VDC(Virtual Data Center,虚拟数据中心)。VDC是用物理设备构建的专属虚拟化资源池,是将云计算概念运用于IDC的一种新型的数据中心形态。用户可以完全掌控自己的虚拟网络环境,包括选择自有的 IP 地址范围、创建子网,以及配置路由表、网关,甚至包括复杂的4-7层应用交付服务。在此基础上,还可以根据用户的需求,提供各种应用环境配置、安全管理、代维等增值业务。

VDC逻辑模型如下图7所示:

图7 VDC逻辑模型

四、结束语

传统网络设备支撑了过去几十年网络的发展和应用,随着云计算与移动互联网的兴起,用户的业务需求呈现出多样化、灵活化、不确定性等特点,目前封闭的网络体系架构已经不能满足实际应用的需求,面临着越来越多的问题和挑战。SDN/NFV作为一种革命性的新技术必将对未来网络的演进带来举足轻重的影响。

分享到
关闭