总17期
Focus    焦点
Focus    焦点
核心路由器的“集群化”, 是“去”还是“不去”?
文/李超

众所周知,路由器是互联网的重要结点,通过路由来决定数据的转发,也是不同网络之间互联互通的主要桥梁。可以说,路由器是构成我们今天互联网最重要的设备之一。而核心路由器更是构建大型网络的重要枢纽,位于网络的最核心部位,因此也被称为“骨干路由器”,其主要功能是负责对数据的分组选路与转发,一般都需要具有较大的吞吐能力。

核心路由器通常会应用在数据中心网络场景当中,吞吐量是其主要性能指标,而吞吐量主要由端口容量和端口密度决定,这也是路由器包转发能力的最直接体现。同时路由表能力、背板能力、丢包率、时延及可靠性也是衡量一款核心路由器优劣与否的重要性能指标。

由于核心路由器的性能指标会直接影响到整网中数据传输的效率,其实际对数据的处理速率也往往成为网络通信中的主要瓶颈之一,对网络中的架构、性能、可靠性、成本等因素都将起到决定性的作用。因此,核心路由器的技术发展与演进方向也越来越受到业界的关注。

核心路由器的应用现状

在今天的很多大型网络当中,比如在大型互联网企业、云服务提供商及运营商网络中的核心路由器基本都会采用集群系统,又称多机箱(Multi-chassis)。这种结构在可扩展性和灵活性方面确实体现出了一定优势。但随着业务的不断增长,其集群规模也在不断扩张,导致其占用空间过大、功耗升高、对机房设施要求高,以及故障影响面扩大等问题越来越突出。

为此,业界提出了相关的解决方案,对大容量网络中的集群化路由器进行“瘦身“,抛出“去集群化”这一实施理念。而这一理念的出现也要得益于网络芯片设计及制造水平的不断发展,以及光通信效率的不断提升,使得路由器容量和集成度都相较以往有了显著提升,这才让去“去集群化”成为了可能。

目前核心路由器市场中单台路由器的端口容量已经能够达到几十Tbps,而不久每端口容量将突破到一百甚至几百Tbps的水准。在这种情况下,目前每端口的容量就已经相当于以往单个槽位、甚至单台路由器的总吞吐量。这在芯片技术没有得到突破之前,是根本无法想象的。从某种意义上说,以往用户采用集群化解决方案,也是受限于设备性能无法满足实际业务需求的一种无奈之举。

单机系统与集群系统孰优孰劣?

在过去十几年里, 大容量网络尤其是国内运营商网络中的核心路由器都采用了集群系统, 集群路由器在扩展能力, 扩容便利性, 网络管理等方面具备一些优势, 但其空间占用大、功耗高、技术封闭、故障维护复杂等问题也十分明显。那么,集群系统在与单机系统的PK中,到底谁能更胜一筹呢?下面我们就从几方面进行逐一分析

1.在产品性能方面

首先在性能方面,以H3C CR19000 T级核心路由器为例,它是新华三自主研发的面向运营级应用的全新一代核心路由器,应用于运营商骨干节点、运营商城域网核心节点、数据中心骨干互联节点等核心位置。目前CR19000在每槽位1800G的能力下,单机端口容量可以达到36Tbps,最大可支持360个100GB接口并提供持续的升级能力。

未来随着端口密度和新一代线卡的进一步升级,单机容量将得到成倍增长。目前已知单机容量将可以达到200Tbps以上,而主流的集群路由器的最大容量基本保持在128Tbps的级别。因此,面对当前需要2-4台矩阵机箱所组成的集群系统,今后只需要一套单机系统就能完全胜任,这就使得整个数据中心在包括空间占用、功耗、成本和可维护性等多方面得到了极大优化。

而大容量单机路由器的主要缺陷则体现在,对低速和传统端口类型的支持和低速端口的容量总和方面。集群系统在这方面的优势几乎是基于其可扩充的槽位(线卡框)数量的累加来实现,而并非通过提升单槽密度或性能去实现,这就意味着需要付出空间、功耗、成本不断上升的高额代价。而今天端口类型已经开始向高速以太网进行收敛, 所以,无论是面对未来路由器市场从100GE到400GE的主流演进趋势,还是从数据中心总拥有成本(TCO)来考虑,以高性能单机系统去替代旧有的低效集群系统将成为核心路由器市场中的一个主要方向。

2. 在网络架构方面

目前,我们看到在应用“去集群化”的核心节点的构建上主要有两种形式,第一种是直接采用单台或少量大容量单机路由器去替代原有庞大的集群路由器,这种网络结构最为简单明了,也是绝大多数运营商正在采用或准备采用的方式;第二种是单机系统与集群系统的一种混合组网方式,通过标准协议将多厂商的单机路由器与原有集群系统构建成一种松耦合的网络架构。由于这种结构相对比较复杂,因此目前只有少数互联网、云服务提供商会采用该方式。

需要注意的是,单机系统完全替代集群系统的方式在实际操作当中一般会采用过渡的方式去完成,也就是说,暂时保留原有集群路由器系统,再通过大容量单机路由器逐渐分担流量的方式进行业务的柔性迁移。这种方式能够最大限度地保障数据中心核心业务的可靠性需求。

而相比传统的集群方式, 单机系统不但在性能和网络结构上都要更具优势,同时在第二种结构中还有效抑制了单一厂商产品的技术锁定,提高了产品的可扩展性与技术的开放性。无论是对大多数云服务提供商,还是运营商而言,采用这种松耦合的大容量单机系统架构对其业务拓展与产品快速上线,亦或后期升级与维护都不失为一种更为合理的选择。

结束语

在核心路由器领域,无论是“集群化”,还是“去集群化”,其实都是市场需求的一种体现,单纯去考虑孰优孰劣其实并没有意义,最终还是应该由市场来决定。当单机容量达到极限,不能满足业务需求时,用户自然会采用“集群化”来进行部署,以扩展数据中心网络的承载能力。而当单机容量不断提升,端口转发性能不断得到突破后,用户自然也会更倾向采用单机的方式去承载业务,毕竟无论是在结构简单性,还是维护难度以及成本方面单机系统都具有明显优势。因此,未来的核心路由器发展也将会在“集群化”与“去集群化”之间不断切换,并实现交替演进与发展。

分享到
关闭