2.3 网络

2.3.1 云网络平台——洛神

阿里云操作系统叫作“飞天”,云网络平台称为“洛神”。作为飞天系统的核心组件,洛神平台支撑超大规模租户、超大规模虚拟机的高性能云网络。在飞天的基础架构里面,最上层是各种云产品,包括大家熟悉的RDS(Relational Database Service)、ECS(Elastic Compute Service)、VPC(Virtual Private Cloud)、SLB(Server Load Balancer)等,支撑这些云产品的是飞天的三个基础组件,即存储系统“盘古”、资源管理“伏羲”和云网络平台“洛神”。也就是说,洛神除支撑阿里云的网络云产品之外,还支撑其他云产品的网络基础设施。

洛神平台由很多网络设备组成,主要可以分为两类:虚拟交换机和各种网关设备。虚拟交换机负责ECS的虚拟网络接入,网关设备提供了丰富的网络功能和服务。洛神平台架构如图2-25所示。

图2-25 洛神平台架构

从系统架构上看,洛神平台由三大模块组成,即数据平面、控制平面和管理平面。

数据平面负责云网络中数据包的处理,它就如同物理世界中的网线和路由交换设备,把数据包高效率、低延迟地从发送端送到目的地。类似地,洛神的数据平面包含各种不同角色的组件,包括支持各种不同类型计算形态的虚拟交换机、用于数据中心互连的DCN网关、用于云网络连接的公网网关、用于云上云下互连的混合云网关、提供负载均衡能力的负载均衡网关、提供端接入能力的智能接入网关。为了提高这些组件的转发性能,洛神不仅使用了软转发技术,而且还对软硬件结合甚至纯硬件技术进行了广泛应用。

控制平面则控制如何处理数据包,它是洛神的业务大脑。从技术上看,洛神的控制平面是一个层次性的分布式控制系统,最底层的设备控制器主要负责控制和管理数据平面的各种组件,同时在每个区域都存在一个虚拟网络控制器,在全局存在一个全球路由控制器。区域的虚拟网络控制器负责本区域的云网络的管理与调度,全局路由控制器则负责协调调度各个区域的资源形成一个全球的云网络。基于虚拟网络控制器和全局路由控制器之上的则是NFV控制器,其完成虚拟网络高级功能如VPN等产品的编排和抽象。

洛神的管理平面是网络运维和运营的中枢,它管理着海量的网元以及用户,这里的海量指的是千万级虚拟机数量和百万级网元数量。为了做到这一点,洛神的管理平台是基于大数据以及机器学习技术实现的,它对网络运行当中产生的海量数据进行实时/离线计算、数据建模,来驱动网络资源的提前规划、网络系统的日常维护以及网络产品的智能运营。整个管理平面包括一套高性能、分布式的数据分析系统,由它分析出来的数据被提供给智能运维系统和智能运营系统,完成资源规划、网络建设、系统变更、实时监控、故障逃逸、产品运营等整个网络产品生命周期的工作。最终实现“在无人值守状态下执行网络变更”“先于用户发现问题”“高效、简单地完成故障逃逸”等丰富且全面的产品特性和用户运营效果。

下面将重点介绍基础的云网络核心技术:网络虚拟化技术和网络功能虚拟化(NFV)技术。