
案例研究 | 中兴通讯高性能 5G 核心网 UPF 实现
2
资源可重用,避免网络多次升级和改造,大幅度降低网络建设成本,
灵活满足运营商 5G 建设和平滑演进需求。
1.2. 中兴通讯 NFV UPF 网元介绍
UPF 作为 5G 核心网关键网元,承载着用户数据处理和转发的重要
功能。随着 5G 的商用推进,4K/8K 高清视频、云游戏、远程驾驶、
工业控制等 eMBB/URLLC 应用需求也日趋紧迫,它们对网络提出
了超低时延、超大带宽的要求。而这些性能需求与 UPF 紧密相关,
需要 UPF 提供高效的数据处理和转发。
中兴通讯推出的经过优化的纯软件 UPF 方案,采用基于英特尔至强
处理器的通用服务器,运用了业界广泛应用的性能优化技术,例如
DPDK、NUMA 绑定、OS 优化、巨页等。除此之外,中兴通讯也
对于 UPF 的软件架构和逻辑着手优化,基于 VPP (Vector Packet
Processing) 原理,采用消息多队列无锁处理、业务首包 DPI、流表
等技术,实现热点报文的批量处理和转发,有效地降低了业务逻辑对
CPU 的消耗,性能水准已达到业界同等条件下的非常优秀的水平。
2. 英特尔® 平台和技术的关键特性
2.1. 英特尔平台介绍
英特尔服务器平台提供了出色的性能和丰富的特性,拥有完善的生态
系统和健壮的路标,是业界主流的 NFV 平台。为满足应用服务的
灵活性、安全性和服务的可达性,英特尔不断地同生态合作伙伴一起
建立基于 NFV 和 SDN 技术相关的解决方案,提供开放的网络基础
架构平台。利用英特尔® 处理器,英特尔® 网络适配器,DPDK 和其他
英特尔平台相关技术,可以降低设备复杂度并提高网络利用率,满足
运营商对电信网络灵活性、可扩展性、可靠性和成本需求,加速
产业链的技术创新和网络转型。
2.2. 英特尔® Speed Select 技术 -
Core Power(英特尔® SST-CP)
第二代英特尔® 至强® 可扩展处理器推出增强型英特尔 Speed Select
技术允许系统提供针对 CPU 性能更多的控制,从而来提高性能并优化
配置成本。使用英特尔 Speed Select 技术,一台服务器可以做得更多。
第二代英特尔® 至强® 可扩展处理器 N (NFV) 系列支持英特尔 Speed
Select 技 术 中 的 Core Power 功 能( 英 特 尔 SST-CP)。 英 特 尔
SST-CP 功能可以灵活配置和调整 CPU 核的优先级,高优先级的
CPU 核运行在更高频率上。这可以使系统关键任务运行在高优先级
的 CPU 核上确保性能,并充分利用 CPU 额定功耗。
2.3. 英特尔 DDP 技术
DDP (Dynamic Device Personalization) 又称动态设备个性化设置,
是英特尔® 以太网网络适配器 700 系列和英特尔以太网网络适配器
800 系列的一个先进功能。此功能允许通过加载固件配置文件
(profile) 动态地实现重新配置数据包处理流水线,以满足特定的场景
需求。换而言之,这些网卡具有部分可编程能力,通过下载特定的
固件配置文件 (profile),可以为用户提供特定通信网络协议的解析
支持,结合网卡的 flow-director FDIR(流引导)和 RSS(散列技术)
特性,实现网络报文解析和分发的硬件卸载,从而提高网络性能。
英特尔以太网网络适配器 700系列提供工业级的配置文件 (Profile),
目前已经涵盖多种协议类型,包括 PPPOE,GTP-meC,GTP-U,
L2TP 等。这些配置文件可以通过通用的 ethtool 或者 DPDK 库进行
便捷地加载。
DDP 能够允许网卡识别特定的电信协议报文并分发到特定的队列上。
这意味着应用程序不再需要用专门的接收 (RX) 或发送 (TX) 处理器
核来做流量分发,这些核就能够释放用于处理应用程序本身业务。
由于报文到队列的分发是由网卡硬件完成的,从 NFVI 的角度来看
整个系统更具确定性:系统延迟和抖动减少了,并且随着负载平衡
RX/TX 核的释放,总吞吐量也增加了。
3. 基于英特尔平台技术加速的 NFV UPF 解决方案
3.1. 英特尔 SST-CP 加速技术的应用
在实际应用中,为了获得更高的性能,常常会启用英特尔® Turbo
Boost 功能,这样 CPU 核可以运行在更高的 Turbo 频率上。Turbo
Boost 技术是一种处理器热功耗余量的技术。采用英特尔 SST-CP 加
速技术,可以将关键业务运行核锁定在高频率,其他业务核运行在低
频率,这样能在保持 CPU 频率尽可能稳定的前提下获取最佳性能。
中兴通讯 5G NFV UPF 的方案使用了 SST-CP 技术,将处理 UPF
转发线程的 CPU 核设置为高优先级并运行在更高的频率上。如下图
所示,在英特尔至强金牌 6230N 处理器平台上,将每个 CPU 的
0-7 核运行在 1.5Ghz,8-19 核运行在 2.8Ghz。
Core 0
Core 1
Core 2
Core 3
Core 4
Core 5
Core 6
Core 7
Core 8
Core 9
Core 10
Core 11
Core 12
Core 13
Core 14
Core 15
Core 16
Core 17
Core 18
Core 19
0
0.5
1
1.5
2
2.5
3
Frequency (GHz)
搭载英特尔® SST-CP 的英特尔® 至强® 金牌 6230N 处理器
Low Priority Cores High Priority Cores
图 1. 英特尔® 至强® 金牌 6230N 处理器使用英特尔 SST-CP 设置核
优先级
3.2. DDP 加速技术的应用
没有 DDP 特性,GTP (GPRS tunneling protocol) 的内层报头不能
够被网卡解析,网卡只能缺省的认定其为普通四层报文。这样对于
5G 核心网用户面网元 UPF 而言,主要处理的报文类型是 GTP(上行)
报文和普通的 TCP/IP(下行)报文。
GTP 报文就无法利网卡的 FDIR 或者 RSS 分流功能散列到不同队列并
绑定到不同的处理器核上做并行处理。为了解决这个问题,传统方案
会额外地使用若干处理器核用软件的方式来解析 GTP 内层报头分别发
到不同的处理核上。这种场景下,软件分发核的性能常常会成为整个
UPF 处理的性能瓶颈,并且软件分发增加了系统整体处理的延迟开销。
Load Distribution Software
Runs on CPU Core
Worker
0
Worker
1
Load Distribution Core
Standard TCP
Traffic incoming
from network
Parsed fields Payload
Packet type 24: UDP in IPv4
Intel® Ethernet
700 Series
GTPv1
Worker
2
Worker
3
Worker
4
DA SA IPv4
RSS
UDP
RSS
TEID IPv4 TCP PAYGTP
RSS
图 2. 不使用 DDP 技术的软件架构
应用了 DDP,网卡就可以扩展报文识别深度到 GTP 内层报文的传输
层,这样就能够直接在 GTP 报文上针对内层报头应用 FDIR 和 RSS
分流功能,利用网卡直接将 GTP 报文散列到不同的网卡队列并绑定
到不同的核上进行并行处理,实现分发功能的硬件卸载,从而大大
提高了性能,同时减小了系统整体处理的延迟。
评论