HELIX: High-speed Real-Time Experimentation Platform for 6G Wireless Networks¶
HELIX 是一个为 6G 无线网络设计的高速实时实验平台
核心内容集中在以下三点:
- 问题背景:
- 移动网络(特别是 6G)正在快速发展, 承诺提供前所未有的数据速率和超低延迟
- 然而, 现有的无线实验平台发展滞后, 它们要么提供低带宽的端到端能力, 要么提供高带宽但缺乏实时功能
- HELIX 解决方案:
- HELIX 是一个具有 6G 可扩展实时能力的实验平台
- 它集成了全面的物理层子系统(支持 multi-numerology) 和先进的软硬件混合控制单元
- multi-numerology: 在同一硬件上动态切换和支持多种不同的 OFDM 参数集的能力
- "人话": 根据实验需求选择和切换不同的波形参数, 从而在同一平台上支持从低频到高频段 (mmWave), 从低到高带宽的泛 5G/6G 实验场景
- OFDM: Orthogonal Frequency Division Multiplexing
- 该平台能够与前传网络 (fronthaul) 交互, 并实时动态配置 functional split
- 在服务器端, 它实现了必要的驱动程序和例程, 以实现与 O-RAN 系统的无缝集成, 从而促进开放和端到端的实验
- 主要性能和能力 (Key Performance and Capabilities)
Introduction 核心内容:
行文思路:
- 移动通信网络的演进趋势和对下一代实验平台的需求
- 指出了现有平台的局限性
- 最终提出了 HELIX 平台作为解决方案及其关键特性
内容分布:
-
移动网络背景与需求:
- 驱动因素: 现代应用, 如自动驾驶、AR/VR, 要求高数据速率和超低延迟(目标低于 1 ms)
- 5G 演进:
- 由于 sub-6 GHz 频谱拥堵, 5G 探索了 mmWave 等更高频率, 提供了大量带宽资源
- 5G 引入multi-numerology, 支持超过 400 MHz 的带宽和高达 256-QAM 的调制阶数
- 6G 愿景: 6G 预期将扩展到 THz 频段, 提供数量级增长的带宽, 并将延迟目标降至 0.1 ms
-
ISAC 及其架构挑战:
- ISAC 概念: 5G 和 6G 增加的带宽提供了实现集成传感与通信 (ISAC) 的机会. ISAC 旨在以最小成本为通信系统添加传感功能
- 架构需求: 实现 ISAC 需要重大的架构变革, 特别是需要 将传统上局限于物理层 (PHY) 的信道测量数据暴露给网络栈的上层
-
现有实验平台的局限性:
- COTS 设备: 兼容标准但缺乏灵活性和关键参数访问权限
- SDR 局限: SDR 平台(如 srsRAN, OAI)虽然提供了对 IQ 样本的直接访问,但在支持 mmWave 频段超过 400 MHz 带宽时,扩展性受到限制
- 前传瓶颈: 主要瓶颈是大规模前传容量,需要在 RU 和运行网络堆栈其余部分的服务器之间传输完整的 IQ 样本
- 实时性问题: 数据速率的增加放大了软件引起的延迟,影响了 PHY 层关键组件(如解调器、解码器)的性能
- 最大带宽: 即使是采用硬件加速的现有解决方案,支持的最大带宽也仅为 100 MHz
-
HELIX 平台及其关键特性: 一个高速实时 6G 实验平台
- 平台基础:
- HELIX 是一个软硬件协同设计的综合平台, 将 5G 兼容的 PHY 层模块集成到强大的 RFSoC 平台中, 具备低延迟和高带宽配置的可扩展性
- 核心功能:
- 动态多拆分功能: 支持 PHY 层模块在硬件和软件之间实时重新定位,与 3GPP 定义的功能拆分选项一致
- 可重构
FR{X}操作: 支持适用于 sub-6 GHz (FR1) 和 mmWave (FR2) 频段的多种数字,可无缝切换频段而无需重启 - 可扩展带宽和载波聚合: 提供多达 4 个载波聚合信道,总带宽高达 1670 MHz
- 带侧信息的 Fronthaul 接口: 设计用于将信道频率响应 (CFR) 和 SNR 等侧信息传输到服务器,支持未来的 6G ISAC 用例
- 集成 AAL: 使用 RFSoC 上的 crossbar 加速延迟关键功能,允许 HELIX 作为加速器补充其他平台
- 性能总结: 平台支持 1670 MHz 的带宽(通过载波聚合)和低至 500 µs 的双向延迟
- 平台基础:
5G Arch Primer 核心内容:

(1) O-RAN 与 Architecture-Disaggregation
- 6G 基础: 6G 预计将以 5G 技术为基础进行演进
- 里程碑: 5G 演进的一个重要里程碑是引入了像 O-RAN (Open Radio Access Network) 这样的解耦架构
- O-RAN 特性: O-RAN 强调灵活性, 模块化和可扩展性, 通过标准化接口和开源实现来解耦硬件和软件组件
(2) Functional Splitting
- 任务拆分: 任务解耦是 5G 的基石.
- O-RAN 通过功能拆分, 将传统基站功能划分给 CU (Centralized Unit), DU (Distributed Unit), 和 RU (Radio Unit)
- 拆分类型:
- High-layer splits: 如 CU 和 DU 之间. 分离 RRC 等控制功能与调度等实时任务
- Lower-layer splits: 如 DU 和 RU 之间. 通常需要更高的前传带宽来传输原始数据, 带来实现挑战.
- 业界偏好: Split 7.2x 是业界青睐的选项. 它与 O-RAN 兼容, 并且简化了 RU 设计, 只需实现数字波束成形和 OFDM 调制, 从而降低了尺寸, 功耗和成本
(3) Fronthaul Bottleneck
- 接口标准:
- DU 和 RU 通过 fronthaul interface 连接
- O-RAN 引入了标准化前传接口 (如 eCPRI on Ethernet, 支持 Split 7.2x)
- 6G 挑战: 虽然标准化接口有益, 但规范主要集中在 Split 7.2x, 这意味着大部分物理层处理仍留在服务器端
- 数据速率需求: 6G 预期数据速率将大规模增加 (更高的带宽, 调制和 MIMO 阶数), 这将对前传提出极高的要求
- 实例说明: 一个拥有 4 个空间流和 \(1600 \text{ MHz}\) 带宽的系统, 使用 Split 7.2x 配置, 将需要 200 Gbps 的前传吞吐量
background knowledge for O-RAN

(1) 传统的 BBU
BBU (Baseband Unit) 是传统基站架构中的关键组件:
- 在传统的集中式网络架构中, BBU 是一个功能完整的单元, 负责处理基站的所有基带功能 (包括高层协议栈和物理层处理), 并通过 Fronthaul Interface 连接到 RU
- 在 O-RAN 中, BBU 的功能被拆分并分配给 CU, DU, 和 RU
(2) 传统 BBU 的功能被拆分为 CU + DU:
- CU - Centralized Unit:
- 主要负责高层协议栈和非实时功能
- 它通过 Backhaul Interface 连接到 Core Network
- CU 内运行的核心功能包括 RRC 和 PDCP
- DU - Distributed Unit:
- 主要负责实时性要求较高的协议栈功能, 如 Scheduling.
- 它连接在 CU (w/ Midhaul Interface) 和 RU (w/ Fronthaul Interface) 之间
- DU 内运行的核心功能包括 RLC 和 MAC (以及部分物理层功能, 取决于拆分选项)
- RU - Radio Unit:
- 主要负责射频 (RF) 和最底层、对时延最敏感的物理层功能 (Low-PHY)
- 在业界青睐的 Split 7.2x 中, RU 仅实现 Low-PHY 和 RF 任务, 如 OFDM 调制和数字波束成形
(3) Split 7.2x: 是 O-RAN 定义的多种功能拆分选项之一, 它在 DU 和 RU 之间划分物理层功能
HELIX Top-level Architecture 核心内容
(1) 平台总体构成:
HELIX 从高层视角看, 主要由以下三部分组成:
- RFSoC 板卡: 一个强大的 RFSoC 板卡. PL 和 PS 协同工作, 形成一个嵌入式系统
- RFSoC: Radio Frequency System-on-Chip
- PL: Programmable Logic
- PS: Processing System
- 服务器端 C++ 库: 位于服务器端, 用于与高层应用集成
- Fronthaul 接口: 连接 RFSoC 和服务器端的接口, 使用硬件核和软件功能通过 UDP sockets 进行通信

HELIX 可以在两种模式下运行: 作为独立系统进行无线实验, 或作为 O-RAN 项目的即插即用 PHY 层平台
(2) Custom Fronthaul Interface:
- 传输机制: 利用 UDP sockets over a 10Gb Ethernet link, 提供稳健, 低延迟, 高速的通信
- 三平面设计: 接口划分为三个独立的逻辑平面, 各自使用特定的 UDP 端口
- Data Plane: 用于数据传输, 通过 Stream Manager 和 Crossbar 直接连接到处理块
- Control Plane: 传输配置和控制命令, 由嵌入式 PS 通过控制缓冲器管理
- Side-info Plane: 用于支持 6G ISAC 应用. 它传输额外的物理层信息, 如 CFR (Channel Frequency Response) 和 SNR (Signal-to-Noise Ratio), 到服务器的上层
- 硬件加速: RFSoC 上集成了硬件实现的 UDP 协议栈, 支持多端口和 AXI 集成, 从而避免将 UDP 处理转移到 PS, 显著降低了延迟
- 拆分透明性: 该前传接口对所使用的功能拆分是透明的, 只需控制消息即可根据选择的拆分选项配置系统以传输相关信息
(3) Control and Stream Manager:
- PS 的控制作用: RFSoC 嵌入式 PS 管理控制平面
- 它读取 control plane 端口接收到的消息, 并使用 AXI-lite 接口来快速修改 PL 中处理块的配置参数 (
Messages received through the control plane port are stored in a buffer, which the PS reads to process and execute commands) - 配置参数包括 numerology, PRB 数量, 调制阶数等
- 它读取 control plane 端口接收到的消息, 并使用 AXI-lite 接口来快速修改 PL 中处理块的配置参数 (
- Stream Manager: 这是一个在 PL 中的块
- 负责精确控制数据流, 包括启动和停止流以确保样本对齐
- 它还处理 10Gb Ethernet 时钟和处理块时钟之间的时钟域交叉
- Side-info 配置:
- PS 通过 config message 配置 Side-info Plane, 确定共享给服务器的侧信息[metadata], 以优化高带宽场景下的前传带宽使用
(4) Crossbar for Flexible Splitting:

- 核心实现: 灵活功能拆分, 集成 Xilinx IP 库的 AXI Stream Interconnect IP 实现
- 动态性:
- 支持 AXI-stream 的处理块, 允许通用数据路由
- 其配置可以在运行时通过控制平面命令完全重新编程
- 快速切换: HELIX 允许在不到 50 µs 内切换功能拆分配置, 无需重新烧录 FPGA 镜像
- 发射器示例:
- 通过调整crossbar内部切换, 数据流可实现 Split 6 的完整处理链 ([LDPC Encoder \(\to\) Modulator \(\to\) OFDM Modulator \(\to\) DAC]) 切换到 Split 7.2x 的简短路径 (Stream Manager \(\to\) OFDM Modulator \(\to\) DAC)
- AAL 集成:
- crossbar 促进了与 O-RAN 的 AAL (Acceleration Abstraction Layer) 集成
- 它可以将数据从 Stream Manager 路由到AAL (例如 LDPC Encoder), 执行计算后将处理后的数据返回给 DU. 这增强了系统的模块化和灵活性
(5) Interface Library:
- 目的设计:
- 开发了一个 C++ 接口库作为 RFSoC 和 NetApp 之间的包装器
- 目标是: 功能抽象和可用性, 无缝集成以及高性能
- 抽象:
- 库隐藏了平台实现细节, 抽象了配置处理块, 启动传输和设置拆分选项等低级操作
- 示例:

- 集成与通用性:
- 库的核心是一个 radio parent class, 可以集成到 srsRAN 或 OAI 等 O-RAN 实现中
- 用户通过简单的函数调用 (如
radio.transmit()) 即可实现无缝数据流
- 高性能实现: 库通过发送一个简单的触发信号 (trigger signal) 来启动传输, 该过程仅耗时约 30 µs, 确保了最小延迟和对高数据速率的支持
Implementation 核心内容:
RFSoC:
在 Xilinx RFSoC ZCU111 和 ZCU208 板卡上实现. 这些板卡集成了 Giga 采样率的 AD/DA 转换器, 多核 ARM 处理器, 10GbE 接口以及硬化 LDPC 解码器
Host Server:
只需要一个多核服务器和一个 10GbE 网卡. 要求网络缓冲尺寸足够大 (>30 MB), 并且接口配置为 jumbo packet mode
PS: 看看人家硬件的配图咋画的. 挺有意思 :)

Related Work 核心内容:
将无线实验平台划分为三大类别, 分析了现有平台的优缺点和局限性, 最终突显了HELIX在高带宽, 实时性和功能支持方面的优势
| 平台类别 | 主要特点 | 局限性 |
|---|---|---|
| 高带宽, 非实时平台 | 提供最高灵活性. 使用信号发生器, 示波器或信号分析仪来生成和捕获任意信号 | 无法实时操作. 仅限于物理层. SDR 方法虽然更便携, 但缺乏 5G/6G 的实时能力. |
| 基于软件的端到端测试平台 | 具有灵活性且相对易于定制. 提供了完整的协议栈实现 (如 srsRAN, OAI, Amarisoft) | 带宽限制: 性能最高仅支持 100 MHz 的带宽. 前传瓶颈: 依赖于传输完整的 IQ 样本到 CPU/GPU, 导致高数据速率需求下的前传瓶颈. 功能限制: srsRAN 不支持 FR2, OAI 对 FR2 的支持也仅限于 \(120 \text{ kHz}\) SCS 和 \(100 \text{ MHz}\) 带宽 |
| 基于 FPGA 的实时系统 | 专注于实现实时系统 | 现有项目通常带宽限制 或功能限制 (仅关注特定物理层功能, 如波束跟踪) |
现有解决方案及其不足:
- 软件平台加速的尝试: 尽管 srsRAN 和 OAI 等可以利用硬件加速器, 或像 NVIDIA Aerial 框架利用 GPU, 但这些方案仍需依赖于 RU 和服务器之间传输完整的 IQ 样本, 最大带宽仍受限于 \(100 \text{ MHz}\)
- 低 PHY 卸载: 有研究尝试将 Low-PHY 功能卸载到 FPGA 以减少处理时间, 但性能的提升会被 FPGA 和 CPU 之间的内存传输所抵消
HELIX 牛b在哪里:
HELIX 被定位为 FPGA-based real-time systems 这一研究方向的下一代平台
- 优势: HELIX 解决了现有平台在高带宽和实时性上的不足
- 能力: 作为一个灵活的平台, HELIX 支持 sub-6 GHz 和 mmWave 频段