跳转至

HELIX: High-speed Real-Time Experimentation Platform for 6G Wireless Networks

HELIX 是一个为 6G 无线网络设计的高速实时实验平台

核心内容集中在以下三点:

  1. 问题背景:
    • 移动网络(特别是 6G)正在快速发展, 承诺提供前所未有的数据速率和超低延迟
    • 然而, 现有的无线实验平台发展滞后, 它们要么提供低带宽的端到端能力, 要么提供高带宽但缺乏实时功能
  2. HELIX 解决方案:
    • HELIX 是一个具有 6G 可扩展实时能力的实验平台
    • 它集成了全面的物理层子系统(支持 multi-numerology) 和先进的软硬件混合控制单元
      • multi-numerology: 在同一硬件上动态切换和支持多种不同的 OFDM 参数集的能力
      • "人话": 根据实验需求选择和切换不同的波形参数, 从而在同一平台上支持从低频到高频段 (mmWave), 从低到高带宽的泛 5G/6G 实验场景
      • OFDM: Orthogonal Frequency Division Multiplexing
    • 该平台能够与前传网络 (fronthaul) 交互, 并实时动态配置 functional split
    • 在服务器端, 它实现了必要的驱动程序和例程, 以实现与 O-RAN 系统的无缝集成, 从而促进开放和端到端的实验
  3. 主要性能和能力 (Key Performance and Capabilities)

Introduction 核心内容:

行文思路:

  • 移动通信网络的演进趋势和对下一代实验平台的需求
  • 指出了现有平台的局限性
  • 最终提出了 HELIX 平台作为解决方案及其关键特性

内容分布:

  1. 移动网络背景与需求:

    • 驱动因素: 现代应用, 如自动驾驶、AR/VR, 要求高数据速率和超低延迟(目标低于 1 ms)
    • 5G 演进:
      • 由于 sub-6 GHz 频谱拥堵, 5G 探索了 mmWave 等更高频率, 提供了大量带宽资源
      • 5G 引入multi-numerology, 支持超过 400 MHz 的带宽和高达 256-QAM 的调制阶数
    • 6G 愿景: 6G 预期将扩展到 THz 频段, 提供数量级增长的带宽, 并将延迟目标降至 0.1 ms
  2. ISAC 及其架构挑战:

    • ISAC 概念: 5G 和 6G 增加的带宽提供了实现集成传感与通信 (ISAC) 的机会. ISAC 旨在以最小成本为通信系统添加传感功能
    • 架构需求: 实现 ISAC 需要重大的架构变革, 特别是需要 将传统上局限于物理层 (PHY) 的信道测量数据暴露给网络栈的上层
  3. 现有实验平台的局限性:

    • COTS 设备: 兼容标准但缺乏灵活性和关键参数访问权限
    • SDR 局限: SDR 平台(如 srsRAN, OAI)虽然提供了对 IQ 样本的直接访问,但在支持 mmWave 频段超过 400 MHz 带宽时,扩展性受到限制
    • 前传瓶颈: 主要瓶颈是大规模前传容量,需要在 RU 和运行网络堆栈其余部分的服务器之间传输完整的 IQ 样本
    • 实时性问题: 数据速率的增加放大了软件引起的延迟,影响了 PHY 层关键组件(如解调器、解码器)的性能
    • 最大带宽: 即使是采用硬件加速的现有解决方案,支持的最大带宽也仅为 100 MHz
  4. HELIX 平台及其关键特性: 一个高速实时 6G 实验平台

    • 平台基础:
      • HELIX 是一个软硬件协同设计的综合平台, 将 5G 兼容的 PHY 层模块集成到强大的 RFSoC 平台中, 具备低延迟和高带宽配置的可扩展性
    • 核心功能:
      • 动态多拆分功能: 支持 PHY 层模块在硬件和软件之间实时重新定位,与 3GPP 定义的功能拆分选项一致
      • 可重构 FR{X} 操作: 支持适用于 sub-6 GHz (FR1) 和 mmWave (FR2) 频段的多种数字,可无缝切换频段而无需重启
      • 可扩展带宽和载波聚合: 提供多达 4 个载波聚合信道,总带宽高达 1670 MHz
      • 带侧信息的 Fronthaul 接口: 设计用于将信道频率响应 (CFR) 和 SNR 等侧信息传输到服务器,支持未来的 6G ISAC 用例
      • 集成 AAL: 使用 RFSoC 上的 crossbar 加速延迟关键功能,允许 HELIX 作为加速器补充其他平台
      • 性能总结: 平台支持 1670 MHz 的带宽(通过载波聚合)和低至 500 µs 的双向延迟

5G Arch Primer 核心内容:

alt text

(1) O-RAN 与 Architecture-Disaggregation

  • 6G 基础: 6G 预计将以 5G 技术为基础进行演进
  • 里程碑: 5G 演进的一个重要里程碑是引入了像 O-RAN (Open Radio Access Network) 这样的解耦架构
  • O-RAN 特性: O-RAN 强调灵活性, 模块化和可扩展性, 通过标准化接口和开源实现来解耦硬件和软件组件

(2) Functional Splitting

  • 任务拆分: 任务解耦是 5G 的基石.
    • O-RAN 通过功能拆分, 将传统基站功能划分给 CU (Centralized Unit), DU (Distributed Unit), 和 RU (Radio Unit)
  • 拆分类型:
    • High-layer splits: 如 CU 和 DU 之间. 分离 RRC 等控制功能与调度等实时任务
    • Lower-layer splits: 如 DU 和 RU 之间. 通常需要更高的前传带宽来传输原始数据, 带来实现挑战.
  • 业界偏好: Split 7.2x 是业界青睐的选项. 它与 O-RAN 兼容, 并且简化了 RU 设计, 只需实现数字波束成形和 OFDM 调制, 从而降低了尺寸, 功耗和成本

(3) Fronthaul Bottleneck

  • 接口标准:
    • DU 和 RU 通过 fronthaul interface 连接
    • O-RAN 引入了标准化前传接口 (如 eCPRI on Ethernet, 支持 Split 7.2x)
  • 6G 挑战: 虽然标准化接口有益, 但规范主要集中在 Split 7.2x, 这意味着大部分物理层处理仍留在服务器端
  • 数据速率需求: 6G 预期数据速率将大规模增加 (更高的带宽, 调制和 MIMO 阶数), 这将对前传提出极高的要求
  • 实例说明: 一个拥有 4 个空间流和 \(1600 \text{ MHz}\) 带宽的系统, 使用 Split 7.2x 配置, 将需要 200 Gbps 的前传吞吐量
background knowledge for O-RAN

(1) 传统的 BBU

BBU (Baseband Unit) 是传统基站架构中的关键组件:

  • 在传统的集中式网络架构中, BBU 是一个功能完整的单元, 负责处理基站的所有基带功能 (包括高层协议栈和物理层处理), 并通过 Fronthaul Interface 连接到 RU
  • 在 O-RAN 中, BBU 的功能被拆分并分配给 CU, DU, 和 RU

(2) 传统 BBU 的功能被拆分为 CU + DU:

  • CU - Centralized Unit:
    • 主要负责高层协议栈和非实时功能
    • 它通过 Backhaul Interface 连接到 Core Network
    • CU 内运行的核心功能包括 RRC 和 PDCP
  • DU - Distributed Unit:
    • 主要负责实时性要求较高的协议栈功能, 如 Scheduling.
    • 它连接在 CU (w/ Midhaul Interface) 和 RU (w/ Fronthaul Interface) 之间
    • DU 内运行的核心功能包括 RLC 和 MAC (以及部分物理层功能, 取决于拆分选项)
  • RU - Radio Unit:
    • 主要负责射频 (RF) 和最底层、对时延最敏感的物理层功能 (Low-PHY)
    • 在业界青睐的 Split 7.2x 中, RU 仅实现 Low-PHY 和 RF 任务, 如 OFDM 调制和数字波束成形

(3) Split 7.2x: 是 O-RAN 定义的多种功能拆分选项之一, 它在 DU 和 RU 之间划分物理层功能


HELIX Top-level Architecture 核心内容

(1) 平台总体构成:

HELIX 从高层视角看, 主要由以下三部分组成:

  • RFSoC 板卡: 一个强大的 RFSoC 板卡. PL 和 PS 协同工作, 形成一个嵌入式系统
    • RFSoC: Radio Frequency System-on-Chip
    • PL: Programmable Logic
    • PS: Processing System
  • 服务器端 C++ 库: 位于服务器端, 用于与高层应用集成
  • Fronthaul 接口: 连接 RFSoC 和服务器端的接口, 使用硬件核和软件功能通过 UDP sockets 进行通信

alt text

HELIX 可以在两种模式下运行: 作为独立系统进行无线实验, 或作为 O-RAN 项目的即插即用 PHY 层平台

(2) Custom Fronthaul Interface:

  • 传输机制: 利用 UDP sockets over a 10Gb Ethernet link, 提供稳健, 低延迟, 高速的通信
  • 三平面设计: 接口划分为三个独立的逻辑平面, 各自使用特定的 UDP 端口
    • Data Plane: 用于数据传输, 通过 Stream Manager 和 Crossbar 直接连接到处理块
    • Control Plane: 传输配置和控制命令, 由嵌入式 PS 通过控制缓冲器管理
    • Side-info Plane: 用于支持 6G ISAC 应用. 它传输额外的物理层信息, 如 CFR (Channel Frequency Response) 和 SNR (Signal-to-Noise Ratio), 到服务器的上层
  • 硬件加速: RFSoC 上集成了硬件实现的 UDP 协议栈, 支持多端口和 AXI 集成, 从而避免将 UDP 处理转移到 PS, 显著降低了延迟
  • 拆分透明性: 该前传接口对所使用的功能拆分是透明的, 只需控制消息即可根据选择的拆分选项配置系统以传输相关信息

(3) Control and Stream Manager:

  • PS 的控制作用: RFSoC 嵌入式 PS 管理控制平面
    • 它读取 control plane 端口接收到的消息, 并使用 AXI-lite 接口来快速修改 PL 中处理块的配置参数 (Messages received through the control plane port are stored in a buffer, which the PS reads to process and execute commands)
    • 配置参数包括 numerology, PRB 数量, 调制阶数等
  • Stream Manager: 这是一个在 PL 中的块
    • 负责精确控制数据流, 包括启动和停止流以确保样本对齐
    • 它还处理 10Gb Ethernet 时钟和处理块时钟之间的时钟域交叉
  • Side-info 配置:
    • PS 通过 config message 配置 Side-info Plane, 确定共享给服务器的侧信息[metadata], 以优化高带宽场景下的前传带宽使用

(4) Crossbar for Flexible Splitting:

alt text

  • 核心实现: 灵活功能拆分, 集成 Xilinx IP 库的 AXI Stream Interconnect IP 实现
  • 动态性:
    • 支持 AXI-stream 的处理块, 允许通用数据路由
    • 其配置可以在运行时通过控制平面命令完全重新编程
  • 快速切换: HELIX 允许在不到 50 µs 内切换功能拆分配置, 无需重新烧录 FPGA 镜像
  • 发射器示例:
    • 通过调整crossbar内部切换, 数据流可实现 Split 6 的完整处理链 ([LDPC Encoder \(\to\) Modulator \(\to\) OFDM Modulator \(\to\) DAC]) 切换到 Split 7.2x 的简短路径 (Stream Manager \(\to\) OFDM Modulator \(\to\) DAC)
  • AAL 集成:
    • crossbar 促进了与 O-RAN 的 AAL (Acceleration Abstraction Layer) 集成
    • 它可以将数据从 Stream Manager 路由到AAL (例如 LDPC Encoder), 执行计算后将处理后的数据返回给 DU. 这增强了系统的模块化和灵活性

(5) Interface Library:

  • 目的设计:
    • 开发了一个 C++ 接口库作为 RFSoC 和 NetApp 之间的包装器
    • 目标是: 功能抽象和可用性, 无缝集成以及高性能
  • 抽象:
    • 库隐藏了平台实现细节, 抽象了配置处理块, 启动传输和设置拆分选项等低级操作
    • 示例: alt text
  • 集成与通用性:
    • 库的核心是一个 radio parent class, 可以集成到 srsRAN 或 OAI 等 O-RAN 实现中
    • 用户通过简单的函数调用 (如 radio.transmit()) 即可实现无缝数据流
  • 高性能实现: 库通过发送一个简单的触发信号 (trigger signal) 来启动传输, 该过程仅耗时约 30 µs, 确保了最小延迟和对高数据速率的支持

Implementation 核心内容:

RFSoC:

在 Xilinx RFSoC ZCU111 和 ZCU208 板卡上实现. 这些板卡集成了 Giga 采样率的 AD/DA 转换器, 多核 ARM 处理器, 10GbE 接口以及硬化 LDPC 解码器

Host Server:

只需要一个多核服务器和一个 10GbE 网卡. 要求网络缓冲尺寸足够大 (>30 MB), 并且接口配置为 jumbo packet mode

PS: 看看人家硬件的配图咋画的. 挺有意思 :)

alt text


Related Work 核心内容:

将无线实验平台划分为三大类别, 分析了现有平台的优缺点和局限性, 最终突显了HELIX在高带宽, 实时性和功能支持方面的优势

平台类别 主要特点 局限性
高带宽, 非实时平台 提供最高灵活性. 使用信号发生器, 示波器或信号分析仪来生成和捕获任意信号 无法实时操作. 仅限于物理层. SDR 方法虽然更便携, 但缺乏 5G/6G 的实时能力.
基于软件的端到端测试平台 具有灵活性且相对易于定制. 提供了完整的协议栈实现 (如 srsRAN, OAI, Amarisoft) 带宽限制: 性能最高仅支持 100 MHz 的带宽.
前传瓶颈: 依赖于传输完整的 IQ 样本到 CPU/GPU, 导致高数据速率需求下的前传瓶颈.
功能限制: srsRAN 不支持 FR2, OAI 对 FR2 的支持也仅限于 \(120 \text{ kHz}\) SCS 和 \(100 \text{ MHz}\) 带宽
基于 FPGA 的实时系统 专注于实现实时系统 现有项目通常带宽限制功能限制 (仅关注特定物理层功能, 如波束跟踪)

现有解决方案及其不足:

  • 软件平台加速的尝试: 尽管 srsRAN 和 OAI 等可以利用硬件加速器, 或像 NVIDIA Aerial 框架利用 GPU, 但这些方案仍需依赖于 RU 和服务器之间传输完整的 IQ 样本, 最大带宽仍受限于 \(100 \text{ MHz}\)
  • 低 PHY 卸载: 有研究尝试将 Low-PHY 功能卸载到 FPGA 以减少处理时间, 但性能的提升会被 FPGA 和 CPU 之间的内存传输所抵消

HELIX 牛b在哪里:

HELIX 被定位为 FPGA-based real-time systems 这一研究方向的下一代平台

  • 优势: HELIX 解决了现有平台在高带宽实时性上的不足
  • 能力: 作为一个灵活的平台, HELIX 支持 sub-6 GHzmmWave 频段