Region-based Content Enhancement for Efﬁcient Video Analytics at the Edge¶

核心背景与挑战

作者的关键发现

RegenHance 三大核心组件

基于宏块 (MB) 的区域重要性预测:
- 为了避免在识别重要区域时耗费过多时间，系统将视频编码中的“宏块”作为最小粒度
- 并训练了一个超轻量级的图像分割模型来快速预测原始帧中宏块的重要性
- 同时，结合 1/Area 算子在时间维度上复用连续帧的重要性预测结果，进一步提升效率
区域感知增强器:
- 由于筛选出的高价值宏块在画面上是稀疏且不规则分布的，而 DNN 只能接受矩形输入，系统设计了一个二维装箱 (Bin Packing) 算法
- 该算法能够跨数据流优先选择重要性最高的区域，并将这些不规则区域“拼接”成密集的张量矩阵，再送入增强模型以最大化吞吐量
基于配置文件的执行规划器:
- 为了解决边缘设备资源紧张的问题，规划器会在离线阶段分析设备的硬件预算以及各项任务的特性，并通过动态规划来决定解码、预测、增强和分析等各个在线组件的最佳资源分配与 Batch size
- 从而在满足延迟目标的前提下最大化端到端吞吐量

跟笔者研究领域关联不大, 如果做 OEC 的话倒是可以看看～