近日,成像探测与智能感知(IDIP)实验室在红外小目标检测领域再次取得重要研究进展,在2024年WACV国际会议发表了题为“RPCANet: Deep Unfolding RPCA Based Infrared Small Target Detection”的学术论文。2023级博士生伍风翼与商汤科技张天放博士为该论文共同第一作者,彭真明教授为唯一通讯作者,电子科技大学和丹麦University of Copenhagen为共同完成单位。
红外探测系统具有更好的抗干扰能力,在地面监视、空间探测及天基预警中起着重要的作用。随着红外数据集的丰富,数据驱动的检测方法取得了显著进步,但多数深度网络仍缺乏对红外小目标特性的分析,算法可解释性低,导致“黑盒”问题。相较之下,模型驱动的检测方法虽对场景变化敏感,但因其高可解释性和红外场景的特定特性,仍受到青睐。结合这两种方法的优势,解决红外小目标检测的挑战成为研究焦点。
在实验室前期大量开展的基于鲁棒主成分分析(RPCA)模型基础上,将算法进行深度展开,提出了一种基于深度展开RPCA的红外小目标检测网络(RPCANet),将深度展开首次运用到红外小目标检测任务当中。该方法将检测任务转化为稀疏目标提取、低秩背景估计和图像重建的过程,并将迭代优化步骤融入深度学习框架,用神经网络替代复杂的矩阵运算。RPCANet不仅提供清晰的可解释性,还保留了图像的本质特征。
图1 RPCANet整体/单阶段网络构造
论文阐述了RPCANet的工作原理,通过可视化每个网络层的输出,展示了如何逐层分离低秩背景和稀疏目标。这一过程展现了网络如何分阶段精确地逼近和提取目标,确保了方法的高度可解释性。
此外,论文也将RPCANet与其他多种SOTA方法进行数值与可视化结果的上对比(图2)。取得优异的检测效果及背景抑制效果的同时,具有较低的参数量。
图2 RPCANet与SOTA在数值与可视化结果上对比
RPCANet架构能有效指导神经层学习低秩背景和稀疏目标,以几乎“白盒”的方式完成检测任务。我们期望这一发现能推动未来在可解释深度学习在红外小目标检测、识别领域的研究和应用。
博士生伍风翼在WACV2024的线上会议中介绍了这项工作,并已开源网络代码,以便与业界共同探索红外小目标检测的新趋势。
图3 博士生伍风翼在WACV2024进行线上汇报
WACV,全称IEEE/CVF冬季计算机视觉应用会议(IEEE /CVF Winter Conference on Applications of Computer Vision) , 是专注于计算机视觉应用方面的国际会议,于2008年在美国首次举办,是继CVPR、ICCV、ECCV三大顶会外的一个计算机视觉国际会议,被广泛认为是该领域中的重要会议之一。
• 论文链接:RPCANet: Deep Unfolding RPCA Based Infrared Small Target Detection
• 开源代码:https://github.com/fengyiwu98/RPCANet
• 新闻链接:信通学院博士生在WACV2024国际会议发表研究成果