近日,实验室硕士生崔兴晔撰写的“ARFHANet: Adaptive Receptive Field and Hierarchical Attention Network for Infrared Small Target Detection”研究论文,已被IEEE JSTARS(中科院二区,最新影响因子5.3)正式录用,罗俊海老师为唯一通信作者。
1、研究背景
红外小目标检测(ISTD)在民用和军用领域有着广泛的应用。然而,红外小目标图像缺乏纹理和结构信息,给检测任务带来了挑战。近年来,基于深度学习的算法在该领域取得了更好的效果,但由于使用传统卷积核,因而缺乏对复杂场景与多样性小目标的自适应性;同时,池化层的使用不可避免地会遇到深层目标丢失、图像信息利用较低的风险。为了解决这个问题,作者提出了一种用于红外小目标检测的自适应接收域和层次注意力网络。设计了多接收域特征交互卷积 (MRFFIConv),通过结合不同的卷积分支与门控单元,自适应于各类红外小目标场景,提取更丰富的图像特征。小波频域增强下采样模块(WFED)通过引入希尔小波变换与频域重构操作,增强目标特征与抑制背景信息,提高了网络对红外小目标的感知能力。此外,作者设计了一个层次化特征融合模块(HLFF),融合低层细节与高层的语义信息,增强模型的分辨率与定位能力。最后,全局中值增强模块(GMEA)引入注意力机制进一步增加特征图的多样性与表达能力,提高模型对图像信息的利用率。在公共数据集SIRST、NUDT-SIRST和IRSTD-1k上的实验结果表明,作者提出的算法在检测性能方面优于其他最先进的方法。
2、主要贡献
论文的主要贡献如下:
1) 受动态卷积启发,设计了多接收域特征交互卷积 (MRFFIConv),通过集成并联的专家卷积分支与门控单元,以应对不同场景下复杂多变的环境特性和小目标特征。
2) 提出了小波频域增强下采样模块(WFED),在抑制噪声和背景信息的同时增强边缘与细节特征,有效缓解分层网络中的特征丢失问题。
3) 为提升信息利用效率,设计了层次化特征融合模块(HLFF)以实现低层细节与高层语义的融合,并引入全局中值增强模块(GMEA)促进跨通道交互,从而强化多尺度特征整合能力。
4) 所提出的网络在多个数据集上实现了最先进的检测性能。可视化结果进一步验证了该方法在多种挑战性场景下具有优异的检测精度与鲁棒性。
总体框架流程如图1所示。

图1:ARFHANet结构图
3、实验结果
实验验证中,将ARFHANet网络与多种SOTA方法进行了数值和可视化结果的对比,绘制了ROC曲线,如图2所示,提出的算法在检测和背景抑制性能方面表现优异。


图2:与SOTA方法的性能对比与可视化结果
