近日,计算机科学与技术学院2023级电子信息专业研究生乐国文以第一作者在国际声学、语音与信号处理会议(International Conference on Acoustics, Speech and Signal Processing,简称ICASSP, CCF-B会议)上发表研究论文,论文题目为《Semi-supervised Iterative Learning Network for Camouflaged Object Detection》。论文是在我校焦铬教授的指导下完成,衡阳师范学院为第一署名单位。该论文的核心理论是:当前的伪装目标检测(COD)方法严重依赖于具有像素级注释的大规模数据集。我们提出了一种半监督迭代学习网络(SILNet)来解决COD中对大规模像素级注释的依赖。SILNet采用卷积网络和变压器作为编码器的协同训练策略,然后使用二进制门控解码器(BGD)进行特征融合。为了优化标记数据的使用,我们引入了一种最优代表选举机制(OREM)来识别未标记图像的关键序列,指导迭代学习和伪标签生成。为了减少伪标签中的噪声,我们结合了一个远程表示模块(LRM),利用了Mamba的背景建模。实验表明,仅使用10%的标记数据训练的SILNet优于目前的无监督和弱监督方法,其性能可与完全监督模型相媲美。