近日,计算机科学与技术学院2024级电子信息专业研究生王芳艳以第一作者在(中科院二区,影响因子: 5.5)上发表研究论文,论文题目为《More Observation Leads to More Clarity:Multi-view Collaboration Network for Camouflaged Object Detection》。论文是在我校焦铬教授的指导下完成,衡阳师范学院为第一署名单位。
该论文的核心理论是:伪装对象检测(COD)方法通常依赖于单视图特征感知,由于背景杂波、光照变化和视点变化等环境干扰,难以完全捕获伪装对象。为了解决这个问题,我们提出了多视图协作网络(MCNet),灵感来自人类复杂场景分析的视觉策略。MCNet结合了多个视角来增强特征提取。全局感知模块采用原始视图、远视图和近视图,使用不同的大核卷积和多头注意机制进行全局特征嵌入。同时,局部感知模块处理倾斜、投影和颜色抖动的视图,通过多分支深度卷积和扩展卷积提取细粒度的局部特征。为了促进全局和局部特征之间的深度交互,我们引入了混合交互模块,该模块利用空间和通道注意力自适应融合特征。在特征解码方面,动态金字塔收缩模块将动态门控卷积与金字塔收缩机制相结合,通过分层收缩策略和群体融合策略逐步聚合语义特征。在常用COD基准数据集上的实验结果表明,MCNet优于18种最先进的方法。