MFFN: Multi-view Feature Fusion Network for Camouflaged Object Detection 论文阅读
date
Jan 17, 2023
Last edited time
Mar 27, 2023 08:37 AM
status
Published
slug
MFFN论文阅读
tags
DL
CV
summary
type
Post
Field
Plat
AbstractMethod数据增强Co-attention of Multi-view(CAMV)Channel Fusion Unit(CFU)Loss FunctionExperimentsAblation Study
Abstract
- 动机
single-view 方法容易受到背景的干扰
- 方法
- 通过数据增强,生成多视角的输入
- 充分融合增强数据的特征
- 挖掘不同视角数据之间的相关性
Method
数据增强
对输入的图像进行增强, 方式包括如下
- 调整视觉距离(缩放图片大小)
- 调整角度(对称旋转)
得到 2组翻转+原图+2组resize 共5个视图.
Co-attention of Multi-view(CAMV)
CAMV 由一个两阶段注意机制组成,用不同视角的特征补充边界信息,并增强不同视角的语义信息。 CAMV通过多视图交互和融合减少了冗余的网络设计。
在 In-attention 中, 使用 Tucker 分解得到特征图的分解 ,我们可以通过相同的操作处理融合后基于距离的视图的特征张量 与基于视角的特征张量 。通过这两个并行的内部注意(In-att)特征融合模块,我们可以从不同角度和距离增强特征图的语义信息。
在 Out-attention 中,融合 和 得到 CAMV 模块的最终输出。
CAMV 聚合了来自不同视图的特征图,并将辅助边界信息集成到包含距离视图的主分支中。因此,我们会将语义增强且更紧凑的特征图传输到下一个处理单元。
Channel Fusion Unit(CFU)
CFU 模块的输入是来自 CAMV 的集成特征图 ,通过融合来自不同视图的特征而获得的嵌入
Loss Function
- Binary cross entropy loss (BECL)
- Uncertainty perceived loss (UAL)