MFFN: Multi-view Feature Fusion Network for Camouflaged Object Detection 论文阅读

date
Jan 17, 2023
Last edited time
Mar 27, 2023 08:37 AM
status
Published
slug
MFFN论文阅读
tags
DL
CV
summary
type
Post
Field
Plat

Abstract

  • 动机
    • single-view 方法容易受到背景的干扰
notion image
  • 方法
      1. 通过数据增强,生成多视角的输入
      1. 充分融合增强数据的特征
      1. 挖掘不同视角数据之间的相关性

Method

数据增强

notion image
对输入的图像进行增强, 方式包括如下
  1. 调整视觉距离(缩放图片大小)
  1. 调整角度(对称旋转)
得到 2组翻转+原图+2组resize 共5个视图.
notion image

Co-attention of Multi-view(CAMV)

CAMV 由一个两阶段注意机制组成,用不同视角的特征补充边界信息,并增强不同视角的语义信息。 CAMV通过多视图交互和融合减少了冗余的网络设计。
notion image
在 In-attention 中, 使用 Tucker 分解得到特征图的分解 ,我们可以通过相同的操作处理融合后基于距离的视图的特征张量 与基于视角的特征张量 。通过这两个并行的内部注意(In-att)特征融合模块,我们可以从不同角度和距离增强特征图的语义信息。
在 Out-attention 中,融合 得到 CAMV 模块的最终输出。
CAMV 聚合了来自不同视图的特征图,并将辅助边界信息集成到包含距离视图的主分支中。因此,我们会将语义增强且更紧凑的特征图传输到下一个处理单元。

Channel Fusion Unit(CFU)

CFU 模块的输入是来自 CAMV 的集成特征图 ,通过融合来自不同视图的特征而获得的嵌入
notion image

Loss Function

  1. Binary cross entropy loss (BECL)
  1. Uncertainty perceived loss (UAL)

Experiments

notion image

Ablation Study

notion image
notion image
 

© Lazurite 2021 - 2024