Shifting More Attention to Video Salient Object Detection 学习笔记突出/显眼目标的识别广泛用于机器视觉,自动驾驶等领域,研究表明,人的眼睛对于显眼和不显眼的目标的识别的方式有着显著的不同 但是由于各类原因,vsod的领域面临着很多挑战,所以,针对这些,这篇文章主要探讨了两个方面,一是提出了基于人眼动态识别这种机制的数据集,尤其要注意的是,以前的vsod很多都是从静
突出/显眼目标的识别广泛用于机器视觉,自动驾驶等领域,研究表明,人的眼睛对于显眼和不显眼的目标的识别的方式有着显著的不同
但是由于各类原因,vsod的领域面临着很多挑战,所以,针对这些,这篇文章主要探讨了两个方面,一是提出了基于人眼动态识别这种机制的数据集,尤其要注意的是,以前的vsod很多都是从静态帧出发,从而分割对象的,但是这样明显不能区分谁是“最显眼的”,所以,这篇文章先提出了数据集,然后提出了一种SSAV方法,这种方法基于convlstm,可以动态地表现人眼的注意力机制。
CONVLSTM是基于RNN(记忆神经网络)的一种结构
https://www.jianshu.com/p/5e5d821b3844
https://blog.csdn.net/gzj_1101/article/details/79376798#title_LSTM%20date_20180210_104921%20tags%20categories__1
这个ssav算法一共分为两个部分:
1. 金字塔卷积模块,用于增强鲁棒性 PDC
2. ssLVSM,就是在LVSM基础上增加了一个注意力转移机制
对于这个产生的数据集: 1.
SFLR [8], S
GSP [52], and STBP [81] are the top 3 non-deep learning
models for VSOD.”
也就是SFLR,SGSP,STBD这些基于光流法的方法是非机器学习方法中效果最好的,但是他们的时间成本同样惊人。
Traditional vs Deep VSOD Models. In Table 4, almost
all of the deep models outperform traditional algorithms,
as more powerful saliency representations can be extract
ed from networks. Another interesting fifinding is the clas
sic leading method (SFLR [8]) performs better than some
deep models (e.g., SCOM [11]) on MCL, UVSD, ViSal, and
DAVSOD datasets. It indicates that investigating more ef
fective deep learning architectures with the exploit of hu
man prior knowledge for VSOD is a promising direction.
Dataset Analysis. We mark the scores with gray color in
Table 4. Darker colors mean better performance for specifific
metrics (e.g., max F, S, and M). We fifind that ViSal and
UVSD datasets are relatively easy, since the top 2 models:
SSAV and PDBM [67] gained very high performance (e.g.,
S > 0.9). However, for more challenging datasets like
DAVSOD, the performance of VOSD models decrease dra
matically (S < 0.73). It reveals that both the overall and
individual performance of VOSD models leave abundant
room for future research.
我们发现,对于VOSD来说,大多数深度学习方法做的比光流法好的多,但是光流法仍然可以做到超越许多深度学习方法,尤其是SFLR方法,说明深度学习仍然有很大的提升空间
同时也发现,随着数据难度的增加,深度学习方法精确度下降的很快
未来的研究目标:
明显目标与implicit非明显目标的识别,对于非明显目标的识别,VSOD的精确性值得研究
SSLSTM的效率问题,加上注意力转移机制之后,在一些复杂的数据集上效率不如之前
对于明显目标的转移问题,如果视频中的目标随着时间,明显目标发生了变化会怎样
今天的文章Shifting More Attention to Video Salient Object Detection 学习笔记 分享到此就结束了,感谢您的阅读,如果确实帮到您,您可以动动手指转发给其他人。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。 如需转载请保留出处:http://bianchenghao.cn/45090.html