基于Attention的弱监督多标号图像分类
作者:
作者单位:

作者简介:

张文(1992-),男,硕士,研究方向:计算机视觉、深度学习,E-mail:w.zhang@nuaa.edu.cn;谭晓阳(1971-),男,教授,博士生导师,研究方向:人脸识别、机器学习、模式识别、计算机视觉。

通讯作者:

基金项目:

中央高校基本科研业务费专项资金(NP2017108)资助项目。


Weakly-Supervised Multi-label-Classification-Based Attention Mechanism
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    深度学习依赖于大数据在很多的任务中取得巨大成功,但目前大部分方法都依赖于严格标注的数据,或者假定仅含一个物体大致位于图片近中心位置且背景较少。而现实场景中背景复杂,出现的物体多样,增加了分类的难度,而且标注的代价很大。本文关注于弱监督场景下的分类任务,提出了基于注意力机制(Attention)结合递归神经网络的深度模型,利用图片级的标注进行多标号学习,利用损失函数进行梯度下降训练自动调整关注区域,使模型每次关注图片的局域区域,并在数据集PASCAL VOC 2007/2012上验证算法的有效性,与其他方法相比具有更强的可解释性。

    Abstract:

    Deep learning has become new state-of-the-art framework in many task in big data circumstance.Most of methods need full annotated data or assume only an object in the image with simple background.However,complex background,more than one object in the image and expensive full annotation in the reality,object recognition becomes more challenging.Here,we propose a deep-model-based attention mechanism and recurrent neural network.It trains the network end-to-end on multi-label data with image-level label.The glimpses change along with stochastic gradient descent and focus on different local region in every step.Finally,the effectiveness of the proposed algorithm is verified on the PASCAL VOC 2007 and 2012 datasets.Results show that the network is easily interpretable than other methods.

    参考文献
    相似文献
    引证文献
引用本文

张文, 谭晓阳.基于Attention的弱监督多标号图像分类[J].数据采集与处理,2018,33(5):801-808

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2017-06-12
  • 最后修改日期:2018-01-23
  • 录用日期:
  • 在线发布日期: 2018-10-29