多示例学习的示例层次覆盖算法
作者:
作者单位:

作者简介:

董露露(1991-),女,讲师,研究方向:数据挖掘、机器学习等,E-mail:851601547@qq.com;谢飞(1980-),男,博士,副教授,研究方向:人工智能、数据挖掘及文本处理;章程(1982-),男,博士,讲师,研究方向:软件工程和数据挖掘

通讯作者:

基金项目:

国家自然科学基金(61503116)资助项目;安徽省教育厅自然科学基金重点(KJ2014A081)资助项目;安徽省级优秀青年基金重点(2013SQRL097ZD)资助项目;安徽省自然科学基金(1408085QF108)资助项目。


Multi-instance Learning with Instance-Level Covering Algorithm
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    在多示例学习(Multi-instance learning,MIL)中,核心示例对于包类别的预测具有重要作用。若两个示例周围分布不同数量的同类示例,则这两个示例的代表程度不同。为了从包中选出最具有代表性的示例组成核心示例集,提高分类精度,本文提出多示例学习的示例层次覆盖算法(Multi-instance learning with instance_level covering algorithm,MILICA)。该算法首先利用最大Hausdorff距离和覆盖算法构建初始核心示例集,然后通过覆盖算法和反验证获得最终的核心示例集和各覆盖包含的示例数,最后使用相似函数将包转为单示例。在两类数据集和多类图像数据集上的实验证明,MILICA算法具有较好的分类性能。

    Abstract:

    In multi-instance learning, the core instances play an important role on the prediction of bags' label. And if two instances have different numbers of instances with the same category around them, they have different levels of representative. In order to improve the classification accuracy, multi-instance learning with instance-level covering algorithm (MILICA) is proposed by which we could select the most representative instances to form the core instance set. Firstly, with the max Hausdorffdistance and the covering algorithm, the initial core instance set is constructed. Then, the final core instance set and the number of instances in a cover are obtained. Finally, a similarity measure function is used to convert a bag into a single sample for classification. Experimental results on two-category datasets and multi-category image datasets demonstrate that the proposed MILICA method has perfect classification capability.

    参考文献
    相似文献
    引证文献
引用本文

董露露, 谢飞, 章程.多示例学习的示例层次覆盖算法[J].数据采集与处理,2018,33(2):359-369

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2017-03-30
  • 最后修改日期:2017-10-30
  • 录用日期:
  • 在线发布日期: 2018-07-09