基于标签传递的异常检测算法研究
作者:
作者单位:

北京交通大学信息科学研究所, 北京, 100044

作者简介:

通讯作者:

基金项目:

国家自然科学基金 61532005, 61572068国家自然科学基金(61532005, 61572068)资助项目。


Outlier Detection Based on Label Propagation
Author:
Affiliation:

Institute of Information Science, Beijing Jiaotong University, Beijing, 100044, China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    异常检测旨在检测出观测数据中的非正常值,被广泛应用于反信用卡欺诈、网络入侵检测、医疗分析以及气象预报等领域。在异常检测中,正常数据通常具有异常数据所不具备的某种内蕴结构。因此,如何有效地利用正常数据与异常数据在数据结构上的差异性将有助于提高异常检测性能。为此,本文提出了一种新颖的基于标签传递的异常检测算法。该算法通过图模型刻画正常数据所具有的内蕴结构,并通过多重标签传递来构建未标记正例样本与待测试样本的标签置信度的差异。最后,基于正例样本的标签置信度的统计特性分析,实现对测试样本的异常性判决。在人工合成及真实数据集上的实验验证了本文算法的有效性。

    Abstract:

    Outlier detection aims at detecting abnormal values from observational data, which has been used in various files. In outlier detection, normal data are generally embedded in some kind of intrinsic structure that is not suitable for characterizing outliers. Hence, how to effectively utilize the difference in structure between normal data and outliers will contribute to the identification of outlier. Then, a novel label propagation-based outlier detection algorithm is proposed in this paper. To characterize the above intrinsic structure, the graph model is adopted for implementing multiple label propagations. Thus, the difference in structure between normal data and outliers will be identical to the difference of label confidence between them. Furthermore, the statistical characteristic of the label confidences associated to those normal data is explored to give the final ensemble decision on the abnormity of the input test data. The experimental results have validated the effectiveness of the proposed method.

    参考文献
    相似文献
    引证文献
引用本文

赵曼,赵耀,朱振峰.基于标签传递的异常检测算法研究[J].数据采集与处理,2019,34(2):331-340

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2017-12-02
  • 最后修改日期:2017-12-26
  • 录用日期:
  • 在线发布日期: 2019-04-22