基于样本邻域保持的代价敏感特征选择
作者:
作者单位:

作者简介:

余胜龙(1992-),男,硕士研究生,研究方向:机器学习、数据挖掘,E-mail:Fishslyu@163.com;赵红(1979-),女,副教授,研究方向:粒计算、代价敏感学习、分层分类学习,E-mail:Hongzhaocn@163.com

通讯作者:

基金项目:

国家自然科学基金(61703196)资助项目;福建省教育厅科技项目(JAT160305)资助项目。


Cost-Sensitive Feature Selection Based on Sample Neighborhood Preserving
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    特征选择是机器学习和数据挖据中一个重要的预处理步骤,而类别不均衡数据的特征选择是机器学习和模式识别中的一个热点研究问题。多数传统的特征选择分类算法追求高精度,并假设数据没有误分类代价或者有同样的代价。在现实应用中,不同的误分类往往会产生不同的误分类代价。为了得到最小误分类代价下的特征子集,本文提出一种基于样本邻域保持的代价敏感特征选择算法。该算法的核心思想是把样本邻域引入现有的代价敏感特征选择框架。在8个真实数据集上的实验结果表明了该算法的优越性。

    Abstract:

    Feature selection is an important preprocessing step in machine learning and data mining. Feature selection of class-imbalanced dataset is a hot topic of machine learning and pattern recognition. Most traditional feature selection classification algorithms pursue high precision, and assume that the data have no misclassification costs or have the same costs. However, in real applications, different misclassifications always tend to produce different misclassification costs. To get the feature subset with minimum misclassification cost, a supervised cost-sensitive feature selection algorithm based on sample neighborhood preserving is proposed, whose main idea is to introduce the sample neighborhood into the cost-sensitive feature selection framework. The experimental results on eight real-life data sets demonstrate the superiority of the proposed algorithm.

    参考文献
    相似文献
    引证文献
引用本文

余胜龙, 赵红.基于样本邻域保持的代价敏感特征选择[J].数据采集与处理,2018,33(2):317-322

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2016-06-07
  • 最后修改日期:2016-06-29
  • 录用日期:
  • 在线发布日期: 2018-07-09