首页  |  期刊简介  |  稿件审稿流程  |  学术道德规范  |  编委会  |  征订启事  |  联系我们  |  English
中文核心期刊
中国科技论文统计源期刊
国际刊号:1004-9037
国内刊号:32-1367/TN
用户登录
  E-mail:  
  密  码:  
  作者 审稿  
  编辑 读者  
期刊向导
联系方式
  • 主管:中国科学技术协会
  • 主办:南京航空航天大学
  •           中国电子学会
  • 国际刊号:1004-9037
  • 国内刊号:32-1367/TN
  • 地址:南京市御道街29号
  • 电话:025-84892742
  • 传真:025-84892742
  • E-mail:sjcj@nuaa.edu.cn
  • 邮编:210016
基于邻域的代价敏感特征选择
Cost-Sensitive Feature Selection Based on Neighbor
投稿时间:2016-06-07  最后修改时间:2016-06-21
DOI:
中文关键词:  代价敏感;特征选择;邻域;有监督学习
英文关键词:Cost-sensitive;Feature selection;Neighbor;Supervised learning
基金项目:
作者单位E-mail
余胜龙 闽南师范大学 fishslyu@163.com 
赵红 闽南师范大学 Hongzhaocn@163.com 
摘要点击次数: 25
全文下载次数: 
中文摘要:
      特征选择是机器学习和数据挖据中一个重要的预处理步骤。而类别不均衡数据的特征选择是机器学习和模式识别中的一个热点研究问题,现有大部分特征选择算法以误分率最小化为目标,并假设训练数据集类别是平衡的和误分类代价是相等的。在现实应用中,不同的误分类往往会产生不同的误分类代价。为了得到最小误分类代价下的特征子集,本文提出一种基于邻域的代价敏感特征选择算法。该算法的核心思想是把邻域引入现有的代价敏感特征选择框架。通过八个真实数据集的实验结果,表明了该算法的优越性。
英文摘要:
      Feature selection is an important preprocessing step in machine learning and data mining. Feature selection of class-imbalanced dataset is a hot topic of machine learning and pattern recognition. Most of the existing feature selection algorithms aim to minimize misclassification rate, and assume that the classes of training data set are balanced and misclassification costs are equal. However, in real applications, different misclassification always tend to produce different misclassification costs. To get the feature subset with minimum misclassification cost, we propose a supervised cost-sensitive feature selection algorithm based on neighbor by defining neighborhood matrix. The main idea of algorithm is that the neighborhood is introduced into the cost-sensitive feature selection framework. The experimental results on eight real-life data sets demonstrate the superiority of the proposed algorithm.
查看全文  查看/发表评论  下载PDF阅读器
关闭

Copyright @2010-2015《数据采集与处理》编辑部

地址:南京市御道街29号        邮编:210016

电话:025-84892742      传真:025-84892742       E-mail:sjcj@nuaa.edu.cn

您是本站第895000位访问者 本站今日一共被访问197

技术支持:北京勤云科技发展有限公司