基于节点度中心性的无监督特征选择
作者:
作者单位:

山西大学大数据科学与产业研究院, 太原, 030006

作者简介:

通讯作者:

基金项目:

国家自然科学基金 61672332,61432011,U1435212国家自然科学基金(61672332,61432011,U1435212)资助项目。


Degree-Centrality Based Feature Selection
Author:
Affiliation:

Institute of Big Data Science and Industry, Shanxi University, Taiyuan, 030006, China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    特征选择方法可以从成千上万个特征中选择合适的少量特征,使模型更加有效、高效。本文考虑到真实场景下高维数据集中特征之间互相关联以及使用复杂网络结构描述特征空间的全局性与合理性,提出无监督场景下的基于复杂网络节点度中心性的特征选择方法。根据特征间的相关性大小,设定阈值选择保留符合要求的关联;再利用保留的关联生成以特征为节点的无向无权重网络结构;最后以衡量节点度中心性的方法筛选此网络中影响力最大的节点集,亦即最优特征子集。本文方法为处理特征重要性及特征冗余增加了灵活性。采用对比实验,将本文方法与常用特征选择或特征提取方法在多个高维数据集上进行性能比较。实验分析结果表明此方法的有效性以及普适性。

    Abstract:

    Feature selection by picking a small size of important features out of the feature space facilitates learning algorithms to perform more accurately and more efficiently on the datasets. Considering the universal existence of relevance between features in real datasets, this paper proposes an unsupervised feature selection framework in which the feature correlating to each other form a network structure and the importance of each of them is measured by degree centrality index of a complex network. The bigger the degree centrality of a feature in this network, the higher the rank of its importance. At the end we select a given number of features with the highest ranks. This framework allows more flexibility on handling feature importance and feature redundancy. Later the proposed method will be compared to classical selection/extraction techniques on six high?dimensional datasets. Experiments demonstrate the advantages of our model on both continuous and discrete datasets.

    参考文献
    相似文献
    引证文献
引用本文

闫泓任,马国帅,钱宇华.基于节点度中心性的无监督特征选择[J].数据采集与处理,2019,34(2):312-321

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2018-12-10
  • 最后修改日期:2019-02-10
  • 录用日期:
  • 在线发布日期: 2019-04-22