时序基因表达缺失值的加权双向回归估计算法
DOI:
作者:
作者单位:

北京工业大学,北京工业大学,北京工业大学

作者简介:

通讯作者:

基金项目:

北京市教育委员会科技计划项目(JC002011200903);水体污染控制与治理重大专项—南水北调中线总干渠水质安全保障关键技术与工程示范(2009ZX07212-003)


Weighted Double Regression Estimation for Missing Values in time series Gene Expression Data
Author:
Affiliation:

BeiJing university of technology,,BeiJing university of technology

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    由于实验条件等客观原因,实验所得到的基因表达谱数据存在数据缺失的现象,不利于数据的后续使用。如何在不丢失数据信息、不影响数据整体使用的情况下,对实验数据进行估计、填充已成为目前生物信息学研究的热点问题。本文通过利用核加权函数提取与缺失值所在的行列具有最大相似性的行列信息,提出了基于双向核加权回归估计的算法。在回归过程中同时考虑基因表达的空间相关性和时间相关性信息,使回归算法使用的信息更加充分。通过与其他缺失值估计算法相比较,加权双向回归算法的估计结果比较好。

    Abstract:

    Because of the limited of experimental condition, there are missing values in gene expression data which make against to following use. Estimating missing values without destroying other data and information lost has becoming an important work of bio-information . By weighted kernel function,similar coefficient between those rows and columns the miss values in and other rows and columns is presented. In this paper an estimation method based on double weighted regression using weighted kernel function is introduced. It makes the information data more abundant by considering gene space correlation and time correlation in regression. Comparing with other methods, weighted double regression method can get better performance.

    参考文献
    相似文献
    引证文献
引用本文

李建更,郭庆雷,贺益恒.时序基因表达缺失值的加权双向回归估计算法[J].数据采集与处理,2013,28(2):136-

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2011-11-23
  • 最后修改日期:2012-05-30
  • 录用日期:2012-06-08
  • 在线发布日期: 2013-04-25