基于字句动态特征和自注意力的情感分析方法
作者:
作者单位:

1.南京邮电大学计算机学院,南京 210023;2.南京邮电大学高性能计算与大数据处理研究所,南京 210023

作者简介:

通讯作者:

基金项目:

国家重点研发计划专项(2018AAA0103300,2018AAA0103302);江苏省自然科学及高校自然科学重大项目(BK20170900,20KJA520001);江苏省创新创业人才项目及江苏博士后基金(2019K024);江苏省六大人才高峰项目(JY02);江苏省博士后研究实践创新项目(KYCX19_0921,KYCX19_0906);之江实验室开放项目(2021KF0AB05);教育部人文社会科学基金青年项目(20YJC880104);南京邮电大学人才启动基金(NY219132)。


Emotional Analysis Approach Based on Dynamic Word-Sentence Features and Self-attention
Author:
Affiliation:

1.School of Computer Science, Nanjing University of Posts and Telecommunications, Nanjing 210023, China;2.Institute of High Performance Computing and Big Data Processing, Nanjing University of Posts and Telecommunications, Nanjing 210023, China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    针对评论情感分析任务中文本长度失衡引起的特征稀疏、特征缺失和提取信息不全等问题,提出了一种基于字句动态特征和自注意力的情感分析方法。首先基于预训练模型对评论进行动态特征编码,使用句向量对不足固定长度的部分进行补全,并表征超出的截断部分,以缓解批训练下文本尺寸失衡引起的特征稀疏和特征缺失问题。然后使用基于自注意力机制的特征重组方法动态整合字句融合特征,并优化权重参数以降低计算和训练时间复杂度。最后在开源数据集上分别进行了消融实验和对比实验。测试结果表明,本文方法在准确率上有较优的改进效果。

    Abstract:

    Traditional models suffer from feature sparsity, feature loss and incomplete comment feature extraction problems due to the imbalance of comment length. This paper proposes an emotional analysis approach based on dynamic word-sentence features and self-attention (DWSF-SA), to alleviate the incomplete extraction problem caused by the imbalance of text size under batch training. DWSF-SA first follows pre-training on dynamic feature embedding, then employs sentence vectors to complete the less parts and represents the truncated parts by fixed length. Moreover, DWSF-SA also introduces a self-attention mechanism to dynamically integrate the word-sentence fusion features, and makes optimization on the weight parameters to accelerate the computation and training. The ablation and comparison experiments on publicly available datasets demonstrate that the proposed DWSF-SA outperforms traditional approaches in accuracy metrics.

    参考文献
    相似文献
    引证文献
引用本文

刘强,朱金森,赵龙龙,沙宇晨,刘尚东,季一木.基于字句动态特征和自注意力的情感分析方法[J].数据采集与处理,2024,(1):193-203

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2023-01-31
  • 最后修改日期:2023-07-13
  • 录用日期:
  • 在线发布日期: 2024-01-25