首页  |  期刊简介  |  稿件审稿流程  |  学术道德规范  |  编委会  |  征订启事  |  联系我们  |  English
中文核心期刊
中国科技论文统计源期刊
国际刊号:1004-9037
国内刊号:32-1367/TN
用户登录
  E-mail:  
  密  码:  
  作者 审稿  
  编辑 读者  
期刊向导
联系方式
  • 主管:中国科学技术协会
  • 主办:南京航空航天大学
  •           中国电子学会
  • 国际刊号:1004-9037
  • 国内刊号:32-1367/TN
  • 地址:南京市御道街29号
  • 电话:025-84892742
  • 传真:025-84892742
  • E-mail:sjcj@nuaa.edu.cn
  • 邮编:210016
赵斌,吉根林,徐伟,顾彦慧.基于拓扑结构的微博话题摘要生成算法[J].数据采集与处理,2014,29(5):720-729
基于拓扑结构的微博话题摘要生成算法
Microblog Topic Summarization Based on Topology Structures
  
DOI:
中文关键词:  微博;话题摘要;拓扑结构;转发;可视化
英文关键词:microblog; topic summarization; topology structure; retweeting; visualization
基金项目:
作者单位
赵斌,吉根林,徐伟,顾彦慧 南京师范大学计算机科学与技术学院,南京师范大学计算机科学与技术学院,南京师范大学计算机科学与技术学院,南京师范大学计算机科学与技术学院 
摘要点击次数: 575
全文下载次数: 2060
中文摘要:
      话题摘要是自然语言处理中对文本进行内容归纳和概要生成的技术。传统的话题摘要研究主要针对新闻、Web网页和博客这样的长文本,本文研究微博短文本的话题摘要问题。本文以微博转发消息为对象,提出具有拓扑结构的微博话题摘要生成算法(Microblog topic summarization,MTS)。首先通过微博转发上下文确定代表性词项;然后识别微博转发中的话题区域,从广度和深度两个方向对话题进行归并操作;最后,基于转发关系生成具有拓扑结构的微博话题摘要。本文实验采用真实的微博事件数据集验证MTS算法的有效性和可行性,并采用可视化方式展现微博话题摘要的结果。
英文摘要:
      Topic summarization is a natural language processing for creating summaries of topic information. Previous work focused on summaries of news, web documents and blogs, while seldom on microblog topic summaries. A microblog topic summarization (MTS) method is proposedbased on topology structures for microblog retweets. First, representative terms are selected according to structural relationships between retweeting tweets. Second, topic areas are identified after topic nodes are merged by using depth-first and breath-frist methods. Third, topic-oriented summaries with topology structure are generated through measuring adjacent topic nodes on the retweeting graph. Finally, experiments on the real world event datasets show the effectiveness of the proposed methods. Visual topic summary trees are also produced for remarkably emphasizing the insight behind the evolving topics.
查看全文  查看/发表评论  下载PDF阅读器
关闭

Copyright @2010-2015《数据采集与处理》编辑部

地址:南京市御道街29号        邮编:210016

电话:025-84892742      传真:025-84892742       E-mail:sjcj@nuaa.edu.cn

您是本站第894991位访问者 本站今日一共被访问192

技术支持:北京勤云科技发展有限公司