详细信息
结合拓扑势的图模型单文档摘要方法研究
文献类型:学位论文
中文题名:结合拓扑势的图模型单文档摘要方法研究
作者:张军娣[1];
第一作者:张军娣
机构:[1]河南财经政法大学;
第一机构:河南财经政法大学
导师:景丽;河南财经政法大学
授予学位:硕士
语种:中文
中文关键词:BERT;图模型;拓扑势;抽取式摘要
摘要:随着网络的发展,我们每天接触到的文本数据也在呈爆炸式增长,海量数据增加了获取关键信息的难度。自动文本摘要可以缓解这一难题,优化文本摘要的质量以及提高文本摘要的准确度也成了自然语言处理领域的研究热点,研究者们在力求通过各种办法从大量文本数据中获取关键信息,节省阅读者的时间和精力。目前基于Text Rank算法的文本摘要仅考虑了节点之间的相似性,忽略了句子的重要性等信息,影响提取文本摘要的质量。本文在现有研究基础上提出了一种结合拓扑势的图模型单文档摘要方法,该方法综合考虑句子重要度和相似度,优化Text Rank算法中图模型的边权关系。本文的主要工作是将拓扑势和相似度融合,以拓扑势来衡量句子的重要性,对比引入拓扑势前后所提取文本摘要的质量。首先选用Bert模型对文本信息进行向量表征,Bert模型采用动态提取向量方式,可根据上下文获得更多更深层次的语义信息,使得到的文本向量表征更灵活。其次引入拓扑势思想,将余弦相似度和词移距离两种相似度度量方式分别和拓扑势相融合,以此来计算拓扑势值,通过拓扑势值的大小来衡量句子的重要性程度,综合考虑句子的相似度和重要性,进一步优化边权结构。最后采用Text Rank算法计算句子得分并对句子进行排序,排名靠前的若干句子作为摘要输出。实验在两个公用数据集TTNews和CNews上进行,结果表明利用本文方法生成的摘要质量,rouge-1、rouge-2、rouge-L这三个评价指标均取得较好改善。
参考文献:
正在载入数据...