登录    注册    忘记密码

详细信息

基于网络评论的情感分类模型研究    

文献类型:学位论文

中文题名:基于网络评论的情感分类模型研究

作者:李曼曼[1];

第一作者:李曼曼

机构:[1]河南财经政法大学;

第一机构:河南财经政法大学

导师:景丽;河南财经政法大学

授予学位:硕士

语种:中文

中文关键词:评论文本;情感分类;词向量;情感词典;机器学习

摘要:网络高度发达的今天,越来越多的社交网络和电商平台渗透到了生活的方方面面。人们不仅仅是网络信息的接受者,也是信息的生产者,众多用户发表的网络评论蕴藏着巨大价值。对网络评论进行情感分析,政府部门可以及时获悉群众对某个重大事件的舆论趋势,用户可以了解某产品的特性,商家也可以获知用户的需求,了解产品的不足,及时调整营销策略。现有情感分类方法主要有情感词典方法和机器学习方法。情感词典方法过于依赖词典中的情感词,情感词典越完备,网络评论情感倾向越显著,分类效果越好,而对情感倾向不易区分的评论分类效果欠佳。机器学习方法是一种有监督的方法,其分类效果依赖于大量事先标注过的语料,目前语料标注是通过人工完成,工作量极大。针对上述问题,综合情感词典和机器学习两种方法的特点构建了一个网络评论情感分类模型,利用相关领域网络评论对情感词典进行扩充,基于情感词典方法的分类结果,通过自监督学习训练一个分类器,进而提高情感倾向模糊文本的分类正确率。主要研究内容如下:(1)基于情感词典方法研究。在已有情感词典的基础上扩充情感词典,依靠词典和规则计算情感值,根据情感值进行分类。实验发现,词典越完备,情感值绝对值越高,正确率也越高,而且对消极评论的情感分类效果较好。(2)基于机器学习方法研究。对网络评论使用word2vec进行向量化表达,再使用PCA算法降维,作为机器学习分类算法的输入。实验表明,机器学习分类方法中支持向量机分类效果较好,同时还发现机器学习方法对积极评论的判定正确率比消极评论的判定正确率要高。(3)融合情感词典和机器学习的分类模型。使用情感词典计算网络评论的情感值,根据情感值得到情感明显的确定集和情感模糊的不确定集,确定集作为机器学习训练语料,不确定集作为待分类语料,确定集的分类结果以词典分类结果为准,不确定集的分类结果结合两种方法进行修正。经实验验证,与传统的情感词典和机器学习方法相比,该模型的正确率在三个数据集上都是最高的。

参考文献:

正在载入数据...

版权所有©河南财经政法大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心