面向新闻领域的社会情感预测 随着互联网技术的快速发展,在线新闻已成为重要的网络信息载体,越来越多的人通过浏览新闻报道了解时事动态。在这一趋势下,已有许多在线新闻网站为用户提供情感投票功能,旨在收集用户在浏览新闻后对新闻报道中涉及的事件的感受和看法。利用用户的情感投票结果预测社会大众对社会热点事件的情感分布有重要的应用价值。本文通过对在线新闻网站用户(即新闻读者)情感投票结果进行观察和分析,总结出了读者情感投票结果有以下两个特点:其一是读者的情感往往和新闻报道中的社会热点事件相关,而不是和新闻报道中的某个具体的词相关,因此传统的基于词粒度的情感分析方法难以准确预测新闻文本的读者情感分布;其二是读者的各个情感之间并不是完全相互独立,各个情感之间存在着细腻而微妙的关系,而传统的单标记情感分类方法并未考虑情感之间的这种关系。基于此,本文利用带权情感主题模型对新闻报道的潜在主题和读者情感进行联合建模,利用多标记学习算法学习读者情感标记之间的关系,进行社会情感预测。本文的主要工作包括:(1)基于带权情感主题模型的社会情感预测:针对读者情感和社会事件相关联这一特点,提出带权情感主题模型,通过发掘新闻文本的潜在主题,将读者的情感标记与新闻文本的主题相关联,生成主题级情感词典。同时通过计算新闻文本的情感熵来评估训练样本权重,能够有效地降低噪音数据对情感预测结果的影响。在Sina News数据集上的实验结果表明,带权主题级情感词典社会情感预测准确率比词级情感词典有明显的提升;(2)基于多标记学习的社会情感预测:针对读者情感之间的相关性,本文将社会情感预测任务抽象成一个多标记学习问题,利用校准标记排序算法、RAk EL算法和分类器链算法等多标记学习算法学习情感标记之间的相关关系,并通过设计实验比较了各多标记学习算法在社会情感预测任务中的性能,实验结果表明利用情感标记之间的相关性能够有效提高社会情感预测的准确率;(3)基于社会情感预测的舆情分析系统:本文设计并实现了一个基于社会情感预测的舆情分析系统,该系统通过自动抓取互联网上最近的新闻报道,进行社会情感分析,并将分析结果通过网页的形式直观地展示给用户,可以帮助用户更好地把握事件发展趋势,及时做出正确决策。 本文来源:https://www.wddqw.com/doc/cb7b61e2b42acfc789eb172ded630b1c58ee9bce.html