基于主题模型的社会情感检测

时间:2022-04-17 14:29:19 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
基于主题模型的社会情感检测

随着社交网络的快速发展,越来越多的互联网用户不再局限于从网络上获取信息,而是更加乐于在网络上表达观点、交流情感。情感分析是指利用自然语言处理、文本分析、计算语言学系统地识别、提取、量化、研究情感状态和主观信息。情感分析被广泛应用于评论、调查结果、在线和社交媒体以及临床医学中。社会情感检测,作为情感分析下面的一个任务,主要任务是检测新闻触发的读者情感,大量的读者对于新闻的情感反映了公众的观点与态度,具有重要的现实意义。在现有的方法中,判别模型忽略了文章中隐含的主题信息并且只能得到一个分类结果,无法用来分析产生情感的原因。而生成模型(如主题模型)则通常做出词袋假设,忽略了单词的顺序,认为文档中每个单词的主题和情感是相互独立的,这种过度简化有利有弊。因此,本文针对使用主题模型进行社会情感检测进行研究,并且致力于摒弃词袋假设,考虑文档中单词的关系,本文的主要工作如下:1.考虑文档中句子结构以及相邻句子间关系并引入主题模型来进行社会情感检,我们提出了一种结合了隐马尔科夫模型和主题模型的主题-情感转移模型,TET模型(Topic-Emotion Transition Model)。该模型考虑了句子结构和相邻句子间主题和情感的转移,可以同时用于文档级别和句子级别的情感分析并且考虑了情感间的相关性。TET模型在文档级别和句子级别上的情感分析结果在两种评价指标上都高于当前最好方法。2.引入概念(concept)到主题模型并且同时对情感、事件类别、主题建模来进行社会情感检测。我们首先提出了一种基于依


存关系抽取的概念抽取方法,以及情感-事件类别发现模型,EECD模型(Emotion and Event Category Discovery Model)EECD模型中处理的基本单位是概念,概念包含了单词共现的信息,单词又能够联系起具有语义相关性的概念。EECD模型的基础上,通过词向量引入泛化波利亚球罐模型,进一步提出一种考虑概念语义关联的EECD-GPU模型。EECDEECD-GPU能够分析出文档的主题、情感和事件类别,能够分析出触发读者情感的事件类别,并且在新闻标题上的社会情感检测结果高于当前最好方法。论文共五章。第一章介绍了研究背景与意义,研究现状以及研究动机与目标。第二章介绍了用于情感分析的主题模型以及其他相关技术。第三章介绍了基于TET模型的社会情感检测方法与实验。第四章介绍了基于EECDEECD-GPU模型的社会情感检测方法与实验。第五章是对论文工作的总结以及未来工作的展望。




本文来源:https://www.wddqw.com/doc/2c79afcb0a4e767f5acfa1c7aa00b52acec79c43.html