基于矩阵分解的社会媒体文本个性化情感分析技术研究 社会媒体作为一种新的在线交互平台,极大地改变了人们的沟通、交流和思维方式,同时促进了用户生成信息的爆炸式增长。用户生成的大量社会媒体文本,近年来已经成为大数据最具代表性的数据来源之一,挖掘与分析这些用户生成信息对于社会发展影响深远。社会媒体文本情感分析作为一种对带有情感色彩的主观文本进行分析、处理、归纳和推理的信息处理技术,近些年来得到学术界和工业界的广泛关注,并在互联网的诸多领域中均具有广泛的应用。传统的文本情感分析研究工作主要专注于从文本中分析情感,却忽略了用户在情感表达时的个性化差异,从而影响了分析结果的质量。针对上述问题,本文研究社会媒体文本的个性化情感分析问题。考虑矩阵分解技术在社会媒体处理中的广泛应用,提出多种基于矩阵分解技术的模型,解决社会媒体文本个性化情感分析研究中可能存在的挑战。具体地,本文的主要研究工作及创新点如下:(1)针对文本情感分析研究一直缺乏可靠、大规模的细粒度情感词典(或情绪词典)的问题,提出一种基于联合非负矩阵分解的方法,它可以从新闻语料构建细粒度的情感词典并将其用于文本情感分析任务。在众包标注的多标签新闻语料的基础上,该方法同时将“文档—词语”矩阵及“文档—标签”矩阵分解为话题相关子矩阵;随后通过子矩阵的组合语义法来生成细粒度情感词典。本文将不同方法生成的细粒度情感词典用在情感分析任务中,结果表明所提出的词典构建方法的有效性;此外,通过与现有最先进的细粒度情感词典进行比较,表明本文构建的词典具有更高的质量和更好的实用性;(2)针对用户在文本情感表达上的个性化差异,提出一种基于隐语义模型的微博个性化情感分类方法。在隐语义模型的基础上,提出将文本在词语级分解来解决个人数据稀疏性的问题;为了增强用户个性化偏好的捕捉,进一步引入用户间的关注关系来嵌入相似的兴趣偏好;为了对文本语义进行细粒度建模,通过词语间的句法依存关系来引入语法单元特征,从而更准确地从微博文本中获得用户的个性化情感。在真实的中文微博和英文推特数据集上的实验结果表明本文所提出的个性化情感分析模型比传统的情感分析模型更能有效地捕捉用户的个性化影响;(3)针对个性化的文本情感分析中的“冷启动”问题,考虑评论中的用户和产品信息并提出文本驱动的隐语义模型来对产品评论进行情感分析;为了解决“冷启动”用户和“冷启动”产品问题,提出成对评分对比优化策略PRC,从评论数据中挖掘评分间的对比信息用于增强用户和产品的特征参数学习,并实现评论文本个性化情感分析性能整体提升。在三个公开的点评数据集上的实验结果表明本文所提出的文本驱动隐语义模型在情感分析质量和学习效率上都要明显好于最先进的神经网络方法;(4)针对用户和产品对文档语义的全局影响问题,基于矩阵分解和深度神经网络的各自优势提出一种深度矩阵分解模型。首先,通过多层的感知器组件来捕捉用户—产品交互的高层表示;其次,通过卷积神经网络组件来捕捉评论文本中各种粒度的局部语义;最终,通过泛化的矩阵分解组件来融合交互表示和文本表示,进而对评论文本进行个性化情感分析。在三个公开的点评数据集上的实验结果表明本文所提出的方法比传统情感分析方法和 本文来源:https://www.wddqw.com/doc/3a5af74859f5f61fb7360b4c2e3f5727a4e9246e.html