融合表情符号的微博文本情感分析 微博作为一个综合性社交平台,因其多样性和实效性的特点受到大众的追捧,成为时下最流行的社交应用之一。微博中包含着大量的主观性文本。对微博数据进行情感分析,可以挖掘出公众对社会事件的态度、用户对产品的评价等信息,对舆情监管与预警、产品调研等应用都有重要意义。微博整体的情感极性由微博文本和表情符共同决定。但是目前大多数针对微博情感分析的研究对表情符并不重视。然而表情符号与微博情感倾向关系密切。因此,为了更加客观准确地判断微博的情感倾向,本文结合微博中表情符号的特点,进行微博情感分析,研究内容主要包括以下三个方面:(1)构建微博语料:对微博进行情感分析,需要大量的领域针对性强的微博语料和大量的人工文本标注工作。目前并不存在适合本文研究的含大量表情符且有标注的微博语料。因此,本文有针对性的构建了一个微博语料库,语料中包含有大量的表情符号。同时提出了一种融合表情符号和情感词的自动标注方式来减轻人工标注的工作量。(2)研究表情符向量化算法:如果要将表情符作为微博情感分析的考虑因素之一,就需要将表情符号进行特征提取。因此本文提出表情符向量化算法,首先定义表情符向量和描述向量,并对这两个向量的相似性建模,然后利用梯度下降算法确定表情符的向量形式。该算法能够保留表情符的语义信息,同时使表情符与词汇一样,能够应用到自然语言处理的各个领域中。(3)融合表情符的微博情感分析:卷积神经网络的网络结构决定了其能够抽取出微博文本和表情符号深层的语义信息。因此本文利用卷积神经网络的分类模型,以表情符向量和词向量为基础,训练情感分类器并进行微博情感分析。实验结果表明,相对于忽略表情符的纯文本情感分析,本文研究的在微博文本中融入表情符信息的微博情感分析能够提高微博情感分类的精度。 本文来源:https://www.wddqw.com/doc/3b68e6b724c52cc58bd63186bceb19e8b8f6eca5.html