基于NLP 的商品在线评论研究

时间:2022-04-18 07:01:27 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
基于NLP 的商品在线评论研究

作者:王宝楠

来源:《中国新通信》 2020年第17



王宝楠 大连理工大学盘锦校区生命科学药学学院

【摘要】 本文旨在通过对数据集的分析,建立相关的评价模型,为产品的销售策略提供指导。我们利用NLP将文本评论转换为可比较的数据,评论情感得分。它规范了评论数据的情感评分,有用的评级和星级评级,以促进统计分布的统一样本。然后利用SPSS对评论和星级评定之间的相关性进行分析。在此基础上,首先利用神经网络来确定基于星光等级的数据测量方法和评论。研究发现,评论和标题的情感得分对明星评分有很大的影响,而评论时间影响不大。由此可以推断,客户不容易受到不同时期的其他评论的影响,从而影响他们自己对产品的星级评级。然后,利用计算机对评论的情感评分随时间的波动进行建模。发现亚马逊藤蔓成员评论的分散使得有用的选票分散,从而允许更多的客户在不同的时间段看到更多有价值和有参考价值的高投票率评论。同时,可以发现,产品上市后期的评论具有更多的参考价值,从而推断出在早期可能存在恶意评论。通过对评价体系权重的分析,发现星级对销售量的影响较大。

【关键词】 NLP神经网络 归一化 亚马逊

引言

阳光公司计划在亚马逊网上市场销售三种新产品,包括微波炉、婴儿奶嘴和吹风机 [1]为了更好地了解市场环境和客户的感受,阳光公司打算在产品上市在Amazon市场销售前,让我们分析一下这三种产品在过去的竞争对手产品中所提供的星级评级和评论[2]。因此,对其营销策略和产品改进提出建议,以提高产品竞争力和顾客情感,降低经营风险,树立良好的品牌效应,获得更大的利润[3]

一、模型的建立与求解

在这里我们并不急于建立一个评估模型,而是打算分析由阳光公司提供的三个数据集之间的数据关系。其中,我们将重点分析星级评级和评论。首先,我们使用Natural Langunge PossnsNLP)对评论进行情感分析。NLP使用计算机来处理、理解和使用人类语言,从而实现人与计算机之间的有效通信。NLP可以应用于许多领域,在这里我们使用它来进行情感分析。我们使用计算机来判断用户评论和标题是否是正面的。

我们通过Python软件找到了有意义的数据关系。TeXBROBPython的文本处理工具,用于处理文本数据。它提供了一种简单的API,用于潜入共同的自然语言处理(NLP)任务,如词性标注、名词短语提取、情感分析、分类、翻译等。

它将原始数据集改变为附件中所示的数据集,使评论和其他语言字符变成直观的数学符号,即评论的情感分数在以下词语中的感伤在此基础上,我们用SPSS软件分析了点评与星级之间的相关性,得到了如图123所示的结果。它可以发现微波炉、婴儿奶嘴和吹风机的评论和星级之间的相关性很弱。














通过分析计算又可以得出,三种产品的星级评级和评论情绪得分之间的相关性分别为0.4290.5200.390,分别通过PythonTeBBulb包的NLP分析获得。它们均在0.30.8之间,SIG值均<0.05。因此,我们可以认为,三个产品的星级评级与评论的情感得分有显著的弱相关性。

经过分析 ,我们可以得到三个产品的星级评级和评论情绪得分的平均和标准偏差。通过比较平均三个产品的平均星级评级和评论情绪分数,我们可以发现,奶嘴的评级最高为4.3,也有最高的评论情绪分数为0.282,而微波炉最低星级评级为3.44,也有最低的评论情感得分为0.215。最重要的是,评论情绪分数确实与星级评级有一定程度的相关性,也就是说,评论与星级评级相关。

在对数据进行进一步分析后,我们发现许多不购买产品的人也进行了相关的评论,这可能导致不准确的结果。因此,我们删除这些评论进行进一步的分析,并获得结果。

通过以上分析,我们可以得出一个类似的结论:三个产品的星级评级与评论情绪得分有显著的弱相关性。然而,由于未购买评论的干扰在此时被消除,消除了一些“刷牙评论”和“刷订单”的可能性,并且得到的结果更真实和有代表性。

此外,为了便于建立后续评价模型,我们规范了评论情绪评分、帮助性评价和星级评定的数据,以便于统一样本的统计分布。有关详细信息,请参阅附录中的数据。在多指标评价体系中,由于各评价指标的性质不同,往往具有不同的维数和数量级。当各指标的水平存在较大差异时,如果将原始指标值直接用于分析,则突出了综合分析中具有较高价值的指标的功能,而较低价值水平的指标的功能将相对弱化。因此,为了保证结果的可靠性,有必要对原始索引数据进行归一化。

将三种数据结合一定权重构成的评价模型,可以帮助我们分析各种产品的销售情况,判断产品是否有可能成功。


有许多方法可以归一化,这里我们使用下面的公式12来规范:







到目前为止,我们已经成功地为每个数据列建立了标准化的测量系统。发现了这些数据中隐藏的关系和参数,并在该数据分析的基础上进行后续的问题求解。

三、结论

虽然我们的模型难以有效地分析在NLP处理中遇到的字符和图片,但是我们将书面评论转换为可比较的数据,并将星级评级和有用选票结合起来作为一种新的评价产品的评价系统。

潜力另外,我们也做了大量的分析。就时间测量而言。该模型简单、新颖,结果直观、易懂,对产品评价问题的研究具有参考意义。

参考文献

[1]张媛媛. 在线评论对消费者购买决策影响的实证研究[D]. 浙江财经大学, 2015.

[2]梁峰杰. 在线评论对消费者网络团购的影响因素研究[D]. 西安电子科技大学, 2014.

[3]瓦瑜. 在线评论对消费者购买意愿的影响研究[D]. 浙江大学, 2014.


本文来源:https://www.wddqw.com/doc/0cc5cd2a4835eefdc8d376eeaeaad1f346931172.html