在线消费者评论的性能预测:大数据分析的情感挖掘方法外文翻译资料

 2022-11-18 21:57:52

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


在线消费者评论的性能预测:大数据分析的情感挖掘方法

Mohammad Salehan , Dan J. Kim

University of North Texas, College of Business, 1155 Union Circle #311160, Denton, TX 76203-5017, USA.

摘要:虽然网上消费者的评论(OCR)已经帮助消费者了解不同产品的优势和弱点,找到最适合自己的人,他们将为企业进行挑战,因为他们的体积、品种、速度和准确性。本研究探讨读者的预测因子和OCR的帮助性,用于大数据分析的一种情绪的挖掘方法。我们的研究结果表明,在标题中更高水平的积极情绪得到更多读者的评论。文本中中性极性的情感评论也被认为更有帮助。一条评论的长度和寿命的积极影响它的读者群和帮助性。因为目前用于排序OCR的方法可能偏向他们的读者和帮助性,在这项研究中采用的方法可以被在线供应商采用去开发可扩展的用于排序和分类OCR大数据的自动化系统、这将有利于供应商和消费者。

关键词:在线消费者评论;情绪挖掘;有用性;读者;大数据分析

1引言

企业现在使用社交媒体来推销他们的产品和服务。许多公司维护脸谱网和Twitter账户以与客户保持联系。客户还利用社交媒体接收有关产品/服务的信息。在许多方面,尤其是因特网和社会媒体,已经改变了顾客购买商品和服务的方式。现在人们很容易在砖瓦店找到他们想要的产品,然后在网上订购。此外,消费者在线评论(OCR)帮助客户了解产品的优势和劣势,找到不同的最适合自己的人。一些研究表明,客户对因特网上用户生成的产品信息比提供的信息提供者更感兴趣[9]。最近的一项研究表明,OCR是第二最信任的源的产品信息后,建议家人和朋友[47]。与供应商产生的产品说明,OCR更面向用户描述产品在不同的使用场景和评估,从用户的角度来看[13]

因此,甚至有人建议,写OCR的消费者充当在线零售商的“销售助理”[13]。虽然OCR分析对消费者和企业都有好处,但由于它的体积、变化、速度和准确性等特点,对它进行分析是很有挑战性的。

从消费者的角度看,对OCR过程可以分成两个步骤:决定阅读评论,和处理评论中信息的实际过程,认为决定使用基于感觉有用的评论[1]。针对OCR处理的两个步骤,本研究在OCR的基础上提出了两个基本的研究问题:

问题1:哪些因素决定消费者注意评论的可能性?

问题2:哪些因素决定一个评论认为帮助性吗?

从企业管理者的在线看,找到这些问题的答案都是对在线消费者的产品和/或服务的最终看法相当重要的步骤,并实现可扩展的自动化系统的分类和大的OCR数据[44,49]分类设计。

第一个研究问题研究了OCR的特性,它吸收了在线消费者的注意力。许多产品收到太多的评论,使得消费者很难阅读它们。因此,大多数消费者必须有选择地阅读它们。总之,第一个研究问题探讨了OCR读者的决定因素。虽然阅读评论是决定其有用性的第一步,以往的研究忽略了OCR的读者。

虽然第一个研究问题仍然很大程度上尚未探索,但第二个问题已受到一些关注。以前的研究发现OCR影响产品销售的有力证据[14,16,18,20,22,23,42,46]。然而,第二个研究问题的三个重要方面需要进一步调查。首先,大多数研究仅在实证分析中使用数字评论评级(例如星星数量)和评论的长度,而没有正式纳入评论文本中包含的信息。因此,对OCR中包含的文本信息进行更深入的分析可以更深入地了解什么是有用的在线评论[46]。虽然以前的一些研究使用OCR的文本来预测有用性[15,22,37],但情绪对OCR有用性的影响仍未探索。

其次,以前的研究表明,积极的言论被认为更有助于消费者[56]。然而,研究对负面评论产生了矛盾的结果。例如,Sen和Lerman [58]发现,在功利主义产品的情况下,负面评论比正面评论更有用,而辛德勒和比克特[56]在负面评论和评论的有用性之间没有发现任何重要关系。通过调查情感极性(即负面,正面或中性)对帮助的影响,本研究提供了对OCR性能的洞察。

最后,以前的研究倾向于识别OCR性能的预测因素,而没有为在线供应商提供许多实用的解决方案。基于其中包含的文本信息,人类主题主要用于OCR的分类。尽管这种方法提供了对OCR性能的描述性视图,但它不利于开发可扩展的OCR分类自动化系统。

本研究通过分析评论中包含的文本信息来调查OCR的表现。以前的研究表明,计算机媒介传播(CMCs)可以有效地转移情绪。此外,通过CMC传递的信息中包含的情绪显着影响接收者如何处理和解释信息[7,54,70]。情感挖掘可用于情绪分析文本信息。情感挖掘是指利用自然语言处理和计算语言学从文本数据中发现和提取主观信息。情感挖掘通常使用自动化工具完成,这些工具提供可扩展性,有效信息检索,自动化网络风险管理以及增加的商业利润等优势[4]。它还有助于处理大量数据。社交媒体是大数据的重要来源,非常适合文本挖掘的目的[12,55]

这项研究以三种独特的方式对现有的知识体系作出贡献。首先,它提供了一个研究模型,用读者感知的方式预测OCR的性能,并使用情感挖掘方法评估的有用性。虽然以前的研究使用OCR的文本来预测OCR的表现,如有用性[15,22,37],但情绪对OCR表现的影响仍未探索。因此,这项研究有望在这个领域提供新的贡献。其次,它使用自动化工具来分析从Amazon.com网站收集的评论组成的一组辅助OCR数据。另外,遵循Chen等人提供的指导[12]。它揭示了大数据分析的新应用。更具体地说,它为在线业务经理提供有关设计和实施可扩展自动化系统的见解,以改进OCR的分类和排序,最终帮助他们实现更高的销售额。

2理论背景

2.1在线评论绩效评估

以前的研究已经采用不同的措施来评估OCR的表现大多数研究使用有用性作为OCR的单一表现指标[3,46,58]。帮助也被称为评论的价值[56]。对于使用二次数据的研究,通过将发现评论的人数除以投票赞成该评论的总人数来衡量有用性[46,58]。

购买意向是绩效的另一种度量。顾客购买意愿受到评论数量和质量的影响[52]。一些研究将销售收入作为在线评论的绩效衡量标准。一项研究使用雅虎电影网站的在线评论预测框 并发现有力证据表明在线评论影响电影销售[42]。在线评论也被用于预测在线书籍的销售量[14]。 产品评级也通过情绪间接影响销售[31]

2.2在线评论绩效的预测因子

不同的措施已被用来预测OCR的性能。一些研究集中在评论的数字星级和字数上来预测他们的表现。例如,极端的数字评级与图书销售呈正相关[14]。具有极端数值评级的评论也被认为更有帮助[46]。

评审的长度也可以预测它的性能。一本书的评论长度显著地预测了它在Amazon.com上的销售量[14]。一个评论的长度也与有用性呈正相关[22,37,46,56]。然而,实证分析未能发现巴尼斯和贵族网站的评论长度与图书销售之间的任何重要关系[14]。陆等建议[44]对OCR的性能进行预测,不应将评论视为独立文档,应使用作者身份和社会网络的上下文信息来提高预测精度。其他一些研究也使用审稿人的特征,包括书面评论的总数。

由用户、专业知识、经验、写作风格、评级模式,和卓越的预测帮助OCR[43,49]。正面和负面评论之间的差异在OCR中是一个有争议的研究途径。在否定偏见理论的基础上,一些研究提出负面评论被认为比正面评论更有帮助。根据负性偏差理论,当演员以期望的方式表现时,人们很难对演员的行为做出推断。推理更容易当演员背离行为规范[35,36]。因此,一些研究者认为,负面评论应该被认为比正面评论更有帮助,因为它们偏离了公认的保持正面的标准[58]。多项研究检验了OCR中的负性偏倚理论。然而,他们的发现是矛盾的。虽然一些研究表明,消费者发现负面评论更有价值,但其他人发现正面评论和负面评论之间没有显著差异。有些人甚至发现积极的评论比消极的评论更有帮助。森和Lerman [58]发现积极的评论通常更多的帮助。然而,负面评论对实用产品(侧重于任务表现的产品)更有用,而正面评论更适用于享乐产品(处理愉悦的产品)。Schindler和比卡特[ 56 ]发现积极的语句数是一个评论的价值有显著的预测作用,而对价值否定语句数的影响不显著。最近的一项研究表明,消费者评论可能受到积极的社会影响偏见,也被称为内部偏见[3]。通过实验,笔者操纵的OCR的有用性和发现积极的手法创造出过去几个月的积极的社会影响。然而,消极的手法,通过校正效果,中和操作偏移。

调查结果表明,公司可以很容易地操纵OCR,评论应考虑到某种程度的怀疑。

2.3调节变量的表现

产品类型是在线评论环境中的一个重要因素,它主要被看作是调节自变量与有用性之间关系的变量。例如,对享乐产品的评论不太可能被认为有帮助[58]。搜索的有用性和经验商品之间也有区别。对于搜索商品,消费者可以在购买之前获得有关产品质量的信息,而经验商品的评估需要抽样或购买。虽然星级评分极高或极低的评论被认为对搜索商品更有帮助,但体验商品的效果不同。对于体验商品,极端评价被认为比中等评价的评价更有帮助[46]。产品类型也调节正面和负面陈述的数量与评论的帮助之间的关系[58]。与体验商品相比,评论的长度对搜索商品的有用性有积极的影响[46]。顾客参与是OCR背景下的另一个调节变量。虽然低参与客户更受影响的数量,而不是评论的质量,高参与的客户是受评论的数量,如果评论质量高。

2.4信息选择相关理论

选择性关注理论认为,人们有选择性地回应消息,因为信息处理能力有限[66]。当人们一次收到多个刺激时,他们需要过滤一些消息,因为它们的处理能力有限。

同样的事情发生在网上评论的背景下。许多产品有大量的评论,这使得人们有选择地阅读在线评论。选择性认知理论有助于解释选择性注意力的机制。根据选择性认知,人们发展出的信仰结构是对世界的简化表示,并使用这些结构来过滤和解释信息[69]

归因理论解释了人们如何分析不同的行为。基于这个理论,人们为不同的行为确定了两种类型的解释:与内部(个人)因素有关的行为以及由外部环境(情境)导致的行为[19,27]。该理论很大程度上解释了消费者可信度的预测因素以及与消费者感知和推论形成有关的其他领域[17]。它也被用来解释消费者对OCR有帮助的看法。读者在决定是否使用评论中包含的信息时考虑评论作者的动机。读者可能会将审阅归因于外部(产品相关)或内部(审阅者相关)原因。如果读者觉得评论是基于外部原因,他们更可能接受它。如果读者认为评论是基于内部原因,他们更可能忽视它[58]

2.5虚假评论

由于在线评论有潜力影响客户,因此他们受到商品/服务的销售商/提供商的高度关注。 有人甚至试图通过制造假评论来影响顾客的看法[38,61,68]。一项研究发现,某些按地理位置和所有权区分的酒店会为他们自己发布更多的假阳性评论,并为竞争对手提供更多虚假的否定评论。单一业主拥有的独立酒店比品牌酒店连锁店更有可能发布虚假评论。此外,靠近酒店的酒店对发布虚假评论有很高的动机,因此会有更多的负面评论[45]。另一项研究报告称,10.3%的书评是伪造的或被操纵的[30]

以前的研究使用不同的方法来识别假评论。 一些研究比较了不同网站上的产品评论来调查假评论。一项研究通过比较两个旅游网站的评论和广泛的酒店评论来确定虚假评论的证据:Expedia.com和TripAdvisor.com [45]。虽然任何人都可以在TripAdvisor上撰写评论,但实际上需要预订至少一晚,以便Expedia上的特定酒店能够为该酒店发布评论。人类主题和自动化工具也被用来识别假评论。一项研究未能认识到操纵评论使用情感挖掘,但发现消费者能够识别他们[30]。其他研究使用机器学习方法来识别假评论[33,40,50]

3.研究模型与假设

我们利用情感挖掘分析评论文本,探讨我们的两个研究问题。每个亚马逊评论都有标题和正文文本。我们提取评论的标题和文本的情感,并使用它们来预测性能。我们已经为OCR性能的两个措施,读者和有用性,每个点对应一个我们研究的问题。图1显示了拟议的研究模型。

在这个模型中,情绪指的是文本中存在的正面和负面的情绪总量。极性是指情绪的方向,可以是积极的,消极的或中性的。更多关于我们措施的信息可以在方法部分找到。Liu,Cao,Lin,Huang和Zhou [41]指出,评论的发表日期与其总票数呈正相关。这被称为ebias。较早的评论收到更多的投票是因为较早的评论已经在网站上存在较长时间,因此更有可能被消费者查看和阅读。另一方面,最近添加到网站的评论不太可能被阅读,因为他们对用户的接触时间很短。此外,包括Amazon.com在内的大多数网站都会按照“最有帮助的优先”而不是“最新的优先”排序[51],这使得新评论不太可能向用户公开。因此,我们可以

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[23937],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。