基于协同过滤算法的个性化推荐方法外文翻译资料

 2023-03-15 11:01:36

基于协同过滤算法的个性化推荐方法

关键词:协同过滤、个性化推荐、定时更新、信任、相对推荐

摘要:协同过滤算法是一种应用广泛的推荐算法。然而,当应用于电子商务个性化推荐时,它面临以下问题:一是如何在用户之间获得相似性时考虑用户兴趣随时间的变化;其次,如何利用社交网络更准确地获取用户的最近邻;第三,如何对具有相同兴趣和不同收视率的用户的行为做出更准确的预测评分评分;第四,如何在推荐时利用产品类别之间的内在关系,如内部关系。为了解决这些问题,本文将时间更新、信任关系、预测评分优化和结构化思想相结合,对传统的协同过滤算法进行了改进。为了区分用户过去的兴趣特征和最近的兴趣特征,通过引入时间更新的思想,将用户的购物体验视为一组时间段,考虑用户在不同时间的兴趣对用户相似性的影响,以及目标用户与相似用户之间的信任关系对最近邻集建立的影响。在此基础上,针对不同用户对同一推荐项目评价标准的差异,对相似用户的评分方法进行了优化,得到了一种基于预评分的预测评分方法,供目标用户推荐项目。此外,考虑到推荐项目与其他项目之间的关系,本文还提出了基于推荐项目的相对推荐作为二次推荐的思想。最后,在明尼苏达大学计算机科学与工程学院提供的MovieLens评论数据集上验证了该方法的有效性。实验结果表明,与传统的协同过滤算法相比,该方法具有明显的推荐精度。

引言

随着电子商务企业之间竞争的加剧,给电子商务企业带来巨大利益的个性化推荐技术也越来越受到关注。根据用户的个人特征、历史行为和商品的特征,采用协同过滤、内容过滤、知识发现、交互推荐等推荐技术,个性化推荐使电子商务企业能够推荐用户可能感兴趣的商品[1]。与传统搜索引擎相比,个性化推荐可以满足不同背景、不同目的、不同兴趣、不同时期的用户需求[2]。推荐服务改变了电子商务用户的购物方式,从“人找信息”到“信息找人”。

有效的个性化推荐可以为电子商务企业及其用户带来双赢的局面。通过提供主动服务,发现每个用户的潜在需求,并由电子商务企业向用户推荐。它改善了用户的购物体验,同时也为电子商务企业创造了更多的价值。如今,如何为用户提供更准确的推荐已成为电子商务企业不可忽视的问题。因为只有当电子商务企业比用户本身更了解用户时,他们才会成为电子商务竞争中的赢家。

协同过滤作为电子商务推荐系统中应用最广泛的推荐技术之一,在实际应用中发挥了重要作用。为了提高个性化推荐的准确性,国内外学者从理论上对协同过滤推荐技术进行了深入研究。将聚类算法应用于协同过滤推荐中,针对聚类算法中初始聚类点不稳定的问题,采用Kruskal算法确定初始聚类点,以提高推荐的准确性[3]。将模糊集的概念引入协同过滤算法中,提出了一种基于模糊聚类的协同过滤算法[4]。提出了一种基于奇异值分解的协同过滤算法[5]。通过分析学习者的属性和学习资源的访问顺序,提出了一种改进的基于隐式和显式属性的协同过滤算法,提高了用户推荐网络学习资源的准确性[6]。提出了一种名为content boosted的协同过滤方法,该方法引入额外的文本信息,为“新用户”和“新项目”提供建议,有效地缓解了冷启动问题[7]。提出了一种将大宗商品分类信息融合到协同过滤算法中,解决数据稀疏问题的方法[8]。提出了一种基于矩阵分解的协同过滤方法。这种方法减少了数据的稀疏性,提高了矩阵分解收敛的速度[9]。基于项目和基于用户的模型用于预测矩阵中的缺失值,这大大增加了评估矩阵的密度。然后,将填充的评估矩阵用于协同过滤,这显著提高了推荐的准确性[10]。提出了一种基于贝叶斯信念网络的协同过滤算法,该算法通过扩展逻辑回归模型对贝叶斯信念网络进行优化,在数据稀疏的情况下提供更准确的推荐[11]。提出了一种基于SVD的增量协同过滤算法,降低了重复矩阵分解的代价,提高了推荐系统的可扩展性[12]。提出了一种基于权重调整的算法,该算法通过减少用户的相似度权重来减少不准确的相似度估计带来的负面影响[13]。评估矩阵中缺失的值由类似用户注释的平均值填充,这提高了推荐准确性[14]。可以发现,很多学者都在从不同的角度进行研究,但时间序列更新的思想较少,本文的目的是从时间周期更新和增强信任的角度对传统的推荐算法进行改进。

协同过滤推荐的挑战

协同过滤算法根据相似度的不同,分为基于用户的协同过滤算法和基于项目的协同过滤算法。

基于用户的协同过滤算法

基于用户的协同过滤基于这样一个理念:在现实生活中,人们很可能喜欢朋友感兴趣的东西。该算法通过用户的购物历史找到相似的用户,得到目标用户的最近邻(或最相似的),然后向目标用户推荐最近邻喜欢的内容。

基于项目的协同过滤算法

基于项目的协同过滤的基本思想是,如果用户喜欢某个项目,那么类似该项目的内容可能会受到用户的欢迎。需要注意的是,基于项目的协同过滤是基于用户行为的,用户倾向于在系统中找到两个项目之间的相似性。

当推荐系统中的数据完整、丰富时,传统的协同过滤算法具有推荐准确、推荐效果好的特点。然而,对于新用户,由于缺乏项目的兴趣数据,出现了冷启动问题。此外,当用户之间历史感兴趣的数据相对较少或项目数量巨大时,存在稀疏性问题。

面对商业活动的复杂性和协同过滤算法的不足,协同过滤技术在实现电子商务个性化推荐时将面临这样的问题:首先,传统协同过滤的建议是基于用户项目评价矩阵来发现用户或项目之间的相似性,它没有考虑用户兴趣随时间的变化,即没有考虑用户兴趣的及时性问题。第二,传统的协同过滤推荐忽略了社交网络中用户之间的信任关系。第三,传统的协同过滤推荐忽略了打印机和墨盒等商品类别、化妆品品牌等影响推荐效率的因素之间的内在联系。

一种基于协同过滤的个性化推荐方法

基于本文的上述研究,考虑到用户的兴趣特征随时间的变化,对用户兴趣特征的分析应该基于不同的时间段,而对邻居用户的兴趣特征也应该如此。虽然用户的兴趣会随着时间的推移而改变,但用户之间的长期信任关系仍然对推荐产生积极影响,这是本研究的一个重要方面。由于不同用户的评价标准存在主观差异,如何消除主观差异造成的推荐干扰也是本文的一部分。为了提高推荐体验,本研究还考虑了一些与被推荐商品有内在联系的商品,通过向目标用户推荐相关商品进行深度推荐。

基于时间序列的协同过滤相似用户研究

针对用户兴趣和时间敏感的特点,将定时更新的思想引入协同过滤算法中。定时更新的理念是分阶段分析用户的购买行为。两个阶段越接近,用户兴趣偏倚越小。

根据步长T将用户U的购买历史记录划分为不同的时间间隔(tk-1,tk ], 1 pound; i pound; k , t i = t 0 i T ,,其中t0表示用户U的购买历史记录的开始时间。

考虑到用户兴趣随时间的偏离,本研究引入德国心理学家艾宾浩斯的遗忘曲线来表达用户兴趣随时间的偏离。遗忘曲线显示了人记忆保持的非线性递减规律。本文使用Logistic函数来表达这条遗忘曲线,它反映了用户兴趣变化的趋势。遗忘函数的表达式为(1),表示时间越长遗忘越严重。

tk表示用户U的当前时间,ti表示用户U的第i次推荐的时间点。

基于遗忘函数,我们定义兴趣偏移权值,见(2)。

Nk -1定义为用户U在tk -1处的最近邻集,DNuk为用户U在区间(tk-1,tk ]内的相似近邻集,DNk由传统的协同过滤算法得到。则用户U在tk处的相似邻居集R(Nuk )如(3)所示。

一般情况下,用户U在tk处的最近邻集与tk-1处的最近邻集相对较近。用户U在tk处的最近邻居Nk属于用户U在区间(tk-1,tk ]内的相似邻居D N k,那些有相似性用户U和V R(N k )在tk可以Simkv由(4)定义的。

一般情况下,用户U在tk处的最近邻集与tk-1处的最近邻集相对较近。用户U在tk处的最近邻居Nk,属于用户U在区间(tk-1,tk ]内的相似邻居,与在Nk-1u中有最近邻居的相邻邻居D N k。这种处理的一个问题是,在某些情况下,与Nk-1u中的用户U不太相似的用户将在第k次推荐之后被删除。

DSimkv定义为目标用户U与其他用户V在区间(tk-1,tk ]内的相似度,用户U与用户V在R(N k )处tk的相似度可定义为(4)所定义的Simkv

基于历史信任的相似用户研究

面临数据稀疏的情况,用户V没有常见的购物活动与目标用户U间隔(tk-1,tk ] (一个案例中,目标用户的最近邻居用户V U时间除了当期,但U V和用户之间的相似度的间隔(tk-1,tk ]是0)。在这项研究中,介绍了John Orsquo;donovan的获取隐式用户信任的思想,并结合3.1的研究。使用历史信任来调整用户的相似度,使根据(4)错误排除的最近邻集N k为tk的用户V仍然可以向目标用户U推荐项目。

John Orsquo;Donovan隐式获得用户信任的基本思想是:根据用户对目标用户的推荐历史记录,可以在他的历史记录中找到正确推荐给用户的数字与推荐总数的比率。它反映了目标用户对用户的潜在信任。信任级别可以帮助我们弥补由于错误删除用户而导致的最近邻集偏差。

在本研究中,基于历史信任获

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[596138],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。