英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
基于半监督机器学习的智能媒体推荐系统
N.GOUTTAYA, N.BELGHINI,A.BEGDOUR, A.ZARGHILI
Laboratoire Systemes Intelligents et Appllication(SIA)
Faculty of Science and Technology
Fez,Morocco
摘要——在普适计算领域,基于用户过去的喜好来预测用户爱好和提供个性化的服务的课题,已经成为一个重要的课题。但是在这个领域,考虑用户爱好的研究相对不足。本论文的目标就是,运用历史上下文和机器学习技术,提出一种可以为用户提供个性化服务的方法。在这种方法中,对普适推荐系统,当我们在构建系统的基础构架时,我们整合了在新的情景上下文下甚至在还没有被考虑到的上下文下的用户爱好预测方法。另外,它也是为了在许多种将来可能出现的上下文下,用一种主动和不间断的方式为用户服务。
关键词——组件,普适个性化,普适推荐系统,用户模式识别,上下文感知系统,用户爱好适应,机器学习,神经网络
- 简介
在帮助和促进人机交互方面,为了提高用户的舒适度,Mark Weiser[1]已经描述了一个普适上下文,作为一个智能上下文,它能够在用户的物理上下文中用一种透明和自发的方式来整合出一个数字系统。
事实上,普适上下文是十分复杂的,其原因是因为它收到了强烈的约束,包括有:1)动态性/不稳定性:因为它的基础设施里有频繁的变化(连接网络和服务可以动态可用或不可用),2)元素长久的出现和/或消失(网络,服务,用户等),3)流动性:由于用户和/或设备移动,4)异构性:必须支持多样化的服务,5)不可预测性:因为在普适应用的设计中,未来可能出现大量的不可预见的上下文上下文
普适系统主要特点是:1)不可见性:它们被集成到日常对象中。2)上下文认识性: 为了给用户提供合适的服务,它们可以识别上下文和用户特点。3)个性化:适应用户的需求和喜好。4)适应性:适应上下文变化的能力。5)主动性:表现为自发地为用户服务。
在相同的愿景下,推荐系统是用于,基于他们与他们的信息范围内的交流,帮助用户决策。然而,这些系统并不考虑用户的上下文(在不同的上下文情况下,依旧以相同的方式表现)。
通过结合普适系统和推荐系统的特点,我们得到了普适推荐系(PRS),PRS能够考虑到使用上下文,为用户提供个性化建议。
但是,在一个普适上下文中,PRS执行期间可能会遇到大量的上下文情况,在这些系统的构建阶段,一些情况可能没有被考虑到。在这种情况下,为了给用户提供合适的服务,大多数现有的系统要求用户手动输入他们的偏好。
在这项工作中,我们提出一种基于机器学习的方法,它可以:1)从用户与PRS的交流历史中自动提取用户的喜好,2)将这些提取出来的喜好与他们的上下文相联系,3)当新的上下文情况出现时预测用户的喜好
- 推荐系统
- 传统推荐系统
推荐系统(RS)旨在促进研究和获取信息,提供合适的服务给用户。例如,像亚马逊一样,估计用户的偏好提出个性化的产品给他,或像谷歌提出的个性化信息检索。推荐系统应该根据用户的意图,选择最有趣的信息给用户。
在实践中,大多数推荐系统由Web应用程序组成,程序可为用户提供有用的资源列表。这些资源可能对应于不同类型的数据,如电影[2],音乐[3],书籍[4],餐厅[5],新闻[6],科学文章[7],网页[8],等等。
推荐系统的原理是基于过滤的过程和适应输入信息(为每个用户),RS为信息过滤主要使用了三种方法:
- 协同过滤: 基于他们过去的判断比较用户,创建社区。每个用户接收被视为与他的社区相关的文件 [9]。
-
基于内容过滤:将新文档与每个用户的模型比较,推荐最接近的文档[10]。
- 混合过滤:结合了这两种方法[11]。
- 普适推荐系统
普适推荐系统(PRS),结合普适系统和推荐系统的特点,在普适上下文中,提供个性化的用户推荐服务 “图1”。
图 1 普适推荐系统
PRS应该有我们定义的特征:
- 上下文感知
经典推荐系统工作在一个二维空间(用户、服务)。然而,用户随着上下文不同选择多样化的服务。例如,用户可以在开车的时候听音乐,在和家人度假旅行的时候看书,等等hellip;hellip;推荐系统必须运行在普适空间(用户、服务、上下文),并根据用户的上下文提供服务。
- 主动性
除了上下文感知的能力,普适推荐系统需要积极主动。换句话说,他们必须能够自发的为用户提供个性化服务,减少他与智能上下文的直接交流。
- 预知性
在新的上下文下,可以预测未来使用上下文和未来偏好。
- 可调能力
为了支持任何可能出现的变化,如用户的偏好,系统能够随着时间的推移进化。
在文献中已经提出了许多系统,这些系统中我们可以发现有:
COMPASS (上下文感知移动个人助手)[12]:是一个应用程序,该应用程序可用于旅游,它在一个特定的上下文下给游客所需的信息和服务。
CORES [13]是一个上下文感知,基于本体的推荐系统,用于推荐服务。这是一个推荐系统,旨在提升选择相关服务的方法,在一个特定的上下文下满足用户的需要。
CASUP(考虑用户偏好的上下文感知系统)[14]。它还计划在普适上下文下,通过探索用户与普适应用的交互历史,提供个性化服务。它从用户的历史上下文下提取用户的偏好和关联规则,提出类似的服务(在将来类似的上下文下,由用户选择)。
CAMRSS(用于日常活动的上下文感知移动设备音乐推荐)[15]:是一种系统,它采用被移动设备收集来的上下文信息,来满足用户的短期播放音乐的需求。
VISIT (用于通知游客的虚拟智能系统)[16]:是一个应用程序,该应用程序向游客提出了相关信息。决策过程考虑五个主要上下文:位置、天气、时间、情绪和用户偏好。这些上下文用于提供更有意义的个性化过程。
这些系统的研究表明这些系统是,(1)上下文感知,(2)提供一个中等水平的主动性(用户从一组提出的服务选择一个服务),(3)但无法在新的使用上下文预测用户偏好。
- 我们的方法
- 原理
我们的方法的目的是在构建这些系统的知识基础时,将在新的无法预见的上下文预测用户偏好的能力整合到普适推荐系统中。这是为了在未来可能出现的不同上下文下,用一种主动的不间断的方式为用户服务。
在这种上下文下,我们提出一个基于人工神经网络(ANN)的解决方案。我们使用一个基于反向传播算法的三层神经网络。该解决方案允许系统考虑用户经历的历史和自动修改他的行为直到获得所需的一个。
我们的网络由三层组成: 代表数据的输入 (上下文参数),一个代表服务的输出层 (用户偏好),和一个执行中间的计算隐藏层。
学习进程的目的是优化网络参数,以便在一个给定的上下文(从它与系统的历史交互中获取)下更好地预测用户偏好。为此,我们尽量减少代表网络产生的输出和期望输出之间不同的错误。产生的错误将通过反向传播方法修正,网络权重将被改变,直到系统收敛。
在测试进程中(新情况出现),我们计算这个新的上下文和学习数据库中的上下文的最大相似性。预测由向用户提出的建议组成,相关的偏好是基于与新的上下文最相似的那一个。
- 用户上下文模型建模
用户模型是指“一组描述一个用户或一组用户的参数”[17]。除此之外,在服务方面,用户偏好自然受其上下文影响。从一个上下文到另一个上下文,这些偏好会有所不同。例如,用户驾车时,在早上可能更听收音机, 而在晚上喜欢看电视。所以用户的偏好是他的上下文和他的模型密切相关。事实上,我们假设模型和上下文是两个不可分割的元素,一个模型如果和它的上下文没关系,那么这个模型就没有意义。
在给定的上下文,我们通过他的偏好定义一个用户的上下文模型,我们以成组的方式设置它:
上下文模型=(用户上下文、用户偏好)
为了为了简化用户上下文模型,我们必须为用户上下文和用户偏好这两个组件建模。
-
-
- 用户上下文
-
我们通过上下文参数来定义的用户上下文,这些参数可能会影响用户和智能服务有关的偏好。一个上下文参数(P),是一个代表全部或部分上下文信息的参数。
我们使用模型值属性[18]来表示上下文参数。用户上下文表示如下:
用户上下文= {Pi/ i = 1hellip;hellip;n }
n是为智能服务定义一个相关的上下文的参数数量。
- 用户偏好
我们用一组描述来定义一个用户偏好,描述包括:用户打算做什么。为了说明这,我们考虑一个用户希望根据所处上下文推出一个媒体服务。用户偏好表示,用户想要打开电视作为媒体服务,想要在“半岛纪录片电台”频道看纪录片。因此,用户偏好可以用三个参数表示:服务的名称(可以电视、广播、打印等),相关的类型(新闻、电影、纪录片等)和链、电台或电子期刊的标题。
一般来说,我们通过如下表示来代表一个用户的偏好:
用户偏好= {Prefj/ j = 1,....,m }其中m代表定义一组描述符参数的数量 ,这个偏好与智能服务有关。
- 体系结构
在计算机系统工程的领域,功能体系结构是一个逻辑表示,表示了系统的各种功能和它们之间的数据流的层次关系。
在本节的其余部分中, 为了显示给每个模块的任务,我们描述我们的方法的功能体系结构 “图2”:
图 2 所提方法功能结构图
- 捕获层Capture Layer:
这一层负责从用户的物理上下文和他与PRS的交互中获取原始数据。它允许:
- 通过为每个类型的信息选用适当的物理传感器,从而捕获物理上下文(温度、光、速度等)。
- 用户交互的捕捉:用户与PRS的交互是直接或间接执行的操作,以满足特定的需要。例如检查收件箱,用户必须首先选择邮箱的类型(雅虎,Gmail,等等),然后输入登录名和密码。直接操作执行的动作是由用户“手动” (点击鼠标,选择一个条目,按下一个按钮,等等),这种捕捉可以很容易通过GUI或使用指向软件设备(事件处理程序)完成。例如,我们可以很容易的捕捉点击触屏的数量,光标的移动或在一个页面或窗口所花费的时间。这些捕获的信息可以存储在日志文件、信息记录程序,等等中。间接行为代表用户与普适应用程序通信所使用的自然行为。这些行动通过手势,面部表情,身体动作,声音,操纵物体等等来实现。这些行为的捕获通常是通过视频或录音来完成(头部动作,眼睛方向,等等)。
- 上下文和偏好管理层:
上下文管理是一个解释原始数据(被物理传感器捕获)的过程。这些传感器提供的技术数据通常不适合被应用程序直接使用。因此,这些数据的转换必须完成,如数据建模、量化、推理、聚合,等等。在我们的方法中,这个操作是通过上下文和偏好管理层完成的。我们将上下文和偏好管理结合在同一层,是由于其强大的关系(参看parag III.B)。这一层允许:
○ 识别用户上下文:上下文识别包括识别用户的上下文情况(上下文实例)。
○ 提取用户偏好:它由对来自不同数据源(文件、视频和音频流等)的数据的分析组成的,这些数据代表了用户与PRS直接或间接的交互。这种分析可以识别用户偏好。
与PRS交互的用户可以存储在交互历史数据库中,成对使用(上下文,偏好)。
- 建设和更新上下文模型层:
建立用户的上下文模型时,只有相关的用户偏好才会被考虑。如果偏好使用频繁,那么它就被认为是相关偏好。它的频率要超过最小阈值,我们称之为MIN-FRQ-THRESHOLD。
在登记在交互数据库历史中的用户交互偏好中,我们应用先验的算法[19],提取这些相关的偏好。
之后,我们将这些相关喜好和它们的上下文(发生时) 结合,将其保存在用户上下文模型数据库。
我们注意到,为了追踪任何最终用户行为随时间的变化,这个上下文模型数据库要定期更新。
- 预测层:
预测层负责为用户根据当前上下文提供一个合适的解决方案。在这个阶段,系统分析他的上下文模型中包含的信息, 对于一个给定的偏好, 查询它相关的上下文。我们考虑一个学习数据库(上下文模型数据库),学习数据库由不同的上下文和它们相关的偏好组成,和一个测试数据库,由新的上下文情况组成数据库,在这一层目的是,在一个新的上下文情况下,预测用户偏好。
- 应用和实验
- 应用原理
为了解释我们的方案,我们使用了一个名叫“智能媒体推荐”的应用。这个应用提供了一个基于用户上下文的媒体推荐系统。在电视台、电台和新闻门户中选择一个媒体服务。这个应用必须根据上下文来为用户自动启动他最喜欢的服务。
事实上,选择一个特定的服务取决于:时间(早上、中午、下午、等)、位置(家里、办公室、汽车等),最后,特殊事件(周末、节日、体育赛事、电影事件,等等)。例如,当用户在早上开车时,可能喜欢听电台节目,晚上在家时,可能喜欢电影频道。
我们通过如下定义用户上下文:
用户上下文={P1=时间,Plt;
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[139204],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。