英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料
学习合作扫地机器人脏区和障碍物的区域划分方法
摘要 - 本文介绍了一种扩展的基于性能的划分方法,用于有障碍环境下的协同清洁领域。由于技术的不断进步,机器人应用对于需要多个机器人在任务操作中进行合作和协调的大型复杂区域至关重要。因此,我们的研究主要集中在多个机器人的控制程序 - 多个智能体之间的合作/协调方法上,以多个机器人的清洁任务为例。我们提出的方法根据环境特征以自下而上的方式划分目标区域,通过识别容易被弄脏的地方,以便代理可以有效和均匀地清理其责任区域。具体而言,它还包括通过清洁任务的步骤识别环境中障碍物的形状和位置的学习,因为障碍物的形状会影响工作表现。我们的实验表明,它可以通过考虑环境特征自主有效地划分责任区域。我们还表示,通过将这些结果与传统方法的结果进行比较,可以实现高效的任务操作,这些方法假定该区域被划分成相同大小的分区和或预先给出环境特征。
关键词:自治图分区; 障碍; 多个机器人; 合作; 污垢堆积; 学习;
I. 介绍
目前,计算机技术的发展日新月异,已被广泛应用于机器人和自动化等领域。由于机器人经常可以在各种环境中执行任务,因此对机器人应用的需求一直在增长。这导致了在计算机和传感器技术相结合的机器人领域的大量软件应用。有些机器人可以在人类困难的地方工作,如核电站搜索,星际探测和救灾等,而其他机器人则可以充实清洁和安全巡逻机器人等日常工作。清洁机器人是最热门的应用之一。如果从内部看,我们可以看到多个清洁机器人的合作现在变得非常重要,因为多个机器人的有效协同清洁可以通过共享任务来提高工作质量并减少清洁时间。清洁的控制也是适用于其他全面的任务,如安全巡逻和地区搜索。这使得许多研究人员将他们的研究集中在诸如路径规划(或图形勘探),区域划分,地图构建,自主导航,自定位以及障碍/避免碰撞等不同问题上的多个清洁机器人。
过去几年中许多研究人员已经讨论过涉及多个清洁机器人的研究(例如[3,6,11])。例如,Elor和Bruckstain [3]提出了使用气球模型的区域划分方法,将清洁区域划分为代理负责的大小相等的子区域。但是,他们没有考虑到环境的特点,比如哪里容易脏污,哪里是障碍。因此,加藤和菅原[6]通过考虑环境中的脏区域提出了扩展分区方法。但是,它假设有关脏区域的信息是预先给出的。此外,这些研究没有考虑障碍物的存在和形状。在现实世界的环境中,肮脏的地区通常无法事先给出,而且他们的工作区域总是存在一些障碍,例如椅子,桌子或房间墙壁。当然,清洁的效果受到障碍物数量和形状的严重影响; 复杂形状的障碍物使清洁任务变得困难。因此,负责区域包含许多形状复杂的障碍物的代理人将变得超载,因此,由于任务分担不均衡,其区域可能比其他区域更脏。
因此,我们提出了在具有障碍物的环境中合作清洁机器人的区域划分方法。我们假设这些代理有自己的责任区域(RA),每个代理应由指定代理清理。我们还假设代理最初知道整个地图和基站的收费位置,但该地图不包含有关障碍物的信息以及哪些区域容易积累污物。然后,我们的目标是自主地将整个区域划分为多个子区域作为区分区域,并识别障碍物的位置和形状,以及污垢堆积的可能性,这些区域表示容易脏污的地方。因此,我们提出的方法可以根据已确定的环境特征和代理人的能力来决定RA来平衡清洁任务。
本文的其余部分安排如下。我们在第二节描述相关工作,第三节描述问题和描述的模型。然后,第四节详细解释了我们提出的方法。第五节讨论了实验设置和结果,这表明所提出的方法可以在质量和数量两方面都取得很好的性能,并且通过考虑特征的分布来划分RA以获得平衡的任务性能,优于传统方法[3]环境。最后,我们在第六节中陈述结论和未来的工作。
II. 相关工作
许多研究针对清扫领域中多个机器人/代理商合作任务的问题。例如,Elor和Bruckstain [3]提出了一种通过整合蚂蚁信息素和气球模型来覆盖区域的分割方法,其中该区域被分割成分别分配给特定代理的子区域。每个分区都被认为是一个压力气球,其值代表分区域的大小。然后,使用信息素通信模型间接交换压力值,并且代理扩展其负责的子区域以使它们具有相同的压力。但是,这种方法将区域划分为相同大小的子区域。由于该地区的特点并不总是统一的,并且总是存在一些现存的障碍,所以同等规模的分区是不合适的。 Luo和Yang [8]提出了一种在时变和非结构化环境下的多清洁机器人的全覆盖路径规划的合作清扫策略。它使用生物启发神经网络,每个清洁机器人将其他机器人视为移动障碍物。该方法能够为非结构化环境下的多机器人自主规划无碰撞协作路径; 然而,他们没有讨论机器人如何划分他们负责任的清洁区域以获得均衡的性能。
葡萄牙和Rocha [9]介绍了一种基于平衡图划分的多级子图巡逻算法,用于在已知环境中进行有效的多机器人巡逻。 Hert和Lumelsky [4]试图将环境分成n个相同大小的部分。巴斯特和赫特[2]也试图划分面积分成相同大小的零件,但具有附加条件零件没有任何锐角。与我们不同,这些他们通过谈判来决定哪个代理应该对这种重叠负责。但是,他们没有讨论环境有障碍的情况,并且还假定有关肮脏地区的信息是事先给出的。 Sugiyama和Sugawara [10]提出了对这些信息进行协调清洁任务的控制方法。然而,他们的方法没有对该地区进行细分,而是选择了适当的路径规划策略在共享环境中移动。
本文的贡献是双重的。首先,我们通过在环境中添加脏区域的学习来扩展先前的工作[6]。我们还证明,我们提出的方法可以通过考虑现有的障碍以及学习的脏区域来有效地划分该区域。我们的研究与其他研究不同,因为我们关注于代理人如何根据障碍物形状和环境特征的复杂性自主识别他们的RA,以便他们能够以平衡的方式共享任务。
III. 模型和问题描述
- Agent与环境模型
令A = 1,...,n为一组代理。代理移动的环境由图G =(V,E)描述,其中V和E对应于节点和边的集合。我们假设代理商知道G,但不包括家具和夹具等障碍物。这种情况经常出现; 例如,房间是免费的,布局仍不确定。我们用一个单位引入一个离散时间,称之为刻度。代理可以在节点之间移动并清理它所访问的节点。在不失一般性的情况下,如果需要,我们可以假设E中边的长度是1。因此,任何代理都可以从一个节点移动到另一个节点,然后清理一个节点到达的节点。 vi和vjV之间的最短路径的长度用d(vi,vj)表示1令vi我在时间t的位置。
每个代理有一个负责区域(RA)来保持区域清洁。时间t上的I i a的RA是子图git=(vit,eit),其中vit v v和eit={ei,jeevv i,vjvit}。
我们假设v ibaseisin; Vit,如果I?= J,VIT和Vjt是不相交的。一个代理可以改变它的RA的大小,即VIT,通过均衡的协作工作来保持区域的均匀干净。如何确定RAS在第四节中得到解释。
- 污垢积累模型
我们概率性地描述了污垢堆积的容易性节点v V的Pv表示一个污垢在每个滴答点累积的概率。 于是,时间t处的v处的污垢量Lt(v)被更新为:
如果在T出现污物(带P V) 否则
然而,如果一个代理在T处访问了V,则L t(V)=0。我们考虑了两种情况下,代理人知道或不知道{ P V | Visin;V }。
当然,在这两种情况下,他们不知道积累的污垢的实际金额,LT(V),但如果他们知道概率{ P V | Visin;V }(或{ P IV | V V的概率isin;},Visin;维生素近似学习在我),他们可以估计它从ELT(V),这是我的期望值(V)在任何未来时间t定义为:
其中是当我访问并最近清理节点v V的代理时,或者当我将节点v包含在其RA中时。 请注意,代理商只知道他们自己的RA,并不知道其他RA中的概率。
- 性能指标
我们用一定时间间隔内污垢的累积存在时间作为衡量我们提出方法的性能指标。这被定义为:
其中正整数ts和te是区间的开始和结束时间(tslt;te)。 性能值越小越好,因此代理尝试最小化Dt,t的值。 注意(2)表示,如果特工离开肮脏的地方而不清理它们,DTS,te将增加,所以特工应该尽快清理这些地点。
- 代理商中的电池
I i中的电池由Bi=(B i max,b i漏,k i电荷)表示,其中i i max>0是电池的最大容量,B IdRungt; 0是每滴度电池消耗量,参数k i充电(>0)表示充电速度。让B i(t)成为代理i中电池的剩余容量。然后,当我移动时,B i(t)被更新:
每一滴答声。代理我因此可以连续操作最多蜱,称为最大运行时间,由M I表示。当我在充电基地充电电池时由M I表示。当我在充电基地充电电池时
从时间t开始充电所需的时间,T i充电(t),与消耗的电池寿命成正比:
在此之后,b max=b i max k电荷=k i电荷,b漏=b i。
为了简单起见,漏极与I无关,但在没有这些假设的情况下,我们可以很容易地扩展下面的公式。全电池的代理开始移动并清理他们的RAS,然后他们回到他们的基地并充电他们的电池。在电池变空之前,它们总是返回到充电底座。代理商重复这个清洗周期,以保持他们的指定区域清洁。对于任何节点VV VIT,我计算电势,这是电池返回到I充电基座V i基座所需的最小容量。V的I的电位由P(V)表示,并用以下公式计算:
其中D(V,V iBASE)是其RA中最短路径长度。我们说,如果时间t,我移动到节点V是安全的。
哪里是在现有的节点在冰的并置。移动代理的安全,只有两个节点;如果下一节点的冰槽安全归来,在两个沿最短路径,然后再充电。
四、提出的方法
A.基于扩展性能的分区方法
我们提出的方法是基于性能为基础的。分区方法[6 ],介绍了扩展清洁机器人拓展责任区的策略(RA)根据该地区的特点和每个个体代理的能力。我们延长了以前的工作[ 6 ],以便我们可以把它应用到环境中这可能包括障碍。我们称所提出的方法。扩展的基于性能划分(EPBP)方法。因为我们假设有一些障碍,主要目标EPBP是识别障碍物的位置,然后分区环境,以便平衡任务运行。
B.区域划分
虽然EBP主要基于在〔6〕中提出的方法,但我们将其扩展为增加污垢累积概率的学习和检测障碍物的功能。
1)扩展功率:代理I计算当它返回充电基座时电流Ra的膨胀功率。直观地,它表示在先前的清洁周期中,我可以有效地覆盖RA。首先,我计算在时间t的RA中累积的污垢的预期量:
其中T V,IVAccess是我访问V.V.VIT的最新时间;如果我从未访问过V,TV,IGATE是V包含在G IV中的时间。此外,在IV-D部分中定义的Piv是迄今为止对V的污垢累积的习得概率。然后,将T在时间t上的扩张功率Zi(i,t)定义为期望值的逆:
由于P IV>0,EL(G?it)?=0,因此ZEI(i,t)是可计算的。代理保持其计算的扩展功率,直到下一个计算时间。在时间t返回到充电基座时计算膨胀功率。膨胀功率的值受许多因素的影响,例如脏区域的存在、RAS的尺寸和(复杂形状)障碍的存在。
2)扩展RAS:每个代理的清洗周期开始时,它离开它的基础节点与一个完全充电的电池,以清洁其RA使用自己的探索算法。如果它决定了它主要清洁RA,它可能决定扩大它的RA。对于这一决定,代理I计算在其未来的时间,E(L T 0 delta;(G 0)),当我离开V i基地在时间t 0,其中delta;是正整数的累积污物的预期量。代理I还存储访问节点的数量,N访问(T),以及真空污垢的数量,N D(T),在T(>0)在当前的清洁周期,从T 0开始。然后,如果满足以下条件,则尝试扩展其当前RA、VIT。
其中,0plusmn;R 1,R 2小于1,0plusmn;delta;omega;i是用于确定是否清洗了大部分电流RA的参数。请注意,我们引入参数delta;,它指定在未来某一时间内RA中预期的污垢量,因为当代理四处移动时,污垢将继续积聚。这些条件间接地反映了代理硬件的能力和探勘算法的质量/性能。具有简单算法的代理不能有效地围绕该区域移动。例如,代理可以多次访问同一节点和/或可以跳过某些节点。可以更快地移动的代理具有复杂的探索算法或大容量电池,它们可以更容易地满足两个条件,从而可能扩展它们的RAS。
3)扩展策略:当(9)和(10)满足时,代理认为他们可以清理更大的区域。因此,他们开始区域扩展试验(AET),这是试图扩展RA以覆盖未被其他代理覆盖的其他节点或处于繁忙代理的RAS中的过程。当代理扩展它们的RAS时,我们必须考虑一些因素,例如从它们的基的距离,因为这些因素可能影响代理以及系统的整体性能。由于页面限制,在这里,节点应该包含在RA中的策略被省略,并且在[6 ]中描述了细节。
我想这是代理的认定,(9)和(10)是以小时satisfies T在它的清洗周期。它是由initiates法案,这两方。第一,在标识的节点中,应该包括在其使用的RA的发展战略。然后,协商决定哪个代理应该负责识别的节点,假设I i的一部分在其他代理的RAS中。
4)扩展负责区域的协商:在识别I i之后,它开始协商,以确定I中的哪些代理节点应该包含在其RA中。这个过程如下:
bull; 修改责任区:
Vit 设置为Vitminus;1 cup; I i .
发送区域扩展请求消息:
代理人i以其当前的扩展能力广播Ii
xi;=xi;(i,t)
接受/拒绝区域扩展请求:
假设代理j已收到请求消息
从时间t我从区域扩展。如果VjIi=,j什么也不做。 否则,j将j的扩展能力xi;(j,t)与xi;进行比较
◦ 如果xi;(j,t)ge;xi;,j发送拒绝消息
Vjcap;Ii和xi;(j,t)给i。
◦ 如果xi;(j,t)lt;xi;,j发送接受消息j将其RA
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[23881],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。