基于手势感应的智能电器控制系统设计与实现外文翻译资料

 2023-01-31 10:21:21

摘要:

随着计算机在社会中越来越普遍,促进自然的人机交互(HCI)将会对它们的使用产生积极的影响。因此,有越来越大的兴趣在发展新的方法和技术,用于桥接人电脑障碍。最终的目的是使得人机交互(HCI)能够得到一种类似人与人之间自然互动的人机互动的方法,为此,结合手势的人机交互(HCI)是一个重要的研究领域。手势长期以来被认为是一种交互技术,它很可能使得我们的计算机通信更加自然,创造性和直观。本文在这方面提供了比较详细的调查分析。使用手势作为一个自然界面、作为一种激励力在手势的分类研究,其表示和识别技术,软件平台和框架在本文中做了简略地讨论。它着重于手势识别的三个主要阶段即检测、跟踪和识别。那些为了交互而采用手势感应的不同的应用将在下面的核心以及高级应用领域被讨论到。本文还提供了在不同的关键参数进行分类,这涉及到对人机交互手势识别系统现有文献的分析。进一步讨论了需要进一步凑合目前的手势识别系统未来可广泛用于有效的人机交互的研究进展。本次调查的主要目标是为研究人员提供基于HCI的在手势方面摘要,该摘要包含进展到达的日期以及需要进一步研究的领域。

关键词:手,手势识别,人机交互(HCI),表现,识别,自然界面。

1 简介:

在当今世界,与计算设备的相互作用已经发展到这样的程度,作为人类,它已成为必然,我们不能没有它。这个技术已经融入我们的日常生活中,我们用它来工作,购物,沟通,甚至娱乐我们自己(Pantic et al. 2008)。计算机的运作,通信和显示技术都在进一步发展,这个结论已经得到了广泛的认可,但是现有的技术可能会成为有效信息被有效利用的瓶颈。

为了充分的使用它们,绝大多数计算机的应用程序需要更多的交互。出于这个原因,人机交互(HCI)已经在过去几年的有了充满趣味的研究。首先根据过去的穿孔卡片,保留给专家,互动发展的图形界面范例。相互作用包括图形对象,如利用指示设备图标和窗口的直接操纵的。即使键盘和鼠标的发明是一个很大的进步,但其中仍有这些设备是不兼容的人机交互的情况,特别是用于与3D对象的交互的情况。2度的自由(自由度)的小鼠不能正确地模拟空间的3个维度。使用手势提供了一个有吸引力的和自然的选择,可以实现人机交互,这些繁琐的接口设备。用手中的设备可以帮助人们使用电脑的更直观的方式沟通。当我们与其他人互动时,我们的手部动作扮演着重要的角色,他们传达的信息是非常丰富的。当我们用手指指向一个人或者一个物体的时候,会传达有关空间、形状和时间特性的信息。我们经常使用我们的双手来与对象进行交互:移动它们,修改它们,并将它们转换。以相同的无意识的方式,我们通过讲话来沟通思想的同时一边比划(停,走近,不,等等)。因此,手部动作是一种非语言交流的手段,从简单的行为(例如,指向对象)到更复杂的(例如表达感情或与他人交流)。从这个意义上说,手势不仅是口语的一种装饰,而且是语言生成过程本身的重要组成部分。手势可以定义为手,胳膊,脸和身体的物理运动,意图传达信息或含义 (Mitra and Acharya 2007)。特别是,识别手势的交互可以帮助实现易用性和自然理想的人机交互。用户通常用手势来表达他们的感受和公布他们的想法。2006年研究人员Karam在他的工作报告中提到手部相比于身体的其他部分,已经被广泛的使用来做手势,而且手势作为一种自然的人与人沟通的媒介可以最适合应用于人机交互(HCI),如图1所示。在这方面的兴趣已经导致了大量的研究已在多个直接或间接与手势识别相关的调查中被消化。表1显示了一些手势识别领域提出的重要调查和文章。下面的调查和文章发表前的手势识别相关的可用于设计的综合分析,实现进化的发展,强大的高效、准确的用于人机交互的手势识别系统。研究文章中涉及的关键问题,可以在许多方面帮助研究人员确定和挖掘这些陌生的领域,朝着更多的用户友好的人机交互系统的进展。本文的其余部分组织如下:

  1. 提供有利的技术可用手势识别概述。

图1显示了不同的身体部位或物体识别文献中采用的手势(Karam 2006)

  1. 讨论了在手势相关文献中可行的分类和表示方法。
  2. 介绍了视觉识别技术,可用于识别手的手势。
  3. 显示了不同的应用程序域,在不同的环境中使用手势相互作用
  4. 提供比较分析基于视觉的手势识别商业产品和软件。
  5. 讨论用于实现手势识别技术的软件平台/框架。
  6. 介绍了国家的艺术和讨论相关的基于视觉的手势识别技术。

第9部分为基于视觉的手势识别的人机交互的一个简要的分析和展望。

第10部分最后总结了调查结果。

2 实现手势识别技术

手势识别的术语统称为跟踪人类手势的整个过程,他们的代表性和转换到语义上有意义的命令。在手势识别的研究旨在设计和开发这样的可以识别明确的人类手势作为输入和处理这些手势表示设备控制通过映射的命令输出的系统。建立和实施这样的高效而精确的手势识别系统通过两个主要类型的使能技术的人机交互,基于接触和基于视觉的设备辅助。图2显示了接触和视觉为基础的设备的例子。

基于接触的设备用于手势识别系统是基于与接口器件,即用户需要适应这些设备的使用用户的物理相互作用,因此不适用于那些新手用户。这些设备通常是基于数据手套,加速度计,多触摸屏等技术,并使用多个探测器。也有设备只使用一个检测器作为加速度计,例如Nitendoc Wii-Remote。这类用于手势识别的接触设备可以进一步分为机类,触觉类,超声波类,惯性类和磁类(Kanniche 2009)。

表 1 一些综合性调查和文章分析

参考文献

年份

分析范围

关键结果

Pavlovic et al. (1997)

1997

涵盖了100余篇有关视觉的手势解释语境中的人机交互的评论。

用于建模,分析和识别手势的方法进行了详细讨论

建议将手势与视觉,声音以及其他自然相关的多式联运接口通信方式整合,来提高这些对手势的人机交互的限制。

参考文献

年份

分析范围

关键结果

Wu and Huang (1999a)

1999

基于视觉的手势识别方法研究。

侧重于不同的识别技术,包括建模的动态识别,建模的语义,HMM模型框架等

重点对手势的复杂性,计算机视觉中的努力,机器学习和心理需要。静态手势识别技术,实现旋转不变性和独立的识别,需要更详细的研究

Moeslund and Granum (2001)

2001

综合评述130篇论文讨论的初始化,跟踪,姿态估计和识别的运动捕捉系统。性能特征相关的系统功能和现代的进步在这些领域综合评价

在整个域的主要问题,如缺乏训练数据,大量的时间所需的手势捕捉,缺乏不变性和鲁棒性进行了探索和可能的解决方案,解决方案如就业的方法类似于语音识别,提取运动层的详细研究

Derpanis (2004)

2004

手势识别技术,特别是专注于手和面部动作的综合调查。隐藏的markov模型,粒子滤波和冷凝、有限状态机、光学溢流、肤色和联结主义模型的详细讨论

需要在特征提取,分类方法和手势代表性领域的研究,以获得人类对自然条件的人机接口的最终目标将要执行

Chaudhary et al. (2011)

2011

手势识别技术全面的调查特别注重手和面部动作。隐马尔可夫模型,粒子滤波和冷凝,无限状态机,光学溢流,肤色和联结模式中详细讨论

根据数据集的大小和执行的手势被识别和各种组合,对不同识别算法的需求可以的出来。从这个研究值得注意的是,任何开发的系统应该是灵活的和可扩展性,以最大限度地提高效率,准确性和可理解性

Wachs et al. (2011)

2011

讨论了人工神经网络、模糊逻辑、遗传算法等软计算方法在手势识别中的应用

Soft computing提供了一种定义东西的方法,这方法是不确定的,但使用的近似模型和训练数据。这是有效的,在得到的结果中,手或手指的确切位置是不可能的

参考文献

年份

分析范围

关键结果

Corera and Krishnarajah (2011)

2011

基于视觉的手势应用的综合性文章。专注于视觉的手势识别系统及其相关应用中现存的不同的挑战

除了技术上的障碍,如可靠性、速度和低成本实现手势交互,还必须解决直观性和手势识别。双手动态手势交互是未来研究的前景

Kanniche (2009)

2009

用于捕捉手势动作的工具和技术的调查。手势识别系统的逻辑问题及设计思考

提示前进的道路是通过模块化、可扩展性和本质上是分散的整个方法的姿态捕获识别

图2. a.手套2 (Kevin et al. 2004) b.SoftKinetic高清摄像头(SoftKinetic 2012)

机械感应设备是由终端用户使用的设备,用于像“igs-190”一体套件用于捕捉肢体语言,“CyberGlove 2”无线仪表手套用于手势识别(Kevin等人。2004)如图2 a。CyberGloves磁性跟踪器用于手势识别的轨迹建模。触觉感应设备是非常常用的,在我们的日常生活中以人机界面即多点触摸屏设备,如苹果iPhone硬件的触摸感,多点触摸手势的交互使用HMM的平板电脑和其他设备(Webel et al. 2008)。

基于超声波的运动跟踪是由声波发射器,声波盘,反射超声波和可以返回脉冲时间的多个传感器组成。位置和姿势的方向的计算是分别基于传播,反射,时间快慢和三角测量(Kanniche 2009)。虽然低分辨率和精度不足的问题都涉及到这套装置,但是其适用的环境缺乏比较和磁性障碍物的存在也可能使得它们受到青睐。惯性感应装备是用来探测运动的地球磁场变化。Schlomer et al. (2008)提出手势识别系统可以采用有HMM独立目标系统的Wii控制器。Bourke et al. (2007) 建议手势识别系统能感测到那些在日常生活中使用到的采用了加速度计的正常手势。Noury et al(2003)建议系统能够多通道直观的媒体浏览,这样用户可以学习个性化的手势。利用磁引装置可以测量人工磁场的变化。

受制于对有经验的用户的依赖,基于接触的设备不提供太多的接收程度,因此,视觉为基础的设备已被用于在人机交互中捕获输入手势识别。这套装置依赖于由一个或几个摄像机捕获的视频序列,来解释和分析的运动(Mitra and Acharya 2007)。此外,基于视觉的设备也使用人类手部动作和手势的检测方法。手动标志可以进一步分为反光标记,反光标记本质上是被动的,而且需要照射,而LED灯在自然和闪烁的序列中是活跃的。在这些系统中,每个摄像机从它的视图中提供标记位置,以及通过闪光灯或者普通灯能使得画面更加明亮的2D

框架。一个预处理步骤是进一步执行用于解释的视图和位置的三维空间。

基于视觉的手势识别的主要挑战是应对姿态变化大。识别手势涉及处理相当数量的自由度(自由度),巨大的变化的二维外观取决于相机的观点点(即使是相同的手势),不同的轮廓尺度(即空间分辨率)和许多决议的时间维度(即变化的手势速度)。此外,它还需要平衡的精度性能有用的权衡,根据应用程序的类型,成本的解决方案和几个标准,如实时性能,鲁棒性,可扩展性和用户独立性。

在实时过程中,系统必须能够分析图像的帧速率的输入视频,来给用户即时反馈用户认可的手势。在不同的照明条件和杂乱的背景下手势识别成功的识别了不同的手势,而鲁棒性在其中起到了重要的作用。该系统还应该在对平面内和平面图像旋转的功能方面是强大的。可扩展性有助于处理一个大的手势词汇,可以包含少量的原语。这使得用户可以很容易地控制不同的手势命令的组合。用户独立创作的环境,是指系统处理由不同的用户,而不是特定的用户完成,而且还应该能进一步识别不同大小和颜色的人类所做的手势。

上面提到的手势识别技术有其优点和缺点。由于接触式可能使用户不舒服,因此他们需要为用户提供物理接触,而且仍然有一个边缘的识别精度和不太复杂的实施,有利于这些设备。基于视觉的设备虽然是用户友好的,但遭受从配置的复杂性和闭

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[150025],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。