预测生物统计学:对预测个人特征的综述和分析生物统计数据外文翻译资料

 2023-01-08 10:50:26

本科毕业设计(论文)

外文翻译

预测生物统计学:对预测个人特征的综述和分析生物统计数据

作者:迈克尔·费尔赫斯特;李程(Cheng Li); 马尔乔里·达科斯塔-阿布拉乌

国籍:英国;英国;巴西

出处:英国工程技术学会

中文译文:

摘要:近十年来,人们对利用软生物特征信息的兴趣不断发展,与主要关注于人的识别的传统生物识别相比,软生物识别处理的思想是研究关于系统用户的更一般的信息的利用,而这些信息不一定是唯一的。越来越多的迹象表明,这类数据将在为用户身份严重提供补充信息方面具有很大价值。然而研究人员也发现,人们对扩大生物特征数据的预测能力越来越感兴趣,包括容易定义的特征,如受试年龄,以及最近的“更高层次”的特征,如情绪或精神状态。这项研究将在最广泛的意义上对生物特征数据处理能力进行有选择性的审查,并对未来如果要充分利用预测生物特征的概念,仍然需要充分处理的关键问题进行分析。

1 介绍

生物计量学已经成为一个成熟而重要的领域,许多现实问题的实际解决方案已经实现,其影响正在迅速增长。世界范围内有一个令人印象深刻和多样化的创新工作的研究基地,这使该领域得以继续扩大和发展,因此,该领域的文献越来越多,越来越详细。

生物计量学的主要重点一直是基于个人生理或行为特征的测量和分析来识别/验证个人,这仍然是目前报道的大多数研究的目标应用。事实上,关于生物计量学研究这一基本的方面的各种全面综述已经可以找到[1-6]。

仅举一个说明性的但更具体的任务领域(文章后面特别关注的领域),[7-15]中报告的研究基于击键动力学的分析提出了不同的用户标识和身份验证方法。有一些商业系统可用,其中包括作为一般安全系统一部分的击键监视。Pisani和Lorena[16]报告了用户识别的击键动态的系统回顾,而[13,17-21]的作者提出了一种解决方案用击键动力学来增强典型访问控制环境中使用的密码。Tsimperidis和Katos提出了一种新的功能来确定正在使用的操作环境(台式/笔记本电脑)。

然而,生物识别技术领域仍然停留在动力学的,目前的努力经常寻求扩大应用领域(鲁棒性的发展和可靠的移动生物识别技术环境[23-26])以及使适用更大范围的策略和方便采用生物识别解决方案(例如,“远距离生物识别技术”,一个有效技术的趋势[27-30],其捕捉环境比现在更少限制)。最近,人们对探索生物特征学和法医分析之间的联系以及探索两者之间的联系的兴趣显著增加,这为两个学科带来了真正有益的想法和技术[31-36]。

除此之外,在生物计量学的一般领域中,其他相关的主题也得到了迅速发展。例如,“软生物特征”(针对个人的生物特征;然而该特征(例如性别)并非受制于他们的年龄)的概念并不新鲜,但已受到重视,作为一种补充的独特生物特征数据的方法来提高识别过程以及一种确定独特的或特定应用场景的额外信息的方法可能在特定环境下证明有用。

然而本文特别感兴趣的是另一种有些不同但是关系密切的选择。这涉及到从传统生物特征数据预测软生物特征的能力。例如,从面部图像确定年龄或性别或从作家签名样本确定用手习惯的能力,有着明显的实际意义启发了强大并且有价值的应用的可能性,尤其在生物特征取证界面提到的。这是个有着相对较长的历史的领域(尤其当感兴趣的生物形态涉及到面部特征-见例[48,49]),但是工作报告通常更加小范围,而且广泛通用的全面的综述材料在这个领域相对难找。

致力于这一领域的研究工作越来越多,这表明对该领域进行更全面的审查,并对其成功和未来发展进行分析是及时的,这正是本文的明确目标。然而,我们的目标只是从已发表的文献中收集对这一主题的各种贡献,我们希望这篇综述能够超越这些狭窄的限制。例如,最近出现了一种明显的趋势,即从生物特征数据中计算出更一般化的预测个体特征,特别是通常被称为“更高层次”特征的指标([50,51]),这些特征可以包括受试者的“情绪状态”等方面。这里的文献要少的多,尽管如上所述,面部生物特征提供了最常见的例子。在评估面部表情方面还有很多工作要做,这是一种提取这些“高级”状态信息的间接方式(如[52])。因此,我们的研究将扩展到这一领域,据我们所知,这是第一次对这一主题进行如此全面的审查。

因此,在本文中,我们的目标是提供一个广泛的审查预测能力的系统,其中获得典型的生物特征数据作为其基本核心功能。本论文将首先对文献中报道的当前领域进行选择性的概述,并对传统的软生物特征预测和上述高级属性预测进行综合研究,虽然传统的基于生物特征的人识别在某种程度上也是一种预测任务,但我们将与这种处理过程相关的活动统称为“预测生物特征”。然后,我们将对该领域的现状进行广泛的分析,总结当前的能力,重要的是,探索该领域未来最有效的发展途径。虽然传统的基于生物特征的人类识别在某种程度上也是一种预测任务,但我们将与这种处理过程相关的活动统称为“预测生物特征”。然后,我们将对该领域的现状进行广泛的分析,总结当前的能力,以及重要的,探索该领域未来最有效的发展途径。

2 生物特征数据预测

关于如何使用软生物识别信息来提高传统生物识别系统的性能以及如何预测预测这类信息,即使有些有限,文献中有多种多样的研究。然而本文的主要目的是探索这类数据更一般的预测能力。

我们会把我们的广泛调查分为两部分,第一部分(2.1节)讨论传统的不受限于对象的年龄或性别的人口统计信息预测,我们将这些特性成为较低级别的软生物测定学。第二部分(2.2节)讨论对对象的情绪或精神状态的预测,我们将这些属性(例如一个对象是高兴或悲伤,压力还是放松)作为更高层次的特征的构成。被普遍认可的是这些特征并不是通常意义上的“软生物特征”,因为它们可以在短时间内发生变化,而且在不同的时间个体之间会有很大的差异。然而,在理解预测性能力的情况下,并且自从它们成为各种基于生物识别的应用的重要价值以来,我们认为这些属性是一个更传统的软生物识别的扩展延伸,虽然它们通常不能被视为直接对个人识别有效的贡献。正如我们所指出的,关于后者的研究报告也比前者少很多。

2.1 低级软生物特征信息预测

尽管迄今为止生物识别处理的主要目的是建立或确认个人身份,人们越来越认识到个人的识别和通常被生物识别系统作为目标的情况之间的密切联系,在这系统中个人重要特征的预测是有必要的。

生物特征数据分析的一部分很可能因此包括估计考虑之中的特定信息的“拥有者”的更一般的特征(例如年龄或性别)的需要。预测一个人的这些特征具有更广泛的应用。但是下一小节报告的调查将集中于与预测一种或多种人口统计信息有关的工作。

2.11年龄估计:在[56,57]中,作者从年龄特征的角度综述了人脸图像合成和估计的最新技术。系统地讨论了现有的模型和算法、系统性能、技术难点、常用的人脸老化数据库、评估协议以及未来的发展方向。

正如所料,大部分年龄预测研究都说关于面部数据的分析。这些研究的主要关注点可分为三类调查:

·研究年龄估算的不同特征或受年龄影响的主要特征[37,58-77]。报告的预测准确率从93%(使用面部老化模式)到73%(使用局部二元模式操作符),虽然正如我们在下面指出的,在解释此类比较时需要谨慎。

·关于不同算法的研究,这些算法能够处理年龄效应导致的面部外观差异[78-95]报告的预测准确度从83%(使用基于最近邻的分类)到70%(使用遗传算法)不等。

·侧重于通过信息融合或使用分类器组合来处理面部年龄相关变化的研究[96-99]。所报道的预测精度范围从95%[使用支持向量机(SVM)作为融合算法时]到92%(使用子空间技术时)

由于这些研究中遇到的实验条件的多样性,有意义的比较分析是极其困难的,但是一些广泛的讨论是有用的。首先,很明显的是,尽管有大量的论文,这一特定的研究在其报告的调查范围内多少受到限制,例如,Geng等人[60,61]提出了一种使用不同数据库进行年龄估计的新算法,他们的工作非常相似。同样的情况也发生在[62,83-85]

很明显,用于识别特性的各种不同技术在某种程度上是有限的。例如,使用流形和子空间结构是一种常见的选择[58、65、75、77、80、83、90]。

在分类技术方面,使用贝叶斯学习等概率技术[74,88,96]非常流行。另一种经常遇到的技术是支持向量机的使用,随着在更传统应用上使用的趋势,这种技术被实现在更广泛的生物识别领域里。

有相对较少的可用数据库提供着必要的人口统计信息用做上述分析,如表1中可以看到,但尽管如此,即使一个有限数量的不同数据集意味着数据库之间的比较被谨慎解释,因为性能变化(如前所述)显然受到了实验参数的影响。需要注意的是,例如,不同的数据库可以采用不同的年龄区间来表征主题的年龄分布,这使得性能比较没有多大意义。

其他生物特征模式在研究领域受到的关注较少;然而,可以找到使用手写签名等形式做年龄预测的研究[103,104]。对步态数据年龄预测的研究可以在[44,105]中找到,而[46,106]则利用不同的几何和纹理特征集研究虹膜数据年龄预测。在[45,100,107]中,作者研究了语音数据对年龄的预测,Markel等[108]研究了指纹对受试者年龄的预测。预测精度从最低的57%(虹膜模式)到最高77%(签名模式)不等,但是上面提到的问题使得得出特定的结论是不明智的。

最后,在文献中有一种非常强烈的倾向,主要集中在使用面部特征来预测年龄,在那里似乎对使用行为模式(如手写签名、击键动力学甚至语音分析)的兴趣要小得多,因此,将这些模式纳入研究范围可能有一定价值。

2.1.2性别预测:再次声明,大多数性别预测论文关注的是面部数据的分析(如[47,109-115])。这些研究的主要重点是利用PCA对人脸进行目标识别,利用SVM进行性别分类。与前面的例子一样,表2显示,提供这类研究所需数据的数据库数量有限。报告的预测精度范围从91%(使用带人脸模式的贝叶斯算法时)到95%(使用带有击键动力学的SVM时)。上节所提到的这些研究的对比性分析的生产的许多相同的困难适用于这个情况,虽然性别类别分配给对象的问题不如年龄的,特定的年龄通常是包含在一组更一般的年龄测量范围。

关于其他模式的性别预测的工作报告少得多。[8]中报道了一项研究,探索了从击键动力学来预测性别,可以找到两项利用iris数据预测该特征的研究[119,120]。自然,时间的流逝带来了探索新的和不同的模式的机会。脑电图和心电信号的分析就是这种模式的一个例子,尤其是考虑到传统的生物特征识别任务时,但到目前为止,对更一般的预测任务的分析还不够。然而,有一项研究可以从脑电图中发现性别预测[121]。

同样,我们可以看到与年龄预测情况的相似之处。性别预测的研究不如年龄预测的广泛,但面部表情再次被认为是此类调查中最常用的方式。与年龄预测一样,使用行为模式(如手写签名或击键动力学)的研究也较少,这可能预示着未来一些可能有成果的研究。

2.1.3多软生物特征预测:可以找到一些已报道的研究,结合其他软生物特征数据预测性别或年龄。这些论文还含蓄地总结了关于预测其他不太被普遍考虑的软生物特征的报道工作。例子包括:

·声音预测年龄和性别 [38,122]

·面部预测年龄和性别 [39,40,43]。

·步态预测年龄和性别 [123]。

·步态预测年龄和身高 [124]

·虹膜预测性别和种族[125]。

·面部预测年龄、性别和种族[41,42,49]。

·笔记预测性别、偏手性和年龄[126]。

·步态预测性别和身高[116,127]。

·脑电图预测性别和年龄[128]。

从已经列出的列表中可以清楚地看出,对多软生物特征预测的重要兴趣是相对近期的,因此,有可能找到以每种模式预测的各种人口指标组,而不一定针对任何组。

从单一数据源预测多个特征并没有在性能上产生任何显著的进步,尽管这显然是一种具有积极实际意义的方法。一个有用的替代方案可能是进一步探索从多个生物特征源预测单个软生物特征的可能性,尽管稍后将会看到,这提出了关于数据库规划和可用性的重要问题。

2.2 高级个体特征预测

我们已经明确指出,本文的一个主要(尤其是新颖的)部分是考虑从生物特征数据预测所谓的“更高程次”特征的问题。虽然由于明显的原因,这些主要是行为模式,但在处理这些状态分析的一系列研究中使用了各种生物特征模式。这些更高级的预测通常与各种形式的“心理”或“情绪”状态(这里我们将交替使用这些术语,尽管我们认识到个别研究可能采用更严格和更正式的定义)。因此,我们也可以考虑将生物统计测量的预测能力扩展和发展到这些更高层次的状态的可能性,例如一个人的快乐或悲伤、平静或紧张的程度等特征。对一个人的心理状态的了解,例如快乐或悲伤、焦虑或平静、压力或放松等等,可能会提供一些信息,这些信息在解释特定情景或评估人类在各种情况下的活动时可能非常有价值。

为了准确地确定一个人的心理/情绪状态,看工作报告[129]将有所帮助,其中作者提供了一个真实的调查给基于情绪的数据做标签并提出了一些重要的问题,例如感知的、经验丰富的情感

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[273113],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。