一种结合图像特征的有效的图像识别方法外文翻译资料

 2022-11-06 15:17:28

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


一种结合图像特征的有效的图像识别方法

作者简介:

  1. Jaekyong Jeong, 成均馆大学,信息与通信工程学院, 韩国水原, 邮箱:jaekyongp@skku.edu
  2. Chijung Hwang,忠南国立大学,计算机科学与工程,韩国大田,邮箱:cjhwang@cnu.ac.kr
  3. Byeungwoo Jeon,成均馆大学,信息与通信工程学院, 韩国水原, 邮箱:bjeon@skku.edu

摘 要

本文提出了一种通过结合图像特征和使用图像聚簇实现的有效的图像识别方法。为了更有效地识别图像,我们以等级的方式使用全局和局部特征。反映图像一般信息的组合全局特征帮助更快地检索候选图像,基于特征点的局部特征有利于与候选图像的精确匹配。我们考虑模糊C-均值聚类方法,因为它对这样的图像数据是有效的——特征相似并且在全局特征上有模糊的边界值。我们使用的全局特征向量是非常有效的聚类和检索,因为它代表了图像的一般属性,其尺寸非常低。其结果是,优质的需要非常大的计算时间和高复杂度的匹配的数目大大减少,因为搜索的原始图像的查询是通过候选图像的部分数据库中的高精度匹配来完成的。

类别和主题描述符

I.4.10【图像处理与计算机视觉】:图像检索。

一般条款

算法,性能

关键字

图像检索,图像识别,全局特征,局部特征,聚类,描述符,标识符,特征点,感兴趣点

声明

允许作为个人或教室使用的全部或部分的数字或硬拷贝的授权是不收费的副本,不作或分配的利润或商业优势和副本承担本通知和完整的引文在第一页。以其他方式复制,转载,张贴在服务器或分配清单,需要事先得到特定的权限或者缴纳相应的版权费用。

  1. 简介

作为多媒体内容,图像可以很容易地被用户出于合法或非法的要求修改从而产生很多不同的版本。针对这些遇到的攻击,图像识别系统被引入来识别一个图像被修改后的不同版本以相互区别开来,即使是在典型的用户修改之后。它从一个图像的内容提取图像描述符并将它与其它图像作比较。它检测一个图像的复制品,即将原始图像与修改后的不同版本进行匹配,如图1所示。

用来解决图像识别问题的描述符大致分为全局描述符和局部描述符。颜色直方图,一个全局描述符的典型实例,它相对观察轴的平移和旋转是不变的,并且随着视角、尺度和遮挡角度的变化非常缓慢地发生改变。然而,它不能区分有类似的颜色分布的图像[1,2]。边缘直方图作为一种强大的全局描述符,体现了图像中亮度变化的频率和方向性。它是一种独特的图像特征,不能通过颜色直方图或同质纹理属性来改变。这是因为它有部分空间限制,将图像划分成相等的子模块[3]。作为一个工具来重建图像,Radon变换是众所周知的,一个二维函数可以根据从沿其域中定义的直线上的积分的知识完全重建[4]。Radon变换的衍生物是Hough变换,这是一个适合稀疏图像的变化,如边缘图[ 5 ]。跟踪变换是Radon变换的一个推广,沿着每个跟踪线计算中值函数[ 6 ]。它们是有用的任务,包括不变的特征构造,图像配准和变化检测。局部描述符是坚定反对几何失真和闭塞,因为小尺寸的本地图像不受空间失真。在检测特征点的方法中,一个图像由一组在由感兴趣点(即特征点)关联的区域计算出的本地描述符描述。该算法对于图像匹配是准确和可靠的,因此主要用于图像识别机制,因为它通过相似性度量来决定点至点对应的一致性。然而,迭代匹配过程的过程导致巨大的计算时间和一个必要的相对大的存储量,来保存本地描述符[ 7 ]。

本文的目的是提出一个快速的、准确的算法来适用于克服局部描述符缺点的任务。图像识别算法作为一个理想的因素,应该考虑处理时间以及其鲁棒性。在本文中,我们将提出一个快速的搜索和比较方法应用在一个大的根据全局特征聚合的图像数据库中,致力于减少处理时间。

本文的结构如下:在下一节中,我们将讨论所提出的方法,提取特征,集群和搜索图片来完成更有效的图像检索。在第3节中,我们提出了实验环境和结果。第4节讨论结论。

  1. 结合图像特征

所提出的方法框图如图2所示。它包括两个过程,离线的过程:构建全局图像聚类的原始图像的数据库,和上线的过程:搜索修改后的查询图像的原始图像。我们解释全局和局部特征提取,聚类,聚类相似度排序,以及精细匹配的步骤。

2.1特征提取

为了构造图像的全局特征,我们提取颜色直方图、边缘直方图、应用Radon变换模式。颜色直方图分析已被广泛应用于图像检索与检索系统[ 1 ]。我们选择的RGB颜色空间,是最常见的颜色空间,其中每个像素通过红色,绿色和蓝色的三个组成部分表现出来。如果我们使用相同的 数量的n个颜色区间来作为R、G、B的通道,我们得到n个三维向量。图像中的边缘构成了表征其内容的重要特征。我们使用边缘直方图特征,一个图像的一种独特的特征,来检索具有相似的语义的图像。边缘直方图描述符的实施是基于MPEG-7的规格的。我们计算边缘直方图根据在YCbCr色彩空间的Y分量,图像分割成子图像并产生一个每个子图像的边缘分布的直方图,其中分为五种类型。我们考虑Radon变换并将其应用于我们的方法的原因如下。图像的二维相关被分解为对应的一维相关,利用Radon变换可以推断原始图像与其修改后的图像之间的相似性。它是由图像进行分解,具体实施是将集成在间隔的Y方向的图像被裁剪到相等的分辨率。虽然有一个小的图像之间的差异,这在转换模式的绝对值中原来是相同的,模式的相似性可以被检测到[ 8 ]。

下一步是,提取的全局信息,颜色直方图,边缘直方图,和应用的Radon变换通过奇异值分解更改为一维信息[ 9 ]。

A=U*diag(S)*V^T (1)

一个M-by-n矩阵奇异值的完全分解是包括一个M-by-p矩阵U,一个的N-by-p矩阵V,和length-p的向量S,其中p定义为min(M,N),即M和N中的最小值。特征值分解用于分析矩阵时是一个适当的工具,它代表一个向量空间映射到自己,因为它是一个常微分方程。另一方面,奇异值分解也是一个适当的工具,用于分析从一个向量空间到另一个向量空间的映射,这两个向量空间可能具有不同的维度。大多数联立线性方程组属于第二类[ 9 ]。我们改变矢量维数,因为我们选择了一个有一个结果集群如何分离的理念和并通过特征尺寸变化获得了更高轮廓值的轮廓图。每个点的轮廓值是衡量自己集群用的点与其它集群点的相似程度的值,变化范围从-1到 1 [10]。

最后,更改后的全局特征与奇异值相结合,代表我们的方法使用的全局特征如下。

V(x,y,z)=[颜色直方图SV,边缘直方图SV,应用Radon转换SV]^T (2)

局部特征被提取出来并存储在数据库中遵循的最佳条件被表达为尺度不变特征变换(SIFT)。提取的特征点数量平均为120~150,基于特征点的局部特征尺寸约为70kbytes每幅图像。

2.2聚类

我们考虑模糊C-均值聚类技术,其中每个数据点属于一个集群,在一定程度上被一个隶属度到聚类的数据库图像。这种技术开始于初始猜测的聚类中心,这是每个群集的平均位置。最初的猜测是最有可能不正确的,并为每个群集分配每个数据点的隶属度。它迭代更新聚类中心和图1.图像识别隶属度为每个数据点到正确的位置内的数据集。它是基于最小化的目标函数,表示从任何给定的数据点到群集中心的距离。我们试图结合全局特征对图像数据进行聚类,但聚类之间的边界不是模糊的,而是模糊的。为了优化图像数据的模糊属性,我们采用模糊C-均值(FCM)聚类[ 10 ],分区数据集根据与每个数据簇相关联的模糊属性。图3显示聚类图像数据的FCM聚类示例。以聚类特征计算和存储最终图像聚类中心坐标的聚类中心。

2.3聚类相似度排序

在线检索过程的第一步是查询图像的特征提取。然后,从数据库中提取的全局特征的查询和聚类特征之间的相似性进行比较,以确定数据库的图像簇之间的顺序的查询。群集相似性顺序提供给下一步,精细匹配,搜索相同的查询的图像。

2.4精确匹配

该方法首先根据聚类相似性顺序搜索数据库中图像聚类中最相似的聚类。它使用的图像数据在集群中使用本地特征之间的细匹配。它继续执行,直到查询图像和搜索图像之间的匹配根据SIFT条件是成功的。精细匹配从图像中提取独特的不变特征,可以用来执行对象或场景的不同视图之间的可靠匹配。图像缩放和旋转的功能是不变的,并提供强大的匹配仿射变换,添加噪声和照明的变化。一个图像描述由一组描述符,它计算相关联的区域与感兴趣点(即特征点)。图像之间的相似性计算是通过计算描述符的距离来完成的,并具有本地信息。[ 7 ]。

  1. 实验结果

该方法是基于双核AMD皓龙处理器2218 2.6 GHz CPU的工作站上实现,4G内存使用MATLAB 7.1。在本节中,我们目前的测试条件,通过修改类型的匹配和匹配的方法,siftonly线性搜索整个数据库中的图像进行比较,减量率数的实验结果比较。我们之所以考虑数量的匹配而不是所需的时间来搜索图像多的时间构建数据库集群消费是脱机过程,确定聚类相似的顺序并不重要与精细匹配比较。因此,匹配的数量是最重要的因素来衡量上线搜索过程的计算效率。

3.1更改类型

我们一般使用的修改分为2种类型,几何修改和滤波修改,如表1所示。测试数据集包含150000个图像,其中有10000个图像是原始的,其他的是他们的十五种不同的修改类型。每个图像的大小归一化等分辨率284x426敏感性降低图像的分辨率。这些图像没有效果,因为我们可能会发现非零填充的图像比更合理的棉衣的人在某些情况下。要构造的图像没有零填充,图像被裁剪到指定的宽度和高度后,在一个修改后的图像的中心变换后的原始图像。

如图4所示,我们比较了一些修改情况下的全局特征。与直方图均衡化相比,颜色直方图和边缘直方图分布在裁剪或平移后变化不大。另一方面,施加的Radon变换的图案是几乎相同的直方图均衡后,裁剪或平移的图像不符合原始。

3.2性能

对所提出的方法的性能进行评估,在两个方面-速度和精度。所提出的方法的速度性能的测定由细匹配数。根据聚类相似性顺序计算完全访问数,在数据库图像中搜索修改后的图像原始版本。匹配数的递减率计算如下。识别精度的性能通过以下公式来度量。

其中R是正确匹配的图像检索和Q号码查询图像的数量。此精度表示成功率,以找到与查询图像相关联的原始图像。

在图5的结果中,我们可以看到,提出的该合并特征点的方法(“合并”)与单一的全局特征匹配(“SV颜色直方图”、“SV边缘直方图”、“SV应用Radon变换”)的每一种情况相比,在显示单一的全局特征匹配的近似的特征点平均数量或者最低数量的方面,我们的合并特征点的方法都表现出了更好的、速率更高的性能优势。如果我们检查结果的修改类型,会发现它在关系到大多数的更改时表现出更高的性能,与直方图均衡化和空间失真的情况相比之下,如旋转,平移,裁剪,剪切等情况发生时。表2体现出了对于特定的不同类型的修改,单个全局特征的性能。颜色直方图和边缘直方图的特点是强大的对于几何修改的抵制,如修剪,翻转,尺度,旋转,平移和具有特别强大的过滤修改能力的Radon变换应用,如颜色或亮度变化。与siftonly方法相比,实验结果表明,在使用本论文提出的匹配方法时,匹配的数目减少了。这一匹配精确度代表找到与查询图像与原始图像的成功率保持平均95%的siftonly匹配和基于数量的匹配计算时间的情况下大大降低平均超过90%,匹配速度是每秒完成7个图像对的匹配。

  1. 总结

对于图像识别算法,搜索目标图像的原始的相同的图像,该方法应该是快速和强大的。在本篇论文中,提出了一种快速、高效的图像识别方法,保持了与以前的方法相同的精度。通过结合全局特征来聚合数据库中的图像,适当的表现出了图像的全局信息,我们的方法降低了需要大量的计算时间的需要使用本地的特征点的图像比对方法的次数,获得强大的加速性能均匀地通过所有的修改攻击。而在精细匹配前的聚合可以通过限制部分数据库图像之间的匹配从而可以减少精细匹配的次数平均值。因此,它减少了处理时间,并且其性能是由递减率非常高的图像匹配来确定的。未来的工作包括提高方法性能,以获得更高的图像匹配速率并使得所有的更改得以递减。

  1. 确认

这项工作是由韩国科学与工程基金会(KOSEF)夺标计划批准,由韩国政府资助(MEST)(roa-2006-000-10826-0(2008))。

  1. 引用

[ 1 ] M. J. Swian,D. H. Ballard,“颜色索引”,国际计算机视觉学报,1卷,7号,第11-32页(1991)

[ 2 ] S. O. Shim,T. S. Choi,“用于图像检索的边缘颜色直方图”,IEEE ICIP 2002,3卷,第957-960页(2002)

[ 3 ] B. S. Manjunath,J. R. Ohm,V. V. Vasudevan,A. Yamada,“颜色和纹理描述符”,IEEE电路交换和视频技术系统,11卷,6号,第703-715页(2001)

[ 4 ] J. S. SEO,J. Haitsma,T. Kalker,C. D. Yoo,“一个使用Radon变换的强大的指纹图像系统”,信号处理:图像通信,19卷,14号,第325-339页(2004)

[ 5 ] A. Kadyrove,M. Petro

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[139317],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。