使用特征空间方法对硬币进行分类外文翻译资料

 2022-11-03 21:28:11

英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料


使用特征空间方法对硬币进行分类

摘要

我们提出了一种基于视觉的硬币分类方法,它能够区分数百种不同的硬币类别。所描述的方法是一个多级过程。在第一阶段,计算了一个描述平移和旋转的不变量。在第二阶段,选择一个照明不变,并且对每种类型硬币的导出正反面概率都是可能的特征空间。在最后一个阶段,硬币类型的两边通过贝叶斯融合包括一种拒绝机制的概率都是可能的。在包含11949个硬币的测试样本中,对93.32%的硬币实现了对932种不同硬币类别和拒绝类别之一的正确决定,即正确的分类或拒绝。对于6.67%的测试硬币,获得了虚假的决定,即虚假分类,错误拒绝或虚假接受。

介绍

慈善组织如奥地利“Dichel”将捐赠来自世界各地的硬币。这些硬币根据其面值和原产地分类是本文提出的方法的应用领域。在2001/2002年底欧洲国家执行欧元的情况下,奥地利公民被要求捐赠他们可能在家里的任何备用硬币,“Licht ins Dunkel”的硬币收藏就是在这个过程中发生的。在这次竞选中,三千万硬币来自于虚拟世界上所有国家,但主要来自十二个欧盟成员国。如此多种类的硬币超过了现有的机电硬币识别机的鉴别能力。

使用机电装置的硬币判断系统通常基于测量重量,直径,厚度,磁导率和电导率(戴维森,1996),振荡电磁场特性(Nubarth等人,1998)以及光电和压电特性(Shah等人,1986)。Fukumi等人描述了使用图像处理的硬币分类(1992),并使用神经网络方法来区分500韩元和500日元硬币。最近,Nouml;lle(2003)和Fuuml;rstet等人(2003)中描述的达戈贝尔硬币识别和分选系统用于高容量硬币和大量货币。我们使用与Fuuml;rst等人描述的相同的机械设置(2003),但是与Nouml;lle等人描述的匹配方法不同(2003年)。

在专利中可以找到许多使用光学手段的硬币鉴别方法,例如,Hibari和Arikawa(2001)描述了硬币的两面首先通过照相机成像的系统,然后从二值化的图像得到特征,最后结果被组合用于每一侧并且用电磁传感器测量。Uenohara和Kanade(1997)对匹配旋转图案的方法与所提出的方法类似,他们描述了一种通过均匀旋转的图像构建本征空间的方法。他们方法是通过在更大的图像中定位特定的小图案来工作,而我们的方法旨在分类大量的类别。在后来的文章中,Uenohara和Kanade(1998)描述了其基于离散余弦变换(DCT)的模板定位方法的改进,我们方法的一部分也是基于本征空间方法的利用。我们的方法不同于Uenohara和Kanade建议的方法,因为本征空间是从旋转到参考方向的图像构建的,因此,每个图像只一次包含在用于构建本征空间的图像集中。

本征空间法是用于构建最具表现力子空间的子空间方法。线性判别分析(LDA)(Belhumeur等人,1997)和支持向量机(SVM(伯吉斯,1998)构建体区别最大的子空间,对于给定的一组类,LDA构建的子空间最大化了类间散度与类内分散之间的比例,LDA关于分类问题的缺点是通过不同的类别来区分,对于每个类的组合,需要一个特定的子空间类。此外,对于某些类,仅存在单个示例硬币,因此不可能估计类内分散,SVM使用所谓的内核映射技术将不可线性分离的数据映射到可以线性分离的超空间中。支持向量机是能够两个类之间进行区分,对Kgt; 2级的类集合方案诸如每类中的一个(OPC)和采用成对偶合(PWC)(吴等人,2001)。不幸的是,这些方案在计算上非常苛刻,即对于使用OPC K的K类问题,二进制分类是必需的,并且对于PWC K(Kge;1)/ 2需要二进制分类器。

我们提出一种基于视觉的硬币分类方法,其能够区分非常大量的硬币,即来自30个国家的硬币和总共932个不同的硬币图像,所提出的方法是多阶段程序(Pudil等,1992),分为以下几个阶段:

  1. 平移和旋转不变性和假设生成的处理
  2. 本体空间的选择和分类
  3. 贝叶斯融合与拒绝

在阶段1中进行硬币的检测,即去除平移依赖性,旋转不变性的处理和分类假设的产生。对于后续的步骤,保留了硬币的正面和反面的少量分类假设。假设是从映射到极坐标后观察到的与参考图像之间是相关性的。在阶段2中,根据硬币厚度和直径估计来选择适当的本征空间,厚度和直径测量值允许多个本征空间的结构,其中的每一个仅跨越的厚度/直径平面的一部分,因此,减少了在单个本征空间中表示的硬币的数量。根据厚度和直径,最多113个类别在单个本征空间中表示;平均30.9个类包含在一个本体空间中,对第1阶段产生的假设进行特征空间的距离评估,并与概率相关。阶段3通过应用于硬币边的贝叶斯融合提供最终决定,贝叶斯融合融合了硬币方面的概率和关于正面和反向硬币边之间的旋转角度一致性的知识。使用基于阈值融合概率的拒绝机制来整理未知硬币和弱支持的决策,选择拒绝阈值以优化复合目标,即正确分类(已知硬币正确分类)和正确拒绝(未知硬币未分类)的最大化和最小化虚假分类(已知硬币是分类为错误的类),错误拒绝(已知硬币被拒绝)和虚假接受(未知硬币被分类)。

本文未讨论的机械设置包括许多设备(Fuuml;rst,2003,Rupp,2003)。首先,将硬币通过奇异化装置输送到传送带上,传送带将硬币通过两个相机移动到分拣机构。在相机之间有一个转动装置,即一个用于反转硬币的机械装置,相机使用圆形照明和阻挡环境光的保护装置。另外,在每个相机前面,光幕允许每个硬币的厚度测量,输送带最终将硬币运送到根据分类结果气动弹出硬币的一个盒子。

在本文中,我们将描述图像处理和硬币分类。第2节总结了本征空间方法的数学符号,并回顾了应用于硬币分类问题的多个特征空间的概念,在第3节中,关于翻译的不变性,讨论了硬币图案处理的旋转和照明,第4节介绍我们的分类,融合和拒绝方法。第5节介绍结果,结论在第6节中找到。

个人空间

Sirovich和Kirby(1987)引入了图像分析的本征空间分解,并发现了在过去几年的许多应用中在脸部识别领域最突出。我们首先介绍在下一小节中使用主成分分析(PCA)的本征空间构造的数学过程,随后,我们在硬币识别的上下文中讨论多个特征空间。

2.1硬币主成分分析

我们考虑一组M图像B1到BM。每个图像Bi的大小为N * N个像素。图像被重新形成向量到,例如通过逐行扫描图像,如果使用图像的所有像素来产生矢量,则每个矢量具有长度L = .平均矢量psi;和差矢量我是由以下公式计算的

(1)

Phi;i的协方差矩阵定义为

. (2)

主轴通过协方差矩阵C的特征分解获得(Sirovich和Kirby,1987; Turk和Pentland,1991),根据相应的特征值,以不增加的顺序对特征向量进行排序。从排名特征值中保留了一小部分M0的重要特征向量,这是一种常见的做法,导致最具表现力的特征(Turk和Pentland,1991)。通过将第k个本征空间分量投影到第k个本征空间分量上,获得对应于新的重整图像的第k个特征图像的权重因子 (3)

对于硬币识别任务,不是将完整的图像重新形成矢量,只有硬币的内部像素被重新排列到矢量中,见图1。

2.2多个特征空间

已经引入了多个或模块化的特征来观察Pentland等人的定向独立面部识别(1994),这是一套基于视图的特征空间,每个人在共同的视图下捕获不同的类。最近,Leonardis等人提出了构建多个特征的自组织框架(2002)。另一种方法是参数化本征空间,用于识别由Murase和Nayar(1995)在不同姿态和照度下的3D对象。在后一种方法中,照明和几何变换的不变性通过改变用于构造本征空间的图像的姿态和照明来实现。在硬币识别任务中,我们将硬币视为在受控照明下拍摄的2D物体。根据其直径和厚度测量,构造多个特征空间来对硬币进行分组。因此,每个本征空间都是由一个图像子集构成的,因此,只有中等数量的类在一个本征空间中表示。扩散在硬币直径和厚度平面上的多个特征的优点是双重的。首先,从较少数量的图像构建特征空间在计算上要求较低,其次,在单个本征空间中存在的较少数量的类别中,可以更快更可靠地执行分类,而不是在所有考虑的情况之间。

由于直径和厚度设置有每个硬币图像,所以直径/厚度平面被划分成规则间隔的区域。对于每个这样的区域,建立本征空间,因此区域m由Esm表示。区域Esm的特征在于其最小和最大直径dlm,dhm,以及最小和最大厚度tlm,thm。每个区域的扩展名为Dstep和Tstep。直径和厚度的全局最小和最大度量Dmin,Dmax,Tmin,Tmax都是从硬币统计得出的。硬币边类Bi通常覆盖多于一个本征空间。每个本征空间的硬币边类的数量计算如图1所示。图2示出了直径/厚度平面的分隔,其中每个单元格ESm表示单个本征空间。每个硬币边Bi覆盖至少一个本征空间。由于直径和厚度公差和测量误差,每个Bi通常表示在多于一个本征空间(见图2)

图1

图2

不是每个本征空间被硬币类占用,例如,大直径和小厚度的组合反之亦然。一些特殊的空间由单个硬币一侧占据,这是意想不到的,直径和厚度应该是一样的,无论硬币的正面和反面是否被看过。这个问题是由于测量噪音小的原因引起的。最后,一些相邻的特征表示同一组硬币类。对于考虑的样本,最常见的特征是发现大约2毫米厚和24毫米直径,最多发现113。更具体地说,Dstep,Tstep和tol是设置为0.3mm,这导致1000个潜在的特征空间,其中494个被至少一个硬币侧图像占据。在494个硬币边图像中,21个特征空间仅包含一个硬币侧图像,这使得分类冗​​余,并且其他95个特征被复制。平均每个特征的硬币边类的数量是30.9。

3.不变量预处理

不变量预处理是在以模型匹配为基础的模式辨别方法的重要步骤,例如特征空间法。可以考虑使用旋转、缩放和平移这三种几何变换。照明也是变量的一种,主要是由于硬币表面磨损或脏污受到可控光束照射产生的折射差异。由于摄像机和对象之间已知距离的静态设置,我们的工作中没有解决尺度不变性。通过分割的硬币检测实现了转换不变性:分割结果保持了中心的硬币图像。 第3.1节讨论硬币分段。 对于更一般的讨论,请参考与规模和翻译不变模式识别相关的大量作品,例如傅立叶 - 梅林变换(Altmann和Reitbo?,1984)。 旋转不变性通过坐标映射和相关性实现,详见3.2节。 第3.3节详细讨论了本征空间方法的照明不变性。

3.1平移不变性

硬币的检测采用共同的分割方法,并可靠地控制照明条件和清洁背景,即中等脏的输送带。 问题可能是由非常暗的硬币引起的,即,仅向镜头反射少量光的硬币。 在这一点上,提出了一个多阶段分段程序。 分割方法的概要是:

1.平滑图像以抑制输送带纹理。

2.使用拉普拉斯高斯方法进行边缘滤波,然后进行零交叉检测(Marr和Hildreth,1980)。

3.检测区域的标记和最大边界区域的选区作为硬币区候选。

4.通过计算硬币区域候选人的凸包来形成一个二进制对象。

硬币的位置和直径由检测到的二进制对象估算而来,这直接表明平移具有不变性。

3.2旋转变换不变性

旋转不变性有时通过使用几何矩(Hu,1962),特征的径向编码(Torres-Mendez等人,2000)或使用从笛卡尔到极坐标表示的映射(例如对数极坐标映射( Kurita等,1998)。我们通过估计旋转角随后旋转到参考姿势来获得旋转不变性。 对转换为极坐标的图像进行角度估计。 在极坐标图像偏移不变性中,对应于映射回笛卡尔坐标的旋转不变性通过互相关来实现。 使用快速傅里叶变换(FFT)(例如,

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[140623],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。