使用基于内核的极限学习机和深度卷积特征识别中国车牌外文翻译资料

 2022-12-05 16:42:54

英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料


使用基于内核的极限学习机和深度卷积特征识别中国车牌

摘要:车牌识别(LPR)是智能交通系统的重要组成部分。和字母以及数字相比,汉字包含更多信息,使得自动识别更加困难。准确的中文车牌识别(CLPR)由三个因素决定:训练数据集,特征提取器和分类器。大多数车牌的基准数据集一般只包含字母和数字;因此,作者为中文车牌识别(CLPR)构建了一个大型数据集。卷积神经网络网络(CNN)可用于在各个抽象层次上提取图像的固有特征。如果它们具有足够数量的完全连接的层,CNN则可以用于进行分类。这意味着必须使用基于梯度下降来训练CNN,这通常会导致次优的结果。极限学习机(ELM)在分类上的表现令人印象深刻,具有良好的泛化。因此,作者提出了一种新的CLPR深层架构,它结合了CNN和ELM。首先,把没有完全连接层的CNN作为特征提取器,深入地学习与书面汉字中的字符相关的特征。然后,基于内核的ELM(KELM)分类器接受CNN的特征作为输入,并被用于分类。与使用Softmax(柔性最大值输出函数),支持向量机和ELM的CNN相比,使用KELM的CNN在更短的训练时间内能产生更具竞争力的结果。

  1. 介绍

自动车牌识别(ALPR)是设计智能交通系统(ITS)的一个重大问题。世界上的所有车辆都应该有一个车牌号码作为他们的唯一标识符;由于这一要求,在过去的几十年中ALPR技术已经取得了重大进展。准确稳定的ALPR是设计ITS的最重要的问题,如电子支付系统(通行费,停车费等的支付)以及高速公路和主干道交通管理系统的监视。此外,因为有观点认为ALPR系统可以用作监控未授权车辆侵入私人领域的控制系统,社会的安全意识日益增强致使对车辆认证的需求也增强了。在中国,车辆的车牌(LP)是长方形的,具有七个字符。任何中国车牌的第一个字都必须是中文字,它代表汽车所属中国的省份。由于汉字和英文以及数字相比有着更复杂的笔画和外形,在中国车辆的车牌识别更为重要。因此,为了智能交通系统(ITS)在中国的发展,准确和稳定的中国车牌识别(CLPR)是一项重要和具有挑战性的任务。尽管ALPR已经是一个被积极研究超过十年的话题,但是缺乏基准数据库是一个公认的问题,CLPR面临着同样的问题; 因此,现有系统通常是实验性的,它们根据不同的基准进行评估,使得难以在不同的系统中进行一个合理的比较。在过去的几十年中,许多ALPR模型被推出。早期的模型主要使用手工制作的特征和采用简单的机器学习算法; 这些方法

很容易过度拟合,只能找到局部最佳解决方案。最近,深度神经网络(DNN)被用来自动学习图像的特征,并且已经表现出了令人印象深刻的识别准确性。因此,为了解决CLPR中的这些挑战和问题,我们提出了一种新颖的CLPR深层架构,并设计专有的训练数据集用于测试这种深层架构。 研究人员已经成功构建了各种深度模型,如深度CNN、深度自动编码网络、深度信念网络以及深度极限学习机(ELM)。CNN是DNN中最受欢迎的一种,能够用来学习一个目标稳定的特征。许多最先进的图像识别算法是基于CNN的。传统的深层CNN用于提取并且分类特征这两种功能已经开发出了很多应用程序。这些不同的CNN可以实现非常棒的结果,但通常是以非常庞大而复杂的网络架构为代价。在深度神经网络中使用几个完全连接的层会导致局部最小化的问题,抑制泛化能力,并且造成沉重的计算负担。两个典型的研究结合了CNN学习表示与支持向量机(SVM)分类器在不同的数据集上测试所得到的混合模型;这些混合模型表现出色。尽管如此,Zeng等人提出了新的深度方法,称为CNN-ELM和CNN-KELM,他们结合了深度CNN具有的卓越判别能力和ELM或KELM分类器优秀的泛性表现,并展示了这些混合模型在交通标志识别(TSR)任务中的完美表现。Huang等人推出ELM和KELM作为强大的单层前馈神经网络(SLFNs)不仅在检测表现方面,而且在时间花费方面胜过SVM和其他常规分类器。受到前面提到的想法的激励,我们构建了一个新颖的深层架构以处理ALPR的有限精度瓶颈以及CLPR的弱泛化能力。在本文中,我们提出了一种利用CNN的良好代表能力和KELM的高训练效率的方法。因此,我们为CLPR提出了一种新颖的深层架构。据我们所知,我们是第一个将具有深层架构的模型应用于CLPR。首先,在我们的方法中,用一个没有完全连接层的CNN作为一个特征提取器,学习LP中文字符的深入和稳定的特征。然后,提供一个基于内核的ELM分类器,对由CNN生成的特征进行分类,具有出色的表现。为了评估提出的深层架构模型,我们从不同的交通视频中构建了一个庞大的图片数据集,其中包含白天和夜晚获取的15,600张图片。使用这个新颖的训练数据集,CLPR的实验证明提出的架构与其他模型相比可以在更短的训练时间内产生强有力的结果。本文的主要贡献如下:

  1. 建立了一个包含65个子集的CLPR数据集。这些子集包括字符0 - 9和A - Z,不包括I和O。此外,还包括31个中国省份的名称。每个子集由包涵各种白天和夜间的车辆图像的样本组成。因此,我们提出一种更有效的利用车流量视频的方法收集中国车牌(CLP)图像。
  2. 设计出一种新颖的CLPR深层架构。本文中提出的模型利用了深度神经网络完美的区分能力。CNN的输出是被传递到KELM分类器,这是为了产生好的泛化效果。最近许多关于图像或视频识别的作品已经提出了各种CNN架构,并且我们评估了一些以前提出的模型,只保留那些对于ALPR很重要的细节。输出的结果是一个更简单但仍然有效的DNN,几乎能够表现出最先进的结果了。
  3. 进行了大量模拟,并显示出DNN在CLPR数据集上测试能够以更低的复杂性,更高的精确性和更短的训练时间展现出更好的结果。

本文结构如下:在第2节中,我们回顾一些相关工作,并提供DNN的概述。第3节解释DNN的详细实施。第4节展示实验评估的结果。第5节给出结束语和未来的工作。

  1. 相关工作

除了第1部分中提到的有关ALPR,CNN和ELM的一般性研究,我们会进一步审查以前与现在的研究密切的相关理论的分析。

车牌定位技术是一种成熟但不完善的技术,它应用于ITS的许多应用。ALPR算法一般包括以下三个处理步骤:(1)定位车牌区域(2)车牌字符的分割(3)识别文字。Chang等人是第一个设计实时LPR算法,基于模糊(用于LP定位)以及神经网络的定位和识别步骤(用于车牌字符和号码识别)系统。实验表明,这种LP算法定位成功率为97.9%,识别成功率为95.6%,总体成功率为93.7%。Anagnostopoulos等人,重点关注的是在下一个阶段需要主要依赖的分割阶段。这是一种新颖的分割技术,称为滑动同心窗口,用于更快地检测感兴趣的区域。这项技术在本文中应用于LPR问题时达到了96.5%的正确分割率。当这项分割技术和一个概率性神经网络组合起来时,车牌识别问题的成功率达到了89.1%,整体成功率是86%。Wen等人提出的一种改进型的图片倾斜修正以及图片灰度增强技术,它们结合了一种改进的Bernsen算法和高斯滤波来检测车牌的汉字字符,并且运用了影子SVM分类器来确认车牌字符。实验表明完全的定位和分割比例是97.16%和98.34%。数字,假名和地址的识别率分别达到99.5%,98.6%和97.8%。此外,颜色是中国车辆车牌的重要特征,是首先需要被考虑的。这里提出的方法产生了一个使用颜色伴随属性来更准确地定位并在车牌背景色和车牌字符之间转换,成功定位率为95.01%。在此基础上提出了一种车辆车牌特定字符的极值区域和受限于Boltzman机器混合区分的识别方法。我们提出的方法对于照明变化和在24小时或1天内天气条件的改变是稳定的。最近,Asif等人,提出了一种简单而有效的CLPR的颜色检测方法,可在各种天气下和照明条件进行。实验结果表明这种方法的准确性是93.86%,平均每幅图像的处理时间为0.33秒。Wang等人使用了一个背景传播神经网络用于中国车牌识别,实验结果表明正确识别率为84.62%。Chen等人介绍了一种用于Android平台的SVM中国车牌识别方法,实验表明这种方法的汉字识别准确率达到82%,数字和字母的识别准确性也很高,是96%。

上述研究是有深刻见解和重要意义的。但是,这些提出的方法大部分都使用了影子机学习算法,并没有考虑中国车辆车牌首字符的复杂自然特征。因此,识别汉字的准确性离理想的中国车牌识别还很远。尽管如此,这些方法的识别的准确性和泛化能力和车牌图像手工制作的元婴并不能达到令人满意的程度。为了设计一个稳定而高效的中国车牌识别方法,深度学习应该是一个有效的框架。根据有关混合CNN的代表性研究,将CNN输出提供给SVM分类器可以在标准数据集上产生令人满意的分类结果。但是,这种CNN-SVM框架的泛化能力是无法保证的。由Huang等人提出的ELM 算法表现出很高的训练效率和几乎最优的泛化性能。对于许多分类和识别应用(MNIST,CIFAR-10和Google Street-View House Numbers),与传统算法相比,与深度学习相结合的ELM取得了更好的效果。特别是针对TSR问题的CNN-ELM和CNN-KELM方法可以保证高识别精度和相对稳定的泛化性能。中国的车牌和交通标志具有相似的颜色信息(图1)。CNN-ELM框架所展示的TSR任务的竞争结果激励我们为中国车牌识别设计类似的深层架构,以改善有限精度和泛化性能的问题。

在本文中,基于我们之前关于中国车牌识别的工作,我们想出了一个准确和强大的中国车牌识别系统,该系统应该能够在各种条件下有效地工作,如阳光明媚的日子、夜晚以及不同颜色和复杂背景。我们根据CNN强大的特征学习能力及其良好的泛化能力,提出了一种新的中国车牌识别深层体系结构。首先,用没有完全连接层的CNN作特征提取器,并深度学习与中文车牌相关的字符和突出特征。然后,使用一个基于内核的ELM分类器把CNN的输出进行分类,结果显示很好。CLPR实验表明,与其他方法相比,我们所提出的体系结构可以在更短的训练时间内获得有竞争力的结果。

图1.中国的车辆车牌和交通标志的颜色是相似的。左侧显示中国车辆的车牌,右侧显示交通标志。

  1. 提出的CLPR深层构架

在这部分中,我们为中国车牌识别提出了一种新颖的深层框架。我们会详细阐述框架的全部。CNN-KELM是建立在多重方式上的,如图2所示。

3.1输入数据的来源

在特征学习之前,拍到的车牌原始图像应该被裁剪并调整为20times;20像素的图像。目标物体的图像根据其位置,阴影和移动而变化。为了准确识别,我们以编程方式裁剪交通摄像头拍摄的图像。我们裁剪并标记了从不同交通视频中收集的大量图像数据,其中包括白天拍摄的150times;65幅图像和夜间拍摄的90times;65幅图像。所提出的捕获车牌图像的方法如图3所示。

图2.CNN-KELM深层架构由两个子系统组成:一个具有卷积层和池层的多层网络用于深度特征提取,以及一个基于内核ELM算法的全连接分类器,用于最终决策。

图3.获取车牌图像提出的方法

所有数据都进行了混洗,并将混洗后的组分为训练组和测试组。测试集合用于测试算法对先前未遇到过的数据的预测能力。测试集合占整个数据集的20%。实验数据集由65个子集组成,其中包含字符09和A - Z以及中国31个省份的名称外,除了字母O和I,。每个子集都覆盖变量的样本组成,这些变量具有足够的变化范围,涉及白天和夜间获取的图像数据。

颜色可以显著影响图像识别。CLPR与TSR类似,是一种强烈的依赖颜色的识别任务。 因此,在Lab空间中提供给CNN的图像应该保留更多关于颜色分量的详细信息。使用交通摄像头采集的原始LP红 - 绿 - 蓝(RGB)图像应转换到Lab空间中进行深度特征提取。RGB图像不能直接成为Lab图像。首先RGB图像需要使用如下方法转化至XYZ空间中:

公式里的i从1至N*N,这里的N是20。然后Lab图像能够通过以下公式进行计算:

公式里的f(_)是一个白噪声连接函数,能够被以下公式表达:

3.2深度特征提取

为了完成用于CLPR深特征提取,我们建议,可以被认为是类似LeCun的基本模型,它被设计用于识别手写体和机打字符的CNN。考虑到汉字的复杂性,CLPR的CNN与传统的CNN在两个方面不同。首先,在每个卷积层中使用较小的接受场(3times;3)来捕捉汉字中更复杂的笔划。其次,使用更多的卷积层和汇集层,接着是整型线性单元层(ReLU),用于捕获CLPR中文字符的深层结构信息。

在所提出的系统中,基于CNN模型的深度特征提取器由层次卷积和分层组成。在卷积层中的特征图通过卷积核由像素在先前层象素滑动萃取,在池层中的池映射由比前卷积层汇集功能收集的。在每个卷积层,每个神经元局部地总结从作为输入被提供前面的层中的所有输出,并通过一个非线性激活函数将结果传递诸如S形或双曲线正切。在本文中,我们只考虑S形函数,即,G(X)= 1 /(1 EXP(-x)),因为在我们的初步实验,我们发现,用其替代品,如线性和多项式相比其性能优于内核。然后我们能够开始用下面的式子定义卷积层:

其中W是卷积滤波器的Htimes;M权重矩阵,b是偏差,这两个参数是通过训练卷积网络获得的。 参数x是指为卷积层中的神经元(i,j)提供输入的神经元的激活。

每个汇聚层对应于通常执行最大或平均响应操作的先前卷积层。 本文只考虑最大化池。然后,对于每个汇聚层,输出可以定义如下:

其中y是与池层中的神经元(i,j)连接的Htimes;M神经元贴片,并且o是合并层的输出。

与经典的CNN模型不同,我们考虑了一个处理过拟合问题的退出机制,并使用ReL

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[21434],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。