车牌定位算法的分类和比较
摘要:智能交通系统(ITS)是世界经济竞争的主题。它们是新的信息和通信技术在运输部门中的应用,能够让基础设施变得更有效、更可靠和更生态。车牌识别(LPR)是这些系统的关键模块,其中车牌定位(LPL)是最重要的阶段,因为它决定了该模块的执行速度和健壮性。因此,在这一步骤中,算法必须在克服气候、光照条件、传感器的角度变化、车牌的非标准化和实时处理等几个限制条件下处理图像。本文介绍了车牌定位(LPL)算法的分类和比较,并描述了每种算法的优缺点和所做的改进。
关键词:车牌定位,车牌定位约束,性能,实时性,多定位,卷积神经网络,深度学习
介绍
人和产品的流动性需求使得道路交通越来越麻烦。ITS的设计旨在规避这一问题带来的挑战。车牌识别是这个领域的核心。它基于三个阶段:车牌定位、车牌字符分割和光学字符识别(OCR)。
高效的LPL算法应能实时提供准确的结果。因此,它必须能够管理定位阶段约束:所有车牌类型的多重定位、气候条件造成的噪音、肮脏的车牌或复杂的采集场景、导致图像对比度低或多色外观不标准的照明条件,传感器/车辆距离和捕获角度对车牌的颜色、大小和形状均有显著影响。
在我们的研究中,我们将车牌定位算法分为三大类:基于数学处理的算法系列介绍在第2节,基于板块特征的算法系列介绍在第3节,基于深度学习的算法系列介绍在第4节。在第5节中,比较了根据该相位约束所研究的算法的映射性能。在第6节中,我们将总结我们的工作。
基于数学处理的算法类
图像的数学处理是一个非常活跃的领域,先进的理论被具体化来处理图像的内容。它包括将一幅图像转换为另一幅图像,从而为应用程序提取有用的信息。它涉及偏微分方程、几何工具和优化概念。然后在验证阶段,利用车牌属性。该系列算法可分为五类:边缘提取、形态运算、混合方法、变换和滑动同心窗口(SCW)。
基于边缘提取的算法类
这些算法应用了高通滤波器与原始图像的卷积;它们会突出高频部分,弱化其他部分。这些技术将图像转换成一组边缘,不一定是封闭的,形成图像的重要边界。这些方法将特征和车牌轮廓作为定位的参考点。它们基本上分为四个步骤:
- 应用过滤器提取边缘点。
- 通过选择阈值对轮廓图像进行二值化。
- 分析结果,提取候选点。
- 通过几何、纹理或密度属性进行验证。
[1]作者使用Sobel滤波器从彩色图像中提取边缘,直方图选择二值化阈值。利用二值图像与HSV图像之间的逻辑与,提取黄色候选图像,并从积分图像中提取其他类型的候选图像。验证阶段基于对连通组件(CC)几何特性的分析。垂直梯度密度高的区域为[2]上的候选区域。验证阶段基于宽高比、形状和跟踪准则。
在[3,4]中,为了减少处理时间,对灰度图像进行边缘提取,并使用纹理作为准确分离车牌的判据。
[5,6]中的边缘提取是用Canny滤波器进行的,它是在应用Sobel滤波器之前用高斯滤波器进行降噪。等高线密度是确定车牌区域的关键性质。
这些方法的特点是简单和快速。但在噪声图像、复杂的采集场景或车牌边界与其他图像相比变化不大的情况下,这些特点是缺陷。此外,这些算法使用了两个阈值,一个是在各种光照条件下难以自动选择的边缘提取阈值,另一个是验证阶段的区域轮廓密度阈值,这使得这些算法非常依赖于传感器-车辆距离。
基于形态学运算的算法类
这是一组非线性操作符,目的是用称为结构化元素(SE)的小几何图形探测图像,以突出显示图像中的某些形状。
- 选择合适的结构元素。
- 基于膨胀和侵蚀的形态运算的应用。
- 像素的二进制表示(白色表示物体,黑色表示背景)。
- 基于结果直方图的CC分析。
[7]的作者提出了一种基于开口的定位算法。它是侵蚀后的灰度图像的放大。验证阶段基于结果的水平和垂直投影以及车牌位置的先验知识。因此,该算法不允许多定位。
在[8]中,采用帽子变换和形态梯度相结合的方法提取候选图像。利用密度、位置和长/宽比确定车牌区域。
该类的优点是它对噪声的稳定性,因为它预先对图像的形状进行处理,并一次去噪。然而,它的治疗需要大量的时间,这使得它们不能适应实时系统。此外,在对比度较差的情况下,形态学运算不能给出良好的结果,这些方法对光照条件的灵敏度要求较高。最后,选择合适的结构化元素是一个重要的参数,它受固定的传感器-车辆距离的影响和限制。
混合算法类
这些算法结合了边缘检测和形态学操作。它们通过只保留边缘来简化图像。然后,他们应用形态学操作去噪图像并完成形状,以定义连通组件。并基于几何和/或纹理标准对车牌进行验证。
在[9]中,垂直梯度的大小用于检测候选区域。开度用于降低噪声和去除非车牌目标的形态学运算。然后,候选对象的长/宽比、大小和方向是验证车牌的几何准则。
在[10]中反向处理,以解决这类对光照条件的敏感性。该算法首先进行顶帽和底帽变换,以获得高对比度的灰度图像。然后通过Sobel滤波器提取边缘。验证步骤包括根据几何标准进行连通组件分析。
[11,12]的作者通过使用Canny滤波器提取二值图像的轮廓来提出候选位置。他们在开口处增加了一个连接紧密物体的扩张操作。检查几何标准:矩形形状和宽/高比的区域是一个车牌。在[10]中进行牌照的旋转以纠正偏差。
在[13]中,图像轮廓的提取是通过高斯-拉普拉斯算子 (LOG)滤波器进行二阶导数,然后进行膨胀来细化轮廓和连接对象,通过将候选对象分类为“文本”和“无文本”来精确定位车牌。
这些算法在定位速度上有很大的提高。因此,它们很好地适应了非标准化和多本地化的约束。然而,与边缘提取(不同光照条件下阈值的识别)和形态学操作(显著处理时间)相关的问题仍然存在。
基于变换的算法类
在本课程中,我们将学习基于霍夫变换(HT)、小波变换(WT)和广义对称变换(GST)的子类。
霍夫变换是一种简单的模式识别技术,通过绑定图像之间的像素;它的主要缺点是处理时间太长。为了解决这一问题,[14]的作者提出了预处理步骤,对原始图像的等高线图进行二值化处理,并在此基础上应用霍夫变换提取平行四边形目标。验证阶段包括评估候选人的长/宽比,然后计算在候选人身高的1/3和2/3处画的两条水平线切割的物体的数量。
当图像有噪声时,霍夫变换不能给出一个好的结果。[15]作者提出用中值滤波对图像去噪来解决这一问题。然后,他们应用第二个过滤器来隔离平板可能所在的区域,以减少处理时间。
这个子类的结果是准确的,它可以立即定位任何类型的牌照,因为它关注的是牌照的形状,而不是类型。然而,这些算法不能在实时系统中实现,也不能在车牌的矩形形状不清晰的图像上实现(因为物体模糊、强度的连续性或物理损伤)。此外,这种类型的算法不能定位过于偏斜的板块。
小波变换将图像分解成一组卡片,每一张卡片都有一个特征。[16,17]的作者从车牌与其性状之间的强度差异是定位车牌的关键因素出发。因此,他们通过小波变换将灰度图像分解为四帧,其中他们使用了两帧。在第一个包含水平细节的区域中,搜索存在最大变化值的区域,以确定参考线的位置。通过分析第二幅图像的水平投影曲线(包含垂直细节),他们确定了图像上现有车牌的大小。然后通过扫描图像,他们确定了候选人。验证阶段以几何性质分析为基础。
这些算法与传感器-车辆距离无关,能够同时检测多个车牌。然而,当人物和背景的对比不太清楚时,他们会给出错误的结果。因此,它们对噪音的敏感度很高。
[18]中的广义对称变换评估局部对称性的证据;它提取出图像在各个方向上的对称轮廓图。作者在[19]中使用了车牌的对称性,就像元素键一样来定位它。为了减少加工时间,重点对板材四角的提取进行了研究;因此,他们只在两个对角线方向(45和-45)扫描图像。将两个结果相乘,并将提取的角点连接起来,得到车牌候选点。最后,利用神经网络系统对车牌进行了验证。
为了使这个子类适应实时系统,有必要修复有限数量的扫描。因此,为了获得准确的结果,有必要考虑照明条件和噪声约束。此外,在受损的车牌或其中一个角落被隐藏的情况下,算法会变弱。
基于滑动同心窗的一类算法
该方法是基于像素强度提取感兴趣的区域。在[20]车牌的定位通过两个阶段:第一个阶段是用两个SCW对图像进行标准差扫描;如果这些值超过预定义的阈值,则该像素属于感兴趣的区域,该区域被标记为1,如果不是,则该像素值为0。结果是候选人的二值图像。第二阶段使用几何标准来验证车牌。该方法适用于多定位应用。然而,由于它是基于像素的强度,低分辨率或糟糕的照明条件是它的阻塞点。因此,它的简单性使得它无法处理嘈杂的图像或复杂的场景。
基于车牌特征的算法类
这些方法假定对车牌属性有良好的先验知识, 有助于实现其定位的稳定模型。他们认为车牌是一个在图像中具有定义属性的对象:特定的纹理、独特的颜色组成或两种组合。识别车牌的性质是这些算法的第一步。然后,每个像素由这些属性的向量表示。因此,分类方法对像素进行分类和标注,以表明它们是否属于某个区域。最后,验证阶段是基于几何准则或直方图分析。这些方法的定位率通常很高,但它们对处理过的车牌类型是特异性的。
基于车牌纹理的算法类
这类算法的重点是分析车牌纹理。他们假设车牌及其字符具有特定的纹理,可以将其与其他图像对象区分开来。
基于以下四个特点:
- 在一个小区域中包含多个字符,
- 人物和背景形成鲜明对比,
- 牌照尺寸相对固定,有固定的长宽比,
- 车牌倾斜角度在一定范围内。
[21]中的算法构造属性向量对像素进行分类。验证阶段基于结果直方图分析。
[22]的思想是车牌位于图像的纹理区域。因此,他们将图像分解成块。计算每个块的密度,将其划分为“纹理”或“非纹理”。验证阶段以几何标准为基础。
[23]作者基于以下车牌特征实现了四种车牌定位算法:
- 连接区域的长/宽比,
- 背景区域,
- 字符/牌照面积密度,
- 牌照中心的边数。
这些特征可通过确定性、概率和两种组合方法加以利用,为每一种方法取几个阈值来验证结果。
该类使用显示区域内属性度数的值。这些值直接受到噪声、传感器-车辆距离和图像分辨率的影响。
基于车牌颜色的算法类
一种独特的颜色组合几乎只出现在车牌区域是这些算法的基本思想。在[24]中,在HSV (Hue, Saturation, Value)空间进行像素分类,解决不同光照下宽RGB (Red, Green, Blue)值的问题。验证阶段是基于长/宽比评估和投影曲线分析。
[25]的作者将其方法建立在模糊逻辑基础上。它们将彩色图像分解成4张卡片:E表示使用作者实现的颜色边缘检测器计算出的边缘图,H、S和V是保留了变换后图像的色调、饱和度和强度分量的图。E、H、S和V是对像素点进行分类的模糊系统的条目。结果表示属于一个车牌的像素的度数。验证阶段被委托给OCR。测试库的丰富性验证了算法的定位性能。然而,由于处理时间较长,使得该方法不适用于实时系统。
该类算法具有较高的
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[596142],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。