基于PCA-BP神经网络的数字仪器识别
Jun Zhang, Lin Zuo, Jiawei Gao, Shaoan Zhao
电子科技大学能源科学与工程学院,成都
摘要
数字仪器在工程实践中得到了广泛的应用,数字仪器的识别技术一直受到广泛的研究。诸如神经网络之类的人工智能算法在目标识别领域被广泛采用。但是,目标识别中现有的神经网络算法需要手动调整隐藏层神经元的数量。它们非常耗时并且难以收敛到最佳解决方案。本文使用PCA算法和传统的BP神经网络来自动选择隐藏层中的神经元数量。实验结果表明,与传统算法相比,PCA-BP神经网络算法可以提高识别效率,降低人工调试的成本,并保证算法的准确性。
关键词:数字仪器;字符识别;PCABP神经网络;相似度匹配方法
- 简介
数字万用表是一种多功能的测量仪器,已在工程实践中广泛使用。通过图像识别自动识别万用表读数有助于降低劳动强度,提高工作效率并减少错误。通常,万用表的自动识别过程主要可分为三个阶段:表盘区域提取,图像预处理和字符识别。
对于拨号区域的分割,沈等人[1]提出手动提取需要识别的数字区域。在文献[2]中,通过区域增长方法获得的分割结果可以提供更好的边界信息,但是可能容易受到照明的影响,导致过度分割或分割结果偏离目标区域。雷等人[3]提出通过颜色特征来定位表盘。此方法考虑了仪器的颜色特性,但需要预先设置仪器的颜色。在文献[4]中,提出了一种多帧差分累加的方法。此方法仅适用于视频,不适用于单张照片。本文提出了一种基于相似度度量的匹配方法,对原始图片,给定模板的仪器可以快速,准确地获取刻度盘区域,避免了人工拦截,并有效地抑制了光的影响(文献[5])。
对于字符识别,BP神经网络用于高精度识别字符。为了确定隐藏层中的神经元数量,匡等人[6]根据经验直接提出了25层。此方法易于实现,但不是针对性的,这可能导致隐藏层太少而导致结果不准确,或者隐藏层太多而导致训练时间过长。 刘等人[7]提出了一种通过进行许多实验来确定隐藏层数的方法。该方法是准确的,但是工作量太大,并且许多测试很耗时。
于是提出了一种结合PCA和BP神经网络的方法。隐层神经元的数量是通过PCA方法确定的(文献[8]),这种方法可以避免测试隐层神经元的数量的耗时过程,而不会牺牲识别数字字符的准确性。
所提方法的流程图如图1所示。
中值滤波
灰值处理
Otsu阈值法
拨号区域的提取
数字字符识别
字符特征归一化
字符区域的提取
图1自动识别系统流程图
- 拨号区的提取
在读取数字万用表之前,需要对转盘区域进行分段。 目的是找到图片中包含有用数据的感兴趣区域。本文采用相似度匹配方法,可以有效避免噪声对照明引起的路段影响。
相似性度量匹配(文献[9])将已知模板与原始图像进行比较。将模板T的大小设置为M x N,搜索到的图像S的大小为W x H。模板T的中心沿图像像素滑动,并且模板覆盖的图像区域记录为局部图像c,(i,j)是图S中的Si,j的左上顶点的位置。i,j两点的搜索范围是:。 通过比较T和Si,j之间的相似性,可以选择所需区域。下列方程可用于测量T和Si,j之间的相似度:
或者,可以将其以矩阵形式编写为:
当向量t与S1之间的夹角为0,即S1(i,j)=Kt时,可以得到R(i,j)=1。否则,R(i,j)lt;1。R(i,j)越大,T的模板与Si,j越接近。 点(i,j)是要识别的匹配点。 根据上述方法,提取的关注区域显示为0。
与区域生长方法相比,相似度匹配方法的结果更为理想。由于相似度匹配方法可以避免表盘右上角的照明影响,因此可能对区域生长方法的结果产生不良影响。因此,在我们的研究中,我们使用这种方法准确地对数字字符区域进行了分割,并且提取的区域将用于随后的阅读识别。
图2两种算法的比较
(a)区域增长方法的结果(b)相似度匹配方法的结果
- 图像预处理
由于万用表可能已使用了很长时间,因此显示屏通常会包含许多随机分布的污垢,这对图像识别有重大影响。中值滤波器可以消除随机噪声和孤立噪声,而不会损坏图像的细节。在我们的研究中,首先使用中值滤波器对原始图像进行降噪。水平和垂直投影方法用于确定每个数字字符的位置,该方法主要适用于二进制图像,需要使用加权平均方法对图像进行灰度处理,并使用Otsu算法来实现拨号图像的二进制化。OTSU算法是图像阈值算法,由大津开发(文献[10])。 执行这些算法后的结果如图3所示。
图3图像预处理
(a)灰度图像(b)由中值滤镜过滤的图像(c)执行膨胀和二值化后的图像
- 字符分割
水平和垂直投影方法是通过分析投影值的数值来计算图像的水平投影和垂直投影,以及数字字符在图像中的特定位置。
通过上述方法获得的二值图像设置为B,图像B中的行数为h,列数为w。 根据投影的定义,可以将水平方向的投影值计算为
同时,垂直方向的投影值计算为:
其所在位置,即垂直投影值沿横坐标从零到非零变化,表示字符的左边界。 同样,可以找到字符的其他边界。因此,可以检测每个字符的长度和宽度。水平和垂直投影如图4所示。
图4数字字符分割
(a)图像颜色反转(b)垂直投影积分的图像(c)水平投影积分的图像
根据这些边界,可以找到每个数字的特定位置。 识别出的字符用红色框标记,并与图像区域分开。 分割后的字符如图5所示。
图5一位数字字符标记和分段
- 用于字符识别的神经网络
当使用BP神经网络识别仪器读数时,有必要对分割后的各个字符进行归一化处理,并且经过处理的字符图片可以加快网络训练的收敛速度。传统的BP神经网络依赖大量试验来获取隐藏层中适当数量的神经元。本文将主成分分析(PCA)算法与BP神经网络相结合,以促进网络的构建。
- 归一化
如果未对分割的各个字符进行归一化,则学习速度可能会非常慢。为了加快网络的学习过程,需要对输入进行归一化,以使所有样本的输入平均值与均方误差相比接近0或非常小。
根据缩放图像的一般经验,分割后的单个字符被缩放为32times;14像素的大小,这有利于图像处理和识别。缩放图像可以有效地防止由于BP神经网络识别过程中输入的绝对值大而导致的神经元输出饱和。
根据此原理,缩放比例由下式给出:
其中H是图像的行大小,W是图像的列大小。
该方法用于缩放分段字符,结果如图6所示。
图6数字字符图像的归一化
- 数字字符识别
- 数字仪器字符识别的算法推导
为了避免繁琐的测试隐藏层神经元数量的过程,将PCA算法集成到BP神经网络算法中,构造了数字仪器字符识别算法。 这篇报告。 PCA算法用于优化隐藏层中神经元的数量。
网络输入层节点定义为xi,隐藏层节点定义为yj。隐藏层节点的输出由下式给出:
其中wji是输入层节点和隐藏层节点之间的网络权重。表示激活函数,通常使用Sigmoid型函数。 所有wji都构成权重矩阵W。
矩阵W通过确定的完全正交向量系统扩展为向量W,向量系统为uj,并且具有:
在分解正交向量基后,使用d个有限项估计向量W,表示向量W的估计,并由下式给出:
均方误差的公式由下式给出:
]
拉格朗日乘数法可用于最小化均方误差,公式可表示为
当j=d 1直到无穷,计算g(uj)的导数。
根据以上推导,具有最小均方误差的W大约等于:
其矩阵形式为W=Um,其中和是矩阵的d个最大特征值的特征向量。通过转置上述公式,我们可以得到最终尺寸减小后获得的M。
- 数字仪器字符识别算法
在识别过程中,使用PCA-BP神经网络对分割后的数字字符进行训练和识别。 首先,确定输入和输出数据的数量。归一化图片的数据信息用作输入。输入层中的神经元数为448。输出层是0到9的10位数字,因此输出层有10个神经元。隐层神经元的值由PCA方法确定,这使得BP神经网络的训练更加准确、快速。
该算法的流程图如图7所示。
图7 PCA-BP算法流程图
- 数字仪器字符识别的结果
根据改进的PCA-BP算法,隐层神经元的最佳数目为18。在仪器字符识别过程中BP神经网络的训练曲线如图8所示。
图8隐藏层18的神经网络训练曲线
为了验证PCA-BP神经网络在识别隐藏层神经元的正确数量方面的性能,我们将其与一般BP神经工作进行比较,后者分别由25和16个神经元在其隐藏层中,两者的选择取决于工程师的经验,识别曲线的准确性如图9所示。
图9隐藏层数不同的三个网络的错误和训练过程的比较
经过888次迭代,PCA-BP算法的误差降低到0.02849,而其他网络以相同的迭代步数运行,它们的准确性均低于隐藏层中具有18个神经元的网络。可以得出结论,使用PCA算法对于BP网络识别隐藏层中合适数量的神经元是有效的。
- 实验
根据上述算法和处理流程,设计了一种用于数字仪器阅读识别的计算机程序。 系统的界面图如图10所示。
图10用于数字仪器阅读识别的计算机程序
使用该程序,分批导入100张和1000张数字仪器图像,识别结果如表1所示。
表1使用不同算法对任意100张图像的识别性能进行比较
识别算法 |
准确度 |
错误 |
时间 |
BP神经网络 |
97.0% |
3.0% |
587ms |
PCA-BP神经网络 |
99.0% |
1.0% |
369ms |
表2不同算法对任意1000张图片的识别性能比较
识别算法 |
准确度 |
错误 |
时间 |
BP神经网络 |
97.5% |
2.5% |
1673ms |
PCA-BP神经网络 |
98.6% |
1.4% |
951ms |
从表中我们可以看到,改进的BP神经网络算法可以提高仪器读数识别的准确性和速度。
- 结论
本文设计了一套用于数字万用表读数的方法和算法。相似性度量匹配方法用于数字仪器的刻度盘区域的区域相关分割。与传统的区域生长方法相比,该方法可以有效避免照明的干扰。通过中值滤波处理拨号区域后,通过投影方法提取一位数字字符。本文采用的PCA-BP神经网络算法可以自动找到中间层神经元的最佳数量,从而提高了网络的收敛速度。用于数字万用表的一种数字图像程序已编码。实验结果表明,与传统的BP神经网络相比,PCA-BP可以显着提高识别的准确性和速度。
参考文献
[1] X Y Shen, Y..J. Tang, and B.J. Jiang, “Numeral Characters Recognition System of Instrument,” Instrument Technique and Sensor, pp. 55-57, 2005.
[2] Y.L. Zhang, R..H. Wang, and Z.G. Ning, “Automatic Reeognition System for Characterson Numeric Meter Dial Plate Displayed by LED,” Computer Measurement amp; Cont, pp. 555-557, 2007.
[3] H.J. Lei, L.H. Xie, and Y
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[239397],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。