基于模式匹配的图像文本分割与识别外文翻译资料

 2022-11-19 15:16:51

英语原文共 4 页,剩余内容已隐藏,支付完成后下载完整资料


基于模式匹配的图像文本分割与识别

作者:N. Anandhi、R. Avudaiammal

摘要:本文讨论的算法是应用模式匹配技术从图像中分割和识别文本。分割是根据应用程序的需求将对象/图像分割为多个分段的过程。图像文本的分割涉及到文档检索,对象识别,车牌检测等应用。本文采用时域和频域分析方法进行图像文本的分割和识别。从图像中提出的文本分割方法已经在MATLAB中实现。

关键字: 字符提取、特征提取、模式匹配、分割

第一节

介绍

通过光学字符识别(OCR)[6]来实现对来自图像中文本的文本的识别,该技术使我们能够转换不同类型的文档,如扫描的纸张文档,pdf文件或数字捕获的图像相机转换为可编辑和可搜索的数据。OCR包括几个模块,如分割,预处理,特征提取和字符识别[8],[9]和[10]。OCR的应用是邮政编码识别,银行自动制图。图像分割[4],[5]是一种从图像中提取信息的技术,通常是图像分析的第一步。分割细分了其组成部分或对象的图像。从图像中分割文本涉及诸如文件检索,对象识别,车牌检测等应用。

在图像上提取文本的流程中,获得图像预处理[5],[9],将彩色图像转换为灰度图像。灰度图像是测量每个像素的强度。然后消除图像中的任何失真或噪音。

遮蔽是重要的过程之一,通过从原始图像中提取部分/部分来掩盖图像以从图像中获取文本[5]。分割每个字符是通过使用行检测和通过顶部,底部,左右边界裁剪图像并获得二进制文本来完成的。

特征提取[2],[9]描述了从原始数据中提取相关信息。特征提取的主要目标是从原始数据中提取相关信息。当输入数据被赋予一个算法太大而无法处理时,它不会提供太多的信息,那么输入数据将被转换为特征的简化表示集。在将输入数据转换为诸如时域特征和频域特征之类的特征之后。

模式匹配是最后一个阶段,并比较每个数据库,如果与它相等,则产生结果。

本文的其余部分组织如下。建议方法在第二节中描述。第三节描述了模式匹配。最后,第四节总结了这篇论文。

第二节。

建议的方法

所提出的用于从两个阶段执行的图像中提取文本的方法,即,

  1. 数据创建阶段
  2. 搜索阶段

在数据创建阶段,收集包含文本的图像数量。然后为每个图像提取诸如字符提取,特征提取,图案匹配等特征。它们作为矢量存储在数据库中。

在搜索阶段,通过使用图中所示的模块来识别从输入文本图像中提取的文本。

图1。

框图

A.图像预处理

OCR软件通常会“预处理”图像以提高成功识别的可能性。图像预处理的目的是改进图像数据,抑制不必要的失真或增强对进一步处理重要的某些图像特征。它将彩色图像转换为灰度图像。

Y=0.2126R 0.71529G 0.722B

然后使用Wiener滤波器,canny滤波器,prewitt滤波器,中值滤波器和混合中值滤波器对灰度图像进行滤波。从表1所示的峰值信噪比确定,混合均值滤波器具有更好的性能。

图2。

原始图像

图3。

灰色图像

图5。

噪音后

图6。

Wiener之后

图7。

prewitt之后

图8。

在canny之后

图9。

中位数后

图10。

混合中位数后

表I峰值信噪比值

B.掩模图像

掩蔽是从原始图像中提取文本特征的重要过程之一,因为通过仅使用图像掩蔽,我们从原始图像中提取进一步处理所需的图像的一部分/部分。

然后从过滤的图像中提取文本。在第一步,灰度图像然后被转换成二进制图像。然后计算阈值。计数和字符串的字符被找到。角色的数量是七。提取的文本如图11所示。

图11。

输入图像

C.字符提取

在提议的工作中,字符提取扮演着重要角色,可通过行检测获取每个字符,并裁剪顶部,底部,左侧和右侧边界。

提取的文本再次转换为图像。为了使所有角色具有相同的尺寸(20 x 18),如图12所示。

图12。

文字图像

这个图像再次被转换为二进制图像。字符扫描通过水平和垂直投影完成。在水平投影线中执行分割,并且通过使用垂直投影来提取分割线的每个字符。然后提取每个角色,如图13所示。

图13。

提取的文本

D.特征提取

表示对分析和分类重要的信息的一组特征或图像特征被称为特征提取。通过降维,特征提取减少了描述大量数据的资源量。

在所提出的工作中,分析文本的每个字符的时域分析,以执行模式匹配。考虑的时域分析是自相关,对比度,相关性,能量,均值,方差,熵。

1)自相关

自相关是一个信号与其自身的相关性,用于寻找噪声模糊的周期性信号的重复模式。

从相关信号取得的数学变量具有恒定的间隔被表示为函数的周期性程度。

F=sum;isum;l(ij)p(i,j)

2)对比度

图像中最大和最小像素强度之间的差异被定义为对比度。

Contrast=sum;i,j|iminus;j|2P(i,j)

其中P(i,j)表示水平和垂直坐标。

3)相关性

参照时间延迟,将像素的相似度与其自身进行比较。

Correlation=sum;i,j(iminus;mu;i)(jminus;mu;j)P(i,j)sigma;isigma;j

为了分类的目的,除了纹理特征之外,还计算颜色特征。

4)能量

能量是一个通过检测或分割物体制定“能量最小化问题”的术语。这给出了计算其执行梯度下降的图像分割的最低值的期望解决方案。

F=sum;isum;jp(i,j)2

5)熵(E)

图像熵是用于描述图像的一定量的信息。具有低熵的图像具有较小的对比度和具有相似值的像素。平面图像具有零熵。高熵在相邻像素之间具有高对比度。

F=sum;sum;ijC(i,j)logC(i,j)

6)均匀性

均匀性是GLCM中非零实体的度量。

Homogeneity=sum;i,j11minus;(iminus;j)2P(i, j)

7)平均值(M)

平均值是指每个字符的所有像素值的总和的平均值。

M=1Nsum;Ni=1P1

8)方差(Sigma;)

方差是指通过计算集合中每个数字与平均值之间的差异,平方差并将平方和除以集合中的数值来计算方差。

S2=Sigma;ni=1(Ximinus;Xavg)2nminus;1

在特征提取中,分析了文本中每个字符的时域分析特征,以便进行模式匹配。提取的文本的特征如下。

表II提取文本的特征

第三节。

模式匹配

模式匹配是从图像中提取文本的最后一步。它涉及严肃的步骤如下。在上面的数据库中有两个集合集合1和集合2.为了分析这些特征,然后比较每个集合与给定数据库的值。如果相等,相应的音频将会生成,否则它不会回答。

第四节。

结论

来自给定图像的文本被提取。图像被转换成灰度图像,然后经过从转换后的灰度图像去除噪声的过程。从灰色图像中,通过掩盖灰度图像来提取文本。蒙版文本中的单个字符通过使用字符提取来提取。使用特征提取为提取的字符计算均值和方差值。然后它涉及模式匹配过程,该过程将给定数据库的特征与预设数据库进行比较,如果数据库匹配,则会生成相应的音频。本文的其余部分组织如下。所提出的方法在第二节中描述。第三节描述了模式匹配。最后,第四节总结了这篇论文。

参考文献:

[1] Leen-Kiat Soh, Member and Costas Tsatsoulis “Texture Analysis of SAR Sea Ice Imagery Using Gray Level Co-Occurrence Matrices” in IEEE Transactions On Geoscience And Remote Sensing, vol. 37, No. 2, MARCH-1999. [2] Rishi Jobanputra, David A. Clausi “Texture Analysis Using Gaussian Weighted Grey Level Co-occurrence Probabilities” in IEEE-2004.

[3] Ryszard S. Choras “Image Feature Extraction Techniques and their Applications for CBIR and Biometrics System” in International Journal of Biology and Biomedical Engineering-2007.

[4] Sunil Kumar, Rajat Gupta, Nitin Khana, student member, IEEE, Santanu Chaudhury, and Shiv Dutt Joshi “Text Extraction and Document Image Segmentation Using Matched Wavelets and MRF model” in IEEE Transactions on Image Processing vol.16, No.8, August-2007.

[5] Ankush Guatam “Segmentation of Text from Image Document” International Journal of Computer Science and Information Technologies, vol.4(3), 2013, 538-540.

[6] Faisal Mohammad, Jyoti Anarase, Milon Shingote, Ptatrik Ghanwat “Optical Character Recognition Implementation Using Pattern Matching” International Journal of Computer Science and Technologies, vol.5(2), 2014, 2088-2090.

[7] Priyanka Karmakar, Biswajit Nayak amp; Nilamani Bhoi “Line and Word Segmentation of a Printed Text Document” International Journal of Computer Science and Information Technologies, vol.5(1), 2014.

[8] Ambadas B.Shinde amp; Yogesh H.Dandawate “Shirorekha Extraction in Character Segmentation for Printed Devanagari Text in Document Image Processing” in Annual IEEE India Coference-2014.

[9] Gaurav Kumar and Pradeep Kumar Bhatia “A Detailed Review of Feature Extraction in Image Processing Systems” in Fourth International Conference on Advanced Computing and Communication Technologies-2014. [10] M. Ramanan, A. Ramanan and E. Y.A. Charles “A Preprocessing Method for Printed Tamil Documents:Skew Correction and Textual Classification” in IEEE Seventh International Conference on Intelligent Computing and Inf

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[23581],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。