英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料
用于检测,定量和分类植物病害的数字图像处理技术
Jayme Garcia Arnal Barbedo
摘要
本文提出的是一个使用数字图像处理技术,通过对可见光谱数字图像的分析达到检测,量化和分类植物病害目的的调查。虽然疾病症状可能在植物的任何部位出现,但是本文只考虑了在叶和茎中的症状, 原因有二:一是要限制文件的大小,二是因为处理根,种子和水果的方法有一些特殊性,需要进行具体的调查。所选方案根据其目标分为三步:检测,严格量化和分类。这些步骤中的每一个再依据算法中使用的主要技术方案进行细分。本文预计对于植物病理学和模式识别工作的研究工作有一定帮助,为研究这一重要研究领域提供了一个全面可及的概述。
引言
农业不仅仅是用于为日益增长的人口提供食物。植物已成为能源的重要来源,也是解决全球变暖问题的根本。影响植物的几种疾病有可能造成毁灭性的经济,社会和生态损失。在这方面,准确及时地诊断疾病至关重要。
检测植物病理学的方法有很多。有一些疾病没有任何明显的症状,或出现症状已经为时已晚。在这些情况下,通常需要通过强大的显微镜进行某种复杂的分析。在其他情况下,只能在人类看不到的部分电磁波谱中检测到符号。在这类情况下,常见的方法是使用遥感技术来探索多光谱和高光谱图像捕获。通常是采用数字图像处理工具来实现其目标。然而,由于它们的许多特性和本文关系程度不够大,在本文中将不予以详细论述。关于这个问题的大量信息可以在Bock(2010),Mahlein et al(2012),Sankaran(2010)等人的论文中找到。
然而,大多数疾病在可见光谱中会产生某种表现,在绝大多数情况下,诊断或至少对该疾病的第一猜测是由人类在视觉上进行的。受过培训的评估者可能有效地认识和量化疾病,但是他们在许多情况下也有可能存在一些缺点。 Bock(2010)列出了一些缺点:
bull;评估者可能会由于疲惫导致注意力不集中,而降低准确性。
bull;内部和内部的变异性(主观性)可能存在很大差异。
bull;需要制定标准区域图以辅助评估。
bull;培训可能需要多次重复才能保持质量,聘请评估者所需资金过多。
bull;如果样品是在现场收集的,而之后是在实验室进行评估,那么视觉评估可能会有很大差异。
bull;评估者容易出现各种误判(例如,病变数量/大小和感染区域)。
除了这些缺点之外,重要的是考虑到一些作物可能会延伸到极大的地区,使监测成为一项具有挑战性的任务。
根据应用,许多这些问题可以通过使用某种图像处理的数字图像,或者在某些情况下,模式识别和自动分类工具来解决。过去三十年来,已经提出了许多方法,本文试图以有意义和有用的方式组织和介绍这些方法,如下一节所述。在关于这个问题的研究方向上的一些批判性话题在最后一节提出。
文献评论
植物病理可能在植物的不同部位出现。有些方法探索几乎所有这些部分的视觉提示,如根(Smith和Dickson 1991),核(Ahmad et al。1999),水果(Aleixos et al。2002; Corkidi et al。2005;Loacute;pez-Garciacute;aet al。2010),茎和叶。如前所述,这项工作集中在后两者,特别是叶。
本节根据提出的方法的主要目的分为三个小节。根据算法采用的主要技术方案,这些子部分依次划分。总结部分提供了一份总结表,其中包含每种工作所采用的培养文化和技术解决方案的信息。
本节介绍的大多数方法都有一些特征:在受控实验室环境中使用消费者级摄像机拍摄图像,并且用于图像的格式是RGB量化的8位。因此,除非另有说明,否则这些就是所述方法操作的条件。此外,本文中引用的几乎所有方法都应用某种预处理来清理图像,因此,从现在开始,将不再赘述,除非有一些特殊之处需要更详细的描述。
发现
由于通过应用图像处理技术收集的信息通常不仅可以检测疾病,还可以估计其严重程度。 简单检测有两种主要的情况:
bull;部分分类:在几种可能的病态中必须鉴定疾病时,进行部分分类可能会很方便,其中候选区域被归类为感兴趣的疾病的结果,而不是直接应用于完整的分类中,进入任何可能的疾病。 这是Abdullah等人的方法的情况,其在“神经网络”一节中描述。
bull;实时监测:在这种情况下,系统会持续监测作物,一旦在任何植物中检测到感兴趣的疾病,就会发出警报。 Sena Jr和Story et al等人的论文就适合这种情况。这两个提案也在以下描述。
神经网络
Abdullah等人提出的方法试图区分给定的疾病与影响橡胶树叶的其他病态。该算法不采用任何类型的分割。 相反,主分量分析直接应用于叶片的低分辨率(15times;15像素)图像的像素的RGB值。 然后将前两个主要组分进给到具有一个隐藏层的多层感知器(MLP)神经网络,其输出显示样品是否被感兴趣的疾病感染。
阈值
Sena Jr等人提出的方法旨在通过使用数字图像来区分来自健康人的秋季粘虫受影响的玉米植物。他们将算法分为两个主要阶段:图像处理和图像分析。在图像处理阶段,将图像转换为灰度级,进行阈值处理并过滤以去除杂散伪像。在图像分析阶段,整个图像被分为12个小块。叶面积小于总面积5%的块被丢弃。对于每个剩余的块,计数代表患病区域的连接对象的数量。如果这个数字超过阈值,那么这个植物被认为是患病的,经过经验评估,这个数字被设定为10。
双分段回归分析
Story等人提出了一种监测和早期检测莴苣钙缺乏症的方法。算法的第一步是通过阈值进行植物分割,因此冠层区域是孤立的。感兴趣区域的轮廓可以应用于原始图像,这样只考虑感兴趣的区域。从中提取了许多颜色特征(RGB和HSL)和纹理特征(来自灰度共生矩阵)。之后,通过识别所有特征的每个测量时间处理和控制容器之间的平均差来计算识别由于钙缺乏引起的应激开始的分离点。进行双分段回归分析,以确定植物营养缺乏组与健康植物组之间的变化点在哪里。作者总结认为,他们的系统可以用于夜间监视温室中的植物,但是当白天的照明条件变化较大时,需要进行更多的研究。
定量
本节提出的方法旨在量化给定疾病的严重程度。这样的严重程度可以通过受到疾病影响的叶片的面积,或者可以通过颜色和纹理特征估计的深深根深蒂固的感受来推断。大多数量化算法包括分离步骤来分离症状,从中可以提取和正确处理特征,以提供疾病严重程度的估计。
值得注意的是,通过分析和测量其症状来确定疾病的严重程度的问题,即使由一名或多名专家进行手动操作也是困难的,这些专家必须尽可能准确地将诊断指南与症状配对。因此,手动测量将始终包含一定程度的主观性,这反过来意味着用于验证自动方法的参考不完全是“实质”。在评估这些方法的表现时,要考虑到这一点。
以下提出的方法根据其用于估计疾病严重程度的主要策略进行分组。
阈值
Lindow和Webb(1983)提出了使用数字图像处理的第一种方法之一。使用模拟摄像机在红光照明下拍摄图像,以突出坏死区域。这些图像后来被数字化并存储在计算机中。测试使用来自西红柿,蕨菜蕨类植物,梧桐树和加利福尼亚花盆的叶子进行。坏死区域的识别是通过简单的阈值来完成的。该算法然后应用校正因子来补偿叶子健康部分中的像素变化,所以至少一些来自健康区域的像素被错误分类为患病区域可以重新分配到正确的集合。
Prices等人比较了视觉和数字图像处理方法在量化咖啡叶锈病的严重性。他们测试了两种不同的成像系统。在第一种情况下,图像被黑白电荷耦合器件(CCD)照相机拍摄,第二种是使用彩色CCD照相机拍摄图像。在这两种情况下,通过简单的阈值进行分割。根据作者基于图像处理的系统比视觉评估具有更好的表现,特别是对于症状更严重的病例。他们还观察到,彩色成像在区分生锈和未生锈的叶子方面具有更大的潜力。
Tucker和Chakraborty(1997)提出的方法旨在量化和鉴定向日葵和燕麦叶中的疾病。算法的第一步是根据所考虑的疾病(病变或生锈)阈值而变化的分割。所得到的像素被连接成代表患病区域的簇。根据病变的特征,将它们分类为适当的类别(如果发生病变,则为a或b型,在生锈的情况下为大小)。作者报告了良好的结果,但是观察到在拍摄图像期间由于照明不当引起的一些错误。
Martin和Rybicki(1998)提出了一种量化玉米条纹病毒引起的症状的方法。作者采用的阈值方案是基于Lindow和Webb(1983)描述的策略,并在前一段中简要解释。作者比较了通过视觉评估获得的结果,通过使用商业软件包和采用自己实现的定制系统。他们得出结论,商业和定制软件包具有大致相同的性能,并且基于计算机的方法比视觉方法获得更好的准确性和精度。
Skaloudova等人提出的方法衡量叶螨造成的损害。该算法基于两阶段阈值。第一阶段将叶片与背景区分开,第二阶段将受损区域与健康的表面分开。最终估计由损伤区域中的像素数除以之间的比率给出叶子的总像素数。作者将结果与基于叶损伤指数和叶绿素荧光的其他两种方法进行了比较。他们得出结论,与叶绿素荧光相比,它们的方法和叶损害指数提供了优异的结果。
在他们的工作中,Weizheng et al提出了量化大豆叶病变的策略。该算法基本上由两步阈值组成。第一个阈值旨在将叶与背景分开。之后,仅将叶片的图像转换为HSI颜色空间,并应用Sobel算子来识别病变边缘。第二个阈值被应用于所得到的Sobel梯度图像。最后,丢弃二进制图像中的小对象,并填充由白色像素包围的孔。所产生的对象揭示患病区域。
Camargo和Smith(2009a)提出了一种识别含有由疾病引起的病变的叶片的区域的方法。使用来自各种植物的叶子,如香蕉,玉米,苜蓿,棉花和大豆进行测试。他们的算法是基于两个主要的操作。首先,执行到HSV和I1I2I3空间的颜色转换,在随后的步骤中仅使用H和两个修改版本的I3。之后,应用基于强度技术直方图(Prewitt 1970)的阈值来分离健康和患病区域。据作者介绍,他们的方法能够对各种各样的条件和种类的植物进行适当的区分疾病和健康的区域。
Macedo-Cruz等提出的方法旨在量化燕麦作物霜冻造成的损失。作者使用的图像直接在作物领域中捕获。算法的第一步是从RGB到Lab表示的转换。作者采用三种不同的阈值策略:大津方法,Isodata算法和模糊阈值。每个策略为每个颜色通道生成一个阈值,它们通过一个简单的平均值进行组合,因此单个阈值被分配给每个通道。如果需要,可以再次将生成的分区进行阈值化,等等,直到满足一些停止标准。最终产生的分区产生了许多类,在经过适当标记后,显示了作物遭受的损害的程度。
Lloret等(2011年)提出了一个监测葡萄园健康状况的系统。这些图像是通过分散在整个领域的网络摄像头捕获的。主要目的是检测和量化病叶。
他们的系统有五个阶段:1)由于照相机和植物之间的距离变化,叶尺寸估计是必要的; 2)阈值化,其使用图像的RGB和HSV颜色表示将患病叶和地面与健康叶分离; 3)一组形态学操作,旨在减少噪音而不消除有用的特征; 4)检测步骤,目的是区分地面和实际病叶; 5)计算病叶比例。根据这个比例的值,系统会发出一个警告,指示工厂需要注意。
Patil和Bodhe(2011)提出了一种评估甘蔗叶中真菌相关疾病严重程度的方法。该方法执行两个分段。第一个目的是将叶与场景的其余部分分开,并通过简单的阈值来执行。在第二分割中,将图像从RGB转换为HSI颜色空间,并且应用二值化以分离患病区域。通过所谓的三角形阈值法来计算二值化的阈值,该方法基于图像的灰度直方图。二进制图像最终用于确定感染与整个叶片的比例。
颜色分析
Boese et al(2008)提出了一种估计鳗叶损伤严重程度的方法,可以通过干燥,消耗疾病和微食物喂养引起。算法的第一步是将叶片无监督的分割成多个类(6到10个)。在下文中,专家将课程标记为五种可能性之一(三种类型的伤害,加上健康的组织和背景)。之后,量化只是衡量每一个伤害所占据的面积的问题。据作者说,他们的方法仍然存在一些限制其实用性的问题,但是比其他方法来量化多重压力源的复杂叶片损伤有一个改进。
Pagola等人提出的方法(2009)讨论了量化大麦叶缺氮的问题。他们在RGB空间中使用一些颜色通道操作,并应用主成分分析(PCA)来获得像素的“绿色度”。为了将所有像素的结果聚合成一个单一的估计,作者测试了四个策略,其主要目标是强调相关区域,并减少非光敏活性区域(如静脉和叶斑)的影响。作者得出结论,他们的方法与基于非破坏性手持叶绿素计的大量采用方法具有很高的相关性。
Contreras-Medina等人提出了一种量化植物叶中五种不同类型症状的系统。他们的系统实际上由五个独立的模块组成:1)褪绿算法,其结合图像的红色和绿色成分,以确定叶子的黄度,这表明褪绿的严重程度; 2)坏死算法,其使用蓝色分量来区分来自背景的叶子,以及绿色分量来识别和量化坏死区域; 3)叶变形算法,其使用蓝色分量来分割叶片并计算叶片的球形度作为其变形的度量; 4)白点算法,其对图像的蓝色分量应用阈值来估计这些斑点占据的面积; 5)马赛克算法,其使用蓝色通道,多个形态操作和Canny边缘检测器来识别和量化叶中存在的脉搏。
模糊算法
在他们的论文中,Sannakki等提出了一种基于模糊逻辑量化疾病症状的方法。测试使用石榴叶进行。该算法开始将图像转换为Lab颜色空间。像素通过K均值聚类分组成多个类。根据作者其中一个组将对应于患病区域,但是该文件没有提供关于如何识别正确组的任何信息。在下面的程序中,程序计算被感染叶片的百分比。最后,采用模糊推理系统进行疾病评估的最终估计。关于如何应用这种系统的细节也不存在。
Sekulska-Nalewajko和Goclawski(2011)的方法旨在检测和量化南瓜和黄瓜叶中的疾病症状。使用平板扫描仪捕获测试中使用的图像。叶片与植物分
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[139225],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。