英语原文共 34 页,剩余内容已隐藏,支付完成后下载完整资料
基于学习矢量量化网络的自相关过程控制图模式实时识别
R.-S. GUH*
国立台湾大学工业管理系 64 文华路,虎尾镇,云林632,台湾,中国
摘要:近年来,人工神经网络(NNS)在控制图模式识别(CCP)识别中的应用研究取得了令人鼓舞的成果。该领域中的大多数神经网络模型被设计用于过程数据是独立的不相关的过程中。不幸的是,在许多制造过程中,数据独立性的前提几乎不满足。迄今为止,关于NNS在CPC识别中的应用还没有研究结果发表在自相关过程中。该工作首先表明,过程数据中的自相关极大地影响了基于独立数据的基于神经网络的CCP识别器的性能,然后提出了一种能够实时有效地识别CCP的学习矢量量化网络系统。具有不同水平自相关的过程。根据分类速率和平均游程长度对系统性能进行评估。仿真结果表明,与传统的控制图法相比,该方法在处理数据正相关时能较好地检测位移,同时也提供了模式分类。使用真实数据提供了一个示例。
关键词:神经网络;统计过程控制;模式识别;控制图;自相关过程;学习矢量量化
1 介绍
统计过程控制(SPC)试图维持可接受的稳定水平一定质量的变量(特征)。控制图是广泛采用的用于此目的的工业。对控制图的制造过程数据揭示过程是否处于控制行为。由于控制图异常模式可与一组特定的转让引起相应的工艺知识是可用时(西方电气1958),控制图模式的有效识别(CCPS)可以设定可能的分配的原因,需要我的极限NVD调查并显著减少了诊断搜索。过程的干扰源必须被识别和消除迅速,尤其是技术过程的产品大量在短时间内产生。因此,CCP识别(CCPR)是一个重要的工具,补充了控制图的控制限用于控制图。图1显示了控制图中的一些典型模式。
图1 控制图中的典型模式
传统的控制图在确定过程的状态时只考虑当前样本,因此不提供任何模式相关的信息。已经提出了许多补充规则,如区域测试和运行规则,以帮助质量控制实践者检测不自然的C。CPS(西部电气1958,纳尔逊1984, 1985,邓肯1986,格兰特和利文沃思1996)。然而,运行规则有一些缺点。所有可用规则的应用可以产生过量的假警报(当过程仅表现出共同原因变化时识别不自然的CCP)。此外,由于自然的工艺变化,在控制极限中断信号使过程失控(戴维斯和Woodall 1988)之前,运行仍然具有较低的发生概率。此外,正在寻求的CCP特征可能是多个模式共同的。例如,罗伊·尼尔森的第五测试规则触发了一个图表报警,当“三行中的三个点落在A区或A区之外”(尼尔森1984)。移位和趋势模式都可以触发这样的信号。因此,规则不能有效地分类模式,因此运行规则对CCPR(Lucy Bouler 1993)不是很有帮助。
随着计算机分类系统的发展,一些研究人员参与SPC已经从最初收集传统控制图测量的数量有限的研究意义自动捕获。专家系统(ESS)一直在考虑国际任务(Lucy Bouler 1991,快速充电1995)。的几种方法,包括模板匹配、统计检验、运行规则和启发式算法,已应用于设计专家系统知识库。大部分在这些知识是基于统计学的ESS。机器学习技术,利用人工神经网络(NNS)已被广泛采用的分类任务。神经网络具有学习和自组织,因此适用于模式识别(Kohonen 1988)。在识别问题,NNS可召回从嘈杂的或不完整的陈述所学习到的模式,这使得它们适合CCPR因为CCP一般是由共同原因引起的变化。不同的研究已经确定了神经网络控制的效用。
Hwarng和Hubele(1993年)通过训练反向传播网络(BPNS)广泛地研究CCPR,以检测六种不自然的CCP突变、趋势、周期、分层、系统和混合。它们的分析结果表明,CCP识别器的性能根据随机噪声的水平而显著变化。Cheng(1995)指出,当采用平均游程长度(ARL)作为性能指标时,一个成熟的神经网络可以比组合的休哈特/累积和(CUSUM)方案更有效地检测到小到中等趋势或更大的变化。Hwarng和Chong(1995)提出了一种基于自适应共振理论(ART)的模式识别器来检测非自然CCPs。该识别器由于ART网络的无监督学习性质而执行快速和累积学习。艺术为基础的识别优于基于BPN周期模式识别,劣质的混合模式,和类似的其他模式。Chang和Aw(1996)通过检测平均变化和确定移大小的模糊神经网络方法。他们的方法优于传统的均值和CUSUM图与样本容量为五的ARL方面。Cheng(1997)相比BPN和基于模块化神经网络的性能(MNN)为基础的识别和发现MNN各级随机噪声有更一致的识别精度。Guh和Tannock(1999)表明,神经网络模型可以确定并发(混合)控制,其中至少两种模式并存,可能起源于不同的分配的原因。HO和Chang(1999年)提出了一种基于神经网络的方法来同时监测均值和方差的变化。比较研究表明,所提出的神经网络控制方法优于其他SPC图在大多数情况下,个别测量和亚组样本大小为5。Wang和Chen(2002)提出了一种用于检测均值漂移的神经模糊模型,并在多元过程中对它们的大小进行分类,发现对于固定的I型误差,他们提出的模型比图具有更低的失控ARL。GUH(2005年)提出了一种混合模型,结合神经网络和决策树学习技术来检测和区分非自然CCP,同时识别主要参数(如移位位移或趋势斜率)和检测到的CCP的开始。神经网络已被证明有相当好的工作甚至在正态假设是轻度或中度的侵犯(Guh 2002)。上面征引的文献表明,基于神经网络的分类系统的性能优于传统方法的识别精度和速度。
基于上面征引的文献,指出了改进的潜在措施。大多数基于NN-CCP识别文献中提出了适用于独立和同分布(IID)过程数据叠加与图案化数据相加。此外,这些CCP识别器的性能进行评估使用独立同分布的过程数据。换句话说,数据自相关时没有考虑开发这些CCP识别。不幸的是,独立或不相关的观测条件甚至不满足某些生产过程如那些涉及连续制造业务(包括食品、化工、造纸和木材产品的生产),它们的产品特征性的连续观测往往是高度相关的(Box等人1974,Vasiopoulos和Stamboulis 1978,Montgomery 2001)。此外,制造自动化的最新进展使得能够快速、经济地收集数据以检测工艺条件。质量特性的测量,每项按生产的时间顺序之间的连续观测的自相关是普遍存在的,因此质量控制从业人员的一个重要的考虑因素。换句话说,自回归涉及的观察成为一个稳定的过程的一个内在属性,特别是当个人的意见进行监测的过程。自相关是回归的一种形式,因变量与自身的过去值在不同的时间滞后有关。虽然减少的过程数据的采样频率可以解决这个问题,但它违反了CCPR的总体目标,即尽可能快地检测出实际的过程扰动。图2显示了自相关过程数据从Pandit和Wu为例(1983),表明造纸过程数据慢慢地随着时间的推移所出现的“上浮”或“下滑”。
图2 自相关过程的一个例子(Pandit和Wu 1983)
如果过程数据表现出低水平的相关性随着时间的推移,传统的控制图就不能很好地工作(Alwan和Roberts 1988,Harris和Ross 1991,Maragah和Woodall 1992)。已经提出使用残差(即实际过程值与预测值之间的差值)来处理自相关过程。最流行的方法是使用Shewhart图表(Alwan和Roberts 1988)或CUSUM图(Runger等人 1995)关于适当拟合自回归滑动平均(ARMA)模型的残差(Box等人1994)。然而,这些残余的基础程序,检测过程转移的敏感性差,特别是具有高度自相关过程(Wardell等1994,Atienza等1998)。在第2.6节中,我们将证明,如果数据是自相关的,以独立的数据训练的基于神经网络的CCP识别器的性能也会显著恶化。因此,数据的自相关问题时应考虑开发基于神经网络的分类模型,尤其是当每个产品的数据用于过程监测。然而,据作者所知,没有任何研究结果对自相关过程的神经网络分类的使用已出版。
Cook和Chiu(1998)和Chiu等人(2001)分别采用径向基函数网络(RBFNS)和BPNS来检测自相关过程参数值中的位移模式。Noorossana等人(2003)扩展了Cook和Chiu(1998)的研究,采用RBFNS检测和三种非随机过程扰动的特殊形式的移位模式,这三个研究采用分类率作为性能指标,但没有考虑ARL性能,这是任何SPC图表方案的最重要的特性之一。Hwarng(2004)采用BPNS检测自相关过程中的过程转移,提出并研究了该模型的游程分布,使用ARL的比较研究表明,所提出的基于BPN的模型优于传统的控制图。Hwarng(2005)提出了一种基于BPN的系统来识别平均变化和相关变化,并给出了该系统的控制和失控ARL性能。
质量控制人员可以通过识别不同的CCPs来关注过程扰动的来源,因此,可以有效地消除可分配的原因,从而降低过程的性能,这项工作提出了一种基于神经网络的系统识别非自然的CCP,加上叠加在一个固有的自相关过程具有恒定的自相关水平。
BPN已被CNS领域中的大多数应用程序用于CCPR,BPN的输出值是连续的,通常在[0, 1 ]的范围内,因此,除了分类外,BPN还可以应用于许多其它应用中,如预测和函数逼近,此属性已被用来估计过程偏差的“数量”,例如移位模式的平均位移,或趋势模式的斜率(Hwarng 2004,Guh 2005)。然而,BPN的一个主要缺点是反向传播算法所需的大量训练时间(Hornik等1989)。对于分类任务,学习矢量量化(LVQ)网络(Kohonen 1995)的另一个强大的神经网络结构的训练速度已被证明比BPNS(Shaffer等1999,Dieterle等2003)更快。更快的方法在实时应用中是首选的,其中时间是一个重要的因素。在许多实际应用中,LVQ网络也可以比BPNS执行更精确的分类(Zhang等1996,Dieterle等2003)。因此,本工作采用LVQ网络来开发自相关过程的实时CCPR系统。
一个广泛的模拟研究的数值结果表明,所提出的基于LVQ的CCPR系统可以很好地工作,即使在过程数据是高度正相关或负相关的情况下。实证比较表明,所提出的系统比传统的SPC方法更有效地检测自相关过程中的偏移。
2基于LVQ的自相关过程CCPR系统
图3自相关过程实时CCPR系统的过程监控过程
本节介绍了一种基于LVQ网络的实时分类系统的发展。图3显示了过程监控系统的程序,它的设计是应用于自动化制造过程中的工艺数据的收集和监控,由计算机系统自动。一个自相关过程控制中的自回归系数一般自回归结构可以基于大量的初步样本在线识别已知的。许多统计软件包,如Minitab(Minitab 2003),具有用于评估过程数据的独立性和用于识别自相关过程的合适的时间序列模型的方式。
在这个过程中的监控程序、平均值、标准偏差和自相关过程的自回归系数是根据收集在过程控制的初步样本估计得出的,LVQ利用相应的自回归系数生成CCP实例来对自相关过程进行在线培训,因此,LVQ网络在这方面的工作是训练用的基本过程,具体的自回归系数只承认CCPs。这个操作程序主要是通过提高网络训练的有效性。初步的实验表明,训练网络的所有回归系数认识CCPs(正或负)在实际生产过程中可能遇到非常困难,由于不同模式之间的相互干扰。如前所述,一个LVQ网络的训练速度快。初步的实验用了大约27.9秒,LVQ网络在2.8 GHz奔腾微机完成训练操作,这个特点使LVQ基于CCP的识别是在线学习。
基于LVQ的CCPR系统通过使用移动窗口识别方法在线监测制造过程(Hwarng and Hubele 1993a,b)(图4)。一系列过程数据向量在移动窗口中呈现给基于LVQ的CCP识别器,该过程数据向量每次通过一次过程观察向前移动,表示单个采样间隔。当不自然的CCP开始出现在数据序列中时,随着识别窗口向前流过过程数据流,模式特征逐渐增强。在CCP识别器检测到非自然CCP之后,通过将5个以上的过程观察添加到识别窗口来进一步对检测到的CCP的类型进行分类,从而提高分类准确度。这种简单的启发式方法已被证明可以显着降低模式类型错误分类的速度,这是由于模式检测后立即进行分析的限制点内的CCP的相似性引起的(Guh 2002,2005)。增加包含在识别窗口中的CCP点的数量增加了可以暴露给CCP识别器的CCP特征的数量,从而提高了识别的准确性。等待24分(即本文中的识别窗口大小)应确保将整个不自然的CCP呈现给识别器。然而,CCPR的主要目标是尽可能快地检测和分类图案。初步研究表明,“五点”是取得满意结果的最低数量。尽管等待来自过程的更多观察延迟了最终决定时间,但认为这个延迟是值得的,因为正确的CCP类型是随后搜索可分配原因的关键线索。
图4 移动窗口识别方法
2.1生成自相关过程数据
由于自动数据收集和检测技术在现代制造业中的广泛应用,X图(个人图)绘制了各个测量值而不是子群的平均值,最近已经引起SPC从业者越来越多的关注。 尽管X图更频繁地发出虚假警报,但它可以比其他控制图(例如X图)更快地识别出失控情况。 在高速自动化生产场景中,必须尽早检测和纠正初期问题,以避免产生其他缺陷产品。 此外,通常收集个体数据以用于连续加工行业以及计算机集成制造环境中的过程监控。因此,这项工作主要涉及X图表。
统计质量控制手册(Western Electric 1958)中涵盖的15个共同CCP中,共有8种基本模式,其余为特殊形式的基本模式或两种或多种基本模式的混合形式。八种基本模式为:
- 自然
- 向上移动
- 向下移动
- 循环
- 增加趋势
- 减少趋势
- 系统
- 混合
由于样本编号为1,因此本工作中的X图表不会出现分层现象。 通过使用简单的规则(例如,3sigma;个控制限制)可以容易地识别出混合。 因此,这项工作只考虑六种最常见的模式(1
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[22665],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。