温室中气温预测的神经网络模型外文翻译资料

 2022-11-19 16:43:21

英语原文共 25 页,剩余内容已隐藏,支付完成后下载完整资料


温室中气温预测的神经网络模型

P.M.Ferreiraa,*, E.A.Fariab , A.E.Ruanoa;c

摘要:解决了径向基函数神经网络对水耕温室内部空气温度的模拟结果,以及室内相对湿度的变化,以及室内空气温度和太阳辐射的函数关系。由于该模型旨在纳入环境控制策略,所以离线和在线方法都可以用于完成此任务。在本文中,分析了已知的混合离线训练方法和在线学习算法。提出了离线方法及其在线学习的应用。它利用径向基函数神经网络中发现的线性非线性结构。2002 Elsevier Science B.V.保留所有权利。

关键词:径向基函数;神经网络;温室环境调控;模型

  1. 引言

前馈分层神经网络(NN)已广泛应用于工程的许多领域,以便对由各种系统生成的数据执行某种类型的非线性处理。在非线性系统的建模和识别领域,越来越多的兴趣是由于几个原因。一些最常见的是,不需要关于动态系统的结构的先前知识,多输入多输出(MIMO)系统以与单输入单输出(SISO)系统相同的方式被处理,以及 NNs具有执行非线性信息处理的强大能力。在这种情况下,NNs作为曲线近似器,因此,它们的设计过程可以被视为多维空间中的曲线拟合问题。所提到的设计问题的性质解释了大多数应用程序包括近似未知系统 从输入输出的角度出发,或在实现分类问题的非线性决策功能的一个例子。在数据生成函数是非线性时变函数的情况下,脱机训练网络的标准做法是,然后在训练后的神经网络上进行适应性调整。在本文中,有几个离线训练 并对在线学习方法进行了比较,提出了一种前馈分层NN,由于其结构简单,近年来已经越来越受到关注:径向基函数(RBF)NN。网络的工程问题是温室环境控制(GEC)。网络将用于建立水栽蔬菜生产温室内部空气温度。在下面的这一小节中,GEC的一般问题以及本文专用的特定建模应用程序都是引用的。在第2部分中,介绍了RBF网络,并将比较的设计方法在第3部分中进行了详细介绍。第4部分进行了实验的解释,结果见第5部分。最后,第6部分为结论。

    1. 温室环境控制

温室的主要目的是改善植物生长的环境条件。在配有适当设备的温室中,这些条件可以通过气候控制进一步改善。例如室内空气温度,湿度和二氧化碳浓度等环境因素受加热系统,通风机和雾气系统的影响,其中还包括某些类型的控制器。温室气候控制的一个很好的概述可以在[23]中找到。温室气候受到许多因素的影响,例如外部天气,致动器和作物。旨在有效控制温室气候环境的方法必须考虑到这些因素,这是通过使用模型实现的。正在考虑的设计问题是将水耕蔬菜生产温室的内部空气温度建模为外部太阳辐射和温度以及内部相对湿度的函数。该模型旨在用于温室自适应预测分层(在[23]的意义上)控制方案中,如图1所示。在[5]中已经表明,该过程的模型在参数中缓慢地变化。这一发现使离线和在线方法都很重要。虽然初始设计可以离线完成,但在实时控制系统中使用时,网络可能需要在线适配。

图1 分层温室环境控制

以前应用神经网络对GEC产生的问题的一些例子可以在[20-22]中找到。 通常采用反向传播(BP)方法以及多层感知器(MLP)。 RBFNN在结构上比MLP更简单,这使得设计和训练过程变得更简单。 它们也强烈地基于函数近似理论,并且在该行中具有许多被证明是理想的性质,使得它们对于手头中的问题非常有吸引力。 由于这些原因,他们被选为本研究。

  1. RBF神经网络

RBFN由三个完全连接的层组成。 第一个是将源节点连接到网络的隐藏层的输入层,其由称为神经元的一定数量的单元组成。 然后隐藏层的输出通过一组参数线性组合,以在输出层中产生整体网络响应。 这样,网络将输入空间Xd映射到输出空间Ym。 隐藏层将非线性变换应用于生成隐藏空间的输入,该空间通常具有比X更高的维度。 给定两套积分 和以及一个函数,使得Y = F(X),NN的任务是以如下方式构建映射: (1)

利用这种公式,网络被限制穿过所有N个数据点,创建严格的插值(SI)问题。 解决这个多变量SI问题的已知方法是径向基函数技术,其中包括选择形式的形式

(2)

||·||是一个规范,通常是欧几里德,是一组被称为径向基函数的非线性函数,以数据点xi为中心,并被一组未知系数。 为了解决现实世界的问题,可能不太可能也不希望有尺寸N的RBF扩展,这可能非常大。 在[2]中,提出了近似于RBF SI问题,使用基于较小维度的扩展:

(3)

其中nlt;N和是一组称为中心的点,它们与一组权重,必须选择以最小化距离,从近似f到目标F,表示为:

(4)

定义 为线性权重向量, (3)可以按照以下紧凑形式的权重编写:

(5)

其中y是所需目标值的N-by-1矢量, 是N-by-n矩阵的元素是以径向基函数为中心的值并且在点处进行评估表示的伪逆。RBFNN中最常用的函数是高斯函数,形式如下:

现在很清楚,(1)等式的扩展(3)产生一个过度约束的系统,它不再在SI意义上内插F,而是接近它。 正则化网络[17]是另一种近似方法,也是基于将正则化理论应用于近似问题的RBF的扩展。 要最小化的数量现在由两个术语组成。

(6)

其中P是微分算子. ||·||是f所属空间的规范, 是正数实数,称为正则化参数。 运算符P的选择体现了关于解的先验知识,并确定方程式中使用的函数。(3)[11]。 方程式右侧的第一个术语(6)是测量近似值与实际数据的接近度的标准误差项。 第二项测量得到的近似的平滑度。 正则化参数建立了两个术语之间的贸易。应该指出,等式 (4)被回收。然后发现这个正则化问题的解与方程式相似。(2),并且再次通过较小维度中的一个来追求该N维扩展的近似值,得到类似于等式的解。(3),其中权重现在由以下计算:

这称为广义径向基函数(GRBF)扩展。 再次,如果 ,方程式 (5)。 从功能近似的角度来看,正则化网络具有三个理想的属性[17]:

bull;它是一个通用逼近器。 给定一个大量的隐藏节点,网络可以任意多义的多元连续函数近似近似。

bull;它具有最好的近似属性[12]。 给定未知的非线性函数F,总是存在一组未知系数,其比所有其他可能的集合更接近于F。

bull;计算的解决方案是最优的,其意义在于最小化功能,其测量解决方案偏离训练数据形式给出的真实值。

  1. 设计方法

3.1离线培训

在使用时代学习的批处理框架下,将比较三种方法,分享一些关于训练过程的基本思想.RBFNN的结构和神经元激活功能的性质导致了训练输出线性权重和 无神经元参数可以被认为是使用不同优化技术有意义的不同任务。与神经元自由参数相反,输出权重是线性的,并且可以使用线性技术很好地确定。在确定无神经元参数中可以应用许多方法,但是应当注意,通过特定方法确定的值对实现一些规定的误差性能所需的隐藏单元的数量以及线性权重的收敛性有很大的影响。 接下来将简要描述两种方法,并且给出第三种方法的两种变体。

      1. 离线方式1

在这里,考虑由两个阶段组成的混合学习过程。选择中心位置和传播,,首先进行确定输出权重使用线性最小二乘(LS)解:

(7)

向量y从公式(3)如,t是目标值的向量,式(7)也可以重写为

(8)

第七阶段由称为最优自适应k均值算法(OAKM)的聚类过程实现[4]。 然后确定神经元激活函数的扩展[13]

(9)

其中dmax是由OAKM确定的中心之间的最大距离。在整篇文章中,该方法将被称为离线方法1或OAKM方法。

      1. 离线方式2

一些方法从输入数据中选择中心位置。最简单的方法是随机抽取所需数量的中心,如果可用数量的数据点不够大,并且其输入空间上的分布不能代表现有问题,则可能导致较大的网络在训练阶段后,看不到的数据表现令人满意,行为不佳。旨在建立具有令人满意的绩效的中等规模网络的方法根据一些标准实施中心选择。正交最小二乘法(OLS)学习算法[3]以建设性的方式从输入数据集合中选择一组合适的中心位置。它将神经元添加到网络中以满足规定的错误性能。再次使用LS计算输出线性权重。这种学习算法的实现可以通过MathWorks公司的神经网络工具箱[6]获得,并在本研究中用于比较。它将被称为离线方法2或OLS方法。

      1. 离线方式3

在这种方法中,中心位置,中心的扩展和输出线性权重都是基于无约束确定性优化的监督学习过程来确定的。 基本上,新的参数值以迭代的方式计算,以便最小化成本函数(7)。 让和。 输出N-by-n矩阵的神经元是。 网络的输出可以用等式 (10),其中网络对输出权重的线性依赖关系和O对v的依赖性已被明确。

(10)

式(8)现在变成了:

(11)

到目前为止,提出的方案涉及到操作过程中的所有网络参数。如已经提到的,输出权重可以由LS解决方案最佳地确定。将目标值矢量t代入式(10),用A表示矩阵O(v),求解u,

其中A 代表矩阵A的伪逆。将此结果代入式(11)给出了新的训练标准:

(12)

这个新的训练标准不依赖于线性参数u,并且明确地包含了以下发现:无论非线性参数v采用什么值,所采用的u参数是最优参数。

可以采用不同的训练算法来最小化(11)和(12)。作为训练算法,可以采用一阶梯度算法(以MLP作为BP算法知道)或二阶方法,例如准牛顿,高斯牛顿或Levenberg-Marquardt(LM)算法。对于非线性LS问题,LM算法被认为是最佳方法,因为它利用问题的平方和特征[18]。因此,用于计算新参数值的优化算法是LM方法[9]。计算参数空间中的搜索方向,将表示为迭代k中的训练标准,由(w k)表示。这种方法被认为是受限制的步骤类型,因为它试图在某种意义上,将二次函数q(p k)与一致的w k的邻域de7n。步骤p k受到q(p k)的有效性区域的限制,该区域是通过以p k表示的截断的泰勒级数展开式获得的.

(13)

其中g k和G k分别是的梯度和Hessian矩阵。如[9]所示,可以求解p k求解以下系统:

(14)

标量在哪里v k控制p k的大小和方向。 然后,必须获得梯度g k,

其中J是形式的雅可比矩阵,

其视图中w的定义可以进一步分解为,

其中使用标准公式(7)计算J的三个衍生物正在

使用新的公式(12),替代的雅可比矩阵可用于此问题。 我们使用[19]中引入的一个,

其中(A)v是表示相对于中心和点的输出神经元矩阵的导数的三维数量。 请注意,这个雅可比是非常容易计算的,因为它是由(15)的两条第7行给出的,其中我以最小二乘的意义取代其最优值。 实际上,使用这个雅可比矩阵意味着最小化(12)的LM方法的每个迭代比最小化(7)便宜。

在非线性LS的上下文中,逼近二阶导数矩阵G k[8]使用在g k的确定中已经可用的信息:

为了测量q(p k)与的一致性,实际减少,,预测的减少量,被使用:

实际和预测的减少值如下获得。 预测采取步骤p k之后的误差值为:

在中预测减少变成了

在上实际减少是简单的

LM方法找到一个值v kge;0,这确保(G k v k I)的正定义,然后求解等式 (14)对于p k。 在这些条件下,解p k是对方程式最小化的独特的全局解。(13)。 LM方法的一次迭代可以表示为

(i)给出w k和v k,计算e k,g k和J k。

(i

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[26987],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。