中国东部衢江流域区域性降雨频率的参数不确定和非平稳性外文翻译资料

 2022-12-10 15:50:12

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


中国东部衢江流域区域性降雨频率的参数不确定和非平稳性

Qian Zhu1; Haiting Gu2; Xujie Zhang, Ph.D.3; and Yue-Ping Xu4

摘要:传统上,区域频率分析是在平稳的环境状态下发展起来的。然而,近期研究发现水文资料在不断变化的环境下有显著的改变。此外,水文频率分析的不确定性是持久的。本研究的目的是调查影响中国东部衢江流域设计降雨深中的不确定性来源、参数不确定性和非平稳性当中最重要一个因素的影响。研究首次提出了分析设计降雨深不确定性的空间自举法,设计降雨深是基于站点频率分析和线性矩的区域频率分析还有指数变量法估计出来的。同时,研究提出结合广义可加模型和30年移动窗口的方法,这个方法是用来分析极端降雨地区的非平稳性的。结果表明,由于参数的不确定,区域尺度下,100年设计降雨深的不确定性在广义极端值(GEV)和第三种皮尔逊类型(PE3)分布下分别达到了15.42%和12.45%,然而在站点尺度,在GEV和PE3分布下,这种不确定性将分别达到19.16%和16.7%。在非平稳的状态下,100年设计降雨深的不确定性可能会分别超过GEV下的24.83%和PE3下的16.94%。GEV和PE3分布下,由参数不确定造成的设计降雨深的不确定都比非平稳频率分析造成的小。

关键词:参数不确定性;空间自举法;非平稳性;区域频率分析;极端降水。 DOI: 10.1061/(ASCE)HE.1943-5584.0001355. copy; 2016 American Society of Civil Engineers

引言

水文事件中的极值频率分析(暴风雨或洪水)已被广泛应用于风险管理和工程设计,如大坝、溢洪道,和城市排水系统的设计。有关极端降雨事件的信息对社会显然很重要,特别是对生活在洪水风险不断增加地区的人口,例如中国的浙江省,洪水是主要的自然灾害(Wen et al. 2006)。在浙江省,降雨量全年分布不均,最严重的降雨事件发生在夏季,降雨会造成灾难性的洪水,洪水是浙江省主要的自然灾害。因而,公众对极端降雨事件和洪水的认识有所增加。

极端降雨或洪水频率分析的目的是提供对极端事件分布函数的完整描述,基于此得到观测值和未观测值的概率估计(Katz et al. 2002; Sugahara et al. 2009)。基于线性矩(Hosking and Wallis 1997)的区域频率分析(RFA)已经被广泛用于无资料站点获得降雨或洪水生长曲线,(Fowler and Kilsby 2003; Yang et al. 2010; Ngongondo et al. 2011; Gabriele and Chiaravalloti 2013; Weiss and Bernardara 2013)。但是,不确定性广泛存在于RFA中。如一些研究总结(Fowler and Kilsby 2003; Merz and Thieken 2005; Ilorme and Griffis 2013):测得的数据、辨别同性质地区的方法、参数估计等,都是FRA中不确定性的来源。不确定性决策的关注点是可靠地计算极端降雨、洪水的概率及其不确定性估计值,科学愿望是做出合理的不确定性估计。

许多研究已经完成对频率分析不确定性的分析(e.g., Merz and Thieken 2005; Lee and Kim 2008)。许多不确定性分析方法已经被提出,包括广义似然估计(GLUE),贝叶斯方法,和马尔可夫链蒙特卡罗(MCMC)等。但是,他们中的大多数都用于估计水文模型的不确定性(Parent and Bernier 2003; Jin et al. 2010; Li et al. 2010a, b; Bouda et al. 2012; Jeremiah et al. 2011; Delsman et al. 2013; Houska et al. 2014)。相比于广义似然估计,贝叶斯方法在频率分析中的分布参数的不确定性估计中的应用更为常见(Gaume et al. 2010; Liang et al. 2011)。然而,在贝叶斯框架中,导出分位数估计一定要知道参数的后验分布(Ribatet et al. 2007),马尔可夫链蒙特卡罗也是这样。Serinaldi和Kilsby建议(2015),自举法是获得评估抽样与参数估计不确定性的置信区间的最实际的选择。自举法是数据驱动的,独立的估计方法,并且可以被用来作为一个非参数重采样技术,这意味着它不依赖于渐近理论。自举法已经成功的用于评估参数的不确定性和估计水文研究中的置信区间(Ramesh and Davison 2002; Prudhomme et al. 2003; Li et al. 2010a, b; Tiwari and Chatterjee 2010)。在这项研究中,自举法被用来作为一个非参数重采样技术,其中新样本是从刚抽取出的样本与担当替代者的原始样本中产生。相比于其他方法,自举法在频率分析中的不确定分析中的应用较少。

除了频率分析中的不确定性,还有另一个问题应给予更多的关注,即非平稳性。一般的现行方法和FRA都是假设时间序列是平稳的;换句话说,他们有自由的趋势和突变(Salas 1993)。但是,Milly等人(2008)指出:“平稳性已经是过去时,不应该作为水资源风险评估和规划的中心和遗漏的假设。”他还指出“平稳性不能被再次使用。”他们认为平稳性的消失是由大量人为导致的地球气候改变以及土地利用和土地覆盖变化锁造成的。考虑到这点,许多研究探索了世界上许多地区在降雨和洪水的背景下平稳性的有效性(Sugahara et al. 2009; Villarini et al. 2009; Zhang et al. 2011; Loacute;pezandFranceacute;s2013; Tramblay et al. 2013; Roth et al. 2014)。这些工作表明,在改变的环境下平稳性的假设应该受到怀疑。

中国华东地区钱塘江流域的城市和郊区在过去几年经历了很大的发展,并且受到气候变化的影响较大(Xu et al. 2012, 2013; Tian et al. 2013)。本研究旨在用空间自举法研究参数的不确定性,以及用结合30年移动窗口、广义可加模型的方法来研究非平稳性和衢江地区降雨频率分析,衢江流域是钱塘江流域的主流。研究内容如下:首先,介绍了研究的领域和数据。然后,简要说明提出方法和分析的结果。最后是本研究的主要发现的讨论和总结。

研究领域和数据

衢江位于中国华东地区的浙江省,是钱塘江的干流。这项研究中设计的流域在衢州水文站以上,其集水区面积约5690平方公里。衢江流域以亚热带季风湿润气候为主,有四个明显的季节(春、夏、秋、冬),气温适中,雨量充沛,日照充足,冬夏季长,春秋季节短。年雨量分布不均。最大降雨发生在连续的四个月,分别为三月至六月或四月至七月,占全年降雨的50%-60%。年平均降水量为1500毫米,平均气温约为15℃-18℃。

研究采用了31个雨量站的年最大日雨量序列(图1)。最长的记录期为1934至2009年,平均记录长度为44年。在这些站中有七站丢失数据,各站信息见表1。

图1:本文中所使用的衢江流域和雨量站及一致区的位置

方法

研究的过程如下:首先,测试在31个站和描绘均匀区域处的所有实测时间序列,以确定它们是否是稳定的。其次,利用基于线性矩的RFA估计设计降雨深的分水位。然后,利用空间自举方法分析区域和站点尺度的设计降雨深的不确定性。用一个结合广义可加模型和30年移动窗口的方法来建立建模框架,用于非平稳性分析,其中选择分布的参数会随着被选择函数和时间所起作用的改变而改变。shuangtadi代表站,作为例子来说明在区域尺度的不确定性分析,以及分析比较由于参数不确定性和非平稳性所产生的不同结果。

表1:衢江流域31个雨量站数据及其相关特征

站点和区域的平稳性检测

平稳性的严格统计定义是一个过程的分布随着时间是不变的(Graf 2015),但这里的平稳性反应的没那么强烈。趋势检验是水文序列的平稳性检验当中最流行的方法之一(Fatichi et al. 2009; Yang et al. 2010; Ishak et al. 2013)。非参数Mann Kendall检验(M-K检验)(Mann 1945; Kendall 1975)被用来完成趋势检测,因为它和其他方法作用相当时,它具有不需要任何分布假设的优势。世界气象组织强烈推荐利用这种方法来评估水文序列中单调趋势的意义(Mitchell et al. 1966)。预白化技术(Yue et al. 2003)用来消除在M-K检验中显著自相关的影响。趋势检验不仅用于检验单站年最大日降水序列,也用于划定一致区。了解区域尺度上趋势检测理论的详情,读者可以参考Adamowski和bougadis(2003)和Douglas (2000)的文献。这两本参考书提到的检验统计量Z是作为标准正态的变式,通过与Z 1minus;alpha;/2绝对值的比较来决定置信度,其中Z 1minus;alpha;/2是标准正态分布的1minus;alpha;/2分位点(alpha;是置信水平)。此外,为了得到稳健的平稳性检测结果,Pettitt方法(Pettitt 1979)被用来发现站点年最大日降水量系列的变化点。

区域频率分析

RFA建立在线性矩(Hosking and Wallis 1997)的基础上,包括四个步骤:

步骤1:使用非一致性的措施筛选数据。霍斯金和沃利斯(1997)提出用非一致性方法测出的D来确认站点数据相对于其他站点是不是非一致的。如果D超过临界值,这个站点将被划定为不一致,临界值大小取决于站点的数量(表2)。

表2:衢江地区三个子流域非一致和非平稳测量结果

步骤2:利用聚类分析识别同质区域。霍斯金和沃利斯(1997)认为站点特征的聚类分析是大数据集形成区域的最实用的方法,它是一个标准的方法,已被广泛而且成功地用于识别同质区域(Baeriswyl and Rebetez 1997; Castellarin et al. 2001; Lin and Chen Yoo et al. 2012)。站点的特征对于定义同质区域非常重要,应选择哪些特性涉及几个阶段的主观决定。这项研究中,采用k-均值聚类分析来完成同质区域的识别。选取6个站点特征,分别是纬度、经度、年平均降水量、线性离差系数(L-CV),线性偏度和线性峰度。尽管存在这样的事实:源自于变量的属性(例如,降雨和洪水)可能受样本变化的影响,因为这些属性依赖于样本,但他们还是通常用来定义区域(Burn 1989; Wolock et al. 2004; Rao and Srinivas 2006; Sawicz et al. 2011)。

变量尺度对聚类分析的结果有影响;因此,这些变量通过标准化被重新调节,以至于它们在范围大小上可以比较,异质性措施被用来评估聚类分析的输出,也就是评估一组站点是否属于同质区域。相比于积矩离差系数,线性离差系数L-CV和线性偏度是最常用的(Ilorme and Griffis 2013),并且将用于这项研究中,使用异质性措施可以称为H-统计,大量的工作表明,基于L-CV的H-统计量对于鉴别同质和异质区域是最有效的(Castellarin et al. 2001; Hosking and Wallis 1997; Ilorme and Griffis 2013)。一个区域如果H<1则被称为水文均一,即站点线性系数变化的变异没有比预期自然抽样变异的大(Hosking and Wallis 1997; Ilorme and Griffis 2013)。若1le;H<2,该地区可能是水文一致区。如果Hge;2,该地区则被称为异质区。

步骤3:利用拟合优度的方法选择合适的区域频率分布。之后,将研究区划分为均匀的区域,适当的分配方法将会为RFA选定出来。在这项研究中,利用Hosking和Hosking提出的线性矩率图和拟合优度选择方法来选择合适的分布。

步骤4:区域频率的参数估计使用线性矩法。线性矩法受抽样变异的影响少,而且相比于其他估计方法(e.g., the maximum likelihood method)可以产生更有效的参数估计值(Norbiato et al. 2007)。因此,区域线性矩法被用于估计参数可能的变化范围。考虑五种分布模型:广义极值分布(GEV),广义帕累托分布(GPA),广义对数分布(GLO)、三参数对数正态分布(LN3),P- III分布(PE3)。

四个步骤后,指标变量的方法(Norbiato et al. 2007),早期的研究也称为指标洪水(Darlymple 1960),就是在执行程序的时候使用洪水数据,来估计设计降雨深的分位数。就像

Chebana,Ouarda (2009),Bernardara (2011)等人和Weiss,Bernardara (2013)提出的,把该年最大降雨平均值作为指标变量。

基于空间自举法的不确定性分析

在站点的规模上,想要达到在任何无资料地区估计极端降水深度的目的,就要考虑周边几个站的实测数据。这里提出的是一种空间的自举法:测站不同时间序列的观测被用来产生无资料地区新的时间序列,利用站点与无资料地区的欧氏距离来确定观测值的权重。

传统的方法中,无资料地区估计一个新的时间序列,附近的短时间序列经常被丢弃,因为他们不能提供足够数量的信息数据去准确估计分位数。此外,它们对于产生长时间序列是没有作用的,

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[27654],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。