• 谷歌scholor
  • 观点:2234

  • PDF下载:404

水文区划与最大流量估算精度的关系

乔Tavakkoli1以及赛义德·哈希姆·侯赛尼2

1伊朗伊斯兰阿扎德大学torbate -Jam分校土木工程系

2伊斯兰阿扎德大学自然资源系,torbate -Jam分校,伊朗torbate -Jam

DOI:http://dx.doi.org/10.12944/CWE.9.3.41

为了便于数据从有统计数据的流域向没有统计数据的流域传递,一般采用水文区划。通过将区域划分为均匀区域,可以实现高效的数据传输。本研究采用聚类分析方法将不同水文区域划分为均匀区。通过因子分析,确定了面积、年平均降雨量、平均高度、流域坡度等自变量的重要性。通过聚类分析方法进行均匀性检验,确定了2个水文均匀区。利用洪水标记法和多元回归方法,分别建立了区域和均匀区域模型。并与三个控制区和研究区最大排放值进行了准确性和性能评价比较。采用相对平均绝对误差指数进行比较。结果表明,均匀区与模型相比具有较高的决定系数和较低的标准误差。此外,当回归期增加时,R2SE值也有所增加。相对误差模型在均匀区域的比较结果表明,均匀区域的误差小于整个区域的误差。面对数据可用性较差,难以估计较长回归期值的限制,本研究建立了一个同质区域模型,并用于案例研究。

聚类分析;同质性;区域分析;分类

复制下面引用这篇文章:

张建军,张建军,张建军,等。水文区划与流域最大流量估算精度的关系。当代世界环境2014;9 (3)DOI:http://dx.doi.org/10.12944/CWE.9.3.41

复制以下内容引用此URL:

张建军,张建军,张建军,等。水文区划与流域最大流量估算精度的关系。当代世界环境,2014;9(3)。可以从://www.a-i-l-s-a.com/?p=7366


下载文章(pdf)
引用管理器
发布历史


文章发表历史

收到: 2014-08-30
接受: 2014-10-28

介绍

在水文学中,区划通常用于将有统计数据的流域的水文信息传递给未测量的流域,开发的区域模型也可以成功地用于估算未测量站点的流量持续时间曲线(E.A. Baltas, 2012)。通过将区域划分为同质区域,可以更有效地进行数据传输。确定各方面的均匀性,在具有相同反应的水文事件中形成水文均匀区。均匀区域最重要的应用之一是区域流分析。为了提高多个气象站水文统计的充分性和准确性,需要提高流量估算模型的精度。虽然所提出的均匀区域的回归模型具有较高的相关系数,但并不期望使用这些模型对流量的估计总是准确的。这是由于区域化过程中所犯的错误(ICOLD, 1988)。研究人员已经研究了使用流量分析确定均匀区域的重要性及其对提高估计准确性的影响(Davoodi, 1998)。一些研究人员指出,应该根据气候特征、地理范围、政治边界和高度位置来划定同质区域(murphy, d.e., 1977和Anil Kumar Kar, 2012)等。另一方面,其他研究者利用水文响应和流域特征作为划分同质区域的依据(Strupczewski, 2001)等。 In the present study, cluster analysis and factor analysis were performed for the separation and homogenization of homogeneous regions. A statistical model estimates the stream flows parameters, basin variables define the watershed characteristics. If a regionalization method is prosperous, strong relationships between stream flows properties and basin variables can be realized (Shin-Min Chiang, 2002), etc.

研究区域

呼罗珊-拉扎维盆地研究区位于伊朗东北部。流域总面积为118854平方公里。盆地位置地理坐标为北纬36.2980°,东经59.6058°。在地质方面,该地区有两个独立的构造单元,包括Hezarmasjed - Koppe Dagh沉积区和Binalood沉积区。根据Demarton的方法将气候分为干旱和半干旱两类。图(1)显示了研究区域的位置。

图1:呼罗珊拉扎维省水文测量站的位置
点击这里查看图


方法

该方法是根据研究,文献,分析和推理。因此,对于所需要的资料是采用水文站的资料。在此基础上,通过因子分析确定了最重要的因子,并将其用于聚类分析分类。这些地区被划分为同质群。此外,数据分析采用SPSS软件进行。

该方法包括以下主要步骤:

  1. 检查整个盆地的均匀性,
  2. 选择优先变量,
  3. 应用聚类方法,
  4. 采用指数泛洪法进行特征总结
  5. 找出回归期放电与地形的关系,并
  6. 选择区域分布


回顾统计方法

选择最合适的区域频率分布


在数据测试和重建水文站之后,对这些站进行了最大流量期间的洪水频率分析。利用HYFA软件(HYFA是一款可用于水文研究统计分析、曲线拟合和统计分布的统计软件),采用Pearson II型、Pearson log III型统计分布函数、2个gamma参数、3个对数正态参数、2个正态和对数参数进行统计分布。

表1:解释的总方差

加载
组件
初始特征值 旋转平方和
总计 方差
百分比
累积
百分比
总计 方差
百分比
累积
百分比
区域 6.581 54.839 54.839 4.401 36.675 36.67
年平均降雨量 1.966 16.385 71.233 2.766 23.05 59.72
平均身高 1.313 10.491 82.164 2.536 21.137 80.86
Gravilius系数 1.083 9.023 91.871 1.239 10.32 91.187
24小时降雨量 0.371 3.09 94.276
净河坡度 0.268 2.235 96.512
河坡 0.213 1.779 98.29
盆地的长度 0.088 0.734 99.025
所有水道长度 0.043 0.354 99.379
主要河流长度 0.036 0.302 99.681
盆地坡度平均值 0.029 0.242 99.922

表2:Varimax旋转矩阵
点击这里查看表格


因子分析与自变量选择

至于主成分分析,因子分析是一种用于数据约简的多变量方法。同样,基本思想是用更少的变量来表示一组变量。在这种情况下,它们被称为因子。因子分析是为区间数据设计的,尽管它也可以用于顺序数据(例如分配给李克特量表的分数)。因子分析中使用的变量之间应该是线性相关的。因子分析模型可以用代数形式表示如下:如果你有p个变量X1 X2…,在n个受试者的样本上测量的Xp,则变量i可以写成m个因素F的线性组合1F2……F其中,如上文所述m < p。

X=一个i1F1+一个i2F2+……+一个即时通讯F+ e…(1)

a在哪里?变量I和e的因子负载(或分数)是多少是变量X的部分这不能用因素来“解释”。因子分析有三个主要步骤:

  1. 计算初始因子负载。
  2. 因子旋转
  3. 因子得分的计算。


在一些统计软件包(如SPSS)中,这种选择实际上是在一开始就做出的。第二种方法,在1上选择特征值,可能是最常见的一种。最终因素得分通常使用基于回归的方法计算(Manly, B.F.J, 2005)。

图2:使用四个变量的分层聚类结果(树状图)
点击这里查看图


聚类分析方法

DeCoursey(1973)、DeCoursey和Deal(1974)、Mosely(1981)、Acreman和Sinelair(1986)、Burn(1989)、Lim和Lye(2003)以及Shin-Min Chiang等(2002)、Chavoshi和Soleimani(2009)、Anil Kumar Kar(2012)已经将聚类分析用于同质区域。DeCoursey(1973)和DeCoursey- deal(1974)使用聚类分析来确定同质区域。这种方法也被称为Decoursey修正法(Wiltshire, S.E, 1986)。聚类分析搜索并组织信息以确定因素组。每组内因素的某些方面彼此相似,与其他组内因素没有差异。如果这些区域具有非常相似的定量性质,这些区域将被认为是彼此非常接近的“n”维空间。研究了这些区域的相似性,以测量它们之间的距离。该方法提供了一种称为接近系数或相似系数的测量方法。基于这个系数,可以总结出两个领域之间的相似性(Tasker, g.d., 1982)。聚类分析包括以下步骤:

  1. 相似性测度的选择(本研究采用因子分析法);
  2. 数据标准化,使所有参数具有相同的单位;
  3. 参数间欧几里得距离的确定;和
  4. 选择一种方法来确定类别(这里应用聚类分析,使用累积类来确定同质区域)。


表3:均匀区域和全区域的流量中位数无量纲量

One hundred./ Q2 50/ Q2 25/ Q2 10/ Q2 5/ Q2 2/ Q2 地区
3.538 3.139 2.753 2.212 1.714 1 均匀区域(I)
3.793 3.341 2.888 2.271 1.776 1 均质区(II)
3.538 3.139 2.573 2.212 1.714 1 整个地区

注:Qn为n年回收期流量

表4:全区和均匀区指数洪水模型

地区 模型 R2 SE
整个 Q2 = 64.86 + 0.1632 a 0.796 0.24
均匀(我) Q2 = 33.17 + 0.1681 a 0.801 0.22
均匀(2) Q2 = 178.34 + 0.1371 a 0.94 0.182

注:Q2为两年回收期流量(m3/s), A为区域面积(km2)

表5全区域最大瞬时流量的多变量回归模型

R2 SE 模型 回收期(年)
0.88 0.17 2= 480.9 + 0.154a - 0.151小时 2
0.88 0.18 5975.884a - 0.321小时 5
0.87 0.2 10= 1303.45 +0.38 a - 0.439 10
0.86 0.19 25= 1725.9 + 0.51 a - 0.594 25
0.8 0.2 502048.614a - 0.716 h 50
0.73 0.21 One hundred.= 2237 + 0.722 a - 0.841 One hundred.

注:Qn为n年回复期最大瞬时流量(m3/s), A为区域面积,H为区域平均高度(m)

指数洪水法

采用洪水指数法进行区域洪水分析,总结区域特征。在实施洪水指数法之前,需要指定均匀区域。

在应用指数洪水法之前,我们必须确定同质区域,之后用户基期应服从最统计期。对选取和重构的用户基站的持续时间进行不完全统计,编制了均匀区域内所有基站的频率曲线。最后进行同质性检验,然后将不同回水量除以年平均回水量。收集所有台站的所得比率,并确定上述各回归期的中位数比率。根据各回归期的中位数比率,绘制区域频率曲线。随后进行回归得到年平均流量与流域面积之间的区域模型(Telori A., 1996 and Chavoshi S., 1997)。

表6:最大均匀区瞬时流量的多变量回归模型

R2 SE 模型 回收期(年)
0.87 0.17 Q2 = 1085 + 0.126 a - 0.372 h 2
0.89 0.17 Q5= 1856+0.216 a - 0.63 h 5
0.88 0.18 Q10 = 2335 + 0.277 a - 0.79 h 10
0.86 0.19 Q25= 2915+ 0.355 a - 0.981 h 25
0.82 0.19 Q50= 3335+ 0.413 a - 1.12 h 50
0.75 0.24 Q100 = 3752 + 0。47小时- 1.25小时 One hundred.

注:Qn为n年回复期最大流量(m3/s), A为均质区面积,H为区域平均高度(m)

多元回归法

该方法代替绘制流域面积-年平均流量的方法,给出了不同回复期流量与流域地理特征的关系(Honarbakhsh, 1993)。一般的多元回归关系如下:

T= F(一个一个BbCc, ......... Zz), (3)

问在哪里T为T年重现期洪水;A、B、C、…、Z为盆地特征的自变量参数;a, b, c,…,z为多元回归分析得到的常数值(Telori a ., 1996; Chavoshi S., 1997)。

在本研究中,建立了流域特征和概率分布参数的回归方程。经过频率分析,得到各台站的合适参数。因此,形成了回归方程,用于估计重要区域的概率分布参数(Fotouhi A. 2004, and murphy, d.e., 1977)等。结合流域特征,得到无统计或有限统计的不同区域的分布参数。因此,问t由得到的分布计算。

结果与讨论

研究的目的是建立一个区域模型,以描述水文均质区参数和选定模型的地理变化特征。同时,建立一个均匀区域模型,可以更准确地估计不同时期的最大年回潮流量。

方差分析

在本研究中,使用SPSS软件对选定地区测量的17个变量进行因子分析。这些变量包括流域的各种特征,如面积、周长、平均坡度、主流坡度、平均水位、平均降雨量、24小时最大降水量、排水密度、重力系数、霍顿系数、米勒系数、最大水位和最小水位。每个度量单位都不同于其他变量。因此,为了准确比较变量,所有的单位都被标准化了。因子分析的初步结果比较复杂,并没有给出最佳的解决方案。为了使每个因子的方差最大化,对因子轴进行最大方差旋转,直到操作结果成为一个独立的因子。因子的识别是基于旋转因子加载完成的。采用回归估计方法,得到了站点因子得分矩阵。为了限制因素的数量,进行了KMO (Kaiser-Meyer-Oklin)抽样充分性度量,它决定了所选因素数量的比例。去除不必要的变量是基于反图像相关矩阵。 To measure the discrimination for these variables, which are correlation matrix diagonal elements, the measure of sampling adequacy (MSA) was utilized. In this method, variables with the lowest MSA value are eliminated by considering the significance level of correlation coefficient matrix among variables. In eliminating variables, KMO statistics and variance percentage should be considered. The elimination of a variable will probably increase or decrease KMO value and percentage of variance (Fotouhi A., 2004). After selecting the required variables, factor analysis was conducted. Necessary variables were selected based on the value of KMO = 0.721. KMO is a statistic which tells whether you have sufficient items for each factor. It should be over 0.7. The Bartlett’s test is used to check that the original variables are sufficiently correlated. This test should come out significant (p < 0.05) — if not, factor analysis will not be appropriate (Rencher A.C., 2002). Subsequently, factor analysis was conducted based on the selected variables. Eigenvalues and percentage of variance factors are shown in Table (1). According to Table (1) extracted factors account for 91% change from the previous variable. As can be seen in the table, the first factor is a greater role in the total variance. This is being satisfied factor analysis of parameters (Anil Kumar K., 2012), etc.

表7:最大均匀区瞬时流量的多变量回归模型

R2 SE 模型 回收期(年)
0.904 0.17 Q2 =217.44 + 0.134 a 2
0.89 0.18 Q5 =332 + 0.264 a 5
0.908 0.17 Q10 =371.5 + 0.367 a 10
0.9 0.18 Q25 = 392.7 + 0.513 a 25
0.87 0.22 Q50 = 391.5 + 0.632 a 50
0.76 0.25 Q100 = 379 + 0.759 a One hundred.

注:Qn为n年回复期最大瞬时流量(m3/s), A为均质区面积(km2)

利用因子分析将48个因子分别度分为4组,得出每个因子的贡献如下:第一个因子的特征值为25,其本身对方差的59%进行了计算和解释。第二个特征值为25的因子能够计算并解释59%的方差。第三个因素:该因素为6,特征值为25,约占解释方差的59%。第四个因素:特征值为2,解释6%的方差,有3个因素。

一旦计算出初始因子负载,就会对因子进行旋转。这样做是为了找到更容易解释的因素。轮换的目的是试图确保所有变量只在一个因素上具有高负荷(Manly B.F.J, 2005)。换句话说,最大方差旋转是一种方法,其中因子结构通过最大化数据矩阵列的方差来提供一个简单的模型。在本研究中,使用最大变量旋转的调查结果将影响因素减少到4个。此外,由于不能确定方差,因此排除了特定值小于1的因子。从表中可以看出,第一个因素在总方差中的作用更大。最大旋转矩阵如表(2)所示。

聚类分析

为了确定研究区内的均匀区域,采用层聚类方法进行聚类分析。特征是面积参数、年平均降雨量、平均流域高度和河流净坡度。采用最大相似系数为15的分层聚类方法。这导致了两个同质区域的确定。用变量做的树形图如图(2)所示。在集群1中,只有19个变量,集群2中只有12个变量。层次聚类方法在不同的变量条件下确定了理想的流域边界。

本研究采用聚类分析的方法,完成了两个同质区域的洪水指数方法。全区域和均匀区域的流量中位数无量纲量如表(3)所示。区域洪水频率公式的制定需要以下两种关系:

  1. (Qt/Qm)与回归周期T的关系
  2. 年平均洪水与流域特征的关系。


基于三个对数正态分布参数,调整相应回归期的无量纲中位数,绘制其他区域频率曲线。利用该曲线,通过无量纲中位数插值来指定其他回归期。利用流域参数对两年洪水进行了模拟。全区域和均匀区域的最终指数洪水模型如表(4)所示。因此,将2年重现期数值与5年重现期无量纲流量的中位数相乘即可得到洪水模型5年重现期指数(表3)。

图3:多变量回归方法中全区域和同质区域相对误差平均值的比较
点击这里查看图


多变量回归

当选择的变量数量较大时,考虑一组较小但有效的变量进行进一步分析,而不是使用所有变量。在这方面,多元回归可以更适合于选择变量的确切数量。应再次选择自变量,同时考虑到潜在的物理过程以及与因变量的良好相关性。本文提出了一种水文区划方案,用于对所测流域进行分类。为了估计未测量地点的流流量,采用回归方程(Shin-Min Chiang, 2002)等。

图4:洪水指数法在全区域和均匀区域的相对误差平均值对比
点击这里查看图


表(5)为全区域估算回归周期为2、5、10、25、50和100年的最大瞬时流量的模型,表(6)和表(7)为均匀区域的模型。

利用聚类分析方法确定均匀区域是区域洪水分析的第一步。Ouarda(2001)确定了研究区域的特征,包括干渠长度、干渠坡度和年平均降雨量。此外,Honarbakhsh(1993)根据洪水的区域分析指出,影响洪水最重要的参数是以下地理特征:面积、平均高度、平均流域坡度、年降雨量和流域长度。在输入变量中,利用第一因子分析法确定了面积、年平均降雨量、流域平均高度和主河地面坡度4个因子是均质化的重要因素。这四个因素达到了91.18%的方差。下一步,通过聚类分析评价流域的均匀性,确定两个均匀区域。基于这四个主要变量,提出了两种类型的模型:一种是针对整个区域的,另一种是针对均匀区域的。均匀区域比整体模型具有更高的决定系数和更小的标准误差。这些地区也表现出较高的回归期R2和SE值。此外,还研究了各模型在均匀区域和整个区域的相对误差。 Figures (3) and (4) present the average relative error determined by multivariate regression and flood index methods in the whole region and homogeneous regions, respectively.

已经进行了几项研究,重点是水文均匀区在提高区域分析模型的性能和精度方面的重要性。在本研究中,与整体区域模式相比,发现创建同质区域的重要性和必要性非常明显。一般来说,均质化导致盆地内各变量的作用增强。因此,模型的精度将会更高。然而,均质化可能会导致变量值的减少,这可能是由于数据分散的增加。由表(4)、(5)、(6)、(7)可知,整个区域的SE值大于均匀区域的SE值,R2值小于SE值,且均匀区域模型比整体模型效率更高。因此,从多变量回归模型(图3)和洪水指数模型(图4)与控制站数据的相对误差对比来看,均匀区域的相对误差小于整个区域。

结论

研究描述了呼罗珊-拉扎维流域划分为两个均匀的洪水频率集群,并研究了优先变量如何影响集群过程。通过使用17个变量中的4个变量来降低变量的维数对同质性和簇的形成没有任何显著的影响。区划通常是在没有统计数据的情况下将水文数据转移到流域。通过将区域划分为均匀区域,可以更有效地进行数据传输(因为区域对水文事件的响应是相同的)。本研究还表明,均匀区域的回归模型具有较高的校正系数,尽管该模型并不总是准确的。因此,在进行的研究工作中,均匀区域的决定系数大于整体模型,标准误差小于整体模型,从而可以提高模型的精度。

参考文献

  1. Acreman, m.c.和Sinclair, c.d.,根据其物理特征对流域进行分类:在苏格兰洪水频率分析中的应用,J。二聚水分子。(阿姆斯特丹),84(3 - 4);365 - 380,(1986)。
  2. Anil Kumar Kar, n.k. Goel, A.K. Lohani和G.P. Roy,基于优先变量的聚类技术在区域洪水频率分析中的应用——以Mahanadi流域为例,水文工程学报(第3期),17个;213 - 223,(2012)。
  3. Baltas, E.A,希腊西部水电潜力区域模型开发,全球NEST杂志,14;442 - 449,(2012)
  4. Burn, d.h.,区域洪水频率的聚类分析;J.水资源。Plann。管理。115(5);567 - 582,(1989)。
  5. Chavoshi Sattar,干旱和半干旱地区瞬时最大流量区划,硕士论文,伊斯法罕理工大学土木工程系,(1997)。
  6. Davoodi Rad Ali Akbar,伊朗中部流域形态因子与洪水流量的关系研究,硕士论文,德黑兰大学土木工程系,(1998)。
  7. DeCoursey, d.g.,洪涝和干旱中峰值流量的客观区划,Proc, 2nd Int。计算机协会。《水文学》,E. F. Koelzer和K. Mahmood主编。,水资源出版,Fort Collins, CO ., 395-405,(1973)。
  8. Decoursey, D.G.和Deal, r.b.,《多元分析的一般方面及其在水文学某些问题中的应用》。Proc,计算机协会。《统计水文学》,美国农业部农业研究局,华盛顿特区,47-68,(1974)。
  9. Fotouhi Akbar和Fariba Asghari, SPSS软件统计分析,第一版,德黑兰科学出版社,2004。
  10. Honarbakhsh Afshin,纳马克湖流域洪水的区域分析,德黑兰大学流域管理硕士论文,(1993)。
  11. [1]李晓东,洪涝灾害的防洪设计,水利水电工程学报,16(1),(1988)。
  12. Lim, y.h.和Lye, L.M.(2003),马来西亚沙捞越未测量流域的区域洪水估算,二聚水分子。科学。J。,48 (1);79 - 94,(2003)。
  13. Kjeldsen, T.r.和J.C. Smithers,《使用指数洪水法分析南非夸祖鲁-纳塔尔省的区域洪水频率》,水文学杂志255, 194-211,(2002)。
  14. 曼利,B.F.J,多元统计方法:入门,第三版,查普曼和霍尔,(2005)。
  15. 莫斯利,M。P.新西兰水文区划分;j .二聚水分子。(阿姆斯特丹),49 (1-2);173 - 192,(1981)。
  16. 墨菲,D.E.和e.w allance和L.J. Lane,地貌参数预测西南地区的水文特征,资源公报,13 (1);217 - 238,(1977)。
  17. 王志强,王志强,《基于典型相关分析的区域洪水频率估计》,杂志水文、254, 157-173,(2001)。
  18. Rencher, a.c.,多元分析方法,第二版,Wiley,(2002)。
  19. Rezaei Abdulmajid,应用回归分析导论,第一版,伊斯法罕科技大学出版社,(1997)。
  20. 蒋新民,蔡廷桂,李志强,流域水文区划,1:方法发展,水资源规划与管理学报(第3期),128;1 (3), 3-11,(2002)。
  21. Strupczewski, W.G.和Z. Kaczmarck,洪水频率建模的非平稳方法²²加权最小二乘估计,水文学报,248;143 - 151,(2001)。
  22. Tasker, g.d.,《水文区划方法比较》,水资源通报,18 (6);965 - 970,(1982)。
  23. Telori Abdulrasoul,洪水发生或加剧的有效因素,专门洪水河流论文集,伊朗水利协会(1996)。
  24. Wiltshire, s.e.,区域洪水频率分析ÉÉ:同质性统计,水文科学杂志,31 (3);321 - 333,(1986)。