混合线性矩和anfiss - ga预测地下水盐度
阿米尔Jalalkamali1*
DOI:http://dx.doi.org/10.12944/CWE.11.3.11
不幸的是,缺乏关于伊朗地下水资源的详尽的定性和定量资料。这就是为什么在估计定性和定量地下水参数时使用各种模型的原因。本文比较了自适应神经模糊推理系统(ANFIS)与遗传算法(GA)模型和l矩混合在克尔曼平原地下水盐度区域和现场预测中的能力和效率。在此过程中,电导率被认为是因变量,而通过回归分析,总离子、镁离子、钠百分比和地下水水位被假设为独立参数。输入值与预期值之间的相关系数是本研究在比较和选择最优模型时考虑的准则。研究区井被划分为3个均质区。计算每个站点的Hass-King异质性和不一致性标准。区域分析的最佳结果为17井,相关系数为0.9958;现场分析的最佳结果为2井,相关系数为0.9787。结果表明,在异质性标准较低的地区,ANFIS-GA区域预测的准确性略高于现场预测。
复制下面引用这篇文章:
A.混合线性矩和anfiss - ga预测地下水盐度。当代世界环境,2016;11(3)。DOI:http://dx.doi.org/10.12944/CWE.11.3.11
复制以下内容引用此URL:
A.混合线性矩和anfiss - ga预测地下水盐度。当代世界环境,2016;11(3)。可以从://www.a-i-l-s-a.com/?p=16383
文章发表历史
收到: | 2016-07-19 |
---|---|
接受: | 2016-10-10 |
介绍
在干旱和半干旱地区,地下水是饮用水、农业和工业消费的唯一可靠来源。显然,未来一年水资源的数量和质量是水资源管理的重要内容。自1950年以来,地下水模拟已被广泛用于更好地管理地下水资源。因此,许多研究人员试图寻找更准确的模型,考虑到实际情况。这些模型需要大量的信息,这些信息很难收集,有时甚至不可能收集。而且,考虑到某些执行条件,如果可能的话,得出结论需要更多时间。另一方面,水文参数中有许多因素使数据应用于模型变得复杂。由于收集更多信息的困难和校准所需的时间,制作物理和概念模型的问题很少得到重视。此外,变量的非线性使问题更具挑战性。近年来,人工智能(AI)模型作为一种新的强大工具被用于水文参数预测。 These methods act as a black box and do not require lots of physical data and are capable of estimating non-static water quality. Due to short processing time and low input data, AI models can supersede numerical ground water models. These new methods act as powerful estimators without the need for governing equations. For error reduction in regional forecasting, all selected wells must choose from one homogeny cluster. So, it is necessary to define cluster homogeny by some examinations. But one must make sure that these places are available. Because choosing some clusters with some wells inside is not sufficient for homogeny. The L-moments as the new types of statistical methods act for solving such problems. A quick search shows that regional forecasting with ANFIS-GA is a new method for modeling. Nero-fuzzy networks for flood regional analysis were used .1研究表明,相对于人工神经网络和非线性相关,神经模糊模型在无比重计现场的流域洪水估算中具有更好的建模能力。L-moments调查了澳大利亚四个含水层的巨大供应。2他们发现,区域分析提高了预测的准确性。自适应神经模糊推理系统(ANFIS)已被用于预测复杂系统中供水的质量和数量趋势,并具有可接受的精度。3、4、5、6 and7人工智能方法是一种非线性的建模工具,不需要明确问题的物理关系。近年来,软计算技术在水利工程领域的成功应用已经大量发表。8、9 ad10本文尝试利用l矩的anfiss - ga预测克尔曼平原地下水的区域盐度,并将区域结果与现场结果进行比较。
研究区域
本研究的地理重点是位于伊朗东南部克尔曼省的克尔曼平原含水层,如图3所示。据说,在这片平原上不存在任何永久的河流;因此,平原周边3200平方公里范围内的农业、工业、生活和市政用水需求高度依赖地下水。近二十年来的干旱和抽水井的增加是造成地下水大量下降的主要原因,在整个地区的不同井中,地下水以每年(1-3)米的速度下降。此外,其他问题也加剧了地下水水质的恶化。11近20年(1993-2013),该地区长期年降水量从150 (mm/年)明显减少到100 (mm/年)。当地获取的数据包括在Kerman机场现场(纬度:30°,16′N,经度:56°,54′E)测量的降雨量和地下水位(时间序列/频率),该数据集由伊朗能源部收集。8
材料与方法
L-moments
(Hosking, 1990)对l矩有了新的定义。根据他的研究,l矩与传统矩类似,可以用序统计量的线性组合来表示。基本上l -矩具有线性函数作为概率加权矩(PWMs)。12与传统矩一样,pwm矩和l矩的主要目标是总结先前观察到的样本和理论分布。(Greenwood et al., 1979)对PWM的理论进行了如下总结和定义13:
βr= e {x [fx(x))r} (1)
其中βr为第n阶PWM, FX(x)为x的累积分布函数。前四个PWM的无偏样本估计量(bi)为。14
式中,x(j)表示排名的AMS,其中x(1)为最高值,x(n)为最低值。前4个l矩给出如下
前四个l矩中的无偏样本估计量是通过替换Eq.(2)和Eq.(3)中的PWM样本估计量得到的。第一个l矩λ0的平均值X是相等的。最后,l弯矩比计算为:
l -矩比的样本估计通过用样本l -矩代替式(4)中的l -矩得到。
异构性测量
非均质性度量用于基于一组考虑的站点的l矩的观测和模拟色散来识别均匀区域。这可以从15:
在哪里V=值的加权标准差,,= N的均值和标准差sim卡的值,和Nsim卡=模拟次数。
当H<1时,一个区域被声明为“可接受齐次”;如果1μ,则为“可能是异质的”v1和δv1。除此之外,还考虑了基于LCV/LCS和LCS/LCK距离的两个额外度量H1和H2。度量H1表明现场和区域估计是否彼此接近,而H2表明现场和区域估计是否一致。H1值越大,表明区域估计值与现场估计值之间的偏差越大;H2值越大,表明现场估计值与观测数据之间的偏差越大。
不整合措施
不一致测量(ZDIST)用于筛选异常站点的数据,即现场样本l-矩与其他站点显著不同的站点,定义为16:
式中Ui =站点i的LCV、LCS和LCK向量;S = V的协方差矩阵;u-=向量Ui的均值。如果Di≤3,则指定地点为不协调地点。ZDIST的临界值定义为14:
式中n为研究区域At-Sites的个数。
神经模糊结构
ANFIS,多层前馈网络,使用神经网络学习算法和模糊推理将输入映射到输出。在自适应神经网络框架下实现模糊干扰系统(FIS)是必然的。图1展示了一个典型的五层ANFIS的架构
|
为简单起见,对于一阶Sugeno模糊模型,表示了一个典型的ANFIS结构,只有两个输入导致四个规则和一个输出。17 and18还假设每个输入都有两个关联的隶属函数(mf)。很明显,这个体系结构可以很容易地推广到我们喜欢的维度。详细的算法和混合学习算法的数学背景可以在参考文献中找到。19
ANFIS-GA方法
该算法将正则实编码遗传算法、减法聚类算法和ANFIS算法相结合,设计和定型的目的是为了产生精确和简洁的近似模糊模型。建模的主要过程是一个由遗传算法执行的优化任务,其中模糊模型的精度和紧凑性是同时优化的主题。遗传算法的整个优化过程分为四个步骤:1-适应度分配2-选择3-交叉4-突变。在遗传算法的适应度分配部分,完成了基于减法聚类方法的模糊模型生成。建模过程流程图如图2所示。
|
|
减法聚类方法可以生成TSK的模糊模型,该模型通过专用于维度的半径参数来确定某些规则的个数(即聚类的个数)。这些半径主要用于集群生成。每个聚类代表一个规则,根据聚类是在多维空间中完成的事实,每个规则必须得到模糊集。通过将每个聚类的中心投影到相应的维数上,得到聚类的中心。在半径的基础上,得到了单一尺寸的MFs宽度r一个这是特别考虑的维度。因此,本研究中的每条染色体作为模糊模型所有维度输入和输出的半径值编码器。然后利用这些模糊模型的半径进行减法聚类来生成一个TSK FIS。
仿真设置
GA的种群大小(PZ)和世代数(G)分别设置为PZ = 100和G = 50。采用概率为0.7的1点交叉。采用概率为0.02的经典突变,选择方法为轮盘赌。对于ANFIS, epoch数和学习率分别设置为100和0.2。半径范围被认为在区间0内。1、2
结果与讨论
定义同质区域的第一步是选择最重要的聚类参数。选择所有重要的参数来定义一种现象的同质性聚类,会增加计算时间和误差,因此,选择最重要的参数可以使计算更简单,而不会产生任何重大差异。本文通过回归分析,从有效参数(记录的时间序列参数)中选择出更重要的参数。结果表明,所有阳离子、镁离子、钠百分比和地下水位对盐度的影响更大,如下式所示。
Ec = 154.446 + 87.852sumCation(8)
EC= 68.539 + 83.78 sumCation + 36.094 Mg (9)
EC= 143.368 + 81.572 sumCation + 43.985 Mg +4.031Na% (10)
EC = 306.097 + 81.705 sumCation + 38.178 Mg + 5.253 Na% + 1.732 L (11)
在哪里l=地下水位,最准确的是公式11,其C.C = 0.97。各参数的C.C如表1所示
表1:多个线性方程中不同参数的相关系数
方程 |
参数 |
运费到付 |
1 |
阳离子和 |
0.998 |
2 |
阳离子和 |
0.951 |
毫克 |
0.066 |
|
3. |
阳离子和 |
0.926 |
毫克 |
0.08 |
|
Na % |
0.031 |
|
4 |
阳离子和 |
0.928 |
毫克 |
0.069 |
|
Na % |
0.04 |
|
l |
0.023 |
因此,这些参数用于聚类中的电导率,也是预测的输入参数。本文采用K-Means方法和Ward分层法,将区域分别划分为2、3、4个扇区。然后,定义了区域的不相容和非同质准则。为了选择最佳聚类模式和最优区域数,对每个区域进行了At-Sites不相容求和,定义了1.5、2和3度以上的不相容At-Sites个数,并进行了非同质性准则。结果如表2所示
表2:不同情况下的非同质性标准。
方法 |
地区 |
标准H1 |
标准H2 |
标准H3. |
一个地区的井总数 |
总计 |
1.5 |
2.5 |
6.77 |
k - means 2区 |
一个 |
0.6 |
1.01 |
1.22 |
B |
-0.45 |
-0.91 |
2.5 |
|
k - means 3个地区 |
一个 |
0.4 |
0.65 |
1.3 |
B |
-0.25 |
-0.53 |
2.28 |
|
C |
-0.45 |
-0.99 |
3.29 |
|
k - means 4个地区 |
一个 |
0.1 |
0.15 |
0.88 |
B |
-0.25 |
-0.35 |
1.01 |
|
C |
-0.11 |
-0.22 |
0.9 |
|
D |
0.12 |
0.45 |
1.8 |
|
病房 2区 |
一个 |
0.6 |
1.01 |
1.22 |
B |
-0.45 |
-0.91 |
2.5 |
|
病房 3个地区 |
一个 |
0.32 |
0.59 |
1.21 |
B |
-0.31 |
-0.43 |
2.33 |
|
C |
-0.33 |
-0.71 |
1.09 |
|
病房 4个地区 |
一个 |
0.14 |
0.23 |
0.92 |
B |
-0.41 |
-0.25 |
1.17 |
|
C |
-0.14 |
-0.31 |
1.29 |
|
D |
0.45 |
0.69 |
1.96 |
考虑到表2,当所有At-Sites被视为一个区域时,只有H1准则是齐次的,H2和H3.non-homogeny。一般来说,K-mean方法包括4个区域作为优先和Ward, 4个区域在次位。考虑到研究区4个均质区,部分井分散在其他区域。为了解决这个问题,所有这些,A区域的No3, No15在B区,不27将D区域的非同质性判据组合在一起,然后计算非同质性判据。井的迁移增加了A区和B区非均质性,减少了c区非均质性的增加。为了确定非均质性的增加,研究了井的不相容性14是不相容的。将井移至B区,重新开始计算。结果表明,1号井的不相容性降低14.最后,移动到B区重新计算,得到了更好的结果。下图显示了最终的同质区域。
区域预测
首先,对于区域预测,在三个区域中每个区域计算无因次数据,包括选择输入数据和电导率。选择最佳预测情景后,将每口井的平均值乘以区域无量纲数据,得到每口井的无量纲预测数据。从2001年到2013年,按月考虑所需的周期统计。为了进行分析,使用了156个区域无量纲数据。在这项研究中,70%的数据用于教学,10%用于验证,剩下的20%用于测试。此外,对于区域预报,研究了用关系方程构建的模型。所有模型均采用动量训练和anfiss - ga方法。
表3:研究区域的最佳拓扑结构anfiss - ga模型
R2 |
不。曼氏金融的 |
不。的规则 |
不。输入变量 |
模型 |
地区 |
0.9895 |
20. |
5 |
4 |
ANFIS-GA |
一个 |
0.9936 |
28 |
7 |
4 |
ANFIS-GA |
B |
0.9929 |
16 |
4 |
4 |
ANFIS-GA |
C |
观察相关系数和非同质判据的结果,非同质性明显降低,观测数据和区域预测数据的相关系数也明显降低。究其原因,低非均质性意味着该井与同一地区的其他井不相容。这样就能减少预测误差。在每个区域实施该方法(ANFIS-GA)后,将每个At-Site期望年份的系数乘以区域预测数据,计算每个At-Site的电导率,最后计算观测数据与计算数据之间的相关系数。表4至表6显示了每口井的相关系数。
表4:A区每口井观测数据与预测数据的相关系数
好数量 |
R2 |
好数量 |
R2 |
1 |
0.8565 |
8 |
0.9701 |
2 |
0.9111 |
9 |
0.9018 |
3. |
0.7825 |
10 |
0.9205 |
4 |
0.9312 |
11 |
0.9366 |
5 |
0.9488 |
12 |
0.9912 |
6 |
0.9726 |
13 |
0.8904 |
7 |
0.8999 |
表5:B区每口井观测数据与预测数据的相关系数
好数量 |
R2 |
好数量 |
R2 |
14 |
0.9827 |
19 |
0.9024 |
15 |
0.7903 |
20. |
0.9231 |
16 |
0.9905 |
21 |
0.9125 |
17 |
0.9958 |
22 |
0.9259 |
18 |
0.8592 |
表6:C区每口井的观测数据与预测数据的相关系数
好数量 |
R2 |
好数量 |
R2 |
23 |
0.8512 |
29 |
0.9126 |
24 |
0.8637 |
30. |
0.9947 |
25 |
0.9325 |
31 |
0.9458 |
26 |
0.9238 |
32 |
0.9825 |
27 |
0.7329 |
33 |
0.8329 |
28 |
0.9028 |
34 |
0.9917 |
考虑到表4、表5、表6所示的结果3.,没有14,没有15也没有27被移动过的,相关系数最小。矿化度接近区域平均水平的井,相关系数越高。因此,在选择井和内部at - site的情况下,区域分析可以实现高精度预测。图4、5、6和7显示了预测和区域盐度。
|
|
|
|
|
图8、9、10和11显示了每个站点的盐度,这是由站点平均值乘以区域预报数据得到的。横轴表示EC浓度,如图8 - 11所示,EC浓度从2001年的8000微莫赫增加到2013年的10000微莫赫。
|
|
|
|
现场预测
为了预测34口井的矿化度,与区域方法类似,将所提出的anfiss - ga方法应用于每口井。为此,得到了观测数据与预测数据之间的相关系数。选择合适的模型后,开始预测。对研究结果的回顾表明,研究区地下水盐度在过去几年中有所增加。而且很明显,anfiss - ga能够预测可接受的地下水盐度。
现场预报与区域预报的比较
通过系数相关法得出克尔曼平原各研究井的区域或现场分析优先级,并代入表7。
表7:不同井最佳构造的相关系数
好吧 没有 |
相关 系数 |
优先级 |
|
现场 |
区域 |
||
1 |
0.9485 |
0.8565 |
现场 |
2 |
0.9787 |
0.9111 |
现场 |
3. |
0.8305 |
0.7825 |
现场 |
4 |
0.9485 |
0.9312 |
现场 |
5 |
0.9598 |
0.9488 |
现场 |
6 |
0.9093 |
0.9726 |
区域 |
7 |
0.8179 |
0.8999 |
区域 |
8 |
0.8902 |
0.9701 |
区域 |
9 |
0.9553 |
0.9018 |
现场 |
10 |
0.9134 |
0.9205 |
区域 |
11 |
0.8943 |
0.9366 |
区域 |
12 |
0.9166 |
0.9912 |
区域 |
13 |
0.8029 |
0.8904 |
区域 |
14 |
0.8245 |
0.9827 |
区域 |
15 |
0.8750 |
0.7903 |
现场 |
16 |
0.8971 |
0.9905 |
区域 |
17 |
0.9403 |
0.9958 |
区域 |
18 |
0.8530 |
0.8592 |
区域 |
19 |
0.9584 |
0.9024 |
现场 |
20. |
0.8812 |
0.8231 |
区域 |
21 |
0.9295 |
0.9125 |
区域 |
22 |
0.9292 |
0.9259 |
现场 |
23 |
0.8139 |
0.8512 |
现场 |
24 |
0.9296 |
0.8637 |
区域 |
25 |
0.9406 |
0.9325 |
区域 |
26 |
0.8911 |
0.9238 |
区域 |
27 |
0.8016 |
0.7329 |
现场 |
28 |
0.8723 |
0.9028 |
现场 |
29 |
0.9063 |
0.9126 |
区域 |
30. |
0.9551 |
0.9947 |
区域 |
31 |
0.9457 |
0.9458 |
区域 |
32 |
0.9463 |
0.9825 |
区域 |
33 |
0.9552 |
0.8329 |
现场 |
34 |
0.9665 |
0.9917 |
区域 |
结果表明,21口区域分析井和13口现场分析井均保持了较好的精度。调查表明,对于区域分析精度低于现场分析精度的井,其平均值高于区域平均水平(井号1)1,没有5,没有9,没有15,没有19也没有22)或低于区域平均水平(井号23,没有28也没有33)。这些井的不相容率高于其他区域均质井。在现场分析中,区域A的优先级最高,其次是C和d。因此,最重要的分析区域是非同质区域。因此,在同质区域内合理选择位点,且位点不相容和非同质标准较低的情况下,区域分析优于位点分析。
结论
回归分析表明,阳离子总量、镁离子、钠离子百分比和地下水位对盐度影响最大。此外,对于同质聚类数量的定义,一般采用4个区域的K-Means方法为首选,4个区域的Ward方法为第二合适的选择。随着非同质性标准的降低,观测数据与区域预报数据的相关系数也随之降低。相关系数最大的是矿化度接近区域平均水平的井。在区域内精确地选择井和at - site,可以实现区域分析预测的高精度。最重要的分析区域是非同质区域。此外,anfiss - ga模型分析表明,在测试阶段,上述模型的紧凑性和准确性有所提高。我们提出的方法旨在为我们提供在ANFIS模型中最佳和有效的结构组成,在精度和某些参数的数量之间进行权衡。维护的结果显示了一种新的混合算法,为神经模糊模型提供了精度和复杂性。
参考文献
- 舒,C,瓦达,T.B.M.J.(2008)。基于自适应神经模糊推理系统的干涉区洪水频率分析。水文杂志。349节,31-43页。
CrossRef - first, j., Bichler, A.和Konecny, F.(2014)。区域极端地下水位频率分析。地下水杂志,Jonwielly。
- Jalalkamali,阿米尔。、Sedghi侯赛因。Mohammad Manshouri .(2011)。,基于神经模糊模型和人工神经网络的地下水位预测研究:以新疆克尔曼平原为例,水文信息学报,13(4):867-876。
- adadamowski, Jan, Fung Chan, Hiu。(2011)。,一种基于小波神经网络的地下水位预报方法,水文学报(7):28-40。
CrossRef - •正义与发展党。(2015)人工神经网络在印度旁遮普邦阿姆利则和古尔达斯普尔地区地下水位模拟中的应用。地球科学与气候变化学报6:274。
- 参孙,M。, Swaminathan, G., Venkat Kumar, N.(2010)。《基于模糊逻辑和地理信息系统的地下水可携性评价——以印度蒂鲁奇拉帕利市为例》,计算机建模和新技术。, Vol.14, No.2, 58-68。
- Jalalkamali,阿米尔。(2015)。,基于混合模糊模型的地下水质量时空预测,地球科学信息,DOI: 10.1007/s12145-015-0222-6。
CrossRef - Jalalkamali,阿米尔。Moradi,迈赫迪。莫拉迪,纳斯林。(2015)。,基于标准化降水指数的人工智能模型和ARIMAX模型在干旱预测中的应用,国际环境科学技术学报,第12卷,第4期,pp 1201-1210。
CrossRef - •正义与发展党。(2015)。,基于人工神经网络的地下水位模拟,中国地质大学学报(自然科学版),第4卷第1期。
- Seyam,穆罕默德。、Mogheir尼斯。(2011)。地下水质量管理的新方法,伊斯兰大学学报(自然研究与工程系列),Vol.19, No.1, pp 157-177。
- Nowjavan, M.R.(2015)。干旱半干旱区水资源及其与地质构造的关系分析(以克尔曼省平原为例),第6卷第7期,第720-727页。
- 霍斯金,J.R.M.(1990)。l矩:用序统计量的线性组合分析和估计分布。,爵士。B, 52, 105-124。
- Greenwood, j.a., Landwehr, j.m., Matalas, n.c.和Wallis, J.R.(1979)。概率加权矩:若干可逆表示的分布的定义及其与参数的关系。水资源研究,15(5),1049-1054。
CrossRef - 霍斯金,j.r.m.,和沃利斯,j.r.(1997)。区域频率分析:一种基于l矩的方法。剑桥大学出版社,纽约。
CrossRef - Kjeldsen, t.r., Jones, d.a.(2006)。基于L矩的中值指数洪水法的预测不确定性。水资源研究,vol . 42。
CrossRef - Rostami, R., & Rahnama, m.b.(2007)。基于l矩法的哈利尔河流域区域洪水频率分析。国际农业研究杂志,美国,纽约。
- Sugeno,(1985)模糊控制的工业应用。爱思唯尔科学出版社
- 王,Elhag, T.(2008)桥梁风险评估的自适应神经模糊推理系统。专家系统与应用34(4):3099-3106。
CrossRef - 张成泽JSR。(1993) ANFIS:基于自适应网络的模糊推理系统,IEEE系统人与控制论学报,23 (3),pp 665-685。
CrossRef