您现在的位置:主页 > 香港六合奖开奖结果 >
基于机器学习的综合干旱监测建模及在西南地区应用

发布日期:2022-05-08 22:42   来源:未知   阅读:

  干旱是由降水不足引起的,受温度、蒸散发等各种环境因素的影响,导致缺水和作物歉收。传统的干旱监测方法主要侧重于气象、水文等单一因子,而对多因子综合干旱监测的研究相对有限。本文利用2001—2015年的温度状态指数(TCI)、植被状态指数(VCI)、植被供水状况指数(VSWI)、降水状态指数(PCI)、土壤湿度状态指数(SMCI)、高程(DEM)及田间持水量(AWC)等7个干旱因子为自变量,以综合气象干旱指数(CI)为因变量,利用随机森林(RF)、增强回归树(BRT)和人工神经网络(ANN)构建干旱监测模型,并以西南五省为研究区进行了评价和分析。结果表明,基于人工神经网络的干旱监测指标(ANN-CI)预测效果最好,在测试集中预测值和观测值间的可决系数(R2)为0.94,均方根误差(RMSE)为0.23。三种基于机器学习的综合干旱指标均在草地区表现最好,林区精度最差。在2001—2015年间,ANN-CI和植被生长状况具有显著的时空相关性(R2=0.70,p0.01)。最后选用ANN-CI对西南地区2009/2010年干旱事件的发展过程进行监测,并且与帕默尔干旱指数(PDSI)的监测结果进行对比,结果表明ANN-CI能够较好地应用于区域的旱情监测。

  *钟九生(1984—),男,副教授,博士,主要从事地理信息系统开发与应用、资源环境遥感、遥感图像处理研究。

  何志远, 钟九生, 代仁丽. 基于机器学习的综合干旱监测建模及在西南地区应用[ J] . 水利水电技术(中英文), 2022, 53(2): 43- 51.

  干旱是全球主要自然灾害之一,干旱导致的水资源短缺,不仅增加了农业部门的脆弱性和经济损失,而且还极大地威胁着人类的生命。许多国家都存在因干旱而导致的农作物减产和水资源匮乏等问题。

  干旱研究中使用了许多干旱指数,这些指数提供诸如水分供应状况和干旱的定量严重程度等信息。其中标准化降水指数(SPI),标准化降水蒸散指数(SPEI),帕默尔干旱指数(PDSI)和湿度异常指数(Z-index)被广泛使用。但这些指数通常只针对单个干旱类型或有限数量的数据源。遥感数据由于其具有宏观、快速和时空上数据连续的优点使得大面积高时间分辨率的干旱评估和监测成为可能。

  由于干旱是由多种因素引起的,所以没有单一的指标可以完全解释干旱的复杂性和多样性。因此,将各种指标结合成为监测干旱的趋势。近年来很多学者尝试考虑将多种致旱因子结合来构建干旱模型并且已经开发了多种综合干旱指数。例如,植被健康指数VH通过加权组合地表温度(LST)和归一化植被指数(NDVI)计算得出,该指数由于其提供了与给定时期内输入数据的历史范围(最小值和最大值)相对应的干旱条件信息从而被广泛应用。RHEE等开发了归一化旱情状态指数SDCI(Scaled Drought Condition Index),综合了降水状态指数(Precipitation Condition Index, PCI)、温度状态指数(Temperature Condition Index, TCI)以及植被状态指数(Vegetation Condition Index, VCI),主要用于监测农业干旱。植被供水指数(VSWI)能够综合反映作物冠层表面温度和植被指数信息,用于检测植被胁迫、水分和干旱影响地区。当组合多个变量时,决定使用哪种加权方案至关重要。平等加权和线性组合方法由于其简单性而被普遍使用,但是各因素对干旱的影响在不同的地区、时间和干旱类型表现不同,因此应研究更先进和自适应的加权方法,以融合多种因素以更好地监测干旱。

  本研究综合考虑了干旱形成过程中的多种因素,以确定它们如何有效地用于监测气象和农业干旱。研究目标为:(1)利用光学遥感数据、微波遥感数据计算出5种干旱相关指标,如TCI、PCI、SMCI、VCI和VSWI,并结合DEM、AWC为自变量,以综合气象干旱指数CI为因变量,训练三种机器学习模型——随机森林、增强回归树模型和人工神经网络,对比三种模型的结果,从中选取效果最优的模型;(2)评价最优干旱指标对于植被干旱的监测效果;(3)通过最优干旱指数对2009/2010干旱事件进行监测并与PDSI做对比。

  中国西南地区范围为20°N—35°N,96°E—113°E,由四川、重庆、贵州、云南、广西五省组成(见

  )。区域总面积约为1.37×106 km2,占国土面积的14.3%。该地区位于青藏高原与中国东部和南部平原的过渡地带。云南南部属热带季风气候,四川西部属高原气候和高山气候,其余地区均属亚热带季风气候。光热条件较好,但受季风气候和山地地形的明显影响,降水时空分布不均匀。喀斯特地貌普遍存在,水土流失严重,易受人类干扰和气候变化,尤其是干旱的影响。

  本文采用西南五省478个主要气象站点(见图1)2001—2015年月平均温度和降水数据,数据已经过质量控制,剔除各站点的缺失及无效数据。

  干旱是由多种致旱因素造成的,不仅与降水、土壤水分胁迫和植被生长状态有关,还涉及到土壤有效持水量、土地覆盖类型等因子。因此,结合多种干旱指数构建综合干旱监测模型有助于干旱监测。本文以7个变量作为模型输入变量,包括TCI,PCI,SMCI,VCI,VSWI,AWC以及DEM;以综合气象干旱指数CI为因变量构建基于遥感数据的干旱监测模型,并且分别对森林、灌木、草地三种植被类型建立模型,以获得更好的干旱监测效果。各变量具体计算公式如

  所列。在模型训练前,抽取气象站点周围10 km栅格点的平均值并计算自变量。使用R2和RMSE来评估机器学习模型的性能,通过测量实际值和预测值之间的差来计算样本标准差。技术路线

  干旱的形成通常与气象条件、土壤水含量、植被绿度关系密切,同时土壤成分和海拔高度也有可能是干旱发生的原因之一,因此本文基于导致干旱发生的要素选取了TCI、PCI、SMCI、VCI、DEM和AWC作为模型的输入变量。TCI,PCI与气象干旱关系密切,TCI由MODIS数据计算,它关注了高温对植被生长的胁迫,TCI越大表示干旱越严重。PCI由TRMM数据计算,该数据提供了月降水量的估计数,PCI能够直接反应降水的异常。SMCI基于长时间序列的ESA CCI土壤湿度产品构建,能够定量刻画土壤的干湿异常程度。VCI和VSWI通过监测植被长势间接反映干旱的严重程度,相比于NDVI,VCI通过比值的方法降低了季节变化带来的噪音影响。VSWI综合了植被和温度信息,当植被受到干旱胁迫时,会关闭部分气孔以保持叶片含水量,香港六合现场直播,从而导致了叶片水汽蒸发量降低,同时也会阻止叶片热量的散发,因此在干旱发生时植被冠层温度会升高,此时植被指数与叶片温度的比值会表现异常。VSWI能够有效地反映出土壤水分对作物长势状况的影响,从而间接反映干旱情况,VSWI越小植被受旱程度越严重。根据VSWI计算原理,该指数的获取是通过同时期的LST和NDVI,与历史数据无关。而TCI和VCI的计算需要以一段时间内的温度或植被绿度作为基线,通过比值来确定干旱程度。但是在气候变化背景下,不同的时间段会产生不同的基线,而VSWI的计算只需要瞬时的温度和绿度,并有明确的物理意义,因此在模型中可以弥补由气候变化导致的干旱评估误差。AWC代表土壤保持水分以及可供植被所用水分的潜力,能反映不同土壤对于干旱的影响。AWC通常是一个常数,一般不同土壤类型的田间持水量不同,其与土壤的粒径有关,黏土最大沙土最小。DEM解释了基本气候条件和太阳能收支差异,对准确监测区域干旱有着重要作用。

  综合气象干旱指数(CI)不仅考虑了降水,还考虑了蒸散发等因素,与只考虑降水的干旱指标相比有较好的表现。综合气象干旱指数能够反映多种时间尺度的降水异常情况,对干旱发展的机制有较强的刻画能力。帕默尔干旱指数(PDSI)通过考虑降水、温度和蒸发等来量化特定时间内的干旱特征,在气象、农业等领域应用较为广泛,具体计算方法详见

  在本文中,选择三个基于规则的机器学习方法-随机森林(RF),增强回归树模型(BRT)和人工神经网络(ANN)模型来建立综合干旱指数。

  RF基于分类和回归树(CART),通过选择训练样本和在树的每个节点上选择变量的两种随机方法生成了许多独立的树,以达到最终决策。这种随机性减轻了CART的典型弊端,例如过拟合问题和对训练样本配置的敏感性。RF由R统计软件(http: //的随机森林包实现,除树木数为1 000外,其余均为默认设置。

  与RF相似,BRT是基于CART的集成方法,BRT通过拟合和组合许多模型来提高单个CART模型的性能。它通过将随机性引入模型来提高预测性能,并通过控制学习率和树复杂度的参数来实现最佳预测。这种方法的优点是它可以处理不同类型的预测变量,容纳丢失的数据并处理预测变量之间的交互作用。在构建BRT模型时,定义树复杂度为5,学习率为0.01,包分数为0.5。

  人工神经网络具有良好的自学习能力和逼近复杂非线性关系的能力,利用梯度下降法来求最优解,其泛化能力较强。本文采用了目前流行的具有反向传播学习算法的前馈网络结构。在基于进化的优化过程中,前馈网络结构可根据权重和偏差在每层隐藏层和神经元的数量进行自适应更改,以满足所需的置信水平。本文使用Python Sklearn库的人工神经网络算法,经过试错法来确定人工神经网络参数,并选取表现最优的参数组合。具体参数为:隐藏层数为8,神经元数量为100;权重优化器使用随机梯度下降法(SGD);用于隐藏层和输出层的激活函数为ReLU;学习率为0.01,其余参数均为默认。

  本文使用交叉验证的方法来评价模型的精度,即将所有样本随机分为训练集和测试集,样本量总数为86 040条,其中训练集占80%,测试集占20%。分别计算两组数据集的预测值与CI的R2和RMSE,由

  )。三种干旱监测模型在评估草地地区的CI上表现最为出色,优于灌木,在森林地区的表现最差,这可能是因为NDVI在植被茂密地区容易出现饱和现象,敏感性下降,无法表现植被真实生长状态,因此导致模型精度下降。同时基于ANN的干旱指数在三个植被类型中均表现出色,RF模型次之,BRT模型表现最差。其中ANN对于草地的预测精度最高,预测值与观测值基本在1∶1线周围分布且较为集中,但对于森林区域,虽然散点也较为集中,但是整体略微偏离了1∶1线,出现了低估现象;随机森林散点图在草地区域表现较为集中,灌木和林区略微散乱,在林区偏离1∶1线较为严重,低估了CI值,对于CI值大于1或者小于-1时点的散乱程度增大,说明随机森林对于极端湿润或干旱事件的模拟性能较差,而对接近0的值预测能力较高;增强回归树模型整体效果欠佳,草地和灌木虽然散点较为集中,但是偏离1∶1线幅度较大,且林区散点更为散乱,均出现了低估现象。综上所述,基于ANN的干旱监测模型(ANN-CI)效果最好,被选为后续分析指标。

  图3 RF,BRT,ANN在森林,灌木,草地区域的模型预测值与观测值散点图

  为了验证ANN-CI对于植被受到干旱时的监测能力,本文选择基于ANN的干旱监测模型(ANN-CI)计算了2001—2015年全区平均值的时间序列,并与基于NDVI的距平指数(NDVIanomaly)的时间序列进行相关性分析。选取生长季的植被距平指数与ANN-CI并计算每年平均值。如

  所示,在空间上ANN-CI与NDVIanomaly指数的关系在65%的区域呈现正相关,48%面积上呈现显著正相关(通过了p0.01的显著性测试)。全区西部呈现负相关,东南部大部分显示为强烈正相关。时间序列上,在水分正常年份NDVI距平指数存在正常的随机波动现象,整体时间序列上植被距平指数与ANN-CI的皮尔逊相关系数为R=0.70,p0.01。结果表明ANN-CI能够很好地捕捉到2009/2010年植被受到干旱胁迫时的响应。在2009年西南地区遭受极端干旱后,植被距平指数急剧下降,较大地偏离了正常值,说明植被在受到极端干旱的情况下生长受到了强烈的抑制。虽然2011年后干旱状况有所好转,但是植被生长状态较2010年表现更差,说明极端干旱事件对植被存在一定的遗留效应,有研究表明草地的遗留效应一般在1 a左右,而森林最多可长达4 a之久。自2011年起植被距平指数走势随ANN-CI的上升而逐渐恢复到正常水平。然而在非极端干旱年份,植被距平指数对于ANN-CI会出现滞后响应甚至是无响应,这可能是由于NDVI只是绿度指数,当植被受到轻微干旱胁迫时,虽然光合作用效率已经开始下降,一字拆一肖正版无错版!但是植被冠层绿度并没有太大的改变。降水与植被响应模式,气象干旱与植被活动之间一般存在时间滞后效应,时间为1~3个月。

  进一步分析基于ANN的干旱监测模型对西南地区2009/2010年极端干旱事件的监测,从空间范围、持续时间、严重程度、发生和结束时间与PDSI的监测结果进行对比。如

  所示,自2009年5月,我国西南地区内大部分区域都出现了一定程度的旱情。该地区72%的区域受到中旱、重旱影响,主要集中在云南省、四川省南部以及贵州省。2009年9月份西南5省43%的区域出现重旱,云南省南部、贵州省和广西省西北部最为严重。干旱在2010年1月份已经出现缓解趋势,但是云南省南部和与贵州省,广西壮族自治区接壤的地方为重旱。2010年5月大部分区域已经缓解到轻旱。然而2010年9月贵州、重庆、广西再度出现中旱。此外,干旱持续时间和严重程度在空间上也不同。贵州与广西北部则经历了较长时间(超过8个月)的重旱和极旱(PDSI-4)。相比之下,四川、广西西南部和东北部以及云南西部的干旱要轻,持续时间更短,严重程度更低。基于ANN模型检测到干旱事件的开始、结束、持续时间和严重程度和PDSI检测到的干旱过程在时空上有着高度的一致性。

  本文以MODIS数据计算的VCI、VSWI、TCI、PCI,SMCI、DEM和AWC为自变量,以气象站点的CI为因变量,采用3种机器学习方法,构建了干旱监测模型。基于ANN-CI对2001—2015年西南五省的植被状态进行了评价和分析。同时对2009/2010西南五省干旱事件进行监测,结论如下。

  (1)本文使用交叉验证的方法,以数据集的80%作为训练集,20%为测试集对模型的精度进行评价,结果表明:三种机器学习方法在干旱监测方面均有不错的表现,其中基于人工神经网络构建的干旱模型具有较高的泛化能力。同时,三种模型在草地预测结果最好,森林最差。

  (2)对2001—2015年的ANN-CI和NDVI时间序列进行相关性分析,结果表明:ANN-CI与植被绿度在时间序列上的波动大体一致,其相关系数为0.70,且通过显著性检验。相关系数在空间上表现为65%的面积呈正相关,48%呈显著正相关。从2009/2010年植被对干旱事件的反应来看,ANN-CI对植被干旱的监测能力较强。

  (3)基于ANN-CI对2009/2010年西南五省干旱事件进行监测,从空间范围、持续时间、严重程度、发生和结束时间上分析干旱时空变化特征。监测结果与PDSI监测结果相符,并能够反映其发展及空间演变情况。ANN-CI有效地结合了来自不同干旱指数的干旱信息,克服了单一干旱指数的一些缺点,因此具有农业和气象干旱监测的潜力。

  水利部《水利水电技术(中英文)》杂志是中国水利水电行业的综合性技术期刊(月刊),为全国中文核心期刊,面向国内外公开发行。本刊以介绍我国水资源的开发、利用、治理、配置、节约和保护,以及水利水电工程的勘测、设计、施工、运行管理和科学研究等方面的技术经验为主,同时也报道国外的先进技术。期刊主要栏目有:水文水资源、水工建筑、工程施工、工程基础、水力学、机电技术、泥沙研究、水环境与水生态、运行管理、试验研究、工程地质、金属结构、水利经济、水利规划、防汛抗旱、建设管理、新能源、城市水利、农村水利、水土保持、水库移民、水利现代化、国际水利等。

最新文章
阅读排行