摘要:近年来,深度学习成为机器学习研究中的一个新的发展热点,通过建立与人脑相似的神经网络对数据序列进行学习,在数据的低层特征基础上抽象出高层属性类别或特征,可以很好解释和模拟复杂数据,在大数据时代尽显其优势。基于水文数据的大量性和水文原理的复杂性,掌握深度学习技术可对水文数据进行有效模拟,对水文工作起到指导作用。
加入收藏
1、深度学习简介
深度学习的计算模型由多个处理层组成,通过训练可学习多个抽象层次上的数据特征,它代表了当前人工智能研究的主流趋势,在计算机视觉和机器学习等领域带来技术层面上的革新。
与传统的机器学习相比,深度学习具有以下优势:模型结构立体纵深,多层的隐层节点使模型内部的训练过程更加复杂精密;数据特征抽象提取,经过多层神经网络的特征变换,将数据的特征表示逐渐抽象到另一个新的特征空间,通过此方法模拟人脑的学习过程。在深度学习的实现过程中,建立多层神经网络结构,确定合适的计算节点,通过逐层迭代训练,即可建立输入层到输出层的函数关系。在调整好模型结构及相关参数后,可实现模型对现实数据的有效模拟,从而大大减小工作量与时间成本,对复杂事务实现自动化管理。
基于此,文章综合国内外相关研究,介绍了深度学习的基本概念与原理,从水文预报、水库调度以及遥感图像分类三个方面阐述深度学习在水文中的应用现状。最后,指出深度学习在水文中的应用中存在数据稀缺性、原理可解释性以及参数选择等方面的不足之处,对未来研究趋势进行分析,以指导深度学习在水文应用中的进一步发展。
2、深度学习在水文中的应用
2.1水文预报
水文预报中采用的模型方法主要有三类:物理模型、概念模型以及黑箱模型,前两者的建立要求掌握水文过程的原理,但由于水文现象的规律十分复杂,且许多参数难以获取,所以很难有较好的模拟效果。此时,基于数据驱动的黑箱模型便显露其优势,只要建立合适的模型,输入足够多的数据,即可得出准确度很高的模拟结果。
作为黑箱模型的一种,深度学习方法近年来才开始运用到水文预报中。目前相关研究不多,主要可总结为降水预测、水库来水预测以及降雨径流模拟三个方面。前两者是对一个水文因素的数据序列进行分析,而后者需要学习两个水文因素之间的相关关系,输入长序列的数据后,通过模型内部逐层学习,即可较好地延展水文序列,以实现水文工作的需要。研究表明,多种基于深度学习方法的计算模型均可适用于水文预报领域,如:长短期记忆神经网络(LSTM)以及深层回声状态网络(DeepESN)、卷积长短期记忆神经网络(ConvLSTM)等。同时,也有研究将深度学习方法进行改进,创造出更适合水文预报的独特方法。2016年YunBai等提出了一种基于混合模型的多尺度深层特征学习(MDFL)方法来处理水库日入库量预测问题。首先提取数据的多尺度(趋势、周期和随机)特征,然后分别用三个深信度网络(DBNs)表示每个DBN的权值,将其应用于初始化神经网络(D-NN)。最后,对三个尺度的D-NNs的输出进行重构,采用混合模型对三峡水库2000—2012年的历史日入库序列进行了研究,证明该模型的效优于传统模型。该方法将深度学习的框架与多尺度、混合观测相结合,有利于探索水库入库预报的复杂性质,为水库调度提供数据支持。但深度学习方法对水文预报的数据量及连续性有一定的要求,数据量不足或水文条件改变都会影响水文预报的效果。
2.2水库调度
水库调度是受到多个变量、多重约束所影响的复杂问题,涉及时间尺度、降雨、农业灌溉等自然条件以及洪水调峰等人类需求等多个具有不确定性的因素。因此,基于运行规则的物理模型难以准确模拟水库运行过程以及预测水库出流。随着大数据挖掘技术的发展,数据驱动的人工智能模型已成功推广到水库调度领域。人工智能模型能够从大量的水文数据和实时的水库运行数据中自动学习水库运行规律,但传统模型仍存在着特征提取能力弱、耗时较长等缺点。
近年来,深度学习作为计算机科技前沿,在解决调度问题方面积累了一些成功的经验。目前,深度学习方法在水库调度中的应用研究较少,主要有贝叶斯深度学习模型、LSTM模型、卷积LSTM模型等。关于水库调度的研究主要集中于深度学习方法与传统人工智能模型的对比,深入分析深度学习方法的优势所在。例如:ZhangD等将3个人工智能模型进行对比,即反向传播(BP)神经网络,支持向量回归(SVR)技术,长短期记忆(LSTM)模型,基于约30a的历史水库运行记录模拟水库操作,以探讨LSTM模型在水库运行模拟中的适用性。结果表明,LSTM模型能够有效地降低其他人工智能模型所需的时间消耗和内存存储量,并具有良好的模拟低流量工况和高峰运行期流量曲线的能力。深度学习方法在水库调度方面的优势已经显现,但入库水量的不确定性对模型精度的影响亟待验证。对此,LiuYQ等提出了一种同时考虑模型参数不确定性和来水不确定性的贝叶斯深度学习方法。在该模型中,采用蒙特卡罗积分将入流概率的复积分转化为求和形式,利用变分推理得到模型参数的后验分布。该方法在长江三峡工程中得到了实际应用,结果表明,此种贝叶斯深度学习方法在水电发电量和均方根误差方面均优于其他比较方法,在考虑入流不确定性时,该方法具有更强的优势。与传统方法相比,深度学习方法在水库调度应用中可以很好地解决不确定性以及条件多变等问题,优势显著。但目前在水库调度中的应用并不广泛,仍需进行更多相关研究,将深度学习方法与水库调度特点更好地融合。
2.3遥感图像分类
提取水体信息以及流域下垫面信息是水文流域调查必不可少的一个环节,可为流域水文模拟、生态环境评估等提供基础资料。为了保证效果最优,遥感影像的分类需要尽量精确。传统的遥感影像分类方法有基于贝叶斯的最大似然法、最小距离法等,但这些传统方法分类精度不高,可能会出现错分、漏分的现象。随着技术的发展,人工智能方法开始得到广泛应用,如:人工神经网络分类方法,此类方法的效果虽然较传统方法有所提升,但仍有较大的改进空间。
近年来,随着深度学习方法的普及,其在遥感影像分类方法的应用研究也逐渐增多。在水体识别提取方面,深度学习以其在特征提取方面的优势开辟了新的思路,不再受到传统方法如单波段阈值法及水体指数法等需要通过多次实验确定阈值的局限。杜敬将深度卷积神经网络模型运用到无人机遥感影像水体识别中,得到的结果表明识别准确度高达95.36%,优于传统的向量机法、面向对象法。许多基于深度学习的新方法被提出,如:基于堆叠自动编码器的水体提取模型,基于卷积神经网络和logistic回归分类器的多光谱数据水体提取方法,这些新方法准确性的优势均得到了验证。在长序列土地利用分类方面,深度学习方法的应用也带来了突破。WangHY等将双向长短期记忆网络(BiLSTM)模型与长时间序列的土地利用分类数据相结合,得到了总体精度为84.20%的分类结果,为建立高分辨率长时间序列土地覆盖分类产品提供了新思路。但基于遥感图像制作标签数据的过程较为复杂,而目前的监督训练方法有需要大量的标签数据,导致工作量较大。此外,影像分类的结果也会受到遥感数据的预处理和标准化处理的方式的影响,更稳定高效的分类方法有待研究。
3、未来展望
3.1不足之处
3.1.1数据稀缺性问题
深度学习属于数据驱动技术,需要大量数据进行训练,且足够的数据量才能保证模型的精度。但基础的水文资料在很多地区难以获得,传统的人工搜集标签数据的方法产生较高的人力物力成本。因此,数据的自动采集传输是亟待突破的难关,基于部分标签的无监督的深度学习方法有待进一步研究。
3.1.2原理可解释性问题
深度学习方法建立基于数据的黑箱模型,缺乏具体的物理原理及过程机理作为支撑。而自然界中的水文过程十分复杂,使用黑箱模型可能会导致模拟精度不够以及难以使人信服等问题。因此,深度学习方法需要与水文原理进行有机结合,创造出更具有水文色彩的更有效的模型。
3.1.3参数选择问题
选择模型训练参数也是深度学习方法面临的一个关键问题,比如:隐层层数、卷积核大小、优化函数的设定等。由于现阶段对于深度学习方法的工作原理认识不够,只能依靠研究人员的经验与反复试验确定训练参数。因此,探究训练参数与训练结果之间的规律是十分必要的,由此可以针对具体的水文情景创建专属的参数设置体系。
3.2结论与展望
近年来,深度学习在水文中的应用广泛,给水文预报、水库调度以及遥感图像分类等诸多领域带来了深刻变革。多年研究逐渐发展出将LSTM模型、卷积LSTM模型、深度卷积神经网络模型等深度学习方法运用到水文领域的成功经验。实践证明深度学习方法在特征提取和模拟优化方面的优势是物理方法及传统机器学习方法无可比拟的,值得进一步研究与发展。
基于目前深度学习技术存在的数据稀缺、原理难以解释以及参数选择困难等问题,已经逐渐发展出元学习、小样本深度学习、神经网络构架搜索、深度迁移学习等深度学习技术的分支。有理由相信,越来越多的研究将会带领深度学习方法与水文领域更好的融合互通,创造出更有效的数据分析以及模型建立技术,为水文领域注入新的发展活力。
参考文献:
[1]杜敬.基于深度学习的无人机遥感影像水体识别[J].江西科学,2017,35(1):158-161.
[2]田启川,王满丽.深度学习算法研究进展[J/OL].计算机工程与应用:1-11[2019-11-07].[3]罗荣,王亮,肖玉杰.深度学习技术应用现状分析与发展趋势研究[J].计算机教育,2019(10):19-22.
龚亮.深度学习法在水文中应用的现状[J].河南水利与南水北调,2020,49(04):33-34.
分享:
鲁北地区地处黄河下游冲积平原地带,饮用水源为深层地下水及黄河水,深层地下水中氟含量普遍偏高,造成氟中毒,属于深层地下高氟水型地氟病病区,是全省受地氟病危害比较严重的地区。其中济阳、博兴、高青、广饶、夏津、宁津等16县777个村受危害人口65万余人[1,2,3,4],出现氟骨症、氟斑、尿氟等症状,严重危害当地群众的生命和健康[5,6]。
2023-11-08渗透系数(K)和影响半径(R)在探讨地下水动力学问题与计算地下含水层允许开采量中是非常重要的水文地质参数[1,2],因此求取可靠的水文地质参数是正确评价地下水资源及其合理可持续开发利用,以及兴利除害的重要前期基础工作[3]。
2023-11-08随着我国经济发展的有效提升,改善水环境污染、实现水资源配制优化、促进经济和环境协调发展是亟待解决的问题。污水处理站的建设有效解决了这一问题,但在水文站上下游修建污水处理站对水文监测具有重要的影响,因此如何降低污水处理站对水文监测的影响是我们值得思考的问题。
2021-08-09基于服务器集群、集成语言查询、实体数据库、动态链接库等技术,采用后台监听技术实现了水文信息收集、检查、分析、计算、信息报送、成果归档全自动一体化处理及水文监测数据在线审查,并与全国水文资料整编系统无缝对接,构建了辽宁省水文站网综合管理系统。研究成果对于提升水文监测数据处理能力、水文资料成果审查效率及水文站网管理水平具有重要的研究和推广价值。
2021-06-16森林生态系统垂直结构涵盖林冠层、枯落物层和土壤层[1,2]。枯落物作为植物群落水文效应的第二活动层,凋落过程是生态系统中物质循环和能量流动的重要环节[3],在保持水土和涵养水源方面具有非常重要的意义[2]。枯落物层具有较好的持水能力及透水性,枯落物的分解也能为林木提供养分[4]。
2020-11-25土地利用作为人类对自然利用的一种途径[1],随着社会的发展,土地经营与改造方式不断变化,下垫面粗糙程度及入渗特性也随之改变,对植被截留、地面下渗及地表蒸散等水文过程造成深刻影响,从而导致径流发生变化,流域内水量平衡遭到破坏[2,3],引发水土流失等一系列生态环境问题[4]。
2020-11-25汉江是长江中游重要的一级支流,干流全长1577km,流域面积约为15.9×104km2。汉江发源于秦岭南麓,于武汉市汇入长江干流,丹江口水库和钟祥水文站将汉江流域划分为上游、中游和下游3部分。汉江流域属于我国典型的湿润区,全年降水量介于800~1200mm之间,降水量在时程上分配不均,4~9月降水量占全年降水量的75%左右,降水量约为600~1000mm。
2020-11-13刚体极限平衡法是现行的各行业规范规定的边坡稳定性分析方法,同时一些规范也推荐使用数值分析方法进行复杂的边坡稳定性分析。目前工程上常用极限平衡法分析边坡稳定性,方法包括:瑞典圆弧法、毕肖普法、简布法和传递系数法等,但这些方法不能很好的反应真实破坏机制,具有一定的局限性。基于有限差分法的数值分析方法可以解决这方面问题。
2020-09-05地下水的化学成分是地下水与外界环境长期相互作用的产物[1],开展地下水化学特征及主要成分来源的研究有助于阐明地下水的来源与形成过程,揭示地下水环境状况,同时也为地下水开发与保护提供科学合理的依据。岩溶地下水是淄博市博山区石马镇主要供水水源,在保障供水、支持社会经济发展及维持生态平衡等方面具有重要地位。
2020-07-16三峡工程运用以来,荆江三口汛期分流量总体变化不大,分沙量急剧减少,松滋口分流、分沙量最多,藕池口次之,太平口最少。分流比变化不大,年均分流比为15.0%,由于三口口门段沿程冲刷,三口分沙比总体呈递增趋势,年平均分沙比为23.4%,最大分沙比达40.0%(2016年),其中松滋口、藕池口增加趋势较明显,占比分别为13.1%、7.3%,太平口变化不大,占3.0%。
2020-06-19人气:3267
人气:3022
人气:2304
人气:2026
人气:1883
我要评论
期刊名称:大学物理
期刊人气:2174
主管单位:中国科学技术协会
主办单位:中国物理学会
出版地方:北京
专业分类:科学
国际刊号: 1000-0712
国内刊号:11-1910/O4
邮发代号:82-320
创刊时间:1982年
发行周期:月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.735
影响因子:0.645
影响因子:1.369
影响因子:0.874
影响因子:0.385
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!