基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系《水利水电技术(中英文)》官网网址https://sjwj.cbpt.cnki.

大家好,欢迎来到IT知识分享网。

《水利水电技术(中英文)》官网网址https://sjwj.cbpt.cnki.net

摘 要:

【目的】梯级水电站间存在的水力联系导致下游电站的运营模式往往受制于上游电站,以往的梯级水电站优化调度中通常选择忽略流量滞时或认为其是常数,少有考虑流量滞时与上游水电站出库流量及区间降雨等因素的动态关系。为提高下游电站预判流量精确度,将神经网络应用到梯级电站间流量动态滞时研究中。【方法】首先采用联合互信息理论选取下游电站入库流量的主要影响因素作为模型输入因子,其次根据卷积神经网络和长短时记忆神经网络的互补特性,建立上游出库流量与下游入库流量的JMI-CNN-LSTM深度学习网络模型,最后结合实际算例,将所建立模型的拟合结果与随机森林回归模型、固定滞时模型进行对比。【结果】结果显示:本文所建立的模型较相同条件下其他方法各类误差均存在不同程度的减少,其中MAE至少减少了14.6%。【结论】结果表明:相较其他方法,JMI-CNN-LSTM耦合模型预测精度更佳,能够更准确的体现梯级电站间流量滞时的动态关系。

关键词:

梯级水电站;动态滞时;联合互信息;卷积神经网络;长短期记忆网络;

作者简介:

闫孟婷(1999—),女,硕士研究生,主要从事水电运行管理及电力市场研究。

*黄炜斌(1987—),男,副教授,博士,主要从事水电运行管理及电力市场研究。

基金:

国家重点研发计划(2016YFC0402208);

国家重点研发计划(2018YFB0905204);

引用:

闫孟婷, 黄炜斌, 张天遥, 等. 基于 JMI-CNN-LSTM 耦合模型的梯级水电站间流量动态滞时关系[ J]. 水利水电技术(中英文), 2023, 54(3): 154- 164.

YAN Mengting, HUANG Weibin, ZHANG Tianyao, et al. Study on dynamic flow lag time between cascade hydropower stations based on CNN-LSTM coupling model[J]. Water Resources and Hydropower Engineering, 2023, 54(3): 154- 164.


0 引 言

随着碳中和、碳达峰战略目标的提出,构建以清洁能源为主的新型电力系统迫在眉睫。截至2021年底,我国水电装机容量3.91亿千瓦,全国水电发电量1.34亿千瓦时。水电作为我国当前占比最大的清洁能源,开发水力资源无疑是我国能源结构改革的有效途径。为了最大限度地利用流域梯级水资源,我国西南地区各大流域已经逐渐形成了为数众多的梯级水电站群。然而,在实际调度运行中,由于梯级电站上下游之间存在的电力、水力多维联系,使得梯级电站在参与市场、优化调度等方面相较于单站更加复杂。此外,随着我国电力现货交易进一步开展,研究上下游电站间流量滞时关系具有很大现实意义。

为揭示梯级电站上下游之间的复杂联系,已有文献把关注点放在水流滞时对上下游水力联系的影响上。肖贵友等将水流滞时设置为一个常数,更进一步,有学者对滞时的变化特征进行研究,张培等通过设置水流滞时的区间对应一组预报入流值,遍历所有组合求解;李景刚等运用平移搜索最大相关系数法进行滞时研究;刘欢等基于梯级电站间水量平衡提出中期分段水流滞时描述方法。但由于水流滞时的影响因素较多,其动态变化规律呈现明显的非线性,根据固定滞时或简单的函数关系预判下游水电站的入库情况存在较大的误差,容易导致下游电站出现弃水或无水可发电的情况,无法满足电站精细化运行的要求。此外,传统的流量演进水力学模型主要是通过求解圣维南方程组的数值解法实现,但由于该方法需要详尽的河槽水力要素值,且计算工作复杂,在实际中应用较少。马斯京根是水文学中应用广泛的流量演算方法,其前提是假定河段蓄水量与流量呈线性关系,对线性关系较差的河流的应用仍有待进一步探讨,且马斯京根法对河段实测数据要求较高,应用难度大,故在水库短期优化调度、现货出清计算中应用较少。数学分析和数据挖掘方法通过函数建模、相关分析、神经网络等手段,具有实现简单、数据驱动、便于实际应用的优点。目前,已有部分学者将数据挖掘方法应用于水电站间滞时研究,如随机森林、相关分析、空间映射、神经网络等。数据挖掘是从大量的的实际应用数据中,提取隐含在其中有用信息的过程,容易导致输入因子存在大量冗余信息,模型缺少对时间序列数据的研究等问题。

模型输入在一定程度上决定了模型预测的效果,目前因子选取的有关研究的关注点主要针对单输入因子的选取,对于输入因子冗余信息较少关注。目前使用较多的因子选取方法主要是采用先验判断法、逐步回归法及相关系数法,这些方法在变量呈线性关系时效果较好,但水文变量间多为复杂的非线性关系,目前已有部分学者将信息论中的互信息应用于水文因子选取中。赵铜铁钢等采用互信息理论对预报模型的输入变量进行选取,程璐等结合copula函数和偏互信息理论,进行径流预报模型输入筛选。但互信息、偏互信息理论在对多个输入因子组成的整体预报因子集进行有效选取具有明显局限性。因此,纪昌明等研究了基于联合和条件互信息的因子选取方法,构建了JMI-BP模型进行预报并获得较好效果。

鉴此,本文从输入因子筛选和上下游水力联系模型构建两方面展开研究。考虑到水电站间流域滞时模型输入为多个因子组成的整体预报因子集,故本文采用基于联合互信息的(JMI)因子选取方法,以信息增长率最大准则对输入因子进行选取。在模型构建方面,引入卷积神经网络(CNN)和长短期记忆网络(LSTM)。卷积神经网络可以实现网络的并行学习,且在特征提取与降维等方面具有较大优势;长短期记忆网络能够更好的处理时间序列数据,维持序列数据前后的相互关系。根据上述两种网络的相互特点建立起两种方法耦合的网络模型,以实现对下游电站入库流量的关联计算。

综上所述,为建立梯级上下游电站的水力联系,探索流域滞时的动态表达,本文首先运用互信息的方法进行模型输入因子选取,其次构建CNN-LSTM耦合网络模型,并基于实际算例进行仿真计算,最后将本文所提模型拟合结果与传统随机森林回归模型、固定滞时模型进行了对比。

1 基于联合互信息的重要因子识别

1.1 密度函数估计

互信息的理论基础为信息熵,因此需要求解各因子的概率密度值。常见的方法有参数估计法,但其需要对数据分布做出假定,受主观影响,导致其与实际情况之间存在差异。本文采用Rosenblatt、Parzen提出的非参数估计方法即核密度估计方法计算变量概率密度。

核密度估计方法的基本思想为:设X为d维空间中的某一点,N为样本个数,为估计P(x)需构建一个以X为中心的超立方体V,其边长为h,则窗函数φ(u)为

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

式中,xi为第i个样本点;xik为xi在第k维的值;xk为x在第k维的值。

则在这个超立方体中的样本数为Νv=∑i=1Νφ(x-xih),由此计算出X的概率密度为

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

1.2 因子选取流程

通常来说水文因素关系建立时涉及因子有多个,若X={X1,X2,…,Xs}为待选因子,Y为输出因子,联合互信息及条件互信息的关系为

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

式中,I(Y;X1,…,Xs)为X1,…,Xs和Y的联合互信息;I(Y;Xs|X1,⋯,Xs−1))为在X1,…,Xs-1确定情况下Xs和Y的条件互信息。

由式(3)可知,最终的联合互信息是通过条件互信息累加得到,当仅有一个因子时,它包含信息是I(Y;X1)。以后每增加一个新的因子,当前信息集就会增加这个因子所包含的条件互信息。为了得到最高的选取效率,在每加入一个新因子时,应该保证该因子所包含的条件互信息值最大。

输入因子集的选取步骤如图1所示。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

图1 因子选取流程

2 CNN-LSTM模型构建

卷积神经网络(CNN)通过逐步移动局部感受野完成对整体的扫描,并且在具有扫描过程中保持相应的权重系数矩阵不变的特点,结合其卷积层与池化层之间的非全连接结构,使得CNN网络更接近生物神经网络,从而实现大大减少权重系数数量,降低模型训练复杂度。目前将其运用于水文变量间关系建立的研究较少,大多文章采用人工神经前馈(BP)网络、随机森林(RF)和支持向量机的方法。

CNN的基本结构为输入层、卷积层、池化层、全连接层、输出层,如图2所示。与一般的人工神经网络采用的矩阵乘法不同,CNN的卷积层使用卷积算法检测特征的局部连接。卷积公式为

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

式中,a=(f-1)/2,b=(h-1)/2;f、h为奇整数;I为待卷积矩阵。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

图2 CNN的经典结构

与其他人工神经网络相同,卷积计算后的输出通过激励函数映射为非线性函数值,较为常见的激活函数如tanh函数、Sigmod函数、ReLU、ELU、PReLJ、LReLU函数等。

池化层紧邻卷积层,由多个特征面组成,通过池化操作,将卷积层每个局部的重要信息进行提取。池化层具有抗变形和数据干扰的特点,图像的旋转、平移等变形对池化层提取特征。

考虑到流量的时变特性,本文引入长短期记忆网络(LSTM)与CNN进行耦合。LSTM实质上是一种循环神经网络(RNN)的改进模型,输入序列按照一定次序先后进入网络,经循环迭代后输出。循环神经网络的优点在处理时间序列时变的明显,其最大的特点在于能维持序列数据前后的相互关系。LSTM模型不仅具备循环神经网络的所有优点,而且因为引入了门控单元记忆历史状态,并用门控单元来控制信息传递使其成为了实际应用中最有效的序列模型。LSTM主要有输入门、遗忘门和输出门三种门控,结构如图3所示。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

图3 LSTM单元结构

假定i为输入门,f为遗忘门,o为输入门。⊙代表元素相乘,W为网络的权值矩阵、b为偏执向量,σ为Sigmoid函数。LSTM的隐藏层的输入为xi,输出为hi,记忆单元ci。门控内部计算公式为

(1)输入门计算

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

(2)遗忘门计算

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

(3)输出门计算

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

结合上述两种网络的各自优势及特点,构造出CNN-LSTM耦合神经网络。在进行模型训练时,由于CNN具有对数据进行特征提取、特征降维的效果,所以先将归一化后的数据输入卷积层和池化层进行重要信息提取、特征降维后,再经过全连接层后输入到LSTM记忆单元当中,经过多次迭代后输出训练好的模型。

深度学习模泛化不优的问题较为常见,目前相关研究多采用正则化方法限制模型的过度学习,使复杂度和性能达到平衡。常用的正则化方法如下。

带有L1正则式的损失函数表达式为

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

式中,J0为原本损失函数;a∑i=1N|ωi|a∑i=1Ν|ωi|为L1正则化项;a是系数;N为网络单元数目。

带有L2正则式的损失函数表达式为

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

式中,a∑i=1Nω2为L2正则化项;λ为系数。

此外,Dropout方法也可缓解过拟合的产生,这种方法是由HINTON提出的,该方法主要是在模型加入Dropout操作之后,在每个训练批次中,模型将忽略部分神经元节点(通常为0.2~0.5),减少节点间的相互影响,提高模型泛化性,减少模型对局部特征的依赖。

因此,本文在构建模型,将采取以下四个措施来避免过拟合问题。首先在构建模型过程中加入L2正则化技术;其次为找到合适的模型结构,从简单的模型(层数和每层的神经元个数都较少)开始,逐渐增加层数和每层的神经元个数,直至达到最佳精度为止;同时在训练过程中逐步调小学习率;最后,在隐藏层之后加入一层Dropout层。

CNN-LSTM耦合模型训练的流程如图4所示。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

图4 CNN-LSTM模型训练过程

3 算 例

本文选取H河干流上的两级电站(电站A和电站B)的实际运行数据为计算实例的数据基础,建立的JMI-CNN-LSTM模型是在Windows10 X64操作系统上使用Python语言实现,其中CNN网络及LSTM网络通过调用Tensorflow框架实现。

电站A为上游电站,总装机770 MW,正常蓄水位528 m, 死水位520 m, 正常蓄水位以下库容1.04亿m3;电站B为下游电站,总装机700 MW,正常蓄水位747 m, 死水位469 m, 正常蓄水位以下库容0.89亿m3。两者均为日调节电站,相距约33 km, 属于间断式梯级电站。

为建立变量间的关系,先从物理成因上分析变量间如何相互影响,对于下游电站的入库流量而言,其显然主要受上游电站出库流量、区间流域的降雨影响。其次,由于流量序列具有自相关的特点,其前几日的入库流量对当日入库流量也具有重要影响。

3.1 输入因子集选取

本文选取电站B当日入库流量为输出变量,待选因子集初步选为电站B前1日至前3日入库流量、电站A当日至前2日出库流量、区间前1日至前2日面降雨量,并根据实测流量数据运用JMI法进行输入因子集的选取。此外,不同季节的径流、降雨有较大差别,导致各影响因子的重要性发生变化,故需要针对不同季节建立不同的关系。考虑到汛期径流变化更明显、降雨更加充沛,各因子间的关系更加复杂,本文将以2020年7月为例进行阐述。

由于原始数据为小时级,为了更好的切合水电站短期调度习惯,并保证训练效果和预测精度,需对原始数据进行上采样操作,使数据与日内优化调度的96点(15 min级)保持一致。经线性插值及异常值筛选后得到的2 976组初步样本数据如图5所示。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

图5 各输入因子时间序列

为消除数据在数量级上的差异,本文对涉及的数据进行归一化处理,归一化的公式为

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

式中,xmax为序列中的最大值;xmin为序列中的最小值。

最终选取因子的结果顺序如表1所列。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

在第六步就停止继续选择的主要原因是,增加下一个互信息的增长量远小于了0.01,可见剩余的因子对最终的输出因子贡献甚小,同时也考虑到过多的输入节点可能使网络模拟过拟合。

将归一化后的数据样本按前面28 d作为训练集数据,后面3 d作为测试集数据的方式进行划分。

3.2 CNN-LSTM网络参数率定

将未经JMI方法选取的输入因子及经JMI方法选取的输入因子集作为CNN-LSTM网络的模型输入,对电站B的入库流量进行预测。鉴于对CNN-LSTM网络模型起到主要影响的超参数包括卷积核大小、激活函数、损失函数、所使用的优化器、训练批处理数目batch size、样本训练代数epoch、学习率、隐藏层节点数、隐藏层数等。从提高模型泛化程度的角度出发,本文采用交叉验证寻找使模型泛化性能最优的参数值如表2所列。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

3.3 对比模型设计

为更好的对比CNN的预测效果及证明其合理性,本文引入随机森林回归(RF)作为对比模型。

随机森林回归计算步骤可以概括如下:

(1)设定随机森林参数(树的数量ntrees, 最大特征数m)网格搜索范围。

(2)划分训练集与测试集,K折划分训练集。

(3)选取搜索范围内的一组参数,随机选择训练集中任意K-1折数据(含n个样本)作为训练样本。

(4)随机有放回地抽取n个训练样本形成抽样数据集,形成决策树。

(5)按照最大基尼杂质减少(分类)或最大均方误差(MSE)最小化(回归)的分裂标准逐个构造树节点,直到达到停止条件。

(6)重复步骤e形成多个决策树构成森林,直到达到预定的树的棵树ntrees。

(7)利用建立好的随机森林对训练集剩下的1折数据进行预测,评价指标采用MSE。

(8)重复步骤(4)—(7),遍历全部K-1折训练样本,计算各组评价指标平均值并记录为该组参数的评价结果。

(9)重复步骤(3)—(7),遍历全部参数组合,将评价结果最优的一组参数作为模型建立参数。随机选择训练集中全部数据重复步骤(2)—(10)得到本文随机森林回归模型。

(10)得到随机森林回归分析结果,其最终结果如式(13),表示回归结果为单个树结果的平均。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

经交叉验证后得到随机森林回归主要参数如表3所列。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

3.4 模型预测结果及分析

本文对比了卷积神经网络、随机森林及固定滞时(考虑A、B电站间距离,采用区间水流滞时为1 h, 区间流量为定值)三种模型,意在验证采用联合互信息进行输入因子筛选以及卷积神经网络模型在流域动态滞时预测中的适用性及合理性。以经过参数率定后的CNN-LSTM网络及RF模型在训练集上进行训练,再使用划分得到的训练集对模型效果进行测试。分位数-分位数图(Quantile-Quantile Plot, 简称Q-Q plot)常作为评价统计模型是否合理的依据,为展示测试集结果的残差分布情况,绘制误差分布正态分位数-分位数图如图6所示。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

图6 模型输出误差分布正态分位数-分位数图

从图6可以看出点位基本分布在对角线左右,只有个别点不在上下限分位之间,表明误差是服从正态分布的,模型拟合有效。各模型在测试集上的表现如图7所示。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

图7 模型测试结果示意

由图7可以看出,CNN-LSTM网络模型和RF模型与实际入库流量曲线的偏离程度较小,并且固定滞时模型相对于实际曲线总体呈偏下状态,说明其容易导致预测的入库流量偏小,其不利于下游电站做出及时反应。RF模型和CNN-LSTM网络模型在流量较大时段都具有较好预测效果,但RF模型在流量较低时段预测值整体偏高,且RF模型预测曲线较为平缓,对下游入库流量的波动性体现不佳。对比之下CNN-LSTM网络模型不仅对于大流量时段抑或是小流量时段均具有较好表现,并且能够较好地体现出下游电站入库流量的波动变化,说明CNN-LSTM网络模型对比RF模型和固定滞时模型具有较为明显的优势。此外,对比CNN-LSTM模型与JMI-CNN-LSTM模型,RF模型及JMI-RF模型可已看出,经输入因子筛选后的模型更加接近实际入库流量曲线,证明利用JMI方法进行输入因子筛选的必要性和合理性。

采用平均绝对误差(MAE)、绝对百分比误差(MAPE)、合格率(RQ)作为模型测试结果评价指标,其计算公式为

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

式中,yˆy^i为预测值序列;yi为真实值序列;nQ为合格点(认为预测值与实际值相对误差在±20%之内为合格)点数;n为测试集总点数。

模型预测效果如表4所列。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

从模型预测结果统计表(见表4)可以看出,各模型合格率均超过了90%,MAPE均在10%以内,精度总体较高。在上述所有方法中,JMI-CNN-LSTM网络模型预测精度最佳,对比JMI-RF模型及固定滞时模型,其MAE减少了14.61%和19.94%,MAPE减少了17.50%和16.30%。其次是CNN-LSTM网络模型,对比RF模型和固定滞时模型,其MAE减少了12.61%和9.34%,MAPE减少了15.84%和8.01%。以上数据均体现了CNN-LSTM网络模型相较RF模型和固定滞时模型具有更好的预测效果。此外,对比输入因子筛选的效果可知,JMI-CNN-LSTM网络模型和JMI-RF模型在预测精度上都有一定的提高,MAE分别减少了11.68%和9.61%,MAPE分别减少了9.02%和7.19%。结果说明利用JMI进行输入因子筛选对减少模型误差,提高模型泛化程度具有较好效果。但仍存在特征降维后模型在少数流量变化较大时段内训练效果有所下降的情况,表现为经过JMI特征筛选后模型相较于筛选前模型合格率存在小幅度下降的情况。

4 结 论

本文引入神经网络应用于上下游梯级电站间动态滞时研究,首先基于互信息中的条件互信息理论进行输入因子的选取,其次根据卷积神经网络和长短时记忆网络建立起上下游梯级电站间流量滞时的耦合深度学习网络模型,描述了二者的动态水力联系。最后结合算例将本文所提模型与随机森林回归模型和固定滞时模型进行对比,所得结论如下。

(1)本文所提CNN-LSTM网络模型可以有效描述上下游电站间水力动态联系,在水电站站间流量滞时关系的研究中具有更高的准确度。

(2)对比所有方案,JMI-CNN-LSTM网络模型表现最佳,较相同条件下其他方法平均绝对误差至少减少了14.6%、绝对百分比误差至少减少了16.3%。

(3)对比相同模型经JMI输入因子筛选前后效果可知,利用JMI筛选后平均绝对误差至少减少了9.6%、绝对百分比误差至少减少了7.1%,说明进行模型输入因子筛选的有效性及合理性。

本文提出的JMI-CNN-LSTM模型结构简单,方法可操作性强、且计算时长较短,语言通用性较强,可直接与逐步优化算法、粒子群算法等水库调度常用算法进行结合,应用于梯级水库短期优化调度模型中。此外,本文提出的模型可通过所建立的上下游水力联系从上游中标出力推求下游电站的出力范围,为水电日前现货市场竞价策略相关研究后续梯级价格-出力-水力模型的构建奠定基础。


水利水电技术(中英文)

水利部《水利水电技术(中英文)》杂志是中国水利水电行业的综合性技术期刊(月刊),为全国中文核心期刊,面向国内外公开发行。本刊以介绍我国水资源的开发、利用、治理、配置、节约和保护,以及水利水电工程的勘测、设计、施工、运行管理和科学研究等方面的技术经验为主,同时也报道国外的先进技术。期刊主要栏目有:水文水资源、水工建筑、工程施工、工程基础、水力学、机电技术、泥沙研究、水环境与水生态、运行管理、试验研究、工程地质、金属结构、水利经济、水利规划、防汛抗旱、建设管理、新能源、城市水利、农村水利、水土保持、水库移民、水利现代化、国际水利等。

基于JMI-CNN-LSTM耦合模型的梯级水电站间流量动态滞时关系

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/64419.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信