• 注册
    • 查看作者
    • 基于深度学习的水电站水流量和发电量预测技术

        引 言

        

        我国水力发电站数量众多,基本上属于无调节能力的径流式水电站,这种水电站具有明显的特殊性[1],而河川径流是由降雨形成,降雨又受到地理、气候等不确定因素的影响,因此对水力发电站的水流量以及发电量进行预测很有必要。水电站的主要运行经济指标是电量,其中水流量的多少将直接影响水电站的蓄水、弃水以及发电量。因此准确预测出发电站的出水量的多少,将会对发电站的经济指标产生很大影响,准确的水位预测是水电站安全运行和增发效益的关键。但受诸多因素的影响,水量预测常与实际情况发生较大偏差,导致发电计划频繁修改,不利于水电站安全、高效、稳定地运行。

        

        大量学者针对水电站的水流量预测和发展预测提出了诸多方法。最早采取的是比较直观也最为简单的回归分析[2],后来随着信息技术的发展,为了追求更精准的预测,有学者相继提出了时间序列法、频谱分析法以及随机微分方程[3]。近年来灰色系统理论、神经网络理论等在水流量预测中都得到了应用[4]。本文对华能旗下三个分别位于上、中、下游的水牛家、自一里、木座发电站收集了相关历史时间序列数据,在对数据进行一定预处理之后,采取了三个预测模型分别对其水流量和发电量进行预测,并对其预测结果进行比较,从而确定最优预测模型。

        

        1 水电站数据预测分析模型

        

        1.1 数据介绍及描述分析

        

        本文选取了水电站数据中的水牛家(装机容量70MW)、自一里(装机容量130MW)、木座(装机容量100MW)三个水电站进行属性分析,通过建立时间序列预测模型,预测这三个水电站的发电量和来水量。通过对水电站的历史数据进行分析之后发现,三个水电站的发电量和水流量数据缺失率低,仅自一里水电站的发电量参数有一个缺失值。其中E_AMOUNT为每天的发电量,W_AMOUNT为每天的水流量,选择完整数据集2008~2018年,并且对2018年进行预测,2008~2017年数据为训练集。对收集到的数据进行描述性统计。

        

        时间序列指的是按照时间顺序的一组数列,时间序列分析(Time-Series Analysis)是指将原来的数据分解为四部分来看——趋势、周期、时期和不稳定因素,然后综合这些因素提出预测[5]。对收集到的水电站的时间序列数据进行处理以便后续的模型分析(图1、2)。

        

        从原始的时间序列来看,三个水电站数据的时间跨度有重合的。通过对数据样本进行统计,发现完整年数据总共10年(2008~2018年),训练数据选择2008~2017年9年的数据,同过机器学习算法进行预测建模,选择最后一年2018年数据进行预测模型测试。另外,从序列图中可以发现W_AMOUNT参数存在较多的异常值。在对数据的时间序列进行分析预测的时候,数据相对越平稳越好,剔除掉异常值就是减少特殊状况对数据的影响,从而使得最终预测结果越准确。异常值采取先删除,后插补的方式进行处理。

        

        2 时间序列数据预测建模

        

        本主要数据预处理和预测建模流程如图3,后续模型的预测选择了三个水电站从2008~2018年的完整数据集,并且取2008~2017年为训练集、2018为预测集进行模型的检验,其中作为训练集的三个水电站各3653条数据,合计共10959条数据。

        

        坚持模型(persistent model)基本思路是把时间序列前一时刻的值作为当前时刻的预测值,坚持型模型作为最简单的预测模型可以作为基准线,与其他预测算法比较准确率,从而证明其他算法存在的必要性。运用坚持模型对水量和发电量的预测如图4、5所示,文中仅以自一里水电站为例。

        

        长短时记忆网络模型。LSTM(Long Short Term Memory Network)长短期记忆网络是一种特殊的循环神经网络(RNN),解决长时间序列训练过程中的梯度消失和梯度爆炸问题,在时间序列预测问题上面有广泛的应用[6]。所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。LSTM同样是这样的结构,但是重复的模块拥有一个不同的结构。不同于单一神经网络层,LSTM有四个,以一种非常特殊的方式进行交互。从表2结果来看E_AMOUNT的预测误差较大,W_AMOUNT预测误差较小。

        

        极限学习机(Extreme Learning Machine,ELM)或超限学习机是一类基于前馈神经网络(FeedforwardNeuron Network,FNN)构建的机器学习系统或方法,适用于监督学习和非监督学习问题[7]。极限学习机是一种单隐层前馈神经网络,随机确定输入权重和偏差,然后分析计算输出权重。ELM的关键思想是将难以求解的非线性优化问题,如输入权重、隐层偏差、输出权重的最优化问题转化为求解最优输出权重以简化运算。而这意味着只要权重的标准足够小,用户就不必考虑所有的输入和隐藏层权重,只需要关注输出权重即可。这个想法和传统的迭代学习方法(如梯度下降学习算法)是完全不同的。

        

        3 结语

        

        我国水电站的数量众多,因此对水电站的流水量和发电量进行预测,保证电力系统的稳定运行至关重要。本文通过对水电站收集相关历史时间序列数据,对数据进行一定预处理之后采用三种不同数据分析模型对其发电量和水流量进行预测,三种算法各有其优势所在。运用数据分析模型可以提高对水电站的预测,对水电能源的充分利用和对水电站的经济运行以及设备检修维护具有重要意义,该研究方法还可以用于电力系统短期负荷预报具有广阔的应用前景及实用价值。

    • 0
    • 0
    • 0
    • 107
    • 请登录之后再进行评论

      登录
    • 做任务
    • 实时动态
    • 偏好设置
    • 单栏布局 侧栏位置: