0

    基于bagging‑cnn‑的风速超短期预测方法技术领域

    2年前 | admin | 223次围观

    基于Bagging-CNN-GRU的风速超短期预测方法

    基于bagging

    cnn

    gru的风速超短期预测方法

    技术领域

    1.本发明涉及风电技术领域,具体是基于bagging

    cnn

    gru的风速超短期预测方法。

    背景技术:

    2.发电功率是风电场最重要的一个指标,而风速是影响功率大小的最直接因素,因此,在风电领域,风速预测越来越重要。风速预测通常按预测时间尺度的不同分为超短期预测、短期预测、中期预测和长期预测,风速预测的方法从狭义上讲可分为物理建模法和统计建模法两种。前者通常是将风电场内部、周边的环境数据和天气预报数据一起代入大气动力学方程中求解进行预测,由于这种方法建模较为复杂,计算量较大,并且精度不高,因此统计建模法的使用更为普遍;而统计建模法是通过实测数据进行预测,主要有持续法、时间序列法、人工神经网络法、支持向量机法、深度学习法等。

    3.现有的风速预测方法中,绝大部分是采用统计方法,但是,统计方法的精度不仅依赖于模型,也依赖于数据,现有的统计方法大多使用测风塔数据作为数据源进行预测,在其用于全场的风速预测或者预测尺度较大时,有较好的效果。然而现代风场规模越来越大,尤其是对于海上风场而言,风机众多并且功率较大,尾流效应明显,而风场中测风塔数量有限且离风场较远,其数据不能反映尾流影响,也不能全面的反映风场中具体位置的风速情况。因此,如果使用测风塔数据对风场内具体某个风机风速进行预测或者预测尺度较小时,预测精度不高。

    4.由于上游风机尾流的影响,下游风机会出现速度亏损。因此,测风塔或风机机舱尾部的机械式测风仪测得的风速数据不能真实反映风机轮毂处的实际风速,进而传统风速预测方法利用其预测出的风速与风机轮毂处风速可能存在较大误差,这会直接影响到对风机的控制精度。

    技术实现要素:

    5.本发明的目的在于解决现有技术中存在的问题,提供基于bagging

    cnn

    gru的风速超短期预测方法,采用深度学习算法,建立激光雷达测得的轮毂附近的风速与上游机械式测风仪测得风速之间的关系,从而可以利用上游风速实现对下游风机轮毂处风速的超短期预测,能够提高对下游风速的预测精度,稳定性和精度大大提高。

    6.本发明为实现上述目的,通过以下技术方案实现:

    7.基于bagging

    cnn

    gru的风速超短期预测方法,包括步骤:

    8.s1、采集风速和功率数据,并对风速和功率数据进行预处理;

    9.s2、对预处理后的数据进行随即采样,获取数据集;

    10.s3、构建cnn

    gru模型作为弱学习器,并初始化弱学习器;

    11.s4、训练弱学习器;

    12.s5、组合学习器并预测;

    13.s6、选择最优学习器,并进行误差评估。

    14.优选的,所述步骤s1中首先对异常点进行剔除,然后对于数据集里的空值使用knn插值法插值,最后将预处理好的数据集按照7:3的比例划分为训练集和样本集。

    15.优选的,所述步骤s2中用boostrap方法对经过预处理的数据集进行随机采样,获得若干个样本子集。

    16.优选的,所述步骤s2中初始采样次数与风机数量相等。

    17.优选的,所述步骤s3中弱学习器的参数初始值包括网络的权值、bias、epoch、激活函数。

    18.优选的,所述步骤s4中将若干个样本子集归一化处理并输入cnn

    gru网络进行训练,并通过梯度下降法修正各项参数,训练结束后可以得到若干个个弱学习器。

    19.优选的,所述步骤s5中将测试集样本分别输入训练好的若干个个弱学习器中,并将所有预测结果通过加权平均法整合作为最后结果输出。

    20.优选的,所述步骤s6中比较弱学习器个数在一定区间内的预测效果,选择达到最佳效果的弱学习器个数,并以rmse作为考量指使用mape、rmse和mae作为评价指标对模型精度进行评估。

    21.对比现有技术,本发明的有益效果在于:

    22.1、本发明结合了cnn和gru的特点,构建了一种cnn

    gru的组合模型,利用cnn挖掘上下游风机风速的空间相关性,利用gru挖掘风速在时间上的时序特征,以求将时间相关性与空间相关性综合考虑,提高对下游风速的预测精度。

    23.2、本发明以cnn

    gru模型作为弱学习器,以集成学习的思想构建bagging

    cnn

    gru模型以实现上游风速对下游风速的预测,由于bagging

    cnn

    gru模型考虑了全场各个位置的风速特性,相比于单一cnn

    gru模型,稳定性和精度进一步得到提高。

    附图说明

    24.附图1是本发明的预测流程图;

    25.附图2是本发明的bagging

    cnn

    gru总体框架图;

    26.附图3是本发明的cnn

    gru模型结构图;

    27.附图4是风速箱型图;

    28.附图5是风速概率密度分布图。

    具体实施方式

    29.下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本技术所限定的范围。

    30.实施例:如附图1

    5所示,本发明所述是基于bagging

    cnn

    gru的风速超短期预测方法,通过对需要解决的问题进行分析,选择兼顾时空特征的cnn

    gru组合模型作为实验方法;然后对风速数据进行分析和预处理;最后用cnn

    gru模型建立了目标风机输入风速与其上游三台风机输出风速和功率之间的映射关系,并以cnn

    gru模型作为弱学习器,以集成学习的思想构建bagging

    cnn

    gru模型以实现上游风速对下游风速的预测,由于bagging

    cnn

    gru模型考虑了全场各个位置的风速特性,相比于单一cnn

    gru模型,稳定性和精度进

    一步得到提高。

    31.具体包括步骤:

    32.s1、风速数据来自于我国某风电场scada数据库记录的实测数据,其中全场数据集中包括风速、风电功率、风向、压强、温度等数据,采样频率为每15min一次;而单台风机数据集包括风速、风向、有功功率、偏航方位角、风轮转速等21个参数数据,采样频率为1min一次。风电场全年风速概率分布图如附图5所示,从图中可以看出风速呈正偏态分布,风速的箱型图如附图4所示。通过对风场内各风机scada数据的统计分析发现短期风速预测时间,数据集中的每个风机或多或少都存在着数据缺失或者异常的情况。因此,为了保证后面分析和实验建模的正确性,需要提前对将要用到的数据集进行预处理,具体处理方法如下:

    33.①

    异常数据处理:

    34.对于异常数据的处理,采用四分位法进行判断并且剔除。实际处理时,根据判定区间的公式,利用python编程找到所有异常点并删除即可。

    35.②

    缺失数据处理:

    36.在异常值删除以后,相应位置将会出现值的缺失,而原本数据集中本身也存在着数据缺失,将这些缺失数据一起分为两种情况处理。认为垂直风向直线上的风机是同一排风机,如果某风机的数据集中某时刻的值缺失,并且和它同一排风机的数据集中相同时刻的值也缺失,则直接删除即可;如果某风机的数据集中存在缺失的值,但和它同一排风机的数据集中相同时刻存在值,则通过knn插补法插值。在实际处理时,可通过fancyimpute库调用相关函数实现。

    37.s2、用boostrap方法对经过预处理的数据集进行随机采样,这里设置初始采样次数与风机数量相等短期风速预测时间,均为12,即采样结束后可以得到12个样本子集。

    38.s3、深度神经网络通过增加隐藏层的数量来提高网络的表达能力,基于此思想,本次实验采用堆叠式结构模型,具体的模型结构和参数如附图2。具体实现时,gru层使用tf.nn.rnn_cell.multirnncell()函堆叠2层,由于数据样本较小,为了防止过拟合,在全连接层上使用dropout技术。dropout技术的原理是在每次训练时随机置0隐藏层一部分结点的值,使这些节点失效,从而避免依赖局部特征,降低过拟合发生的概率。它的本质是简化模型结构,在一定程度上达到正则化的效果。编程时是通过设置参数dropout_placeholdr实现,它的大小决定了每次需要置0的节点数,取值范围一般为[0.2,0.6]。设置10个弱学习器(cnn

    gru)的参数初始值,如网络的的权值、bias、epoch、激活函数等。

    [0039]

    s4、将10个样本子集归一化处理并输入cnn

    gru网络进行训练,并通过梯度下降法修正各项参数,训练结束后可以得到12个弱学习器;

    [0040]

    s5、将测试集样本分别输入训练好的12个弱学习器,通常将所有预测结果通过加权平均法整合作为最后结果输出。

    [0041]

    s6、本次实验一开始设定初始弱学习器个数为12个,然而该参数是人为给定,可能并非最优参数。因此进一步重新设置弱学习器个数,比较弱学习器个数在[12,20]区间内的预测效果。每种情况分别测试12台旗舰各10次,以所有结果的平均值作为最终结果,并以rmse作为考量指标。经结果分析可得:当弱学习器个数为18时rmse值最低,因此,最终实验采用18个弱学习器。使用mape、rmse和mae作为评价指标对模型精度进行评估。预测流程图如图1所示。

    [0042]

    本发明结合了cnn和gru的特点,构建了一种cnn

    gru的组合模型,利用cnn挖掘上下游风机风速的空间相关性,利用gru挖掘风速在时间上的时序特征,以求将时间相关性与空间相关性综合考虑,提高对下游风速的预测精度;

    [0043]

    本发明以cnn

    gru模型作为弱学习器,以集成学习的思想构建bagging

    cnn

    gru模型以实现上游风速对下游风速的预测,由于bagging

    cnn

    gru模型考虑了全场各个位置的风速特性,相比于单一cnn

    gru模型,稳定性和精度进一步得到提高。

    技术特征:

    1.基于bagging

    cnn

    gru的风速超短期预测方法,其特征在于,包括步骤:s1、采集风速和功率数据,并对风速和功率数据进行预处理;s2、对预处理后的数据进行随即采样,获取数据集;s3、构建cnn

    gru模型作为弱学习器,并初始化弱学习器;s4、训练弱学习器;s5、组合学习器并预测;s6、选择最优学习器,并进行误差评估。2.如权利要求1所述的基于bagging

    cnn

    gru的风速超短期预测方法,其特征在于:所述步骤s1中首先对异常点进行剔除,然后对于数据集里的空值使用knn插值法插值,最后将预处理好的数据集按照7:3的比例划分为训练集和样本集。3.如权利要求1所述的基于bagging

    cnn

    gru的风速超短期预测方法,其特征在于:所述步骤s2中用boostrap方法对经过预处理的数据集进行随机采样,获得若干个样本子集。4.如权利要求3所述的基于bagging

    cnn

    gru的风速超短期预测方法,其特征在于:所述步骤s2中初始采样次数与风机数量相等。5.如权利要求1所述的基于bagging

    cnn

    gru的风速超短期预测方法,其特征在于:所述步骤s3中弱学习器的参数初始值包括网络的权值、bias、epoch、激活函数。6.如权利要求3所述的基于bagging

    cnn

    gru的风速超短期预测方法,其特征在于:所述步骤s4中将若干个样本子集归一化处理并输入cnn

    gru网络进行训练,并通过梯度下降法修正各项参数,训练结束后可以得到若干个个弱学习器。7.如权利要求1所述的基于bagging

    cnn

    gru的风速超短期预测方法,其特征在于:所述步骤s5中将测试集样本分别输入训练好的若干个个弱学习器中,并将所有预测结果通过加权平均法整合作为最后结果输出。8.如权利要求1所述的基于bagging

    cnn

    gru的风速超短期预测方法,其特征在于:所述步骤s6中比较弱学习器个数在一定区间内的预测效果,选择达到最佳效果的弱学习器个数,并以rmse作为考量指使用mape、rmse和mae作为评价指标对模型精度进行评估。

    技术总结

    本发明公开了基于Bagging

    技术研发人员:魏善碧 潘天乐 周翼 肖勇 侯杨 陈行

    受保护的技术使用者:重庆大学

    技术研发日:2021.06.25

    技术公布日:2021/9/9

    发表评论