当前位置首页 > 信息公告

基于K-means++与ELM的短期风电功率预测模型研究

更新时间:2023-09-22 文章作者:佚名 信息来源:网络整理 阅读次数:

1.What96y物理好资源网(原物理ok网)

提出了一种基于K-means++降维剖析和极限学习机(ELM)的短期风电功率预测方式,同时使用数值天气预报(NWP)数据与SCADA系统的历史检测数据,实现了对未来72h的短期风电功率预测。96y物理好资源网(原物理ok网)

2.Why96y物理好资源网(原物理ok网)

生物质能的波动性对风电产业的迅速发展带来了巨大挑战,确切可靠的短期风电功率预测对满足电网调度以及增加度电成本具有重要意义。96y物理好资源网(原物理ok网)

3.How96y物理好资源网(原物理ok网)

3.1物理方式96y物理好资源网(原物理ok网)

(1)互信息96y物理好资源网(原物理ok网)

互信息(MI)是评判变量间相关性的量度,互信息越大,代表变量间的相关性越强。对于离散随机变量X,Y,其互信息I(X,Y)表示为:96y物理好资源网(原物理ok网)

式中p(x)和p(y)分别是X和Y的边沿机率分布函数;p(x,y)为X和Y的联合机率分布函数。96y物理好资源网(原物理ok网)

(2)K-means++降维96y物理好资源网(原物理ok网)

本文选用K-means++算法对数据进行降维,主要步骤如下:96y物理好资源网(原物理ok网)

a.在数据集中随机选出一个降维中心点C1,依次估算其他数据样本Xi与C1之间的距离,记为L(x),则样本点被选中为下一降维中心点的机率为:96y物理好资源网(原物理ok网)

使用轮盘法选出下一个降维中心,重复此步,直到选出K个降维中心点;96y物理好资源网(原物理ok网)

b.估算剩余的数据样本与K个降维中心点的距离,按距离大小,将剩余的数据样本分入距离最小的中心点Ck所在的子集中;96y物理好资源网(原物理ok网)

c.重新估算各数据子集中数据点的中心点;96y物理好资源网(原物理ok网)

d.重复步骤b~步骤c,直到降维中心点不再发生联通。96y物理好资源网(原物理ok网)

(3)极限学习机96y物理好资源网(原物理ok网)

极限学习机是一种基于单隐层卷积神经网路的新型算法,其结构如图1所示:96y物理好资源网(原物理ok网)

图1ELM结布光96y物理好资源网(原物理ok网)

对于给定N个任意样本(Xj,tj),其中,Xj=[Xj1,Xj2,…,Xjn]T∈Rn,tj=[tj1,tj2,…,tjm]T∈Rm,具有L个隐藏层的ELM网路可以表示为:96y物理好资源网(原物理ok网)

式中j=1,...,N,G(x)为激活函数,Wi=[Wi1,Wi2,…,Win]T为第i个隐藏层与输入层之间的权重矩阵,ρi=[ρi1,ρi2,…,ρim]T为第i个隐藏层与输出层之间的权重矩阵超短期风电功率预测,bi为第i个隐层单元的偏置。式(3)可表示为:96y物理好资源网(原物理ok网)

其中,96y物理好资源网(原物理ok网)

式中H代表ELM的隐藏层输出矩阵。ELM的系数ρ可以通过搜索线性系统Hρ=T的最小二乘解96y物理好资源网(原物理ok网)

来确定:96y物理好资源网(原物理ok网)

其中,H+是蕴涵层输出矩阵H的Moore-广义逆。96y物理好资源网(原物理ok网)

ELM模型训练时其输入层的残差与阀值为随机形成,算法执行过程中只须要对蕴涵层神经元的个数进行调整,无需调整参数。96y物理好资源网(原物理ok网)

3.2短期功率预测模型96y物理好资源网(原物理ok网)

本文提出的风电功率预测模型的结构框图如图2所示:96y物理好资源网(原物理ok网)

图2系统结构框图96y物理好资源网(原物理ok网)

(1)数据预处理96y物理好资源网(原物理ok网)

风电场的SCADA系统采集频度为60s,将数据集进行平均处理,帧率为15min。因为输入向量量纲不一致,使用Z-score标准化方式对数据进行归一化,依照各输入特点与风电功率之间的互信息值选择输入特点,其结果如表1所示。按照J1、J2数据集的互信息值,J1、J2均选择风向、温度、相对温度、风速、表面浮力作为输入特点。96y物理好资源网(原物理ok网)

表1互信息值96y物理好资源网(原物理ok网)

(2)数据降维96y物理好资源网(原物理ok网)

针对上一步所选定的输入特点及前三天的实测风速数据,将数据界定为K个子集,并估算偏差平方和(SSE),使用手指法选定最合适的K值。按照手指法的原理,SSE值在接近真实降维数时会随之变化,当分类的个数小于4后,其SSE值变化渐趋缓慢,因而令数据集J1、J2的K值为4。96y物理好资源网(原物理ok网)

(3)功率预测96y物理好资源网(原物理ok网)

针对上一步界定的数据子集,分别建立ELM预测模型。通过估算NWP数据与降维中心点的距离选择合适的模型实现预测。96y物理好资源网(原物理ok网)

3.3算例剖析96y物理好资源网(原物理ok网)

(1)实验数据96y物理好资源网(原物理ok网)

选用山东鱼台海上风场提供的风电数据超短期风电功率预测,对文中提出的功率预测模型进行验证。其中J1为该风场2020年11月13日~2021年2月3日提供的NWP信息,J2为2020年12月09日~2021年3月3日提供的NWP信息。选用其后20天的数据作为测试集,其他数据作为训练集,预测时长均为3天。96y物理好资源网(原物理ok网)

(2)评价标准96y物理好资源网(原物理ok网)

文中使用NRMSE(RootError,归一化均方根偏差)、NMAPE(MeanError,归一化平均绝对比率偏差)作为功率预测评价指标。其公式如下所示:96y物理好资源网(原物理ok网)

式中yt为原始风速值;96y物理好资源网(原物理ok网)

为风速预测值;C为风机的额定功率。96y物理好资源网(原物理ok网)

(3)实验结果96y物理好资源网(原物理ok网)

为了验证该模型的性能,文中比较了未经降维的持续法、BP神经网路、ELM模型,与使用K-means降维的K-ELM模型作为对比模型,每位模型训练50次取平均值,预测时长每隔24h(即96个预测点)取平均值,从预测精度来评价该模型。其预测结果如表2~表5所示。96y物理好资源网(原物理ok网)

表2J1数据集与精典方式的对比结果96y物理好资源网(原物理ok网)

表3J1数据集与降维方式的对比结果96y物理好资源网(原物理ok网)

表4J2数据集与精典方式的对比结果96y物理好资源网(原物理ok网)

表5J2数据集与降维方式的对比结果96y物理好资源网(原物理ok网)

剖析表2、表4的预测结果可以看出,与精典风电功率预测方式相比,文中提出的K++ELM方式的NRMSE、NMAPE分别平均增加了15.2%、17%。从表3、表5的预测结果可以看出,将数据降维后更能确切地实现预测。96y物理好资源网(原物理ok网)

4.96y物理好资源网(原物理ok网)

实验结果表明,本文提出的基于K-means++降维与ELM的短期风电功率预测方式与其他4种预测模型相比,具有较高的机率预测精度。96y物理好资源网(原物理ok网)

5.96y物理好资源网(原物理ok网)

(1)本文先介绍了所采用的物理方式:互信息法、K-means++算法、极限学习机算法;随即提出短期功率预测模型,将实验样本带入,详尽地描述了数据预处理、聚类剖析、功率预测的步骤;最后再进行算例剖析验证算法的有效性。思路清晰,结构严谨,无论是“机器学习”领域还是“功率预测”领域,都是一篇例文。96y物理好资源网(原物理ok网)

(2)笔者之前在学习《基于K均值降维算法的电源运行状态数据剖析》论文时,曾考虑到K-means降维“需要人为给定K的个数”以及“聚类结果受初始降维中心选定影响大”的缺陷,而本文使用的K-means++降维算法完美解决了这两个问题。笔者总结该算法的核心思想是:所选初始降维中心之间的互相距离要尽可能的远,如果早已选定了n个降维中心,则在选定第n+1个降维中心时,距离当前n个降维中心越远的点越容易被选中。96y物理好资源网(原物理ok网)

(3)本文所用实验数据均为四川风电数据,又集中在11月-3月之间,样本容量较小,且在地域和时间上均存在一定的局限性,还须要进一步研究不同地貌、不同季节对风电功率预测的影响。96y物理好资源网(原物理ok网)

(4)在实验结果的展示方面,原文只突显出数据集被分为4类,倘若能提供每位类别的预测曲线图,是否会愈加直观形象?96y物理好资源网(原物理ok网)

(5)待学习:神经网路。笔者对神经网路理论有些遗忘,造成对本文预测算法理解不深入,须要备考相关知识,为后续学习更多功率预测算法打下基础。96y物理好资源网(原物理ok网)

发表评论

统计代码放这里