电气工程

基于DTW-LSTM的短期楼宇电力负荷预测方法*

张明理1，2a，张明慧2b，王勇2a，武志锴2b，满林坤2a

(1. 东北大学软件学院，沈阳 110169； 2. 国网辽宁省电力有限公司 a. 经济技术研究院， b. 财务资产部，沈阳 110015)

摘要：为了提高楼宇电力负荷预测精度，解决传统聚类算法楼宇用电曲线聚类效果差的问题，提出一种基于DTW-LSTM的楼宇短期电力负荷预测模型.采用DTW聚类算法对楼宇日用电曲线进行聚类与编码，分析楼宇用电行为.根据楼宇10天的日用电曲线编码，利用马尔科夫链对未来一天的用电曲线编码进行预测，得到用电曲线原型.将编码作为一个特征，结合历史用电数据对楼宇的短期负荷进行预测，结果表明，相对于传统的聚类算法，所提方法的聚类结果更加合理且预测精度也有所提升.

关键词： DTW聚类算法；电力负荷预测；马尔科夫链模型；长短期记忆网络；用电数据；预测精度；用电曲线；短期负荷

在增量配电网投资管理中，因为楼宇用电行为对大型园区能耗影响较大，故针对楼宇电力负荷预测具有较为重要意义[1].鉴于电能难以存储的特性，电企的生产能力应该能够根据实际用电进行动态调整.楼宇用电作为电能主要用途之一，对楼宇短期的电力负荷精准预测既可以降低电能的损耗，又能保证用电环境的安全与稳定.

智能电网是未来电网发展的必然趋势[2]，智能电网的重要组成部分是安装在各个楼宇中的智能电表，其可定期发送和接收楼宇与供电商之间的用电量信息，且随着数据存储和处理器功能的增强，可以将获得的大量楼宇用电数据以时间序列的形式进行存储，对数据进行处理后，即可预测未来的用电情况.

在过去的几十年中，学者们提出的众多统计和人工智能方法应用于短期电力负荷预测.李泽文等[3]利用时间序列分析和加权最小二乘法建立ARMA模型，实现短期的负荷预测，但最终预测精度仍有较大的提升空间.许言路等[4]发现，随着神经网络的兴起，卷积神经网络(CNN)在多个方面均表现出卓越的贡献，在具有时间序列特征的电力负荷预测方面也有优越表现.余登武等[5]提出利用深度卷积神经网络(DCNN)模型来预测加拿大维多利亚市一周中每一天的用电负荷，但随着网络深度的增加，预测精度会趋于饱和甚至下降.此外，循环神经网络(RNN)使用也较为普遍，其中最为著名的是长短期记忆(LSTM)循环神经网络.李鹏辉等[6]提出一种基于LSTM的短期高压负荷回归预测方法，通过引入自循环权重，各单元彼此循环连接，动态化地改变积累时间尺度，使其具有长短期记忆并表现出优异的性能.

仅使用统计方法或人工智能方法进行短期负荷预测精度受限，故结合聚类算法对用电行为进行分析的想法被提出.艾欣等[7]应用K-Means、K-Medoid和SOM聚类算法，根据家庭一天的用电模式划分为簇，并产生能代表家庭内常见用电模式的曲线；赵凯等[8]将SOM与K-Means算法相结合应用于工业建筑能耗模式分析，并成功识别出不同的能耗及相关行为模式；史静等[9]根据用户消费模式的相似性，利用周期性分析和K-Means聚类算法将用户进行分组.然而现在大多数传统聚类算法会导致簇数过多，其中每个用电曲线可能与多个簇有关，用电曲线无法确定固定的模式.针对上述问题，本文的贡献如下：

1) 采用一种基于形状的动态时间规整(DTW)聚类算法对楼宇日用电曲线进行聚类，并对聚类结果进行编码.

2) 利用马尔科夫链模型，根据楼宇过去10天用电曲线所属簇的编码对未来一天的用电曲线编码进行预测，该步骤的目的是预测出未来一天的用电曲线原型.

3) 以编码为特征，通过LSTM网络，根据楼宇历史用电数据对楼宇未来的短期负荷进行预测.

4) 将DTW-LSTM短期负荷预测模型与LSTM模型进行对比实验，由此分析DTW聚类对预测精度的提升效果.其次针对传统的短期负荷预测SVR模型做出对比实验，从而说明本文所提出模型最终的效果.

1 DTW-LSTM模型

1.1 DTW聚类算法

对于楼宇的用电曲线，传统聚类算法采用的是基于欧式距离的度量，其只能对同一时刻的用电数据进行相似评估.楼宇的用电曲线可能在两个不同时间段具有相似的用电行为，若继续采用基于欧式距离度量的聚类算法，则可能最终的聚类效果较差且具有较多的簇数目[10].

DTW算法专门用于处理衡量时间序列相似度问题，通过在时间轴上的非线性拉伸或收缩进行两条用电曲线的形状匹配.算法具体描述如下：比较两个长度为N的时间序列X和Y，首先需要定义一条规整路径p=(p1，p2，…，pL)，其中pi=(ni，mi)∈[1∶N]×[1∶N](1≤i≤L).规整路径需要满足以下条件：

1) 边界条件.其中p1=(1，1)，并且pL=(N，N).

2) 单调性.路径上的每个点必须随着时间单调进行变化，故ni和mi满足n1≤ni≤nL，m1≤mi≤mL.

3) 连续性.对于路径上一点pi=(ni，mi)及下一个点pi+1=(ni+1，mi+1)满足ni+1-ni≤1，且mi+1-mi≤1.

满足上述条件后，根据d(xn，ym)=(xn-ym)2，可以计算时间序列X与Y之间的规整路径总代价为

(1)

最优规整路径p*是所有可能的规整路径中，总代价最小的一条.序列X与Y之间的DTW距离即为最优规整路径总代价，定义为

dDTW(X，Y)=cp*(X，Y)

(2)

p*=arg min cp(X，Y)

(3)

为了计算两条负荷曲线的DTW距离，找到最优的规整路径，本文利用动态规划思想求解.首先计算时间序列X与Y中每两个点之间的距离，并利用一个代价矩阵C保存.最优规整路径的总代价可以递归计算，递归公式为

dDTW(xi，yj)=d(xi，yj)+min(dDTW(xi-1，yj)，

dDTW(xi，yj-1)，dDTW(xi-1，yj-1))

(4)

最终dDTW(xN，yN)即为最佳规整路径的总代价.给定楼宇负荷曲线序列X，聚类数目K，每个簇的原型设为uk.基于DTW的聚类算法目的是找到K个簇的DTW距离之和最小，即

(5)

因此，通过DTW算法进行聚类得到的每个簇的用电曲线中相同时刻的用电情况可能差异较大，但整体用电规律是相似的.

1.2 马尔科夫链模型

马尔科夫链过程是以系统状态转移规律作为基础，研究和分析事物的发展趋势，从而推导出事物未来最有可能出现的状态[11].

选取历史编码作为划分系统状态的根据，设编码序列共包含r种状态，记为s1，s2，…，sr.当聚类数目为K类时，其中的某个状态si的取值范围为[0，K-1].历史的编码数据从si状态经过n步转移到sj状态的概率为

Pij(n)=Mij(n)/Mi

(6)

式中：Mij(n)为编码序列中由si状态转移到sj状态的次数；Mi为编码序列处于si状态的总次数.

基于式(6)可以求出马尔科夫链n步的状态转移矩阵为

(7)

式中，

计算出转移矩阵，则要预测r+1步的状态.以第r步的状态sr为依据，从状态转移矩阵中找到状态sr转移的最大概率，即max(Prl(n))，其中l=1，2，…，r，最终sl状态则为r+1步可能性最大的状态.

1.3 长短期记忆网络

Hochreiter等[12]最早提出了LSTM神经网络，其对RNN做出了改进.RNN是用于处理序列数据的神经网络，随着历史信息和当前预测信息距离的增大，其丧失了从过去学习信息的能力，即梯度消失问题.而LSTM神经网络能够解决RNN的梯度消失问题，LSTM神经网络标准结构如图1所示.

LSTM神经网络之所以能够解决梯度消失问题，主要是引入了一个Cell处理器.在Cell中主要包含三扇门，分别为遗忘门、输入门及输出门[13-14].

图1 LSTM网络结构
Fig.1 LSTM network structure

遗忘门用于决定上一阶段有多少信息可以传递到当前状态.若输出为0，则丢弃上一阶段的全部信息；若输出为1，则保留上一阶段的信息，其筛选表达式为

ft=σ(Wf[ht-1，Xt]+bf)

(8)

式中：σ为sigmoid激活函数；Wf为遗忘门当前的输入Xt与前一时刻输出ht-1相乘的权重；bf为偏置.

输入门用来决定有多少当前输入信息可以加入记忆单元.通过sigmoid层决定更新值，通过tanh层生成当前新的记忆单元候选状态，即

(9)

式中：Ct-1为前一阶段状态；it为输入门输入；为记忆单元候选状态.

输出门主要决定模型的输出，其利用sigmoid函数得到初始输出，再利用tanh函数将值缩放到(-1，1)，将两者相乘得到输出公式为

ht=ottanh Ct

(10)

ot=σ(W0[ht-1，Xt]+b0)

(11)

函数sigmoid是不考虑之前学到的信息输出，函数tanh则是对之前学到的信息进行压缩，将两者结合即为LSTM的思想.

1.4 整体模型

本文提出的整体网络结构如图2所示.模型主要包含3个部分，第1部分是对楼宇日用电曲线进行聚类，得到K簇并对簇编码(0～K-1)；第2部分利用马尔科夫链模型预测楼宇的用电曲线编码，每个楼宇利用r天的用电编码预测第r+1天的用电编码，目的是为了得到r+1天的用电曲线原型；第3部分是对楼宇的短期负荷进行预测，将马尔科夫链预测的用电编码作为一个特征，结合历史负荷数据，利用LSTM进行短期的负荷预测.

2 实验过程

2.1 实验配置

本案例研究选择芝加哥8个楼宇2014年6月至9月工作日的用电情况，共计696条日用电曲线，用电数据获取频率为每小时一次.研究中涉及的所有实验均基于python3.7编译环境下，神经网络模型均基于TensorFlow开发的Keras.实验涉及的模型超参数如表1～2所示.在进行深度模型实验时，对数据进行分割，其中60%的数据作为训练集，20%的数据作为验证集，其余的20%作为测试集.

图2 整体网络结构
Fig.2 Overall network structure

表1 SVR模型超参数
Tab.1 SVR model hyper-parameters

模型惩罚参数ε参数内核次数核系数SVR2000.01rbf3auto

表2 深度模型超参数
Tab.2 Depth model hyper-parameters

模型层数学习率批次大小内核LSTM180.1128noneDTW-LSTM180.1128none

2.2 聚类实验

2.2.1 聚类评价标准

为了评价聚类的效果，本文利用3个性能指标来进行衡量：

1) 各簇中的用电曲线与簇中心的距离之和记作WC，该指标可以评价簇的紧凑性.

2) 各簇心之间的距离之和记作WB，该指标可以评价簇之间的差异性，计算表达式为

(12)

3) WC与WB的比值记作WCBCR，该指标可以评价两者变化的比率.一个好的聚类结果，应具有较小的WC值和WCBCR值，以及较大的WB值.

2.2.2 聚类结果

对于8个楼宇的日用电曲线数据，实验聚类数目为5～65簇.图3记录了不同聚类数目的WCBCR评价指标.

图3 WCBCR指标
Fig.3 WCBCR indicator

随着聚类数目增多，簇之间的距离之和变大，故WB的值增大；每个簇中曲线越来越紧凑，故WC的值减小.综合上述两点，WCBCR的值随着聚类数目增加逐渐减小.但在聚类数目11之前下降较快，而在聚类数目11之后下降较慢，根据拐点法选择聚类数目为11最佳.图4为最终的聚类结果，并对每个簇进行编码(0～10).

2.2.3 编码预测

对于编码的预测，本文基于楼宇中每10天的编码，并利用马尔科夫链模型预测第11天的编码.

对于每个楼宇，编码预测正确率如表3所示.从表3中可以得到编码预测平均正确率为92.19%，这为下一步负荷预测奠定了良好的基础.

2.3 负荷预测实验

2.3.1 预测结果评估指标

对实验预测结果的评估指标使用绝对百分比误差(MAPE)、平均绝对误差(MAE)以及均方根误差(RMSE)，其具体计算表达式为

(13)

(14)

(15)

式中：Zip为预测值；Zit为真实值.

2.3.2 负荷预测结果

1) LSTM与DTW-LSTM比较.该实验主要是为了说明DTW聚类算法对预测结果的提升，表4分别给出了两个模型的各参数对比情况.

图4 11簇聚类结果
Fig.4 Clustering results of 11 clusters

表3 编码预测正确率
Tab.3 Coding forecasting accuracy

1号楼2号楼3号楼4号楼100%75%100%87.5%5号楼6号楼7号楼8号楼75%100%100%100%

从表4中可以看出，DTW-LSTM模型对于各个楼宇的预测精度均有所提升.以MAPE指标为例，提升幅度最大值为1.325 2%，最小提升幅度为0.38%，平均提升幅度为0.861 3%.通过分析发现，8号楼中的日用电曲线的聚类结果较为分散，故编码对负荷预测的影响较大；而1号楼中的日用电曲线聚类结果几乎为同一个簇，编码对负荷产生的影响较小，符合最终的结果.

表4 MAPE、MAE和RMSE指标
Tab.4 MAPE，MAE and RMSE indicators

评价指标使用算法1号楼2号楼3号楼4号楼5号楼6号楼7号楼8号楼MAPEMAE/MWRMSE/MWLSTM6.632011.52758.66578.50509.40158.08167.89838.0648DTW-LSTM6.252010.38238.06127.58928.62347.57696.65656.7396LSTM4.38001.24005.89004.32005.12002.92003.00004.3700DTW-LSTM4.27001.16005.35003.84004.05002.77002.47003.7100LSTM5.82001.91007.56005.17006.21003.82004.89005.5600DTW-LSTM5.66001.89007.04004.64005.79003.58004.19004.5900

综上所述，DTW聚类用电原型的预测对于最终的负荷预测精度提升是有帮助的，且该模型对楼宇的负荷预测具有普适性.

2) DTW-LSTM与SVR比较.为了证明DTW-LSTM模型相对于传统负荷预测模型的性能提升，本文选择SVR模型进行精度对比，对比结果如表5所示.

由表5中可以发现，DTW-LSTM模型在各性能指标方面均优于SVR模型，MAPE指标平均降低1.703%，MAE指标平均降低1.056 MW，RMSE指标平均降低1.06 MW，且模型具有泛化能力，对所有的楼宇具有普适性.因此在实际的应用中，DTW-LSTM模型完全能够胜任楼宇短期的负荷预测.

表5 性能对比结果
Tab.5 Performance comparison results

楼宇SVRMAPEMAE/MWRMSE/MWDTW-LSTMMAPEMAE/MWRMSE/MW1号楼8.73495.866.906.25204.275.662号楼12.72812.473.1410.38231.161.893号楼9.64866.387.848.06125.357.044号楼9.89664.456.017.58923.844.645号楼10.08434.826.728.62344.055.796号楼9.08434.244.897.57692.773.587号楼7.27812.964.566.65652.474.198号楼8.04944.895.806.73963.714.59

3 结论

本研究提出了DTW-LSTM短期负荷预测模型.首先与LSTM神经网络模型进行性能对比，说明DTW聚类后预测未来的用电原型对精度的提升效果；其次与SVR模型进行系统地比较，分析其模型对比传统算法提高的效果.实验表明，DTW-LSTM短期负荷预测模型取得了较好的效果.

综上所述，DTW-LSTM模型在负荷预测精度上有所提高，且该模型对楼宇具有普适性.但在此基础上，仍可继续研究，例如将日用电曲线进行划分，将划分结果进行DTW聚类，这样的编码会精确到以小时为单位，最终负荷预测精度仍将会有所提高.

参考文献（References）：

[1]陈立，王蓓蓓，黄俊辉，等.电网公司保底服务实施后的增量配电网投资策略 [J].电力系统自动化，2018，42(20)：38-44.

(CHEN Li，WANG Bei-bei，HUANG Jun-hui，et al.Incremental distribution network investment strategy after the implementation of the power grid company’s guaranteed service [J].Automation of Electric Power Systems，2018，42(20)：38-44.)

[2]胡诗尧，安佳坤，韩璟琳，等.基于一致性算法的智能电网储能单元分布式调度策略 [J].沈阳工业大学学报，2019，41(4)：372-377.

(HU Shi-yao，AN Jia-kun，HAN Jing-lin，et al.Distributed scheduling strategy of smart grid energy sto-rage units based on consistency algorithm [J].Journal of Shenyang University of Technology，2019，41(4)：372-377.)

[3]李泽文，胡让，刘湘，等.基于PCA-DBILSTM的多因素短期负荷预测模型 [J].电力系统及其自动化学报，2020，32(12)：32-39.

(LI Ze-wen，HU Rang，LIU Xiang，et al.Multi-factor short-term load prediction model based on PCA-DBILSTM [J].Proceedings of the CSU-EPSA，2020，32(12)：32-39.)

[4]许言路，武志锴，朱赫炎，等.基于多尺度卷积神经网络的短期电力负荷预测 [J].沈阳工业大学学报，2020，42(6)：618-623.

(XU Yan-lu，WU Zhi-kai，ZHU He-yan，et al.Short-term power load forecasting based on multi-scale convolutional neural network [J].Journal of Shenyang University of Technology，2020，42(6)：618-623.)

[5]余登武，刘敏.基于深度卷积神经网络与支持向量机的变电站非侵入式负荷分解 [J].电力科学与工程，2020，36(6)：24-30.

(YU Deng-wu，LIU Min.Non-invasive load decomposition of substation based on deep convolutional neural network and support vector machine [J].Electric Power Science and Engineering，2020，36(6)：24-30.)

[6]李鹏辉，崔承刚，杨宁，等.基于ARIMA-LSTM组合模型的楼宇短期负荷预测方法研究 [J].上海电力学院学报，2019，35(6)：573-579.

(LI Peng-hui，CUI Cheng-gang，YANG Ning，et al.Research on short-term building load forecasting method based on ARIMA-LSTM combination model [J].Journal of Shanghai University of Electric Power，2019，35(6)：573-579.)

[7]艾欣，杨子豪，胡寰宇，等.基于改进K-means算法的VPP负荷曲线聚类方法及应用 [J].电力建设，2020，41(5)：28-36.

(AI Xin，YANG Zi-hao，HU Huan-yu，et al.A load curve clustering method based on improved K-means algorithm for virtual power plant and its application [J].Electric Power Construction，2020，41(5)：28-36.)

[8]赵凯，侯玉强.基于自组织映射神经网络K-means聚类算法的风电场多机等值建模 [J].浙江电力，2019，38(8)：30-36.

(ZHAO Kai，HOU Yu-qiang.Multi-machine equivalent modeling of wind farms using SOM-based K-means clustering [J].Zhejiang Electric Power，2019，38(8)：30-36.)

[9]史静，南开辉，周琪，等.大数据环境下基于K-means聚类算法的分组负荷预测研究 [J].电力大数据，2020，23(6)：9-16.

(SHI Jing，NAN Kai-hui，ZHOU Qi，et al.Research on classification load forecasting based on K-means clustering algorithm in big data environment [J].Power Systems and Big Data，2020，23(6)：9-16.)

[10]陶洋，邓行，杨飞跃，等.基于DTW距离度量的层次聚类算法 [J].计算机工程与设计，2019，40(1)：116-121.

(TAO Yang，DENG Xing，YANG Fei-yue，et al.Hierarchical clustering algorithm based on DTW distance measurement [J].Computer Engineering and Design，2019，40(1)：116-121.)

[11]陈海涛，杨军，施迎春，等.基于云模型与马尔科夫链的继电保护装置寿命预测方法 [J].电力系统保护与控制，2019，47(16)：94-100.

(CHEN Hai-tao，YANG Jun，SHI Ying-chun，et al.Life prediction method of relay protection device based on could model and Markov Chain [J].Power System Protection and Control，2019，47(16)：94-100.)

[12]Hochreiter S，Schmidhuber J.Long short-term memory [J].Neural Computation，1997，9(8)：1735-1780.

[13]赵会茹，赵一航，郭森.基于互补集合经验模态分解和长短期记忆神经网络的短期电力负荷预测 [J].中国电力，2020，53(6)：48-55.

(ZHAO Hui-ru，ZHAO Yi-hang，GUO Sen.Short-term load forecasting based on complementary ensemble empirical mode decomposition and long short-term memory [J].Electric Power，2020，53(6)：48-55.)

[14]钱甜甜，王珂，徐立中，等.基于双向长短时记忆网络的母线负荷分解方法 [J].电力工程技术，2020，39(6)：104-109.

(QIAN Tian-tian，WANG Ke，XU Li-zhong，et al.The bus load decomposition method based on bidirectional long short-term memory model [J].Electric Power Engineering Technology，2020，39(6)：104-109.)

Short-term building power load forecasting method based on DTW-LSTM

ZHANG Ming-li1,2a, ZHANG Ming-hui2b, WANG Yong2a, WU Zhi-kai2b, MAN Lin-kun2a

(1. Software College, Northeastern University, Shenyang 110169, China; 2a. Economic Research Institute, 2b. Financial Assets Department, State Grid Liaoning Electric Power Co.Ltd., Shenyang 110015, China)

Abstract： In order to improve the accuracy of building power load forecasting and solve the problem of poor clustering effect of traditional clustering algorithms on building electricity consumption curves, a short-term building power load forecasting model based on DTW-LSTM was proposed. A DTW clustering algorithm was used to cluster and code the daily electricity consumption curves of buildings, and the building electricity consumption behavior was analyzed. According to the encoding of daily building electricity consumption curve for ten days, the Markov chain model was used to predict the electricity consumption curve encoding for one forthcoming day, and the prototype of electricity consumption curve was obtained. The obtained encoding was employed as characteristics to predict the short-term power load of buildings in combination with historical electricity consumption data. The results show that the clustering results with as-proposed method are more reasonable, compared with the traditional clustering algorithms, and the forecasting accuracy also gets improved.

Key words： DTW clustering algorithm; power load forecasting; Markov chain model; long and short term memory network; electricity consumption data; forecasting accuracy; electricity consumption curve; short-term load

收稿日期： 2021-03-11.

基金项目：辽宁省自然科学基金项目(2019-MS-112)；中央高校基本科研业务专项资金项目(N2017001)；国家电网科技项目(SGLNJY00ZLJS2000091).

作者简介：张明理(1978-)，男，辽宁沈阳人，高级工程师，博士，主要从事电力系统运行与控制等方面的研究.

*本文已于2021-07-14 12∶06在中国知网优先数字出版. 网络出版地址： http：∥kns.cnki.net/kcms/detail/21.1189.T.20210713.1448.034.html

doi：10.7688/j.issn.1000-1646.2021.04.01

中图分类号： TM 715

文献标志码： A

文章编号： 1000-1646(2021)04-0361-07

(责任编辑：景勇英文审校：尹淑英)