基于时间序列建模的电力营销客户交易行为分析*

方正云,杨 捷,杨 泓,廖洁萍,段明明

(中国南方电网 云南电网有限责任公司,昆明 650011)

摘 要: 针对电力系统对客户服务的效率低、针对性差的问题,提出了一种采用云模型、离散余弦变换和反向传递神经网络的客户分类算法.通过云模型提取价格敏感度、投诉率、欠费率、销售变现天数以及忠诚度的变化波动情况的云测度,结合余弦变换计算得到特征向量,输入反向传递神经网络训练,从而得到自动客户分级识别的模型.结果表明,提出的模型可以有效实现客户分级以及销售状况评估,其平均检测精确度可达95%以上.

关 键 词: 云模型; 云测度; 离散余弦变换; 价格敏感度; 投诉率; 欠费率; 销售变现天数; 忠诚度; 决策支持

电力服务单位通过电力营销实现创收增利.为了满足社会公众的需求,电力商品与其附加服务的生产、输送、分配、销售贯穿整个营销过程.随着市场变化以及服务模式的转变,我国电力服务单位的营销模式也需在新的形势下做出变革.改革主要体现两方面:一方面要进行电力体制改革和智能电网建设;另一方面要兼顾电力市场需求和客户满意度.新模式下的电力营销需要增供扩销,扩大客户服务的功能,确定不同客户群体对电力电能的消费和使用能力,从而起到引导电力服务单位生产、运营的作用.因此,通过分析不同客户的用电消费行为模式,制定针对性的运营策略,判断和分析营销状态,提出客观、即时、准确地决策意见对于提高电力单位在能源市场中的配额,创造更多的经济以及社会效益意义重大[1-5].

针对电力营销中客户行为的风险评估和建模,由于同时涉及客户行为影响力以及克服心理反应的建模,需要使得营销分析更符合人类认知模式,即实际接触客户行为的随机性和模糊性,从而实现对电力营销状态的精准评估.本文基于模糊集理论和概率论云模型[6-7]来定量描述电力营销客户对象的行为,并对价格敏感度、投诉率、欠费率、销售变现天数以及忠诚度这5个参数的变化波动情况进行离散余弦变换,再利用云建模并结合云测度定量化描述每个客户在营销过程中的特征.同时结合聚类或者分类算法实现客户分级与销售状况评估,为电力营销管理决策提供支持.

1 现有技术与云模型

利用适当的营销服务调整来创造价值,近年来受到电力服务单位越来越多的关注.研究着眼点包括对电力营销目标市场和供电企业营销状态的动态分析评价,对售电量及其影响事件的因素分析挖掘,对电力客户实时履约能力判断以及对供电企业营销业绩效果考核等.其引用的评估手段从类别上可以大致划分为3种,分别为基于模糊集理论、基于概率论与数理统计以及人工智能技术.采用的分析模型涉及模糊评判法、物元模型、聚类技术、因素关联模型、排序算法、主成分分析法、神经网络算法以及熵权法等.然而,目前市场电力服务单位营销数据在表征方式、类别等特性上均存在明显的差异.营销分析评估在具体实施时存在难以量化、采用数据定性分析困难的情况,这主要是由于大多营销策略均是采用自然语言描述的,具有天然模糊性和不确定性.然而,基于模糊集理论的评价方法容易忽略隶属函数本身的不确定性,且隶属度函数的构造和生成因为使用者的偏好而存在不同,从而容易降低对评价对象认知的客观性.单纯使用概率统计理论方法,虽然在建模和分析难度上最低,却难以有效量化自然语言描述的各种概念.通过人工智能方式得到的分析结果虽然对样本组成的鲁棒性更强,但中间生成的参数和模型的实际物理意义难以明确,且参数调整和建模本身难度更高,在实际使用中,计算代价以及硬件成本也较为昂贵[8-11].

云模型是通过统计分布去定量化描述一个定性概念,其中,定性概念C的任意一次随机出现可以表示为x,也称为一个云滴.x对C的确定度为u(x),u(x)属于0~1自然分布中的随机数,x在论域上的分布即生成一个云模型,进一步通过计算云期望J及熵I来描述其基本特性.超熵L是云模型特有的数字特征,是熵I的不确定性度量.云期望、熵以及超熵也是云模型中最常用的云测度.

在进行连续统计过程中,电力营销客户购买行为表现出的价格敏感度、投诉率等可以被用来云建模.每一次行为的实施相当于一个云滴,而对这些云滴进行统计拟合分析,便可建立起对应每个观察变量的云模型.与采用单一正态云模型有所不同,本文对于每个观测变量均采用多元正态云模型建立,其数学模型表示为x~N(JI*TI*),其中,I*~N(ILTL),x的确定度表示模型为

2 离散余弦变换

离散余弦变换是将待分析数据投影到一组余弦正交基上的变化方法.采用其对随时间变化的用户数据进行处理主要是因为余弦变换能够有效地将反映波动变化的数据成分分量与偶然的数据有效分离,且通过变换后,数据整体的能量变得更加集中,反应出的数值特点也更加容易通过统计等分析进行处理[12-13].X表示一个客户行为采样信号,对应的离散余弦变换矩阵为BB为一个M×M的变换矩阵,则对应的离散余弦变换为

Y=BX

(1)

式中,其中,

变换得到的向量Y=(y1,y2,…,yn),其中,

3 反向传播神经网络算法

云测度需要进一步通过适当的聚类/分类模型进行无督导或者督导学习,从而达到识别不同客户类型的目的.神经网络算法作为一种模拟自然信息处理流程的机器学习模型,能够更好地适应多特征融合分类的使用场景,特别是将其模拟为神经元工作方式,每一个神经元对多输入信息加权处理,并叠加整合向下一层进行传递.而层与层之间通过一个开关函数实现非线性传递,利用样本标签信息和实际分类结果之间的误差,构造误差能量与权重之间的损失函数,再通过误差能量对权重系数求导,以一阶梯度为零点,在局部凹函数的假设下,优化得到最佳权重[14-15].

反向传播神经网络算法在实际使用时,一般优先构造生成目标函数,得到实际输出与期望输出的误差均方.在均方误差最小原则下,构造出目标函数的凹解集合,使用梯度下降或者其他寻优算法得到最优权重,获得极小值点.反向传播神经网络一般包括至少一个隐层结构,每个隐含层中具有若干隐单元Vj(j=1,2,…,J0)连接其前向输入单元ξk(k=1,2,…,K)以及后向输出单元Oi(i=1,2,…,I0).定义wjk为从输入单元ξk到隐单元Vj的配置权重系数,从隐单元Vj到输出单元Oi的配置权重系数为Wijω={W,w}用于表示权重系数矩阵;上标μ用于区分输入类型,μ=1,2,…,P;g1和g2为激活函数,实现不同隐含层之间的光滑连续过渡.

对确定输入模式为μ,隐单元j的输入可以表示为

(2)

其后向输出为

(3)

单元i的前向传递输入表示为

(4)

整合传递激活函数得到

(5)

其中,单个单元目标误差函数为

(6)

式中,为特定输入模型μ对应的期望输出.

单元i总误差均方函数表示为

(7)

其中,优化迭代权重的调整方向为梯度的负方向.ω增加变化为ω+Δω,使误差迭代减小,最后收敛得到全局极值点.从隐含单元到输出单元梯度变化表达式为

(8)

式中:η>0为信息增量步长;

从输入单元到隐含单元梯度变化表达式为

(9)

式中,从而更新配置权重系数为

ωnew=ωold+Δω

(10)

梯度下降算法的长调节因子一般是人为确定的,也可以通过共轭梯度或者随机梯度等方式自动生成.例如在模拟退火、蚁群、鸟群等智能优化算法中,其下降步长可以是集群或者多个方向计算得到的平均值,从而提高整体算法的性能和鲁棒性[16].本文所采用的神经网络算法输入变量是客户云模型计算得到的云测度,考虑到实际建模的复杂度和计算代价,采用两层隐含层的结构进行实际配置,生成最后用于分类识别的计算模型.神经元上、下两层之间采用全连接的方式建立其映射路径,激活函数选取软阈值的S形函数.

4 数据采集及结果分析

电力营销客户状态等级可以具体划分为“优、良、中、劣”4个档,对应1~4级.通过云模型分析采集得到的客户数据,并转化生成相应的云测度指标,其中,用户等级划分主要依据专家经验得出.计算评估的数据集合包括了实际采集得到的473例样本,每个样本的时间观测周期为每月一次,连续采集了近5年的数据.因为实际数据中存在部分数据点缺失或者明确记录错误等情况,剔除了其中21例样本,并对剩余的452例样本中的数据点进行了缺失值补充,补充值为该数据点前后数值的加权平均值.

“优、良、中、劣”4档在进行神经网络训练计算过程中,被具体标记为1、2、3、4进行相应的类别划分.在训练计算过程中,训练数据集中采用督导训练的方式,每个类别和它对应的特征分别作为输出和输入.

在进行神经网络计算过程中,每个特征参数的传递连接权重被计算归一化,即权重取值范围为0~1.梯度下降的步长取值范围为10-3~10-5量级.以客户的销售变现天数为示例,图1给出了客户销售变现时间波动趋势图.根据图1可以看出,客户数据在不同时间内存在时变特点,对其进行离散变换,同时分析其数据分布的云模型,得到对应的结果分别如图2、3所示.

图1 客户销售变现时间
Fig.1 Customer sales cash-in time

图2 离散余弦变换结果
Fig.2 Results of discrete cosine transformation

图3 云模型分布
Fig.3 Cloud model distribution

通过图2余弦变换得到的数据结果可知,除了存在一个零频率分量外,在其他周期频率上也存在波动变化,如图2圆形框图中所示.该波动从一定程度上反映出客户行为特点,可以提取作为客户行为分析指标.

图3中每个数据实现即表示一个云滴,可以直观地观测出其行为应属于一个二元混合正态云模型.数据分布在53 d以及54 d上存在双峰,说明了观察数据销售变现天数的统计特性,对应图1具体体现为前一段时间和后一段时间销售变现天数的区别.图3仅仅作为一个示例给出,其它的监测参数也同样存在随时变化的曲线,可以建模生成相应的云滴统计模型.

结合前文提及的计算期望、熵以及超熵计算公式,提取452例样本的云测度以及余弦变换后的波动特征进行对应的分类识别判断.进行50次随机二折交叉验证,每次抽取的训练样本量为所有样本量的一半,采用另外一半样本进行模型结果验证,得到的对比分类测试结果如表1所示.

表1 训练集与测试集对比
Tab.1 Comparison between trainingand testing data sets %

对比集合精确度虚警比例漏检比率训练集94±1.22±0.71±0.4测试集95±3.13±1.04±2.2

从表1可以看出,数据通过云测度提取再经过后向反馈神经网络进行训练后,可以有效区分不同类别的客服数据,其平均检测精确度可达95%以上.

5 结 论

本文提出了采用云模型结合后向反馈神经网络进行电力运营客户交易行为研究的方法.通过云测度连续提取价格敏感度、投诉率、欠费率、销售变现天数以及忠诚度这5个参数的变化波动情况,并将其作为特征向量,输入神经网络中进行训练,最后得到能够进行自动识别的分类模型.通过对电力营销客户状态等级的分类识别,可以有效鉴别出当前服务质量水平以及是否具有改进空间.在得到的分类等级为“中”及以下时,可以及时调整服务方式,加强监督管理,该方法具有良好的推广性.

参考文献

[1]Surana A.Koopman operator framework for time series modeling and analysis [J].Journal of Nonlinear Science,2018,15:1-14.

[2]Kotzur L,Markewitz P,Robinius M,et al.Time series aggregation for energy system design:modeling seasonal storage [J].Applied Energy,2018,213(3):123-135.

[3]曾鸣,甘德一,崔拓伟.基于动态仿真和云模型的发电竞争参数设计研究 [J].电力系统保护与控制,2009,37(20):7-11.

(ZENG Ming,GAN De-yi,CUI Tuo-wei.Research on the design of generation competition parameters based on dynamic simulation and cloud model [J].Power System Protection and Control,2009,37(20):7-11.)

[4]胡江溢,贾俊国,林弘雨,等.售电市场分析与预测指标体系 [J].电力系统自动化,2009,33(2):10-14.

(HU Jiang-yi,JIA Jun-guo,LIN Hong-yu,et al.Market analysis and forecasting index system for electricity sales [J].Power System Automation,2009,33(2):10-14.)

[5]孙晓璐,马静,李渊博,等.基于云模型的电压暂降设备敏感度评估 [J].电力系统保护与控制,2011,39(4):100-104.

(SUN Xiao-lu,MA Jing,LI Yuan-bo,et al.Sensitivity evaluation of voltage sag equipment based on cloud model [J].Power System Protection and Control,2011,39(4):100-104.)

[6]胡涛,王树宗,杨建军.基于云模型的物元综合评估方法 [J].海军工程大学学报,2006,18(1):85-88.

(HU Tao,WANG Shu-zong,YANG Jian-jun.Matter-element comprehensive evaluation method based on cloud model [J].Journal of Naval Engineering University,2006,18(1):85-88.)

[7]李德毅,刘常昱.论正态云模型的普适性 [J].中国工程科学,2004,6(8):28-34.

(LI De-yi,LIU Chang-yu.On the universality of normal cloud model [J].China Engineering Science,2004,6(8):28-34.)

[8]张少敏,栗军,王保义.竞争市场下的电网公司经营风险综合评价模型 [J].电力系统保护与控制,2011,39(8):70-74.

(ZHANG Shao-min,LI Jun,WANG Bao-yi.Comprehensive evaluation model of operation risk of power grid companies in competitive market [J].Power System Protection and Control,2011,39(8):70-74.)

[9]胡向东,李秋实.基于人工鱼群算法优化神经网络的WSN数据融合 [J].重庆邮电大学学报(自然科学版),2018,30(5):614-619.

(HU Xiang-dong,LI Qiu-shi.WSN data fusion based on neural network optimized by artificial fish swarm algorithm [J].Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition),2018,30(5):614-619.)

[10]杨玉颀.基于分段线性模型的专变用户电能配给估计 [J].沈阳工业大学学报,2018,40(2):121-125.

(YANG Yu-qi.Electricity consumption estimation for specific transformer user based on piecewise linear model [J].Journal of Shenyang University of Technology,2018,40(2):121-125.)

[11]麦霭庭,吴裕宙,李朔宇.基于灰色模型的专变用户节能配给研究 [J].电网与清洁能源,2017,33(6):50-53.

(MAI Ai-ting,WU Yu-zhou,LI Shuo-yu.Research on energy-saving allocation of transformer users based on grey model [J].Power Grid and Clean Energy,2017,33(6):50-53.)

[12]杨勰颖,孙曼.基于连续小波分析的多尺度电力需求预测 [J].电网与清洁能源,2017,33(6):67-70.

(YANG Xi-ying,SUN Man.Multi-scale power demand forecasting based on continuous wavelet analysis [J].Power Grid and Clean Energy,2017,33(6):67-70.)

[13]胡柏初,胡刚,胡朝华,等.基于灰色预测的电网基建投资测算模型 [J].电子科技大学学报,2013,42(6):890-894.

(HU Bai-chu,HU Gang,HU Chao-hua,et al.Estimation model of grid infrastructure investment based on grey prediction [J].Journal of University of Electronic Science and Technology of China,2013,42(6):890-894.)

[14]陈宏.基于用户行为模式的电力需求响应建模与实现 [J].电子设计工程,2017,25(6):156-159.

(CHEN Hong.Modeling and implementation of power demand response based on user behavior model [J].Electronic Design Engineering,2017,25(6):156-159.)

[15]Hesamian G,Akbari M G.A semi-parametric model for time series based on fuzzy data [J].IEEE Transac-tions on Fuzzy Systems,2018,9:1-17.

[16]Han M,Zhang S,Xu M,et al.Multivariate chaotic time series online prediction based on improved kernel recursive least squares algorithm [J].IEEE Transac-tions on Cybernetics,2018,3:1-13.

Transaction behavior analysis for power marketing customer based on time series modeling

FANG Zheng-yun, YANG Jie, YANG Hong, LIAO Jie-ping, DUAN Ming-ming

(Yunnan Power Grid Co. Ltd., China Southern Power Grid, Kunming 650011, China)

Abstract In view of low efficiency and poor pertinence of power system for customer service, a customer classification algorithm based on cloud model, discrete cosine transformation and reverse transfer neural network was proposed. The cloud measure of fluctuating situation in price sensitivity, complaint rate, arrears rate, sales cash-in days and loyalty were extracted by a cloud model; eigenvectors were calculated and obtained by cosine transformation; the reverse transfer neural network was input and a model for automatic customer classification and recognition was obtained. The results show that the as-proposed model can effectively achieve customer classification and sales evaluation, and its average detection accuracy can reach more than 95%.

Key words cloud model; cloud measure; discrete cosine transformation; price sensitivity; complaint rate; arrears rate; sales cash-in days; loyalty; decision support

中图分类号: TM 76; TP 393

文献标志码:A

文章编号:1000-1646(2020)02-0127-05

收稿日期 2109-03-22.

基金项目 国家科技重大专项项目(2017YFB213827); 南方电网科技立项项目(YNKJQQ00000275).

作者简介 方正云(1979-),男,云南玉溪人,高级工程师,硕士,主要从事智能电网与电力信息化等方面的研究.

*本文已于2020-03-18 14∶29在中国知网优先数字出版. 网络出版地址: http:∥kns.cnki.net/kcms/detail/21.1189.T.20200317.1458.012.html

doi:10.7688/j.issn.1000-1646.2020.02.02

(责任编辑:景 勇 英文审校:尹淑英)