(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114611738 A(43)申请公布日 2022.06.10
(21)申请号 202011441261.9(22)申请日 2020.12.08
(71)申请人 南京工程学院
地址 211167 江苏省南京市江宁区科技园
弘景大道1号南京工程学院(72)发明人 卞海红 钟怡群 徐国政 (74)专利代理机构 南京源古知识产权代理事务
所(普通合伙) 32300
专利代理师 郑宜梅(51)Int.Cl.
G06Q 10/04(2012.01)G06Q 10/06(2012.01)G06Q 50/06(2012.01)G06K 9/62(2022.01)G06N 3/08(2006.01)
权利要求书2页 说明书5页 附图2页
(54)发明名称
一种基于用户用电行为分析的负荷预测方法
(57)摘要
本发明公开了一种基于用户用电行为分析的负荷预测方法,涉及用电信息采集系统应用技术领域,其技术方案要点是:提取用户的特征向量,A类用户的负荷曲线同时含有日相关、时间邻近相关两种特性,B类用户的负荷曲线只有日相关特性。利用FCM算法对已经分类A、B两类用户进行相似日选取工作,对于A类用户,利用步骤(3)介绍方法计算出待预测日d+1时刻的局部相似序列,将选取的局部相似序列与前d点
历史负
荷值作为用户信息集,B类用户只具有日相关性,利用FCM算法计算出相似差最小的局部相似序列,并作为用户信息集,利用时序数据提高负荷预测模型精度,提高用户的预测模型精度。
CN 114611738 ACN 114611738 A
权 利 要 求 书
1/2页
1.一种基于用户用电行为分析的负荷预测方法,其特征在于,包括以下步骤:(1)用户历史负荷数据:通过数据采集模块采集不同地域的用户负载的用电数据,分析用户的用电行为特征,寻找用户负荷曲线与时序相关性,并用K‑means算法将用户聚为A、B两类,A类用户同时具有时间邻近相关性与日相关性,B类用户仅具有日相关性;
(2)数据预处理:对用户数据进行数据预处理,对于失真或者缺失的异常数据本文采取水平平滑法进行处理,即利用异常值的前16个邻近数据点的平均值替换异常值;
(3)K‑means聚类分析:结合数据资源维度,建立客户用电行为指标体系,基于客户属性和数据分布,制定客户指标计算规则,将客户用电行为指标转化为标签,采用k‑means算法模块对形成的客户标签系列进行聚类,得到典型客户群体分类,并重新划分用户负载的用电评价等级;
(4)改进FCM算法,定义历史日与待预测日的相似差
式中:Dk表示
目标矢量x0与样本矢量xk的相似差;μμi,0表示目标矢量x0属于第i类聚类原型的隶属度;i,k表示样本矢量xk属于第i类聚类原型的隶属度;
(5)选取相似历史负荷序列,在目标序列与历史负荷序列的比较中,目标序列取值为待预测时刻t+1的前d个负荷点,为了缩短神经网络训练时间,本文在近n个历史日中选取相似度较高的m个同时段历史负荷作为局部相似序列Li,t,其中:L0,t={lo,t‑d+1,lo,t‑d+2,…lo,t},lo,t‑d+1表示待预测日t‑d+1时刻历史负荷值;Li,t={li,t‑d+1,li,t‑d+2,…li,t},i=1,2,…m,li,t‑d+1表示第i日t‑d+1时刻历史负荷值,利用步骤(2)中公式计算出相似差最小的m个历史负荷序列作为局部相似序列;
(6)提取用户的特征向量,A类用户的负荷曲线同时含有日相关、时间邻近相关两种特性,B类用户的负荷曲线只有日相关特性。利用FCM算法对已经分类A、B两类用户进行相似日选取工作,对于A类用户,利用步骤(3)介绍方法计算出待预测日d+1时刻的局部相似序列,将选取的局部相似序列与前d点L0,t历史负荷值作为用户信息集,B类用户只具有日相关性,利用FCM算法计算出相似差最小的局部相似序列,并作为用户信息集;
(7)利用
得到局部相似日中各组样本的负荷变化率,然后利用公式计算得待预测时刻的负荷数据,其中
刻的负荷变化率,它由公式
为待预测日t+1时计算得到;
(8)对于A类用户将得到的负荷变化率及邻近时刻负荷值作为BP训练样本,B类用户只取负荷变化率作为BP训练样本,通过BP神经网络计算得出待预测日的负荷数据。
2.根据权利要求1所述的一种基于用户用电行为分析的负荷预测方法,其特征是:步骤(2)还包括:对异常数据处理完毕后,利用
将所有负荷数据进行归一化处
理。
3.根据权利要求1所述的一种基于用户用电行为分析的负荷预测方法,其特征是:步骤(3)还包括数据修复方法,所述数据修复方法针对负荷数据的横向相似性,利用K‑means算法对每个用户的日负荷曲线进行聚类,得到聚类中心即负荷特征曲线,以此为基准对日24/
2
CN 114611738 A
权 利 要 求 书
2/2页
96点负荷曲线数据进行坏数据的位置识别与处理。
4.根据权利要求3所述的一种基于用户用电行为分析的负荷预测方法,其特征是:对所述K‑means算法做出优化,消除聚类数目初始值的选择对聚类效果的影响。
5.根据权利要求1所述的一种基于用户用电行为分析的负荷预测方法,其特征是:所述步骤(1)还包括:数据过滤模块对数据存储模块中的用户历史负荷数据进行过滤。
6.根据权利要求5所述的一种基于用户用电行为分析的负荷预测方法,其特征是:所述数据过滤模块包括剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据。
7.根据权利要求1所述的一种基于用户用电行为分析的负荷预测方法,其特征是:所述步骤(1)中的地域可具体分为工业区和非工业区。
8.根据权利要求1所述的一种基于用户用电行为分析的负荷预测方法,其特征是:所述步骤(1)中数据采集模块采集到的用户负载的用电数据还包括该区域内的用电时间段和该时间段内的用电总时间。
9.根据权利要求1所述的一种基于用户用电行为分析的负荷预测方法,其特征是:步骤(3)中的所述k‑means算法模块采用电行为指标体系作为相似性的评价指标,即认为两个对象的电行为指标体系越近,其相似度就越大。
3
CN 114611738 A
说 明 书
一种基于用户用电行为分析的负荷预测方法
1/5页
技术领域
[0001]本发明涉及用电信息采集系统应用技术领域,更具体地说,它涉及一种基于用户用电行为分析的负荷预测方法。
背景技术
[0002]负荷预测是电力部门的重要工作内容之一,在电力系统规划、运行、调度中有着重要作用,准确的负荷预测结果能够保证电力系统的可靠、经济运行。[0003]在负荷预测技术发展早期,负荷预测方法主要为传统预测法,一般包括自回归滑动平均法、回归分析法、卡尔曼滤波法和指数平滑法等,这些方法都是通过分析输入和输出之间的线性关系来建立预测模型并进行预测,在负荷保持稳定的前提下,这些方法能快速有效的得到预测结果。[0004]但是,伴随着智能电表的接入,用户数据海量增加,数据复杂程度不断加大,单个用户用电的波动性和随机性较大,系统级负荷预测方法在单个用户的负荷预测上的预测性能较差,无法满足电网精益化管理的需求。发明内容
[0005]本发明的目的是提供一种基于用户用电行为分析的负荷预测方法,利用时序数据提高负荷预测模型精度,提高用户的预测模型精度。
[0006]本发明的上述技术目的是通过以下技术方案得以实现的:一种基于用户用电行为分析的负荷预测方法,包括以下步骤:(1)用户历史负荷数据:通过数据采集模块采集不同地域的用户负载的用电数据,分析用户的用电行为特征,寻找用户负荷曲线与时序相关性,并用K‑means算法将用户聚为A、B两类,A类用户同时具有时间邻近相关性与日相关性,B类用户仅具有日相关性;[0007](2)数据预处理:对用户数据进行数据预处理,对于失真或者缺失的异常数据本文采取水平平滑法进行处理,即利用异常值的前16个邻近数据点的平均值替换异常值;[0008](3)K‑means聚类分析:结合数据资源维度,建立客户用电行为指标体系,基于客户属性和数据分布,制定客户指标计算规则,将客户用电行为指标转化为标签,采用k‑means算法模块对形成的客户标签系列进行聚类,得到典型客户群体分类,并重新划分用户负载的用电评价等级;
[0009]
(4)改进FCM算法,定义历史日与待预测日的相似差
式中:Dk
表示目标矢量x0与样本矢量xk的相似差;μi,0表示目标矢量x0属于第i类聚类原型的隶属度;
μi,k表示样本矢量xk属于第i类聚类原型的隶属度;[0010](5)选取相似历史负荷序列,在目标序列与历史负荷序列的比较中,目标序列取值为待预测时刻t+1的前d个负荷点,为了缩短神经网络训练时间,本文在近n个历史日中选取相似度较高的m个同时段历史负荷作为局部相似序列Li,t,其中:L0,t={lo,t‑d+1,lo,t‑d+2,…
4
CN 114611738 A
说 明 书
2/5页
lo,t},lo,t‑d+1表示待预测日t‑d+1时刻历史负荷值;Li,t={li,t‑d+1,li,t‑d+2,…li,t},i=1,2,…m,li,t‑d+1表示第i日t‑d+1时刻历史负荷值,利用步骤(2)中公式计算出相似差最小的m个历史负荷序列作为局部相似序列;[0011](6)提取用户的特征向量,A类用户的负荷曲线同时含有日相关、时间邻近相关两种特性,B类用户的负荷曲线只有日相关特性。利用FCM算法对已经分类A、B两类用户进行相似日选取工作,对于A类用户,利用步骤(3)介绍方法计算出待预测日d+1时刻的局部相似序列,将选取的局部相似序列与前d点L0,t历史负荷值作为用户信息集,B类用户只具有日相关性,利用FCM算法计算出相似差最小的局部相似序列,并作为用户信息集;
[0012]
(7)利用得到局部相似日中各组样本的负荷变化率。最后利用计算得待预测时刻的负荷数据,其中
为待预测日t+计算得到;
公式
1时刻的负荷变化率,它由公式
[0013]
(8)对于A类用户将得到的负荷变化率及邻近时刻负荷值作为BP训练样本,B类用
通过BP神经网络计算得出待预测日的负荷数据。户只取负荷变化率作为BP训练样本,
优选地,步骤(2)还包括:对异常数据处理完毕后,利用
将所有负
[0014]
荷数据进行归一化处理。
[0015]优选地,步骤(3)还包括数据修复方法,所述数据修复方法针对负荷数据的横向相似性,利用K‑means算法对每个用户的日负荷曲线进行聚类,得到聚类中心即负荷特征曲线,以此为基准对日24/96点负荷曲线数据进行坏数据的位置识别与处理。[0016]优选地,对所述K‑means算法做出优化,消除聚类数目初始值的选择对聚类效果的影响。
[0017]优选地,所述步骤(1)还包括:数据过滤模块对数据存储模块中的用户历史负荷数据进行过滤。
[0018]优选地,所述数据过滤模块包括剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据。[0019]优选地,所述步骤(1)中的地域可具体分为工业区和非工业区。[0020]优选地,所述步骤(1)中数据采集模块采集到的用户负载的用电数据还包括该区域内的用电时间段和该时间段内的用电总时间。[0021]优选地,步骤(3)中的所述k‑means算法模块采用电行为指标体系作为相似性的评价指标,即认为两个对象的电行为指标体系越近,其相似度就越大。[0022]综上所述,本发明达到的有益效果是:利用时序数据提高负荷预测模型精度,提高用户的预测模型精度。
附图说明
[0023]图1是本实施例南京某地区5个随机用户一周负荷曲线;[0024]图2是本实施例的技术方案流程图;
[0025]图3是本实施例A类用户和B类用户预测曲线对比图;
5
CN 114611738 A[0026]
说 明 书
3/5页
图4是本实施例聚类效果对比图。
具体实施方式
[0027]以下结合附图对本发明作进一步详细说明。[0028]一种基于用户用电行为分析的负荷预测方法,包括以下步骤:(1)用户历史负荷数据:通过数据采集模块采集不同地域的用户负载的用电数据,分析用户的用电行为特征,寻找用户负荷曲线与时序相关性,并用K‑means算法将用户聚为A、B两类,A类用户同时具有时间邻近相关性与日相关性,B类用户仅具有日相关性,其中地域可具体分为工业区和非工业区;[0029](2)数据预处理:对用户数据进行数据预处理,对于失真或者缺失的异常数据本文
即利用异常值的前16个邻近数据点的平均值替换异常值;采取水平平滑法进行处理,
[0030](3)K‑means聚类分析:结合数据资源维度,建立客户用电行为指标体系,基于客户属性和数据分布,制定客户指标计算规则,将客户用电行为指标转化为标签,采用k‑means算法模块对形成的客户标签系列进行聚类,得到典型客户群体分类,并重新划分用户负载的用电评价等级;
[0031]
(4)改进FCM算法,定义历史日与待预测日的相似差
式中:Dk
表示目标矢量x0与样本矢量xk的相似差;μi,0表示目标矢量x0属于第i类聚类原型的隶属度;
μi,k表示样本矢量xk属于第i类聚类原型的隶属度;[0032](5)选取相似历史负荷序列,在目标序列与历史负荷序列的比较中,目标序列取值为待预测时刻t+1的前d个负荷点,为了缩短神经网络训练时间,本文在近n个历史日中选取相似度较高的m个同时段历史负荷作为局部相似序列Li,t,其中:L0,t={lo,t‑d+1,lo,t‑d+2,…lo,t},lo,t‑d+1表示待预测日t‑d+1时刻历史负荷值;Li,t={li,t‑d+1,li,t‑d+2,…li,t},i=1,2,…m,li,t‑d+1表示第i日t‑d+1时刻历史负荷值,利用步骤(2)中公式计算出相似差最小的m个历史负荷序列作为局部相似序列;[0033](6)提取用户的特征向量,A类用户的负荷曲线同时含有日相关、时间邻近相关两种特性,B类用户的负荷曲线只有日相关特性。利用FCM算法对已经分类A、B两类用户进行相似日选取工作,对于A类用户,利用步骤(3)介绍方法计算出待预测日d+1时刻的局部相似序列,将选取的局部相似序列与前d点L0,t历史负荷值作为用户信息集,B类用户只具有日相关性,利用FCM算法计算出相似差最小的局部相似序列,并作为用户信息集;
[0034]
(7)利用得到局部相似日中各组样本的负荷变化率。最后利用计算得待预测时刻的负荷数据,其中
为待预测日t+计算得到;
公式
1时刻的负荷变化率,它由公式
[0035]
(8)对于A类用户将得到的负荷变化率及邻近时刻负荷值作为BP训练样本,B类用户只取负荷变化率作为BP训练样本,通过BP神经网络计算得出待预测日的负荷数据。[0036]所述步骤(1)还包括:数据过滤模块对数据存储模块中的用户历史负荷数据进行过滤,述数据过滤模块包括剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前
6
CN 114611738 A
说 明 书
4/5页
后浮动较大的数据。
[0037]所述步骤(1)中数据采集模块采集到的用户负载的用电数据还包括该区域内的用电时间段和该时间段内的用电总时间。
[0038]
步骤(2)还包括:对异常数据处理完毕后,利用将所有负荷数据进
行归一化处理。
[0039]步骤(3)还包括数据修复方法,所述数据修复方法针对负荷数据的横向相似性,利用K‑means算法对每个用户的日负荷曲线进行聚类,得到聚类中心即负荷特征曲线,以此为基准对日24/96点负荷曲线数据进行坏数据的位置识别与处理。
[0040]步骤(3)中的所述k‑means算法模块采用电行为指标体系作为相似性的评价指标,即认为两个对象的电行为指标体系越近,其相似度就越大,对所述K‑means算法做出优化,消除聚类数目初始值的选择对聚类效果的影响。
[0041]本发明达到的有益效果是利用时序数据提高负荷预测模型精度,提高用户的预测模型精度。[0042]实施例
[0043]一种基于用户用电行为分析的负荷预测方法,包括以下步骤:(1)用户历史负荷数据:本发明采用南京某地区随机选取的200个用户进行短期负荷预测,训练集为2018年1月1日8月1日负荷数据,测试集为2018年8月2日至8月31日负荷数据;[0044]如图1所示,分析用户的用电行为特征,寻找用户负荷曲线与时序相关性,并用K‑means算法将用户聚为A、B两类。A类用户同时具有时间邻近相关性与日相关性;B类用户仅具有日相关性。图1为南京某地区5个随机用户一周的负荷曲线,每30分钟记录一个点;[0045](2)数据预处理:对用户数据进行数据预处理,对于失真或者缺失的异常数据本文采取水平平滑法进行处理,即利用异常值的前16个邻近数据点的平均值替换异常值;[0046](3)用K‑means算法将200个用户按时间相关性分为A、B两类。其中A类用户为负荷日相关且时间邻近相关;B类用户仅为日相关。最终200个用户聚类结果为127个A类、73个B类,随机展示其中15个用户,如表1所示;[0047]表1 用户聚类结果
[0048]
(4)预测曲线对比图,如图3所示,采用本专利模型对200个用户进行预测;[0050](5)如图4所示,将聚类与未聚类FCM‑BP模型进行对比;[0051](6)如图2所示,对于A类用户将得到的负荷变化率及邻近时刻负荷值作为BP训练样本,B类用户只取负荷变化率作为BP训练样本,通过BP神经网络计算得出待预测日的负荷
7
[0049]
CN 114611738 A
说 明 书
5/5页
数据。
通过上述预测曲线对比图可以看出,本发明所提模型对于提高用户级负荷预测模
型精度效果显著。
[0053]以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
[0052]
8
CN 114611738 A
说 明 书 附 图
1/2页
图1
图2
9
CN 114611738 A
说 明 书 附 图
2/2页
图3
图4
10