专利内容由知识产权出版社提供
专利名称:一种基于Spark Streaming的流式大规模电力数据
分析方法
专利类型:发明专利
发明人:黄建平,钱仲文,张旭东,夏洪涛,王文,杨少杰,王政,陈
浩,张建松,沈思琪,正卓凡,毛宾一,吴敏彦,王亿,陈显辉,黄杰,王炎,陈耀军,沈峰,周明磊,纪德良
申请号:CN201910337786.9申请日:20190425公开号:CN110047016A公开日:20190723
摘要:本发明公开了一种基于Spark Streaming的流式大规模电力数据分析方法,步骤如下:第一步,利用SS树进行在线电力数据流的相似性搜索,以对电力数据进行聚类;第二步,改进的Spark并行K均值聚类法对离线电力数据流进行聚类,K均值聚类的聚类中心和类数初始值采用第一步所获得的聚类中心。本发明方法在UCI数据集上的实验评估表明,本发明方法优于传统的K均值聚类算法。同时,通过对用户真实数据集的测试发现,本发明可以快速有效地对用户的电力数据进行聚类。
申请人:国网浙江省电力有限公司,浙江华云信息科技有限公司
地址:310007 浙江省嘉兴市黄龙路8号
国籍:CN
代理机构:北京科亿知识产权代理事务所(普通合伙)
代理人:汤东凤
更多信息请下载全文后查看