关键词:电力侧大数据分析;并行负荷预测;云计算;数据的交互性
引言电力用户作为智能主体,在电网需求中起了重要的作用。对于电力用户侧大数据实时的采集,传输和存储,还有庞大的历史数据进行有效而快速的分析。这些大数据不仅仅包括智能电表收集的用电量,还有各类传感器按照固定频率采集的温度、天气、湿度、地理信息和风速信息等。用户测数据复杂程度增大,数据存储规模将从目前的GB级增长到TB级,甚至PB级,逐步构成了用户侧大数据。而针对这些数据的分析支撑着智能电网的可靠安全地运行,对这些数据的分析具有跨时代的意义。
1电力用户侧大数据特点
如何对电力用户侧大数据进行快速准确的分析,是当前电力电工系统面临的重要问题之一。各式各样传感器的普及及智能家电的使用,导致电力用户侧大数据分析的任务量加大。据不完全统计,截止2013年1月,我国智能电表的覆盖率达到40%,直供直管的智能电表覆盖率达到55%。智能家电随着物联网时代的到来及大数据精简时代的进步,逐渐出现在更多的家庭当中。电力用户侧大数据的特点如下:
(1)数据量大。根据调查,美国的太平洋天然气电力公司,每个月要从900万个智能电表中抽取出3TB的数据资料,每年的数据存储量高达39TB。例如,一个地区有5000个传感器终端,每个传感器按照5min的间隔来进行一次数据采集,那么每个月的数据收集量将达到4.6TB,而每年产生的数据将达到0.5PB[1]。
(2)数据结构类型繁多。随着各类的数据传感器广泛应用,数据收集由原来的单一类型,变成了现在复杂的类型。数据的收集包括:各种结构化数据收集、半结构化数据收集、非结构化数据收集。这些数据经过采集、传输、存储、发展形成了多元化的数据结构。
(3)数据的交互性。数据的交互性是智能电网的一个重要特性。目前,基于信息化技术平台的云计算是解决大数据管理的重要技术支撑。现阶段大数据管理与并行处理的主流技术是开源Hadoop技术。该技术具有强大的扩展能力和较高的可靠性,对于大数据的管理有着重要的现实意义。
2电力用户侧大数据分析
智能电表的广泛运用于各个领域,各类传感器的普及,智能家电(比如智能化冰箱,洗衣机灯智能电器的普及)和各类消费模式的改变。这三个方面是电力用户侧大数据的主要来源。智能电表也是得到了全国普及,从往年的智能电表的覆盖率中看出,从2016年1月份就达到60.2%,智能家电也在普通家庭中得到了普及。所以结合以上的数据我们可以看出电力用户侧大数据有以下特点。
2.1数据量大
随着电网智能化程度的加深,人们精确和标准化的计算这些数据,这些数据的维度也发生的变化。人们采集种类的增多,数据量快速增长,历史的数据再也难以满足复杂数据的分析。
2.2数据结构类型繁多
各种结构化数据、半结构化数据和非结构化数据是各类传感器收集的数据的重要组成部分。这三个数据结构类型是传感器的典型组成部分。
2.3速度快
电力用户数据指数级的增长,其速度之快令人始料未及。电力系统中的高级应用不仅需要对现在搜集的信息进行分析,还需要对海量的历史数据进行离线分析处理,这些需要往往要求数据平台能够提供并行化的海量历史数据批处理的能力,并且能够快速传输与存储采集到的新数据。
2.4数据的交互性
交互性也是智能电网的又一个特征,通过和用户的交互实现智能用电,以及和各行业的数据相互的融合,才能更深层次的挖掘分析进行电力负荷预测。更深层次的挖掘分析电力负荷预测中最难的一个方面是由于数据的交互性,这样让数据更庞大、更复杂,对于我们负荷预测增加了难度。我们要从这个方面着手才能有所突破。
3并行负荷预测
3.1电力负荷预测
预测常用的方法,主要有决策树、极限学习和遗传算法等。这几种短期负荷预测常见的方法存在不足。随着大数据的产生,这几种方法难以满足大数据统计的需求。像我们熟悉的云计算技术,在各个领域得到了广泛的应用,在外面的电力系统也可以用到。针对智能电网中负荷数据的一些特征,云计算技术,极限学习进行负荷预测,使其具有分布式能力和多Agent思想,提升了负荷预测算法预测准确率和速度。以上方法取得了相应的研究成果。
3.2并行处理
负荷、温度、风速等数据进行并行化分析,人们提出基于随机森林算法的并行负荷预测方法。利用随机森林算法进行并行化,可以大大地缩短负荷预测时间和提高随机森林算法对大数据的处理能力。通过数据集群和管理、数据管理和预测分类算法库等功能。针对大大小小的数据集进行负荷测试试验,并行化随机森林算法进行负荷预测试验。这种方法也是目前应用于负荷预测用的得比较多的一种方法。相比传统的计算方法,并行化随机森林算法的预测精度不管是在预测的精度,还是在预测的准确性也得到了明显的提高。对于庞大的电力用户测数据能够较好的进行了分析处理。可以结合智能负荷预测方法,较多的智能算法被引入并应用到负荷预测工作当中。这些智能负荷预测方法发展主要分为两个方面。一种是新型的数学方法的应用;另一种是从负荷原理上着手。从原理上改进这些负荷预测。面对庞大的电力用户数据分析也可以使用云计算来并行负荷预测。利用互联网知识,利用云端技术对于这些数据进行分析和处理,从而得出对于大数据库数据的分析。这样相对于传统的计算方法来的更快捷和方便,计算速度很快,数据的准确性也得到了提高。
4结语
本文主要是通过分析电力用户侧大数据的特征,提出了并行负荷预测的方法,主要是除了传统的计算方法,也可以结合随机森林算法来预测,利用现代化的云端技术对于这些数据的分析,对历史庞大的数据和现在智能化数据的分析。这三者并行化处理,可以得到负荷预测,对于我们电力系统的分析起了很大的作用。我们还要从很多方面来提高这种计算的准确性,以后是我们重点要研究的课题,也许面对将来更巨大的电力用户侧数据还需要更多更好的方法来计算。
参考文献
[1]黄庆仕,陈冬沣,肖建华.电力用户侧大数据分析与并行负荷预测研究[J].自动化应用,2016(11).
[2]马坤隆.基于大数据的分布式短期负荷预测方法[D].湖南大学,2014.
[3]王德文,孙志伟.电力用户侧大数据分析与并行负荷预测[J].中国电机工程学报,2015(3).