负荷的历史纪录总是构成一个时间序列。时间序列指观察和记录到的一组按时间顺序排列的数据。实际数据 的时间序列 , 展示 了研究对象在一定时期内的发展变化过程 , 可以分析和寻找 出它的变化特征、 趋势和发展规律的预测信息。时间序列法用时间来替代影响负荷的因素, 依据负荷过去的统计数据, 通过曲线拟合和参数估计, 找到其随时间变化的规律, 选择适当的模型形式和模型参数以建立预测模型, 利用模型进行预测, 对模型预测值进行评估和修正得到预测结果
目前时间序列法是处理随机序列的基本方法¨ , 具有以下优点: ( 1 ) 原理成熟、 应用简便; ( 2 ) 所需历史数据少、 工作量少。( 3 ) 主要根据过去的负荷值及干扰值来推算未来的负荷, 不需要相关因素的资料, 因而在一些相关因素的预测值和某些常数难以得到时, 是一种有效可行的办法。
时间序列法具有以下缺点: ( 1 ) 对数据的要求较高; ( 2 ) 用线性模型表达负荷之间非线性关系有一定局限性; ( 3 ) 不能方便地考虑天气情况等对负荷有重要影响的相关因素, 只致力于数据的拟合 , 对规律性的处理不足, 只适用于负荷变化比较均匀的短期负荷预测的情况。
时间序列法都完全没有考虑到天气、 社会活动等对负荷的影响, 尤其是温度对负荷的影响, 当气候骤变或有一些特殊的社会活动时, 时间序列法存在着预测不精确的问题。这主要由于该方法存在明显的滞后性, 当最近的实际数据发生异常变化时, 由于模型平滑作用, 预测数据无法随之做出反应, 采用A R MA法进行短期负荷预测研究应着眼于这方面。 1 . 2 灰色理论预测法
灰色预测是一种不严格的系统方法。以灰色系统理论为基础的灰色预测技术, 可在数据不多的情况下找出某个时期内起作用的规律, 建立负荷预测的模型。从一阶常微分方程的解中可以看出, 它要求原始数据序列光滑, 一次累加生成后的数据序列接近指数分布。建立灰色模型首先将原始燃气负荷数据累加生成为近似有指数规律增长的数列, 构造近似的不完全确定的微分方程, 完成灰色建模 。 灰色预测的优点是: ( 1 ) 要求负荷数据少, 建模比较简单, 在数据缺乏时十分有效; ( 2 ) 不考虑分布规律、 不考虑变化趋势; ( 3 ) 运算方便、 短期预测精度高、 易于检验。 灰色预测的缺点是: ( 1 ) 当负荷增长速度较慢,预测精度较高, 较大时, 预测精度变差, 即当数据灰度越大预测精度越差; ( 2 )不太适合负荷的长期预测, 长期预测会大大超过实际值; ( 3 ) 它比较适合具有指数增长规律的负荷的预测。当负荷的增长规律不是指 数型时, 预测精度变差; ( 4 ) 简单灰色预测应用于燃气系统的长期预测时, 会出现增长率过快的问题;( 5 ) 在数据量小的情况下, 极有可能舍去了一些有用信息, 降低预测精度。该方法能根据原始数据的不同特点, 构造出不同的预测模型。对于具体的负荷预测问题, 目前并不存在一种通用的改进模型, 要提高预测精度, 需要针对实际问题的特点选择合适的改进方法或几种改进的组合。灰色神经网络用于燃气日负荷预测的结果表明, 该组合较好地提高收敛速度和预测精度, 简便易行 。但灰色系统理论还不尽完善, 还有待于进一步发展。 1 . 3 回归分析法
回归预测是根据历史数据的变化规律寻找自变量与因变量之问的回归方程式, 确定模型参数, 据此做出预测。回归模型有一元线性回归、 多元线性回归、 非线性回归等回归预测模型。回归分析法从研究燃气负荷与相关因素的相关关系人手, 通过回归分析建立回归模型, 负荷预测, 对过去具有随机性的负荷记录进行拟合, 得到一条确定的曲线, 然后将此曲线外延到适当时刻, 就得到该时刻的负荷预测值。
回归预测的优点是: 预测精度较高, 适用于中、 长期预测。回归预测具有以下缺点: ( 1 ) 规划水平年的工农业总产值很难详细统计; ( 2 ) 用回归分析法只能测箅出综合用负荷的发展水平, 无法测算出负荷发展水平, 也就无法进行具体的建设规划 ; ( 3 ) 不能考虑到燃气负荷逐年递增的情况。
回归分析是一种常用的因果预测模型, 作为影响因素的自变量的选取以及自变量预测值的准确性都非常重要, 在预测时要引入适当的自变量, 否则会加大计算量 , 降低模型的稳定性, 使误差累加到相应的因变量上, 从而造成很大的误差。在系统发生较大变化时, 可以根据相应变化因素修正预测值, 对预测值的误差有一大体把握。对于短期预测来说, 由于燃气数据波动大, 影响因素较复杂, 将直接影响到预测值的准确度, 因此它更适用于长期预测 。
1 . 4 专家系统法
专家系统预测法 ( E x p e r t S y s t e m) 是利用专家丰富经验和权威性进行预测, 是对数据库里存放的过去几年甚至几十年的, 每小时的燃气负荷和天气数据进行分析, 从而汇集有经验的负荷预测人员的知识进行燃气负荷预测。专家系统法是对人类的不可量化的经验进行转化的一种较好方法。专家系统一般由知识库、 综合数据库 、 推理机、 解释程序和知识获取等五部分组成。知识库用以储存专家用以解决燃气负荷预测问题的知识 , 包括各种数学模型; 综合数据库用以储存推理过程中的事实, 存放系统运行中所需的原始数据和生成信息, 主要包括历年气象数据 、 燃气负荷及特殊情况数据和有预测结果的数据信息; 推理机用以控制推理过程, 据综合数据库的状态, 利用知识库知识来实现实际问题求解; 知识获取部分用以建立、 修改编辑、 补充知识库 , 并对其进行一致性、 完整性维护; 解释程序用以说明求解过程, 回答用户问题。其中最主要的是知识库和推理机。一般来说知识库中知识的数量与质量是专家系统性能是否优越的决定性因素。
专家系统法的优点是: ( 1 ) 能汇集多个专家的知识和经验, 最大限度地利用专家的能力; ( 2 ) 占有的资料、 信息多, 考虑的因素也比较全面, 有利于得出较为正确的结论。( 3 ) 较好地避免人为差错 , 具有较为广泛的使用前景。专家系统法的缺点是: ( 1 ) 不具有 自学习能力, 受数据库里存放的知识总量的限制 ; ( 2 ) 对突发性事件和不断变化的条件适应性差。专家系统预测法适用于中长期负荷预测。负荷预测专家系统本身是一个耗时的过程, 它的研制需要较长时间进行原始资料积累和模型修正,开发周期长。且专家系统需要考虑的因素很多, 各种因素以及它们之间的关系很难量化, 因而很难确切地在专家系统中反映。不同的负荷预测专家系统对同样的问题可能有不同的知识或政策, 做出不同的回答, 即使同一个负荷预测专家系统在确定结果时也会因预测人员的不同而不同。 1 . 5 人工神经 网络法
人工神经网络( A N N, A r t i f i c i a l N e u r a l N e t w o r k ) 是由多个神经元连接而成、 用以模拟人脑行为的网络系统, 是一种与传统计算方法不同的信息处理工具, 它能通过学习获得合适的参数, 用来映射任意复杂的非线性关系。利用人工神经网络的学习功能, 用大量样本对神经元网络进行训练, 调整其连接权值和阀值 , 然后根据己确定的模型进行预测。A N N应用于短期负荷预测比应用于中长期负荷预测更为适宜。 研究角度和适用条件: 回归分析法、 时间序列法着重统计规律的描述, 适用于大样本; 灰色模型法致力于少数据所表现出来的现实规律的研究 , 适用于贫信息条件下的分析和预
测; 专家预测法拥有某个领域内专家的知识和经验, 适用于中长期负荷预测; 神经网络法学习能力强, 适用于时间序列预测问题, 尤其是平稳随机过程的预测, 主要应用于短期负荷预测。
适用的时间分类: 时间序列法、 灰色系统理论预测法、 神经网络法较适宜近期预测, 回归分析法、专家系统法适用于中长期负荷预测。
数据处理
高质量的决策来自高质量的数据。数据的处理能够改善数据的质量,进而提高预测的有效性和准确性。燃气短期负荷预测的一个突出特点是要对过去的负荷及影响负荷变化的各个因素进行分析,因此数据的处理与分析是预测过程的重要步骤。 1.1 降噪处理
城 市燃气负荷预测所用的历史负荷数据来自燃气部门的调度报表。各个计量器的偏差或人工抄表的疏忽造成有的负荷实际值与记录值差别很大,有时设备维修、燃气泄 漏等也造成负荷数据偏离合理值。因此,采集到的数据为染噪数据。染噪的出现,打破了负荷所具有的周期性及规律性,因此有必要将染噪数据进行处理。
燃 气负荷可视为非平稳的一维数字信号。对这种信号进行降噪处理时,由于传统的傅里叶变换完全是在频率域中对信号进行分析,它不能给出信号在某个时间点上的变 化情况,因此分辨不出信号在时间轴上的任何一个突变。但是小波包分析能同时在时频域内对信号进行分析,所以它能有效地区分信号中的突变部分和噪声,从而实 现对非平稳信号的降噪[8]。 1.2 异常点处理
在收集到的历史数据中,通常存在着不遵循数据模型普遍行为的样本。这些样本和其他数据有很大不同或不一致,叫做异常点。异常点可能是由测量误差造成的,也可能是数据固有的可变性的结果[9]。数据的异常点往往包含着重要信息,应该对异常点进行具体分析。从全年日负荷走势来看,异常点有两种:
第一种异常点是2002年2月10、11 13(农历腊月二十九、三十),这两天燃气日负荷突变非常明显,但春节是按照农历计算,这两天的日负荷不能很好地表征燃气日负荷以星期为周期的变化规律,因此以这两天所在星期的平均日负荷值进行取代。
第二种异常点是2002年6月23日, 该天不是传统节日。虽然该天是星期日,但与该季度其他星期日的日负荷对比异常偏高,产生这种结果的原因有两个:记录数据的严重错误、输配过程中重大事件的 发生。无论从哪个方面分析,这种异常点从全年来看是奇异的,而且没有代表性,所以以该季度星期日的平均日负荷值进行取代。
1.3 分类处理
考虑到鞍山市燃气日负荷的总趋势受季节周期影响比较大(12月、1月、2月为第一季度,3月、4月、5月为第二季度,6月、7月、8月为第三季度,9月、10月、11月为第四季度),首先将燃气13负荷按一年四季分为4类,其次考虑到人们的日常生活有星期周期规律性,燃气负荷也应该有星期周期的变化规律,所以又将每个季度的日负荷按一个星期7 d再进行细分,这样,将全年日负荷一共分成28个类别分别进行建模研究。 1.4 规格化处理
规格化就是将一个属性取值范围投射到一个特定范围内,以消除数据因大小不一而造成预测结果的偏差。对于神经网络,采用规格化处理后的数据不仅有助于确保学习结果的正确性,而且也会提高学习的速度。因此,采用零均值规格化方法对收集的历史数据进行处理。 零均值规格化方法是根据属性A的均值和偏差来对A进行规格化。属性4的值可以通过以下计算公式获得其映射值v′。
图1-1 某区某日居民燃气用气小时负荷特性
图1-2 某区居民燃气用气月度负荷特性
由图1-1和图1-2可以看出,对于居民燃气负荷小时预测来说,用气有早、中、晚三个高峰,相对应于居民用餐时间,与居民生活习惯密切相关,而对于居民燃气负荷月份预测来说,温度等天气的因素就显得尤为重要了。从中我们可以看出,由于夏季气温高需要制冷,冬天气温低需要制热,天然气的消耗量要相应大幅增加。此外节假日对居民燃气负荷日预测也有重要影响,在法定节假日中燃气量都有大幅的上升。
某区4月燃气负荷及影响因素
用神经网络预测法
表中d1表示一天中的最大负荷值,d2是一天中的最小负荷值,c1是最高温度,c2是最低温度,c3是平均温度,c4是最高相对湿度,c5是最低相对湿度,c6是光照时间,c7是天气其他因素如风速、降雨等,可以根据具体情况分成15等,分的越细越好。
假设目标属性(d1、d2)与七个条件属性有关,我们把前25天的负荷数据作为训练样本,把剩余的5天作为预测样本,再应用四等分距法对数据进行特征化,这样粗糙集就能从训练样本中找到条件属性和目标属性之间的关系了,经过特征化的数据见下表
特征化后的负荷及影响因素图
按照等式
因篇幅问题不能全部显示,请点此查看更多更全内容