黑龙江省农业机械总动力预测分析--基于 ARIMA 模型
汤岩;王福林;焦扬
【摘 要】This paper applies statistical data from 1980 to 2011 of Heilongjiang Province,to analyze agricultural machinery total power by establishing ARIMA model of Heilongjiang Province .The result shows that ARIMA model not only suit the character of no steady time series of agricultural machinery total power , but also provides ideal forecastef-fect.ARIMA(0,2,1) model forecasts the mean percent error between numerical number and actual numerical number from 1980 to 2011 which has 2 .87%, it can be used to forecast and analyze agricultural machinery total power of Hei-longjiang Province .%运用黑龙江省1980-2011年的统计数据,建立了黑龙江省农业机械总动力的 ARIMA 模型,并进行了预测分析。结果表明:黑龙江省农业机械总动力是非平稳的时间序列, ARIMA模型的拟合效果良好;应用 ARI-MA(0,2,1)模型进行预测,1980-2011年预测值与实际值之间的平均相对误差为2.87%,可用于今后黑龙江省农业机械总动力的预测与分析。
【期刊名称】《农机化研究》 【年(卷),期】2014(000)002 【总页数】4页(P44-47)
【关键词】农业机械总动力;预测;时间序列;ARIMA 【作 者】汤岩;王福林;焦扬
【作者单位】东北农业大学理学院,哈尔滨 150030;东北农业大学工程学院,哈尔滨 150030;东北农业大学理学院,哈尔滨 150030 【正文语种】中 文 【中图分类】S220
农业机械总动力指用于农林牧渔业生产和运输的所有机械动力之和,是反映和评价一个地区农业机械化发展总体水平的重要指标之一,是农机规划的重要部分[1]。黑龙江省是我国的农业大省,长期以来一直高度重视农业的发展,农业机械化水平不断提高。对黑龙江省农业机械总动力进行预测分析,能够为给决策部门提供农机化发展规划的理论参考依据。
农业机械总动力水平受到自然、经济、技术和社会等多种因素影响,其中的部分因素难以量化,各因素之间关系又及其复杂,用回归分析和因子分析等方法来预测是比较困难的,也难以达到理想的预测效果。时间序列分析是一种动态数据处理的统计方法,通过对数据的某些统计量进行分析,获得数据的动态变化规律,进而建立模型进行预测。其中,包括多种预测模型,ARIMA模型是其中之一。
笔者研究了黑龙江省农业机械总动力的时间序列(1984~2011年),建立了黑龙江省农业机械总动力的ARIMA模型,并将此模型应用于黑龙江省农业机械总动力的预测,取得了良好的效果。
设{xt,t∈T}为一个时间序列,B为后移算子,即Bxt=xt-1,记=1-B,称为差分算子。一般有
若{xt,t∈T}在d阶差分后平稳,则满足(1)式的模型称为自回归求和移动平均模型,简记为ARIMA(p,d,q)模型,即
其中,|B|≤1且φ(B)与θ(B)互质;φpθq≠0;d为差分阶数;p为自回归阶数;q为移动平均阶数;{εt}为零均值白噪声序列,是随机扰动项[2]。
简单地说,当一个非平稳的时间序列经过d阶差分化为平稳序列后,通过一系列的运算及检验,最终将当前时刻的序列值表示为以前时刻的序列值和以前时刻的随机扰动之间的线性组合形式,即ARIMA(p,d,q)模型。
通常采取Box-Jenkins建模法建立ARIMA(p,d,q)模型,步骤如下:
1)数据预处理。根据时序图和相关系数值判断序列的平稳性和纯随机性。如果序列是白噪声,则具有纯随机性,无建模价值;如果序列是非白噪声,则可直接建立平稳时间序列模型,或将非平稳序列处理为平稳序列后建模。
2)模型定阶。通常初始模型定阶是通过判断自相关与偏相关系数的拖尾和截尾性来确定,然后再进一步检验。通常需要调整,也可以同时利用AIC或BIC准则比较各模型的AIC或BIC的值,选取其值最小的作为预测模型。
3)参数估计。常用的估计方法有矩估计法、最小二乘法、极大似然法和条件最小二乘法等。其中,理论估计效果最好的是极大似然法,但是这种方法实际应用时算法复杂,计算量大。在实际运用中,最常用的是条件最小二乘法。
4)模型检验。在定阶和参数估计之后,需要对建立的模型进行有效性检验,实际上在步骤2)和3)中已经体现了这一步。基本做法是对参数进行显著性检验,并对模型残差εt进行白噪声检验。若检验认为εt是白噪声,则说明残差序列中已不存在未提取的有用信息,建模获得通过;否则,需要重复步骤3)和4)。模型检验的方法包括χ2检验法、D检验法和W检验法等。
建立ARIMA模型后,需要对未来时刻的序列值进行预测。一般采用最小方差预测法,即预测值能够使得式(2)成为最小,即
在最小预测方差法下得到的估计值是在序列xt,xt-1,xt-2,…已知的情况下得到的条件无偏最小方差估计值,且预测方差只与预测步长l有关,而与预测起始点t无关。但预测步长l越大,预测值的方差越大,因此只适合于短期预测。在正态假定下,估计值的1-α的置信区间为
式中 σε—白噪声序列的均方差; α—显著性水平,一般取α=0.05。 2.1 数据预处理
在建模之前要检验序列的平稳性和随机性,在序列平稳和非纯随机的基础上才能建立一般的时序模型。纯随机的序列是没有分析价值的,而非平稳的序列可以通过差分化为平稳序列。
首先,绘制黑龙江省农业机械总动力的时序图,对时间序列的平稳性进行观察,如图1所示。数据来源于2012年黑龙江省统计年鉴。
直观来看,黑龙江农业机械总动力序列{xt}具有明显增长趋势,表明E(xt),var(xt)和cov(xt,xt-s)随时间t的变化而变化,是非平稳序列。另外,黑龙江农业机械总动力的数据在1980-2011年间平均增长率超过5.92%,显然具有递增趋势,可以考虑进行1阶差分,消除递增趋势,xt=xt-xt-1。1阶差分后,提取了原序列中部分长期趋势,但从Zero mean,single mean,trend等3种模型的ACF检验结果来看,各统计量的P值均大于0.05,序列不平稳,长期趋势提取不充分。1阶差分后,序列中仍蕴含着长期递增趋势,于是对1阶差分后序列再做一次差分运算,2xt=xt-xt-1。经过ACF检验,3种模型各阶延迟下的Tau统计量的P值小于0.05,序列平稳;2阶差分后的序列{2xt}比较充分地提取了原序列中蕴含的长期趋势,可取d=2。各阶差分后的序列ACF检验结果见表1。
对序列{2xt}的纯随机性进行χ2检验,其QLB统计量的P值为0.0384(<0.05),故{2xt}序列为非白噪声序列,有建模价值。 2.2 模型识别与检验
对平稳序列进行模型识别与检验是建模的主要过程,也就是选择恰当的自回归阶数p和移动平均阶数q,估计模型中各项参数,从而建立相应的ARMA模型拟合观察值序列,最后进行参数检验和模型检验,进而进行未来值的预测。
目前没有十分有效的定阶方法,通常都是根据观察数据的自相关和偏相关函数值,或利用AIC和BIC等准则进行定阶,有时还需要反复尝试。调用SAS软件中的PROC ARIMA过程,可以对模型的定阶及参数估计进行设计和计算。采用相对最优模型识别,根据单位根检验结果以及{2xt}序列的自相关和偏自相关系数都是1阶拖尾的性质(见图2),适当选择m=1,n=2进行相对最优模型定阶,得到BIC(0,1)=8.470 293。说明在p=0,q=1时,BIC函数值最小。因此,可以选择ARIMA(0,2,1)模型进行拟合。根据差分后自相关图和偏自相关图的都是1阶拖尾的性质,也可考虑拟合ARIMA(1,2,1)模型。
接下来,对2个模型进行参数估计及检验。这里参数估计方法选取的是条件最小二乘法,取显著性水平α=0.05 ,最终只有ARIMA(0,2,1)模型通过了检验。检验结果如表2和表3所示。
参数显著性检验中的P值小于0.05,故可以认为参数显著。各延迟阶数下,残差白噪声检验中的P值均大于0.05,故可以认为εt 是白噪声,模型提取信息充分,显著成立,确定ARIMA(0,2,1)视为相对最优预测模型。 2.3 预测
{xt}表示黑龙江省农机总动力序列,其预测模型的口径为
用此模型对1980-2011年黑龙江省农业机械总动力进行预测,所得的预测值与实际值拟合精度如图3所示。模型预测的平均相对误差约为2.87%。该模型可以用于黑龙江农业机械总动力的预测, 2012-2016年的农机总动力预测值与95%置信区间如表4所示。
1)运用1980-2011年黑龙江省农业机械总动力数据,建立了ARIMA(0,2,1)模型并进行预测。结果表明,黑龙江省农业机械总动力与其第1阶和第2阶的滞后值及第1阶的随机扰动项的关系较为密切。
通过SAS9.0软件,对该模型预测的准确性进行了实证检验。结果显示,预测的平
均相对误差在2.87%左右。这说明,所建立的ARIMA(0,2,1)模型是适合黑龙江省农业机械总动力的发展规律的。从预测结果来看,黑龙江省农业机械总动力仍将平稳地增长。
Key words: agricultural machinery total power; forecast; time series; ARIMA 【相关文献】
[1]余国新,程静.中国农业机械总动力预测分析—基于ARIMA模型[J].农机化研究,2009,31(2):51-54.
[2]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005.