沈碩

摘要:時(shí)間序列一般會(huì)在生產(chǎn)和科學(xué)領(lǐng)域當(dāng)中進(jìn)行使用。指的是一系列時(shí)刻之下獲取到的離散數(shù)字所形成的集合。時(shí)間序列可以借助系統(tǒng)當(dāng)中提供的時(shí)間序列數(shù)據(jù),借助參數(shù)估計(jì)和曲線擬合法分析之后的趨勢(shì)。本文主要介紹了移動(dòng)平均(MA)、自回歸(AR)等多種模模型,得到預(yù)估參數(shù),為實(shí)際問(wèn)題提供解決思維和方案。
關(guān)鍵詞:道路工程;三維線性;事故率
1 引言
時(shí)間序列當(dāng)中的數(shù)據(jù)具有一定的復(fù)雜性,例如經(jīng)濟(jì)領(lǐng)域當(dāng)中的年產(chǎn)值、產(chǎn)品的市場(chǎng)銷量、產(chǎn)品的價(jià)格變動(dòng)、股票的實(shí)時(shí)變化、地區(qū)的人口流動(dòng)、國(guó)民收入情況等都能夠形成時(shí)間序列,除此之外,鐵路的客流量、自然環(huán)境當(dāng)中的月降水量、河流數(shù)量、太陽(yáng)黑子數(shù)等等,也都是以時(shí)間序列的形式進(jìn)行排列。
當(dāng)前在經(jīng)濟(jì)、社會(huì)、科學(xué)等多個(gè)領(lǐng)域當(dāng)中,依然有很多的時(shí)間序列具有缺陷,急需改正和彌補(bǔ)。科學(xué)家們?cè)趯?duì)這些時(shí)間序列進(jìn)行分析的過(guò)程當(dāng)中,也希望能夠掌握相關(guān)現(xiàn)象的浮動(dòng)規(guī)律,從動(dòng)態(tài)層面更加了解現(xiàn)象和其他現(xiàn)象之間的聯(lián)系,提高獲取數(shù)據(jù)的準(zhǔn)確性,將得到的信息和數(shù)據(jù)應(yīng)用到研究當(dāng)中,通過(guò)預(yù)測(cè)來(lái)掌握某一現(xiàn)象的未來(lái)發(fā)展趨勢(shì)。
恩格爾之后對(duì)于時(shí)間序列的研究分析一直持續(xù)了下來(lái)。直到目前,時(shí)間序列分析已經(jīng)有了相對(duì)成熟、完善的理論架構(gòu),并且隨著互聯(lián)網(wǎng)時(shí)代的不斷發(fā)展,這一架構(gòu)逐漸和當(dāng)代信息技術(shù)、互聯(lián)網(wǎng)技術(shù)相融合,提高分析手段的技術(shù)性。但是這些高技術(shù)分析策略,比如神經(jīng)網(wǎng)絡(luò)等,所涉及的理論知識(shí)繁雜,并且當(dāng)前的應(yīng)用范圍非常小,需要走過(guò)很長(zhǎng)的發(fā)展道路。所以本文在分析過(guò)程當(dāng)中,僅以基本的時(shí)間訓(xùn)練理論為基礎(chǔ),以研究簡(jiǎn)單易行的解決方案為最終目標(biāo)。
2 時(shí)間序列的介紹
2.1 何為時(shí)間序列
時(shí)間序列顧名思義是以時(shí)間為排列順序,其變化情況受到時(shí)間的影響,在科學(xué)、社會(huì)、經(jīng)濟(jì)等各個(gè)領(lǐng)域當(dāng)中應(yīng)用范圍較廣。在長(zhǎng)時(shí)間的發(fā)展之后,時(shí)間序列當(dāng)中往往會(huì)存在非常龐大的數(shù)據(jù)量。而如何針對(duì)這些數(shù)據(jù)展開(kāi)統(tǒng)計(jì)分析,獲取到有價(jià)值、有意義的信息,是當(dāng)前大多用戶都比較關(guān)心的一個(gè)問(wèn)題。
例如針對(duì)經(jīng)濟(jì)運(yùn)行發(fā)展過(guò)程,假設(shè)運(yùn)行開(kāi)始時(shí)間為t0,那么可以根據(jù)時(shí)間變化將整個(gè)過(guò)程劃分為Y1,Y2,∧,YT,YT+1,∧,YT+n多個(gè)變量展開(kāi)描述。其中一個(gè)隨機(jī)變量序列代表一個(gè)隨機(jī)過(guò)程。正常情況下,時(shí)間序列數(shù)據(jù)在隨機(jī)過(guò)程當(dāng)中表示為Y1,…,YT,指的是時(shí)間序列的一種實(shí)現(xiàn)方式。對(duì)于時(shí)間序列展開(kāi)分析,其實(shí)就是通過(guò)隨機(jī)過(guò)程實(shí)現(xiàn)掌握相關(guān)的發(fā)展規(guī)律。
從系統(tǒng)意義上看,時(shí)間序列就是某一系統(tǒng)在不同時(shí)間(地點(diǎn)、條件等)的響應(yīng)。這個(gè)定義從系統(tǒng)運(yùn)行的觀點(diǎn)出發(fā),指出時(shí)間序列是按一定順序排列而成的。這里的“一定順序”即可以是時(shí)間順序,也可以是具有各種不同意義的物理量,如代表溫度,速度或其它單調(diào)遞增的取值的物理量。
可見(jiàn),時(shí)間序列只強(qiáng)調(diào)順序的重要性,而并非強(qiáng)調(diào)必須按時(shí)間序列排序,而且時(shí)間序列是所研究系統(tǒng)的歷史行為的客觀記錄。因而它包含著系統(tǒng)結(jié)構(gòu)特征(如周期波動(dòng)的周期、振幅、趨勢(shì)的種類等);揭示其運(yùn)行規(guī)律,進(jìn)而用以預(yù)測(cè)、控制其未來(lái)行為;修正和重新設(shè)計(jì)系統(tǒng)(如改變其周期、參數(shù)),使之按照新的結(jié)構(gòu)運(yùn)行。
2.2 時(shí)間序列的研究概況
時(shí)間序列分析包含的范圍非常廣泛,并且研究?jī)?nèi)容、研究深度涉及各個(gè)領(lǐng)域。對(duì)時(shí)間序列開(kāi)展分析主要有以下用途:①對(duì)系統(tǒng)整體的闡述。在開(kāi)展系統(tǒng)的觀測(cè)試驗(yàn)中,采用數(shù)值分析方法對(duì)采集到的數(shù)據(jù)進(jìn)行擬合,實(shí)現(xiàn)對(duì)系統(tǒng)的闡述。②對(duì)系統(tǒng)整體的研判。在開(kāi)展系統(tǒng)的觀測(cè)試驗(yàn)中,若發(fā)現(xiàn)存在兩個(gè)及以上的變量因子時(shí),可以通過(guò)因子在一個(gè)時(shí)間序列中的發(fā)展過(guò)程去表述另一個(gè)印在時(shí)間序列中的發(fā)展變化。③對(duì)系統(tǒng)未來(lái)變化的預(yù)估。一般而言,想要實(shí)現(xiàn)對(duì)系統(tǒng)的精準(zhǔn)預(yù)測(cè),要建立合理且有效的模型,多采用ARMA模型。④提供決策基礎(chǔ)。通過(guò)建立有效的時(shí)間序列模型,再調(diào)整變量使得系統(tǒng)整體保持在一定水平線上,若發(fā)現(xiàn)系統(tǒng)整體要偏離水平線時(shí),就要考慮對(duì)系統(tǒng)整體進(jìn)行控制。上世紀(jì)初期,現(xiàn)代統(tǒng)計(jì)學(xué)的蓬勃發(fā)展使得時(shí)間序列的研究?jī)?nèi)容進(jìn)入學(xué)者的研究視野之內(nèi),從這一時(shí)期直到上世界70年代末期,針對(duì)這一問(wèn)題的研究一直被線性假設(shè)這一研究思路所把控,圍繞這一問(wèn)題所建立的模型均為線性模型,這一時(shí)期的時(shí)間序列均為線性時(shí)間序列。針對(duì)這一類時(shí)間序列的研究,截止目前已經(jīng)取得重大突破和進(jìn)展,成果廣泛。然而,線性時(shí)間序列僅僅是時(shí)間序列的一類,并且屬于最簡(jiǎn)單的一種類型。雖然如此,在半個(gè)世紀(jì)以來(lái),整個(gè)領(lǐng)域研究的最為深入、最為徹底的也是有限參數(shù)的線性時(shí)間序列模型,例如眾所周知的LARMA模型。并且,通過(guò)實(shí)踐驗(yàn)證,表這類時(shí)間序列模型具有一定的可靠度。然而,隨著科學(xué)技術(shù)的發(fā)展和研究深度的不斷延伸,線性時(shí)間序列模型的缺點(diǎn)愈發(fā)嚴(yán)重,應(yīng)用范圍有限,自適應(yīng)性不足。例如,在這類模型中,無(wú)法產(chǎn)生具有非對(duì)稱周期特征的數(shù)據(jù),產(chǎn)生的數(shù)據(jù)一般是可逆的。在實(shí)際使用中,采用這類模型開(kāi)展研究工作時(shí),對(duì)整個(gè)系統(tǒng)的預(yù)測(cè)并不是基于時(shí)間序列當(dāng)前特征的,預(yù)測(cè)優(yōu)良也就無(wú)法得到保證。
3 基本ARMA模型
時(shí)間序列分析和模型建立過(guò)程當(dāng)中涉及到的主要對(duì)象為觀測(cè)數(shù)據(jù)系列,在建立模型的過(guò)程當(dāng)中,會(huì)在掌握數(shù)據(jù)之間關(guān)聯(lián)性的前提下,借助回歸分析法制定當(dāng)前時(shí)刻和過(guò)去時(shí)刻之間存在的具體聯(lián)系的模型。
時(shí)間序列分析法于1976年正式誕生,最初的基本模型主要有自回歸模型、移動(dòng)平均模型、以及兩種模型混合的共三種模型,這三個(gè)模型都是借助歷史數(shù)據(jù)來(lái)展開(kāi)線性預(yù)測(cè)。
在確定隨機(jī)成分并建立時(shí)序模型的過(guò)程當(dāng)中,一般會(huì)使用到的方法為時(shí)序建模分析法,
使用該模型應(yīng)用到實(shí)際的當(dāng)中有很多便利之處。該模型是線性模型,所以只需要根據(jù)較少數(shù)量的參數(shù)就能夠獲取到具體的模型,處理步驟較為簡(jiǎn)單;并且該模型有一定的理譜密度,和所有的連續(xù)譜密度差距都不大;并且該模型分析數(shù)據(jù)結(jié)構(gòu)和內(nèi)在性質(zhì)更為容易,能夠保證在線性最小方差意義環(huán)境當(dāng)中所提供的預(yù)報(bào)和控制是最合適的。
ARMA模型又分為以下幾種形式:
3.1 自回歸模型(AR:Auto-regressive)
AR(p)模型為p階自回歸,針對(duì)該模型進(jìn)行相關(guān)因素影響作用分析時(shí),只需要使用到時(shí)間序列變量當(dāng)中歷史觀測(cè)值這一類數(shù)據(jù)就能夠得到明確的分析結(jié)果,其他條件并不會(huì)對(duì)分析產(chǎn)生干擾,比如模型變量相互獨(dú)立假,除此之外模型還能夠有效解決一般回歸預(yù)測(cè)方程當(dāng)中的自變量選擇、多重共線性問(wèn)題,表示方式如下:
此時(shí)間序列是一個(gè)自回歸訓(xùn)練,并且為p階自回歸模型,即AR(p),其中的 具有自回歸特性,為模型當(dāng)中的待預(yù)測(cè)參數(shù),是一個(gè)以 隨機(jī)項(xiàng)為服從0均值, 方差為正態(tài)分布的白噪聲序列,和 無(wú)關(guān)聯(lián)。
3.2 移動(dòng)平均模型(MA:Moving-Average)
MA(q)模型為q階移動(dòng)平均模型,借助不同時(shí)期的干擾和預(yù)測(cè)誤差產(chǎn)生的組合進(jìn)行預(yù)測(cè),序列當(dāng)中波動(dòng)較大的隨機(jī)變化對(duì)時(shí)間序列方向不會(huì)產(chǎn)生干擾,具體如下表示:
其具體表示為一個(gè)移動(dòng)平均序列和q階移動(dòng)平均模型,即MA(q)。其中的 是待預(yù)測(cè)的移動(dòng)平均參數(shù),是一個(gè)以 隨機(jī)項(xiàng)為服從0均值, 方差為正態(tài)分布的白噪聲序列。
3.3 混合模型(ARMA:Auto-regressive Moving-Average)
ARMA(p,4)具有自回歸性和移動(dòng)平均性,如果時(shí)間序列 是前期值、當(dāng)前數(shù)值、前期隨機(jī)干擾綜合產(chǎn)生的線性函數(shù),那么該模型就是將前面兩種模型進(jìn)行混合所形成的;其中AR表示自回歸,p表示回歸項(xiàng);MA表示移動(dòng)平均,q表示移動(dòng)平均數(shù),所以該模型具體表現(xiàn)形式為:
此模型當(dāng)中的時(shí)間序列具有自回歸移動(dòng)平均性,模型以(p,q)階進(jìn)行建立,即ARMA(p,q)。其中的 具有自回歸性, 具有移動(dòng)平均性,是模型當(dāng)中的待預(yù)測(cè)參數(shù)。整個(gè)序列是以 隨機(jī)項(xiàng)為服從0均值, 方差為正態(tài)分布的白噪聲序列。如果q為0,則是AR(p)模型;p為0則是MA(q)模型。
4時(shí)間序列模型建立步驟
ARMA模型Box-Jenkins方法為理論基礎(chǔ),建立過(guò)程需要反復(fù)執(zhí)行的步驟為:①參數(shù)估計(jì);②假設(shè)檢驗(yàn);③模型識(shí)別。反復(fù)執(zhí)行這三個(gè)步驟,并且通過(guò)假設(shè)檢驗(yàn)來(lái)獲取模型當(dāng)中的時(shí)間序列。
其中使用的Box-Jenkins方法理論步驟分為:
(1)平穩(wěn)化
可以將對(duì)數(shù)變換和差分變換兩種方法進(jìn)行綜合使用,令自相關(guān)函數(shù)當(dāng)中的指數(shù)有所衰減,保證模型的平穩(wěn)性。
(2)識(shí)別、估計(jì)模型。
根據(jù)上文可知,模型識(shí)別過(guò)程需要遵守一定的標(biāo)準(zhǔn),在ACF自相關(guān)、PACF偏自相關(guān)形狀指導(dǎo)下,獲取模型的p、q值,過(guò)程當(dāng)中比較常用的方法為最小二乘法。因?yàn)槟軌蛲瓿纱隧?xiàng)工作的計(jì)量軟件類型較多,所以本文不針對(duì)其中的估計(jì)方法進(jìn)行詳細(xì)敘述。
(3)診斷
診斷是為了了解被估測(cè)模型當(dāng)中是否為白噪聲殘差序列,如果是則表示該模型刻畫時(shí)間序列的準(zhǔn)確性較高,如果不是,就需要回到第二個(gè)步驟進(jìn)行重新估算,得到新的模型。診斷是必不可缺的環(huán)節(jié),因?yàn)檫@個(gè)過(guò)程能夠?qū)r(shí)間序列ARMA(p,q)過(guò)程、樣本自相關(guān)函數(shù)和偏自相關(guān)函數(shù)識(shí)別提供幫助,而且如果p、q都不為0,整個(gè)識(shí)別過(guò)程具有很強(qiáng)的復(fù)雜性,識(shí)別過(guò)程并不容易,需要借助豐富的技巧和經(jīng)驗(yàn)推動(dòng)識(shí)別順利進(jìn)行。
(4)預(yù)測(cè)
通過(guò)診斷之后得到的模型能夠進(jìn)行預(yù)測(cè)應(yīng)用。
5 ARMA-GJR-M模型參數(shù)估計(jì)
對(duì)上述模型,記 , , , , , , , , ,那么 為模型ARMA(m,s)-GJR(p,q)-M(k)待估參數(shù)集。
為了得到參數(shù)的后驗(yàn)密度分布,可以引用以下定理。
ARMA-GJR-M模型的均值方程可寫成如下形式:
這里 對(duì)所有i>p成立, 對(duì)所有的i>q成立。
構(gòu)建參數(shù)θ的后驗(yàn)密度函數(shù)為 ,那么在給定ε0的情況下,模型的似然函數(shù)為
其中
參考文獻(xiàn)
[1]許龍,劉志輝,姚俊強(qiáng),魏歡歡,張圓.基于多變量時(shí)間序列CAR模型研究[J].中國(guó)農(nóng)村水利水電,2015(06):81-85+90.
[2]陸嘉佳.多變量時(shí)間序列模型的參數(shù)估計(jì)及其實(shí)證檢驗(yàn)[D].華東師范大學(xué),2008.
[3]呂忠偉,秦建國(guó).多變量時(shí)間序列模型識(shí)別方法[J].統(tǒng)計(jì)與決策,2007(02):129-131.
[4]艾書超.單變量時(shí)間序列建模與預(yù)測(cè)研究[D].武漢理工大學(xué),2005.
[5]劉麗蘭.時(shí)間序列分析在振動(dòng)系統(tǒng)時(shí)變參數(shù)辨識(shí)中的應(yīng)用[D].西安理工大學(xué),2005.