王法玉, 王靜超
(天津理工大學 計算機實驗教學示范中心; 智能計算及軟件新技術重點實驗室, 天津 300384)
高校實驗室是高校從事實驗教學、進行人才培養的重要場所[1]。為了進一步培養大學生的創新和實踐能力,近年來,各高校紛紛建立了創新實驗室,為學生提供課外第二課堂創新實踐平臺[2]。工程類實驗教學不僅是教學的重要的組成部分,多樣性的實驗教學和開放性實驗室也是教育改革的一項基本任務[3-5]。目前大多數學校都在實施實驗室開放,對實驗室管理也做了很多研究,并開發了一些實驗室開放管理系統,但是多數管理系統都是只注重便捷,而對資源的利用率的研究比較少。
為了給學生提供一個開放自由的學習環境和足夠的學習資源,培養學生的創新實踐能力,我院自2000年以來實施了實驗室開放政策,得到了廣大學生的歡迎,學生的學習熱情更加濃厚。但在實驗室管理上,實驗室上機人數的隨機性和值班人員如何安排,卻難以權衡,為了充分滿足學生的需求,值班人員配備和開放實驗室數量總是大于實際需求,造成值班人員安排和實驗房間開放的數量難以確定,造成人力、物力和財力的浪費。為了更加有效利用和挖掘實驗室資源,提高實驗室和實驗設備的利用率[6]。通過對幾年來的實驗室上機人數研究,發現實際的上機人數具有長期相關性, 也稱自相似性, 即統計意義下的自相似性,具有成長性[7]。因此,本文利用時間序列分析法對實驗室日常上機人數進行分析、研究和建模,進而對上機人數進行預測,旨在通過合理安排值班人員和開放實驗室數量,達到節約資源的目的。
時間序列分析是處理動態數據的一種比較有效的時域分析方法,通過觀察動態數據的變化規律,對數據進行擬合,并對未來數據做出預測。在許多實際問題中,所觀測到的數據序列{xt}常不是平穩序列,但如果將其做有限次差分處理后,可轉化差分序列{Sn},是平穩序列,那么可用平穩信號序列模型來做研究[8]。
自回歸移動平均(Auto-Regressive Integrated Moving Average,ARIMA)模型是由美國統計學家Box 和Jenkins 共同提出的,又叫B-J 模型[9]。該模型擬合的是差分平穩序列,實際上就是差分運算和ARMA 模型的結合。其基本建模思想和建模步驟可總結為:① 通過差分使非平穩過程變成平穩過程;② 建立描述該平穩過程的合適模型;③ 使用構建好的模型,預測將來值。ARIMA 模型是時間序列分析中重要的模型之一,目前廣泛應用于各種領域[10-12]。
假設{xt/t=0,1,…}為非平穩隨機序列,則ARIMA的一般形式為:

(1)
其中:
Φ(B)=1-φ1B-φ2B2-…-φpBp
Θ(B)=1-θ1B-θ2B2-…-φqBq

季節性SARIMA 建模是在ARIMA 模型基礎上發展起來的,用于具有周期性變化的序列的建模。在周期內,它提取當前時刻數據與前期數據的關聯特征;在周期間,它提取當前時刻數據與前幾個周期相同時刻的數據的關聯特征[13]。將周期內特征和周期間特征結合起來,更加全面地描述序列的變化規律,得到的模型,對于序列變化情況的刻畫也更加準確。因此,使用季節ARIMA 模型對季節性數據進行研究也是目前時序分析的熱點[14-16]。

(2)
Θ(Bs)=1-Θ1Bs-Θ2B2s-…-ΘpBps
Φ(Bs)=1-Φ1Bs-Φ2B2s-…-ΦqBqs
式(2)的模型中季節差分僅僅消除了周期間相同周期點之間具有的相關部分,時間序列還可能存在長期趨勢,一個周期內的不同周期點之間也具有一定的相關性,因此,由式(1)、(2)可得季節性ARIMA(p,d,q)(P,D,Q)s模型為:
ADF(Augmented Dickey-Fuller)檢驗是增項DF檢驗,ADF檢驗不僅可以檢驗AR(1)的平穩性,而且可以檢驗AR(P)過程的平穩性。
對于任意AR(P)過程,
Xt=φ1Xt-1+…+φpXt-p+εt
(3)
如果方程所有特征根都在單位圓內,則序列平穩;如果有一個特征根存在且為1,則序列為非平穩序列。
對式(3)進行變形簡化后得:

H0∶ρ=o?H1∶ρ 構造ADF檢驗統計量: 通過Monte Carlo方法,可以得到ADF檢驗統計量的臨界值表。 本文在季節性SARIMA模型構建過程中主要分為以下幾步: (1) 平穩性檢驗。檢驗時間序列的平穩性,即確定d、D的大小,最直觀的識別方法是自相關圖法。如果自相關系數迅速趨于零,即自相關系數具有截尾性,則時間序列為平穩時間序列;如果時間序列存在一定的趨勢性,則需要對原序列進行差分處理;如果時間序列存在異方差性,則需先對數據進行對數轉換。 (2) 模型識別。模型識別即確定相應季節ARIMA模型的階數p、q、P、Q的取值。一般情況下,可通過觀察相關圖估計模型階數p、q、P、Q的可能取值,然后通過AIC、SC準則等,確定最合適的模型階數,AIC值和SC值都是越小越好。 (3) 用最小二乘法進行模型估計。最小二乘法估計是線性模型中最常用的估計方法,具有良好的統計性質,且計算簡便。 (4) 白噪聲檢驗。對殘差進行白噪聲檢驗,由定義可知白噪聲序列的任意兩個時序值之間都是完全不相關的。但在實際中,完全的不相關是不可能的。由于序列的長度都是有限的,故自相關系數不可能都是零。可以認為自相關系數總是在零附近上下浮動,且浮動的范圍有非常界限的序列為白噪聲序列。為了定量準確的判斷是否純隨機,Bartlett給出了統計的方法驗證序列的白噪聲性,此時是將自相關系數放在一起進行整體檢驗。Bartlett提出如果一個時間序列是白噪聲序列,則提取一個觀察個數為n的序列,那么該序列的延遲非零期的樣本自相關系數將近似服從均值等于零,方差近似為觀察序列個數倒數的正態分布。 (5) 預測。本文用Eviews6.0實現整個建模過程,Eviews軟件是美國QMS公司推出的計量經濟學軟件,在對時間序列的數據進行分析,建立序列間的統計關系式,并用該關系式進行預測、模擬等。 圖1為2011年1月~2012年11月我院實驗室日常上機人數時序圖,該時序圖以天為單位,實驗環境是Eviews6.0。由圖1可以看出日常上機人數隨機性很大, 觀測值序列呈現周期性[16],可初步斷定該序列為非平穩序列。 圖1 日常上機人數時序圖 為了進一步檢驗序列的平穩性, 本文對原序列進行ADF檢驗,即如果方程所有特征根都在單位圓內,則序列平穩,如果有一個特征根存在且為1,則序列為非平穩序列。ADF檢驗結果如表1所示。 由表1的結果可以看出,在10%的顯著性水平下可以接受原假設,即原序列有一個單位根,故可以斷定原序列具有非平穩性。 表1 ADF檢驗結果 從圖1中可以看出,在每年的5月份和11月份都會有一段連續的峰值出現,表明此段時間內實驗室上機人數較多。而8、2月份基本為零,因為這2個月為放假時間。可初步斷定周期為6個月,有相關圖可得周期為182天。 在一般情況下,周期性序列的季節性差分次數不會超過1[9]。因此,我們首先進行一階差分消除趨勢特征,再進行182步周期差分消除周期信息,并對差分后的序列進行ADF檢驗,結果如表2。 表2 差分序列ADF檢驗結果 由表2中的P值可以判斷出,在10%的顯著性水平下拒絕原假設,即序列對象不存在單位根。因而上機人數是1階單整,故SARIMA模型的d=1。 通過差分后序列AC和PAC,判斷SARIMA模型的階數p、q、P、Q。由表3可以看出,AC 為一階截尾,可令q=1。另外,在t=182處,PAC顯著不為0,因此,可令P=1。同樣觀察偏相關系數,可以看出,p在8階截尾,可得p=8。在t=182處,AC顯著為0,因此,可令Q=0。 在EVIEWS 6.0中,對模型進行最小二乘法參數估計并利用模型對差分后的序列進行擬合,經過多次嘗試、篩選和剔除所有不顯著系數,最終確定結果見表4。 白噪聲檢驗結果如表5所示。由表可知,AC與PAC顯著趨于0,因而殘差序列不存在自相關,是白噪聲序列,故構建的模型是理想的,可用于預測。 表3 差分后序列相關圖 表4 最小二乘法參數估計結果 表5 殘差相關圖 最終可得模型為ARIMA(8,1,1)(1,1,0),表4為相應參數的估計值。故模型方程為: (1-0.313B-0.268B2-0.151B7)(1+ 0.536B182)xt=(1-1.03B)εt 利用模型對2012年12月1日~15日進行預測。 由表6可以看出,預測結果比較接近實際情況。自2012年開始對模型進行研究,并應用于我院實驗室開放實際中,一年以來,實驗室開放管理水平得到了很大提升。在毫不影響學生充分利用實驗室設備的基礎上,為學院省下一部分財政支出,大大節約人、財、物的使用。減輕了工作人員的工作強度和工作時間。 ARIMA是一種計算簡便、計算精度較高、使用范圍很廣的時間序列預測模型。季節性SARIMA 模型在原有模型的基礎上擴展了對周期性序列的應用,使其范圍更加廣泛。本文利用季節性SARIMA模型,采用EVIEWS軟件對實驗室日常上機人數進行預測分析,是我院實驗室開放管理的一部分,有效提高了實驗室資源的利用率,方便學生學習,同時節省了資源,使我校的實驗室管理水平又上了一個臺階。希望本研究對于其他學校實驗室開放管理給予一個啟發和借鑒。 表6 實際上機人數和預測人數對照表 [1] 蔡海燕,劉 昭.實驗室信息化管理初探[J].實驗室研究與探索,2010,29(11):373-375. CAI Hai-yan,LIU Zhao.Discussion on the Information Management of Laboratory[J]. Research and Exploration in Laboratory,2010, 29(11):373-375. [2] 王志軍,楊延軍.開放式教學實驗室實時監控系統[J].實驗室研究與探索,2011,30(1):158-160. WANG Zhi-jun,YANG Yan-jun. Real Time Monitoring System for Open Teaching Labs[J]. Research and Exploration in Laboratory,2011, 30(1):158-160. [3] Alon Gany. The role of laboratory experiments in engineering education [C]//Proc ASME 2008 9th Biennial Conference on Engineering Systems Design and Analysis (ESDA2008). Haifa, Israel, pp. July 2008:645-647. [4] Richard Chiou, Michael Mauk, William Danley, Robin Kizirian. Innovative engineering technology curriculum integrated with web-based technology in robotics, mechatronics, and equality [C]//Proc ASME 2009 International Mechanical Engineering Congress and Exposition (IMECE2009). Lake Buena Vista, Florida, USA, pp. 2009: 369-376. [5] Frank K. Lu, Philip K. Panicker, M. Byron Webb. Introducing modern laboratory experiences to mechanical and aerospace engineering students [C]//Proc ASME 2007 International Mechanical Engineering Congress and Exposition (IMECE2007). Seattle, Washington, USA, pp. 2007:443-452. [6] 王法玉,張 樺.基于Web 與短信結合的實驗室開放管理系統設計與實現[J]. 實驗技術與管理, 2011,28(1):104-107. WANG Fa-yu,ZHANG Hua. Design and Implementation of Laboratory Opening Management system based on Web and SMS[J]. Experimental Technology and Management,2011,28(1):104-107. [7] 金 旗,裴昌幸,朱暢華.ARIMA 模型法分析網絡流量[J]. 西安電子科技大學學報(自然科學版),2003(2):6-10. JI Qi, PEI Chang-xing, ZHU Chang-hua. ARIMA analysis method in network traffic[J].Jouranl of Xidian University,2003(2):6-10. [8] 王宏禹. 非平穩隨機信號分析與處理[M]. 北京: 國防工業出版社, 1999. 293-307. [9] 鄒柏賢,劉 強.基于ARMA模型的網絡流量預測[J].計算機研究與發展,2002,39(12):1645-1652. ZOU Bo-Xian, LIU Qiang. ARMA-BASED TRAFFIC PREDICATION AND OVERLOAD DETECTION OF NETWORK[J].Journal of Computer Research and Development, 2002,39(12):1645-1652. [10] 楊建萍. 基于ARIMA 模型的用電量時間序列建模和預報[J]. 工程數學學報, 2008,25(4): 611-615. YANG Jian-Ping. ARIMA Time Series Modeling and Forecasting of Electricity Consumption[J]. Chinese Journal of Engineering Mathematics, 2008,25(4): 611-615. [11] 漆 莉,李 革,李 勤. ARIMA 模型在流行性感冒預測中的應用[J]. 第三軍醫大學學報, 2007,29(3): 267-269. QI Li,LI Ge,LI Qin. Applications of ARMA model on predictive incidence of influenza[J].Acta Academiae Medicinae Militaris Tertiae, 2007,29(3): 267-269. [12] 韓 超, 宋 蘇, 王成紅. 基于ARIMA 模型的短時交通流實時自適應預測[J]. 系統仿真學報, 2004, 16(7): 1530-1532. HAN Chao,SONG Su,WANG Cheng.A Real-time Short-term Traffic Flow Adaptive Forecasting Method Based on ARIMA Model[J].Journal of System Simulation,2004,16(7): 1530-1532. [13] 周 鑫,張 錦,李 果,等.基于乘積季節模型的GPRS小區流量預測[J]. 計算機工程,2010,36(18):76-78. ZHOU Xin, ZHANG Jin, LI Guo,etc.Traffic Prediction of GPRS Cells Based on Multiple Seasonal Model[J].Computer Engineering,2010,36(18):76-78. [14] 張 蔚, 張彥琦, 楊 旭. 時間序列資料ARIMA 季節乘積模型及其應用[J]. 第三軍醫大學學報, 2002, 24(8): 955-957. ZHANG Wei,ZHANG YAN-qi,YANG Xu.Model of multiple seasonal ARIMA and its application ot data in time series[J]. Acta Academiae Medicinae Militaris Tertiae, 2002, 24(8): 955-957. [15] 張 偉, 張新波. 移動GSM網話務量的ARIMA模型的建立及其預測[J]. 數學理論與應用, 2008, 28(2): 70-74. ZHANG Wei, ZHANGXin-bo. Modeling and predicting wirless GSM traffic load on the ARIMA model[J].Mathematical Theory and Applications, 2008, 28(2): 70-74. [16] Geoge E,Box P. 時間序列分析預測與控制[M]. 顧嵐主, 范金城,譯. 北京: 中國統計出版社, 1997:125-126.
1.4 SARIMA模型建模步驟
2 實例應用
2.1 平穩性檢驗


2.2 周期性確定
2.3 平穩化處理

2.4 模型定階
2.5 模型的建立與預測



3 結 語
