祁冠文
摘 要: 隨著中國經濟的迅猛發展,中國對外開放的程度不斷加深,體現在教育行業中很顯著的一點便是中國留學生人數增加、規模擴大,掀起了一股留學熱潮。本文運用統計學的原理和時間序列分析的基本理論,選取每年赴美留學人數作為觀測值,對這一現象進行基本的探究和分析,擬構建合適的模型,做出科學的預測,為定量研究這一社會現象提供依據和思路。
關鍵詞: 時間序列 ARIMA模型 中國赴美留學人數
一、引言
中國作為世界上最大的發展中國家,正在日新月異地提升其各方面的軟硬實力。無論是經濟、政治還是社會領域,整個社會和國民都在不斷進步、發展,視野和心態越來越理性、開闊、兼容并包。在教育領域,科學和技術日益受到重視,人們對知識和學術更尊重和推崇,對政治和經濟的穩定進步與發展,知識的作用都愈發明顯,知識經濟甚至可以算老生常談了。
本文在反映留學熱潮的各種數據和信息中,選取了比較具有代表性的——1996年至2012年每年中國學生赴美留學的人數作為觀察值序列,應用課程學習的時間序列分析的理論,對其進行歸納和研究,并以此構建ARIMA模型,對所收集的數據進行擬合。一方面從更本質更基礎的層面上認識時間序列理論,另一方面對所學內容做一次基本的實踐應用,并對數據進行預測。經過具有代表性的數據和模型的構建,可以更充分更全面地了解近年的留學趨勢,對留學的形勢有一個更客觀的把握。
2.模型的理論基礎
2.1時間序列分析理論基礎
時間序列分析是將某種統計指標,或在不同時間的不同數值,按時間順序排列起來,以便于研究其發展變化,并能以此預測未來的一種統計方法。
在拿到一個觀察值序列后,首先要對它的平穩性和純隨機性進行檢驗。非平穩序列,由于它不具有二階矩平穩的性質,因此對它的統計分析要周折一些,通常要進行進一步的檢驗、變換或處理,才能確定適當的擬合模型。如果序列平穩,則進行純隨機檢驗。如果序列值彼此之間沒有任何相關性,就意味著該序列是一個沒有記憶的序列,過去的行為對將來的發展沒有絲毫影響,從統計分析的角度而言,這種序列沒有任何分析價值。只有這些序列值之間具有密切的相關關系,歷史數據對未來的發展有一定影響的序列,才值得我們花時間挖掘其中的有效信息,預測序列的未來發展。
2.2模型構建的理論基礎
一個序列經過預處理被識別為平穩非白噪聲序列,那就說明該序列是一個蘊含相關信息的平穩序列。在統計上,我們通常建立一個線性模型擬合該序列的發展,借此提取該序列中的有用信息。ARMA(Auto Regression Moving Average)模型是目前最常用的平穩序列擬合模型。
ARMA(p,q)模型的結構為
x■=Φ■+Φ■x■+…+Φ■x■+ε■-θ■ε■-…-θ■ε■Φ■≠0,θ■≠0E(ε■)=0,Var (ε■)=σ■■,E(ε■ε■)=0,s≠tEx ?搖■ε■=0,?坌s 式中,p為自回歸模型的階數,q為移動平均模型的階數。在用ARMA模型擬合觀察值序列時,要根據樣本自相關系數和偏自相關系數的性質進行估計。這就是模型的識別過程即定階過程。 實際上,在自然界中絕大部分序列都是非平穩的,因而對非平穩序列的分析更普遍、更重要,人們采用的分析方法更多。由確定性導致的非平穩,通常顯示出非常明顯的規律性,比如有顯著的趨勢或者有固定的變化周期,這種規律性信息通常比較容易提取,而由隨機因素導致的波動則非常難以確定和分析。確定性因素分解方法不能充分提取觀察值序列中的有效信息,導致模型擬合精度不夠理想。隨機時序分析方法的發展彌補了確定性分解方法的不足。差分運算具有強大的確定性信息提取能力,許多非平穩序列進行差分運算后會顯示出平穩序列的性質,這時我們稱這個非平穩序列為差分平穩序列。對差分平穩序列可以使用ARIMA(Auto Regressive Integrated Moving Average)模型擬合。 ARIMA(p,d,q)模型的結構為 Φ(B)?犖■x■=Θ(B)ε■E(ε■)=0,Var (ε■)=σ■■,E(ε■ε■)=0,s≠tEx ?搖■ε■=0,?坌s 其中,Φ(B)=1-Φ■B-Φ■B■-…-Φ■B■為平穩可逆ARMA(p,q)模型的自回歸系數多項式;?犖■=(1-B)■,d表示x■的差分階數;Θ(B)=1-θ■B-θ■B■-…-θ■B■為平穩可逆ARMA(p,q)模型的移動平滑系數多項式。ARIMA模型的實質就是差分運算與ARMA模型的組合。這說明任何非平穩序列只要通過適當階數的差分運算實現差分后平穩,就可以對差分后序列進行ARMA模型擬合。 3.結語 社會科學文獻出版社近日發布的《國際人才藍皮書:中國留學發展報告》顯示,2012年中國出國留學人數已占全球人數的14%,而成為全球輸出留學生最多的國家。“進入新世紀以來,最突出的新情況就是自費出國群體激增,低齡化、大眾化、選擇多樣化、地域分布廣,專業選擇更實用,出國方式更多”。中國與全球化研究中心主任王輝耀如是總結。在全球教育水平發展各異的各個國家中,美國以其最權威的學術水平、最高端的科研能力及匯集了頂尖的名校、教授和人才的特征成為對中國學生最有吸引力的國家。美國是我們研究留學發展趨勢最有代表性的國家。近幾年中國赴美國留學人數激增,成為美國第一國際生源國。自中美兩國建交以來,美國成為中國開展教育對外交流最重要的國家。 留學的大潮勢必會對未來的國際國內形勢造成巨大影響。隨著出國留學從精英教育向大眾教育的轉變,留學會越來越受到各界的關注。不斷升溫的“留學熱”不僅是中國社會發展的必然結果,還是加快中國發展進程的積極力量。 本文確定了一個較合適的ARIMA模型,對歷年赴美留學人數進行了相對簡單的擬合和預測,定量分析了留學發展的基本情勢。但是留學的“大眾化”只是近一二十年才日漸顯著的,數據明顯不足。時間序列分析可以提供一種分析思路。眾多留學機構、部門及專家學者都是基于非常有限的信息,但通過更復雜、全面的數據與模型對今后數年的留學人數做了更科學的估計與預測。2013年后,每當新的一年的留學生數據產生的,本模型可以不斷修正、完善,并因觀測值的增加而具備更精準的預測能力,從而得出更有價值的預測結果。 參考文獻: [1]王燕.應用時間序列分析[M].北京:中國人民大學出版社,2008. [2]王輝耀.中國留學發展報告(2012)[M].北京:社會科學文獻出版社,2012:37-47. [3]鄧暉,崔琦,賈遠琨.出國留學人數激增莘莘學子究竟為了啥[N].中國改革報,2012-10-17(4).