□楊 艷,雷咪咪
(1.陜西學前師范學院數學與統計學院,陜西 西安 710100;2.西安財經大學統計學院,陜西 西安 710100)
農村一二三產業融合發展,是社會經濟發展到一定階段的必經之路。《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》提出優先發展農業農村,全面推進鄉村振興,推動農村一二三產業融合發展。2021 年底中央農村工作會議強調要聚焦產業促進鄉村發展,深入推進農村一二三產業融合,大力發展縣域富民產業,推進農業農村綠色發展,讓農民更多分享產業增值收益。
陜西是華夏農耕文化的重要發祥地之一,農耕文化歷史悠久,農業資源豐富多樣,農業科技力量雄厚,特色產業優勢突出,農村經濟發展平穩。根據《陜西省統計年鑒2021》的數據可知,2020 年底陜西省總人口3 955 萬人,其中城鎮人口2 478 萬人,占總人口的62.66%;鄉村人口1 477 萬人,占37.34%。陜西省經濟發展勢必會改變就業形勢,各產業的就業規模、就業結構及就業質量都會發生變化。從陜西省農村實際情況看,一二三產業融合尚存在資金、技術、人才等一系列問題。隨著工業化、城鎮化迅速發展,農村勞動力“空心化”、老齡化、人才支撐不足等問題加劇。農業就業崗位少,農民收入增長緩慢,很多農村青壯年勞動力離開農村,嚴重影響了三產融合經濟效應的充分發揮。三產融合在推動經濟增長的同時,也產生了就業創造和就業消失效應。因此,研究農村一二三產業融合的就業效應,對“十四五”期間補齊陜西省農村發展短板、全面推進鄉村振興具有積極意義。其中,陜西省農村勞動力市場發展、農村勞動力資源優化配置與當前農村一二三產業融合進程息息相關。
本研究利用ARIMA 模型對1998—2017 年陜西省農村就業人口序列進行分析和建模,進一步研究三產融合背景下陜西省農村的就業效應,為當地經濟發展提供參考。
ARIMA 模型是將非平穩時間序列通過差分運算轉化為平穩時間序列,然后利用平穩時間序列的建模方法,對經過差分后的平穩序列擬合ARMA 模型。利用這種建模思路所擬合的模型稱為求和自回歸移動平均模型,記為ARIMA 模型。
ARIMA 模型結構:若序列{x}可以通過階差分轉化為平穩時間序列,即{x}={△x}是一個平穩時間序列,且可以擬合一個平穩可逆ARMA(,)模型,則序列{x}可以擬合如下形式的模型。

式中:Φ()=1--…φB,Θ()=1--…θB。
具有上述結構的模型稱為求和自回歸移動平均模型,記為ARIMA(,,)。移動平均自回歸模型(ARIMA)是一類常用的時間序列模型,精度較高,適合短期預測,可以用來分析時間序列的隨機性、平穩性等特征,從而選擇適當模型進行預測。
獲得觀察值序列,檢驗時間序列是否是平穩的時間序列。如果是平穩的,進一步檢驗該序列是否是白噪聲,如果不是白噪聲序列,則可以擬合ARMA 模型。建模過程如圖1 所示。

圖1 ARIMA 模型建模流程圖
根據國家統計局網站上提供的數據,從1978 年起開始有農村就業人數的記錄。從《陜西省統計年鑒2021》中收集整理了1978—2020 年陜西省鄉村就業人數的時間序列,見表1。
由表1 的數據可知,從1978 年起,陜西省農村就業人數迅速增長,1994 年起增速減緩,2000 年開始小幅回落,2003 年起又開始穩步增長,從2006 年開始再次回落,2009 年起基本保持逐年遞減的趨勢。
由于統計指標的調整,陜西省農村就業人數從1999 年開始有了具體的產業分類統計數據。根據研究需要,本研究從表1 中截取了1998—2017 年的時間序列進行數據分析與預測。

表1 1978—2020 年陜西省鄉村就業人數
3.2.1 數據的處理與分析
平穩性檢驗是構建ARIMA 模型的首要步驟。首先對陜西鄉村就業人數的時間序列進行平穩性檢驗。利用adf.test 函數進行ADF 檢驗,經ADF 檢驗發現,Dickey-Fuller=0.741 411,值為0.99,在5%置信水平下拒絕原假設,說明此序列是非平穩序列。結合圖2陜西省鄉村就業情況的時序圖可知,數據前期呈上升趨勢,隨后呈現持續下降趨勢,因此需要對數據進行平穩化處理。使用R 語言,運行的ADF 檢驗結果如下。

圖2 陜西省鄉村就業情況時序圖(1998—2017 年)

3.2.2 平穩化處理
對一階差分后的新序列進行平穩性檢驗,經ADF檢驗后,發現=0.019 34,通過了穩定性檢驗,結合圖3 陜西省鄉村就業人數一階差分時序圖可知,一階差分后的序列是平穩序列,不存在單根問題,因此ARIMA(,,)模型中的參數=1。使用R 語言,運行的ADF 檢驗結果如下。

圖3 陜西省鄉村就業人數一階差分時序圖(1998—2017 年)

3.2.3 序列白噪聲檢驗
白噪聲檢驗的原理:如果延遲6 階和延遲12 階的LB 統計量的值均小于0.05,則可以判斷此序列是一個非白噪聲序列。經過檢驗,由差分獲得的平穩序列為平穩非白噪聲序列。使用R 語言進行白噪聲檢驗的結果如下。

3.2.4 模型識別
對平穩非白噪聲序列進行建模。根據自相關圖和偏自相關圖來選擇模型,對一階差分后的序列進行自相關(acf)和偏自相關(pacf)分析,并繪制出自相關系數(ACF)和偏自相關系數(PACF)圖,見圖4。
根據圖4 可知,滯后階數逐漸增加時,自相關系數(ACF)逐漸減小趨近于0;偏自相關圖在1 階后減小到0,故選擇ARIMA(1,1,0)模型。在R 語言環境下,使用ARIMA 函數的具體建模過程如下。

圖4 自相關系數(ACF)和偏自相關系數(PACF)圖

3.2.5 模型檢驗
合理的模型其殘差應該滿足均值為0 的正態分布。繪制正態Q-Q圖并進行模型殘差自相關系數分析。
構建的模型殘差理論分位數和樣本分位數絕大多數落在線上,見圖5,說明殘差近似均數為0 的正態分布。

圖5 正態Q-Q 圖
進一步進行殘差白噪聲檢驗(Ljung-Box 檢驗),殘差為純隨機序列即白噪聲,Ljung-Box 檢驗發現所有值>0.05,拒絕原假設,即可認為殘差的自相關系數為0,模型ARIMA(1,1,0)可以比較好地擬合本數據。在R 語言環境下,對模型ARIMA(1,1,0)的殘差序列進行白噪聲檢驗,結果如下。

3.2.6 模型擬合和模型預測
利用SPSS 軟件擬合陜西省鄉村就業人數真實值和ARIMA 模型擬合值的趨勢,發現ARIMA(1,1,0)模型的趨勢與真實值趨勢差別不大,大多數真實值都落在擬合值95%的置信區間中,較好地擬合了陜西省鄉村就業人數,見圖6。

圖6 模型擬合圖
利用ARIMA(1,1,0)模型預測2018—2020 年陜西省鄉村就業人數,顯示鄉村就業人數都在ARIMA模型預測值95%置信區間內,預測結果見表2。實際值與預測值的平均相對誤差為5.817 7%,表示這個模型能較好地預測趨勢效果,可以較好地把握陜西省鄉村就業人數的趨勢。

表2 ARIMA(1,1,0)模型鄉村就業人數預測值
對1998—2017 年陜西省鄉村就業人數時間序列進行分析并建立模型。因為1998—2017 年陜西省鄉村就業人數的時間序列非平穩,故而使用Box-Jenkins法建立ARIMA 模型。根據所建立的ARIMA(1,1,0)模型,對陜西省農村就業人數進行預測,達到了較好的短期預測效果。通過對陜西省農村就業人數的時間序列進行分析,可以從就業規模的角度反映陜西省農村一二三產業融合的就業效應,為進一步研究提供方法和思路,也有助于在地方制定經濟發展目標時提供決策依據。