李婧文 朱毅


摘要:隨著互聯網技術的發展與進步,網絡技術已經滲透到人們生活的各方各面。借助于網絡平臺,網絡招聘以其高效便捷、范圍廣、無地域限制等優點,逐漸超越人才招聘會等傳統招聘方式,成為現今求職的首要渠道。該文以北京市python開發工程師這一職位的需求量為例,運用時間序列預測模型(ARIMA模型),對未來該職位需求量進行預測,利用創新型招聘技術提高求職效率、提升網絡招聘的服務質量。
關鍵詞:網絡招聘;時間序列;預測
中圖分類號:TP393 文獻標識碼:A
文章編號:1009-3044(2020)15-0022-02
1引言
中國勞動人口眾多,就業形勢日趨嚴峻,網絡招聘和求職沒有時間、地域的限制,節省了時間、精力和費用,越來越受到廣大求職者的青睞。對于高校畢業生來講,選擇一個前景廣闊的行業十分重要,目前網絡招聘信息繁雜,而且相當多的招聘網站提供的是網絡中介服務,功能過于單一,用戶滿意度不高,跟不上市場需求的變化。因此為求職者提供直觀數據,是現今網絡招聘服務網站的發展目標。
2原理與統計方法
2.1 ARIMA模型的基本原理
ARIMA模型的全稱叫作自回歸移動平均模型,是統計模型中最常見的一種用來進行時間序列預測的模型,是由博克思(Box)、詹金斯(Jenkins)于20世紀70年代初提出的著名時間序列預測模型,又稱為Box-Jenk ins模型。其中AR是自回歸,p為自回歸項;MA為移動平均,q為移動平均項數,d為時間序列成為平穩時間序列時所做的差分次數。ARIMA(p d,q)模型的實質就是差分運算與ARMA(p,q)模型的組合,即ARMA(p,q)模型經d次差分后,即為ARIMA(p,d,q)模型。
2.2數據獲取與統計方法
以“北京市python開發工程師”的職位為例,分別對智聯招聘、百度招聘等招聘網站中該職位的招聘信息進行調查。選取2018年4月~2018年10月的數據,用于模型的建立;2018年11月至2019年1月的數據,用于模型檢驗。對于缺失數據,取各月份職位需求量的平均值。
受到經濟、企業招聘周期等制約因素影響,職位信息具有非平穩性、非線性的屬性。以職位的需求量為例,其數據隨著時間的推移而產生變化,呈現一定的規律性。使用ARIMA模型來擬合,采用自相關分析與偏相關分析的方法來確定模型的類別,即進行模型結構辨識;采用差分的方式進行數據平穩化。如果時間序列的不平穩是由于存在趨勢特征時,如數值總體上逐漸增加或者減少,則進行一次差分運算,將差分后的序列作為模型的輸入序列。如果一次差分后仍不平穩,則繼續進行差分運算,直到序列平穩為止。經過差分運算后,可將帶有趨勢特征的非平穩序列轉化到一個較為平穩的時序數據。
3模型擬合過程與結果
3.1模型的辨識
將實驗數據處理,進行對數變換后,發現非平穩性并未消除,則需要通過差分將數據平穩化。數據進行一次差分后仍為非平穩序列,則進行二次差分。經過二次差分后的數據(如圖1所示),近似平穩。對進一步對其進行單位根檢驗(ADF檢驗),檢測值小于5%時的臨界值,顯示為平穩序列。將處理后的數據,進行自相關分析及偏相關分析(如圖2、圖3所示),偏自相關系數一階截尾,自相關圖顯示拖尾性。根據上述結論,判斷為ARMA(p,q)模型。
3.2模型的參數估計與檢驗
由3.1可知,觀察自相關圖及偏相關圖,偏自相關系數一階截尾,自相關圖顯示拖尾性,初步判定p=1、q=0。為精確起見,選用p,q=0、1為模型參數進行擬合。
為彌補根據自相關圖和偏自相關圖定階的主觀性,在模型擬合優度的問題上,本文采用AIC定階準則。該準則在極大似然值的基礎上對模型的階數和參數給出一組最佳估計。AIC準則是在給出不同模型的AIC計算公式的基礎上,選取使AIC值最小的那一組階數為最佳階數。對于模型ARMA(0,1)、ARMA(1,0),通過計算取得他們的AIC值為3.2245和3.2386。根據AIC定階準則,ARMA(0,1)模型的AIC值小于ARMA(1,0)模型的AIC值,因此選擇ARMA(0,1)模型。
模型的檢驗主要是進行殘差項的白噪聲檢驗。由于AR—MA(p,g)模型的識別與估計是在假設隨機擾動項是在白噪聲的基礎上進行的,因此,如果估計的模型確認正確的話,殘差應代表白噪聲序列。如果通過所估計的模型計算的樣本殘差不是白噪聲,則說明模型的識別與估計有誤,需重新識別與估計。觀察ARMA(0,1)模型的殘差序列,并未存在明顯特征,可看作是無規律的隨機白噪聲,即模型擬合成功。
應用該模型對2018年4月至2019年1月北京市python開發工程師職位需求量進行預測,預測結果如圖3-4所示。該模型得到的預測值與真實值平均誤差率在1.03%。從數據及圖形上,該模型預測結果較為合理。
4結論
ARIMA模型適用于數據量小的短期預測,預測結果精確程度較高。當數據量增大時,為提高預測準確度,可根據補充的數據修正該模型。但隨著預測期的延長,模型的預測誤差將逐漸增大,故可使用該模型進行短期預測。
本文利用ARIMA模型針對某一地區某一職位的需求量進行預測,并取得了較好的預測效果,為網絡招聘服務提供巨大的發展空間。對于該領域其他方面的預測,可以把影響因素作為輸入變量,進行多變量的時序分析,擬合出更加合理精確的模型。