胡霖
摘 要: 針對大數據下的人力流動區域的估算問題,提出基于大數據分析的人力流動區域估計仿真模型。引進了K近鄰非參數估計仿真模型,對大數據背景下的人力流動區域進行標準估算。同時能夠對K值進行預留計算,避免大數據干擾的發生,優化了分類近鄰子集生成模塊,有效地提高了估算能力以及估算的范圍,對人力流動區域的估算準確性有極大的幫助。并進行實驗分析,由實驗分析可知,提出的方法能夠準確地對人力流動的區域進行系統的估算。
關鍵詞: 大數據分析; 人力流動區域; 估計模型仿真; K近鄰非參數估計
中圖分類號: TN911?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)24?0074?03
Abstract: In allusion to the estimation problem of human resource flow region under the background of big data, an estimation simulation model based on big data analysis is proposed for human resource flow region. The K?nearest neighbor nonparametric estimation simulation model is introduced to perform standard estimation of human resource flow region under the background of big data. The K value is reserved for calculation to avoid the occurrence of big data interference. The classified nearest neighbor subset generation module is optimized to effectively improve the estimation capability and estimation range, which is of great help to the estimation accuracy of human resource flow region. The experiment was carried out. The experimental analysis results show that the proposed simulation model can perform systematic estimation of human resource flow region accurately.
Keywords: big data analysis; human resource flow region; estimation model simulation; K?nearest neighbor nonparametric estimation
0 引 言
人力資源在區域內流動可以推進該區域的經濟發展以及城市化建設,而人力資源的流動過程又會產生一定的流動副產品[1?2],人力資源的流動可以提高區域勞動力以及區域的文化交融水平,極大地刺激了物質文化的各個領域。所以,需要利用大數據分析的方法對區域人力資源的流動情況進行預計以及估算[3?4],這樣可以有效地根據人力資源的流動情況進行資源的預計調配以及優化使用。
在人力資源的流動過程中,人力資源本身是一種資源的數據概括量,具有很大的流動性以及不確定性。通過使用大數據的分析方法能夠對人力資源的流動進行屬性定位以及條件限制[5],這樣便可以使用對應的數據估算方法進行系統的預算[6?7]。傳統的數據模型由于使用過程中需要對數據采集分量進行設置,所以使用起來比較復雜。因此,提出基于大數據分析的人力流動區域估計仿真模型系統,使用K近鄰非參數估計仿真模型對人力資源的流動進行估算,避免了使用數據采集分量的可能性。為了檢驗本文設計的基于大數據分析的人力流動區域估計仿真模型的有效性,設計了對比仿真試驗,通過實驗可以證明,改進的估計仿真模型,能夠有效準確地對區域人力資源的流動進行估計。
1 人力流動區域估計模型設計方案
1.1 仿真模型硬件設置
本文設計的基于大數據分析的人力流動區域估計仿真模型,其硬件設計的結構主要有三層,由于人力資源數據是一個非線性序列,設計的三層結構可以對非線性序列進行一定的處理計算。第一層是人力資源大數據的采集層,為了減少計算的復雜程度,運用SIYB采集系統;第二層為數據運算處理層;第三層為數據存儲層。除此三層結構以外,仿真模型中還包括電源系統、控制系統、顯示模塊、入錄模塊以及認證識別模塊。設計的基于大數據分析的人力流動區域估計仿真模型結構圖如圖1所示。
1.2 引進K近鄰非參數估計仿真模型
基于大數據分析的人力流動區域估計仿真系統適用于K值近鄰參數的估算方法,可提高數據采集的準確程度,同時避免了采集過程中采集分量設置。近鄰參數公式如下:
式中: 為大數據的趨勢度;為大數據的采集分量;為采集數據的規模參量;為規劃數據參量;為預處理的假使參量。通過近鄰參數的計算可以達到采集數據的條件限制,對大數據的參量進行估算前還需要對大數據的變量進行趨勢預測,公式為:
式中:為恒定參數;為高趨勢的起始量;為高趨勢的終止量;是大數據的突變幾率。經過上述的處理便可以進行K值的近鄰非參數的估算,公式為:
式中:表示數據的流動變化參量;表示數據特征的附屬函數;是限制數據的坐標參量;表示數據預計結果;是數據的軸向系數;為數據的采集走勢。endprint
1.3 近鄰子集的優化設計
為了保證本文設計的基于大數據分析的人力流動區域估計仿真模型計算的準確性,優化了近鄰子集。近鄰子集是對數據使用條件限制,能夠有效解決數據干擾的問題,優化過程為:
式中:為殘差序列;為限定誤差修正項;反映變量之間的數位差;是衡量變化大小的參數。對近鄰子集的誤差修正為:
式(5)是為大數據進行一階差分計算。這樣可以對人力流動的區域進行選集的設定,引入了修正后的子集時間,保證計算的準確性,公式為:
經過優化的鄰近子集滿足時間條件的限制,能夠提高計算的準確性,同時完善了本文設計的基于大數據分析的人力流動區域估計仿真模型的限定能力。
1.4 構建F統計量
構建F統計量能夠保證仿真模型的估算過程中不會受到參數的過度限制,這樣有助于本文設計的仿真模型的參量計算,由于大數據區域估算具有一定的隨機性,因此構建了F統計量。預處理過程為:
式中:為F值波動起始量;為數據的隨機參量;為模型適應參量。若系統模型的數據接收量的極限為,則模型接納能力飽和。若為空集,那么模型將無法計算。F統計量集合限定條件為:
對集合進行限定,是保證設計的基于大數據分析的人力流動區域估計仿真模型能夠在計算的過程中正常運行,對運行矩陣進行限定是保證數據采集準確性的關鍵,限定條件為:
式中:為人力流動飽和總量;為估計仿真模型的特征函數;為人力流動臨近矩陣;為模型限定參數;為人力流動數據權重;為模型調整參數;為隨機干擾函數。
根據不同情況需要對計算參量進行調整,參量變化條件是由決定,參量調整條件為:
通過上述的公式調整能夠保證數據的有效性,通過對使用條件的限定保證了設計的模型能夠正常的運作,限定的使用條件保證計算的準確性,參量的限定保證了設計過程能夠更加精準地對人力流動區域進行計算。
2 仿真模型的實現
2.1 參數設定
根據上述仿真設定的參量以及環境設定,進行實驗,結果分析如下。
2.2 結果分析
實驗結果如表1所示。
分析表1結果得知,本文設計的基于大數據分析的人力流動區域估計仿真系統,避免了采集分量的限制,能夠通過大數據分析出人力資源的變化趨勢。
3 結 語
本文設計的基于大數據分析的人力流動區域估計仿真系統,引進了K近鄰非參數估計仿真模型,對大數據背景下的人力流動區域進行標準估算,避免大數據干擾的發生,同時優化了分類近鄰子集生成模塊,有效地對人力流動區域進行劃分,保證了人力流動區域的分配更加的完整,解決了傳統估算方法的局限性。通過實驗的數據可以證明本文設計的仿真模型能夠準確的進行區域人力流動的估算。
參考文獻
[1] 高昭昇,曹晉軍,馮柳,等.基于大數據的傳染病爆發、預測和預警等應用分析[J].中國衛生事業管理,2016,33(4):270?272.
[2] 王雪蓉,萬年紅.基于跨境電商可控關聯性大數據的出口產品銷量動態預測模型[J].計算機應用,2017,37(4):1038?1043.
[3] 朱軼婷,李霖,韓玉巧.基于大數據分析的多館制圖書館文獻資源典藏策略研究[J].圖書館工作與研究,2016,1(4):77?82.
[4] 王勇,董恒新.大數據背景下中國季度失業率的預測研究:基于網絡搜索數據的分析[J].系統科學與數學,2017,37(2):460?472.
[5] 牛方曲,劉衛東.基于互聯網大數據的區域多層次空間結構分析研究[J].地球信息科學學報,2016,18(6):719?726.
[6] 蔣小榮,汪勝蘭.中國地級以上城市人口流動網絡研究:基于百度遷徙大數據的分析[J].中國人口科學,2017(2):35?46.
[7] 鄧中亮,張森杰,焦繼超,等.CCF BigData 2015+222基于高精度室內位置感知的大數據研究與應用[J].計算機應用,2016,36(2):295?300.endprint