劉皛 宋村夫
摘要:部隊(duì)在外人員管理已成為制約部隊(duì)安全和發(fā)展的“瓶頸”,通過利用數(shù)據(jù)挖掘技術(shù)收集部隊(duì)在外人員海量數(shù)據(jù)、建立分類模型、分析數(shù)據(jù)關(guān)聯(lián),挖掘潛在有用信息,以此評(píng)估在外人員安全系數(shù)、預(yù)測(cè)傾向性問題和高頻率易發(fā)問題,為部隊(duì)管理決策提供支持,實(shí)現(xiàn)部隊(duì)精細(xì)化管理。
關(guān)鍵詞:在外人員;數(shù)據(jù)挖掘;分類;模型
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)08-0252-02
部隊(duì)在外人員因違規(guī)違紀(jì)引發(fā)的事故問題,暴露出一些部隊(duì)教育管理的重大漏洞。在大數(shù)據(jù)背景下,利用數(shù)據(jù)挖掘技術(shù)從海量在外人員數(shù)據(jù)中提取挖掘信息,建立分類模型,分析數(shù)據(jù)關(guān)聯(lián),可以達(dá)到評(píng)估在外人員安全系數(shù)、預(yù)測(cè)傾向性問題和高頻率易發(fā)問題、及時(shí)采取有效應(yīng)對(duì)措施、確保部隊(duì)安全穩(wěn)定的目的。
1部隊(duì)在外人員管理現(xiàn)狀
在外人員主要是指外借、探親休假、住院、待轉(zhuǎn)業(yè)、因公出差和在外學(xué)習(xí)培訓(xùn)等,不在部隊(duì)營(yíng)區(qū)內(nèi)、不在管理視線內(nèi)、不在組織和群眾直接監(jiān)督之下的人員。在外人員遠(yuǎn)離部隊(duì)、遠(yuǎn)離組織,教育管理易出現(xiàn)空檔和盲區(qū),是易發(fā)生事故案件和違紀(jì)問題的重點(diǎn)對(duì)象。
隨著部隊(duì)信息技術(shù)革新和大數(shù)據(jù)工程的全面推進(jìn),人員管理也不斷向信息化轉(zhuǎn)變,從基礎(chǔ)計(jì)算工具到信息數(shù)據(jù)存儲(chǔ),再到全面管理乃至于戰(zhàn)略決策支持,對(duì)信息技術(shù)的應(yīng)用不斷深入和擴(kuò)展。但盡管部隊(duì)自身擁有豐富的大數(shù)據(jù)資源,在外人員信息數(shù)據(jù)卻未受到關(guān)注,更未從中挖掘出隱藏的、事先不知道、但是有潛在關(guān)聯(lián)的信息,以滿足部隊(duì)精細(xì)化、科學(xué)化管理的需要。
2數(shù)據(jù)挖掘在部隊(duì)在外人員管理中的應(yīng)用構(gòu)想
數(shù)據(jù)挖掘是將傳統(tǒng)的統(tǒng)計(jì)分析方法和處理大量數(shù)據(jù)的復(fù)雜算法結(jié)合起來,從大量的、不完全的、有噪聲的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、事先不知道的但又是潛在有用的信息和知識(shí)的過程。通過綜合部隊(duì)在外人員信息數(shù)據(jù)和歷史事故案件數(shù)據(jù),利用數(shù)據(jù)挖掘分類和回歸算法,建立符合管理實(shí)際的評(píng)估模型,實(shí)現(xiàn)細(xì)致的分類管理,提高預(yù)防等級(jí)。數(shù)據(jù)挖掘通常分為四步:資源發(fā)現(xiàn)、信息選擇和預(yù)處理、建立模型和評(píng)價(jià)。
2.1收集在外人員相關(guān)數(shù)據(jù)
通常,大數(shù)據(jù)采集是通過RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)、視頻攝像頭的實(shí)時(shí)數(shù)據(jù)、來自歷史視頻的非實(shí)時(shí)數(shù)據(jù),以及社交網(wǎng)絡(luò)交互數(shù)據(jù)及移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)等方式獲得的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化的海量數(shù)據(jù)。我們綜合在外人員基本情況、思想狀況、軍事訓(xùn)練情況、考核情況、崗位特點(diǎn)、專業(yè)技能、興趣愛好、家庭情況、居住情況、消費(fèi)情況、季節(jié)特點(diǎn)、外出時(shí)間、活動(dòng)場(chǎng)所、動(dòng)態(tài)軌跡、社交網(wǎng)絡(luò)等數(shù)據(jù),存儲(chǔ)并處理三類信息:人事檔案信息,即電子化人事信息;日常管理信息,即在部隊(duì)期間的考勤、考核、思想現(xiàn)狀、崗位特點(diǎn)、工資待遇等信息;動(dòng)態(tài)管控信息,即在外時(shí)間、外出季節(jié)、在外事由、活動(dòng)場(chǎng)所、動(dòng)態(tài)軌跡、社交情況等信息。
2.2數(shù)據(jù)轉(zhuǎn)換與選擇
因?yàn)檫M(jìn)行挖掘的數(shù)據(jù)必須滿足完整性、精確性、一致性等要求,才可以作為數(shù)據(jù)模型輸入的字段值,而項(xiàng)目的數(shù)據(jù)可能來自多個(gè)系統(tǒng),不同的系統(tǒng)其數(shù)據(jù)質(zhì)量不一,存在數(shù)據(jù)代碼化、關(guān)鍵屬性值缺失或無法拆分聚合數(shù)據(jù)等情況,各數(shù)據(jù)源的原始數(shù)據(jù)并未經(jīng)過加工和處理,所以,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)預(yù)處理主要?jiǎng)澐譃橐韵聨讉€(gè)步驟:原始類型轉(zhuǎn)換、清理、整合、拆分、終止。在數(shù)據(jù)清理階段,判斷數(shù)據(jù)是否重復(fù)。數(shù)據(jù)清理完成后,根據(jù)需求將數(shù)據(jù)整合為數(shù)據(jù)庫,并根據(jù)不同的主題分類抽取數(shù)據(jù)變量,通過數(shù)據(jù)導(dǎo)入功能存入數(shù)據(jù)中心庫中。以此完成數(shù)據(jù)的準(zhǔn)備工作,為后續(xù)數(shù)據(jù)模型的生成建立基礎(chǔ)。
2.3建立模型
數(shù)據(jù)挖掘主要有四種任務(wù),即關(guān)聯(lián)分析、分類與回歸、聚類分析和離群點(diǎn)檢測(cè)。其中,分類和回歸是兩種不同的預(yù)測(cè)方法,邏輯回歸是廣義線性回歸分析模型的一種,具有易解釋、易使用等優(yōu)勢(shì)特點(diǎn)。為分析在外人員動(dòng)態(tài)數(shù)據(jù)與人員發(fā)生事故風(fēng)險(xiǎn)情況之間的規(guī)律,預(yù)測(cè)傾向性問題和事故案件發(fā)生的概率,可建立基于邏輯回歸算法的在外人員分析模型,在軌跡數(shù)據(jù)處理的基礎(chǔ)上,使用邏輯回歸算法,得到以在外人員評(píng)分模擬關(guān)系為計(jì)算基礎(chǔ)的風(fēng)險(xiǎn)評(píng)分,為科學(xué)決策管理提供依據(jù)。
2.4模型評(píng)估
完成模型訓(xùn)練后,采用分析節(jié)點(diǎn)的模型準(zhǔn)確率分析功能,進(jìn)行模型準(zhǔn)確性分析。為保證基于邏輯回歸的在外人員評(píng)分模型的算法有效性,還可以采用C5.0決策樹與SVM算法,對(duì)其計(jì)算結(jié)果準(zhǔn)確率進(jìn)行比對(duì)和分析。
3應(yīng)把握的幾個(gè)問題
對(duì)部隊(duì)而言,大數(shù)據(jù)所能帶來的巨大能量已經(jīng)顯現(xiàn),數(shù)據(jù)挖掘技術(shù)也已慢慢地從高端的研究轉(zhuǎn)向日常的應(yīng)用。基于大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)在部隊(duì)在外人員管理中的應(yīng)用應(yīng)把握以下問題。
3.1提升大數(shù)據(jù)背景下部隊(duì)信息化建設(shè)水平
相對(duì)于過去的數(shù)據(jù)處理方式,無論是過程、數(shù)據(jù)類型、處理標(biāo)準(zhǔn),還是處理對(duì)象,都存在著巨大的差異。大數(shù)據(jù)在本質(zhì)上仍然是海量數(shù)據(jù),但規(guī)模更大、實(shí)時(shí)性和多樣性等特點(diǎn)更明顯,在外人員信息中包含的可能是非結(jié)構(gòu)化數(shù)據(jù),如圖片、視頻、文字,處理這些數(shù)據(jù)有著極其重要的意義。因此,相應(yīng)的數(shù)據(jù)挖掘技術(shù)也需要有所改進(jìn),研究如何將這些半結(jié)構(gòu)化甚至非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,是目前大數(shù)據(jù)挖掘面臨的挑戰(zhàn)之一,也是部隊(duì)信息化建設(shè)中要面對(duì)的一個(gè)重大課題。
3.2如何去噪聲留信號(hào)
在海量的數(shù)據(jù)里面大部分都只是噪聲而已,真正有用的信息非常少。在進(jìn)行數(shù)據(jù)清洗時(shí),不易把握清洗粒度。粒度太大,殘留的噪聲會(huì)干擾有價(jià)值的信息;粒度太小,可能會(huì)遺失有價(jià)值的信息。因此,部隊(duì)在外人員信息數(shù)據(jù)預(yù)處理面臨的一大難點(diǎn)就是如何將正確的信號(hào)從混雜了噪音的數(shù)據(jù)中提取出來,提高分析挖掘數(shù)據(jù)的能力。
3.3改進(jìn)數(shù)據(jù)挖掘算法
在上文中提到的模型建立階段,可采用更多的數(shù)據(jù)挖掘算法,得到不同的決策結(jié)果,從而提供更多的決策依據(jù)。另外,大數(shù)據(jù)時(shí)代數(shù)據(jù)的量級(jí)達(dá)到了一個(gè)新的階段,而且還有其他新的特征,現(xiàn)有挖掘算法需要基于云計(jì)算進(jìn)行改進(jìn),以適應(yīng)不同應(yīng)用對(duì)數(shù)據(jù)處理能力的需求。
參考文獻(xiàn):
[1] 陳工孟,須成忠.大數(shù)據(jù)導(dǎo)論[M].清華大學(xué)出版社,2015.
[2] 吳功宜,吳英.計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用技術(shù)教程[J].2014.
[3] 李孟杰.數(shù)據(jù)挖掘技術(shù)在人力資源管理領(lǐng)域的管理與應(yīng)用[J].2013.
[4] 陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].2017.
[5] 舒正渝.淺談數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J].2015.
【通聯(lián)編輯:光文玲】