陳 芳,楊詩琪,徐碧晨
(1.中國民航大學 安全科學與工程學院,天津 300300;2.西安咸陽國際機場股份有限公司 現場運行中心,陜西 西安 710086)
隨著民航運輸規模的擴大,民航業已成為數據密集型產業,但卻存在絕大部分運行數據未有效利用,數據向信息轉化程度不夠的問題,面臨“數據海量,信息匱乏”的困境。有效的安全管理高度依賴于安全數據收集、分析和綜合管理能力[1],從安全數據中獲取的安全信息可為管理人員制定安全決策、指導安全管理的具體行動提供支持[2]。民航局雖然對安全信息管理人員設立了準入要求,但并未對人員的數據分析、挖掘等能力做出要求,難以對安全管理決策提供有效的支持。因此,設立民航安全信息管理人員的崗位任職資格要求,構建準確、客觀、高效的民航安全信息管理人員能力與崗位匹配測評模型,是提高安全信息管理水平的重要舉措。
在民航安全信息管理能力的研究中,學者們從僅關注信息管理某一環節的能力逐步發展到關注信息輸入到輸出的全過程,從信息收集、信息分析、信息應用、信息共享等方面構建信息管理能力的指標體系[3-4];齊曉云等[5]認為個體的知識、潛在的職業精神等對安全信息管理工作的實施起著關鍵作用,從業務能力、基本知識等方面設計了人員勝任力模型并構建了安全信息管理人員的勝任力指標體系。但上述研究均將視角局限在傳統信息管理層面,注重信息資源本身的管理和利用,較少關注于從信息中挖掘情報即挖掘有效信息的能力,已然難以滿足大數據時代“數據驅動安全管理”的要求。
在能力-崗位需求匹配度的測量研究中,學者們一般采用直接測量或間接測量的手段。直接測量要求被調查者對其與工作的組織的匹配程度進行直接評價[6-7],一般為個人直接進行自評,具有非常強烈的主觀性。間接測量則通過設置可直接測量的中間特征,并利用數學方法進行測量。傳統的間接測量方法包括傳統統計學方法、模糊綜合評價方法等[8-9],為了適應大數據環境的要求,構建更加客觀、精確、高效率的人員能力評價模型,有學者嘗試將機器學習算法應用于人員能崗匹配測評中,基于BP神經網絡(BPNeural Network,BPNN)構建人員能力評價模型[10-11],但單一BPNN模型結果往往參數取值不確定,穩定性較差,會產生較大誤差。
針對上述問題,通過分析勝任力內涵,基于數據生命周期和信息處理層次結構理論,建立民航安全信息管理人員勝任力指標體系,為克服單一BPNN在模型精度和收斂速度方面的不足,引入貝葉斯(Bayes)優化算法對BPNN的超參數尋優,構建基于Bayes優化BPNN的民航安全信息管理人員能力評價模型,以期為民航企事業單位招聘、選拔、評價安全信息管理人員,提供理論依據。
隨著世界各行各業對專業人員的綜合素養和跨學科能力的要求逐漸提高,經濟合作與發展組織、聯合國教科文組織等國際組織認為人員勝任力的內涵為運用行業背景所依托的相關學科或專業交叉的知識、技能和態度解決復雜問題的綜合能力[12-14]。
信息管理是以數據管理為基礎、以信息流為管理對象的管理模式,而民航安全信息管理的目的是通過民航安全信息收集、分析和應用,實現安全信息共享,推進安全管理體系建設,從而預防民用航空事故發生[15]。因此,民航安全信息管理人員應具備的知識包括:數據科學知識和民航安全管理知識,這些知識能夠為民航安全信息管理技能提供支撐。在大數據時代,“數據范式”成為信息管理的新研究范式,對數據進行挖掘、分析和利用以支持安全管理決策成為信息管理的核心[16],通過以上分析可知,民航安全信息管理人員勝任力的本質是數據素養[17]。依據數據生命周期理論構建素養模型能夠很好地體現數據的流動過程,故基于“數據驅動的安全管理”過程[1]以及信息處理層次結構理論的數據-信息-知識-智慧層次結構[18],提出民航安全信息管理人員應具備的技能包括:定義問題或目標的能力、民航安全數據收集能力、民航安全數據挖掘能力、民航安全信息分析能力、民航安全信息應用能力、民航安全信息共享能力。最后,具有批判性思維等民航安全信息管理態度能夠對技能起到導向作用。構建的民航安全信息管理人員勝任力概念模型見圖1。
圖1 民航安全信息管理人員勝任力概念模型
根據1.1所構建的民航信息管理人員勝任力概念模型,在學者Wang等[17]對關于安全專業人員數據素養研究的基礎上,構建民航安全信息管理人員勝任力指標體系,見表1。
表1 民航安全信息管理人員勝任力指標體系
由于民航安全信息管理人員勝任力指標體系具有高維度、數據具有小樣本的特點,將BPNN用于民航安全信息管理人員能崗匹配測評模型中。又考慮到全局優化算法中的Bayes優化算法能夠克服單一BPNN收斂速度慢、學習效率低,易陷入局部極小化的缺陷,能夠提升模型的精度和收斂速度,采用Bayes優化算法,依據從未知目標函數獲取的信息,找到下一個評估點,從而最快地達到最優解,能夠有效地利用完整的歷史信息來提高搜索效率,可以有效地對BPNN的超參數進行優化。構建的基于Bayes優化BPNN的民航安全信息管理人員能崗匹配測評模型,如圖2所示。
圖2 民航安全信息管理人員能崗匹配測評模型
表1(續)
2.2.1 數據收集及預處理
數據收集及預處理主要包括樣本選取及數據收集、模型訓練樣本數據處理計算2個過程。
1)樣本選取及數據收集
選取民航企事業單位從事安全信息管理工作的人員作為調查對象,通過問卷調查的方式收集調查對象各項勝任力指標的得分。
2)模型訓練樣本數據的處理計算
測評模型的輸入數據為問卷調查收集的安全信息管理人員的勝任力指標得分,采用Min-Max法將測評模型的輸入數據進行線性變換轉換到[0,1]區間[19],如式(1)所示:
(1)
輸出數據為人員的能崗匹配分值,由于該數據難以直接獲得且勝任力指標體系呈現多準則與模糊性的特點,基于DEMATEL-模糊綜合評價計算訓練樣本輸出的能崗匹配分值,步驟[20]如下:
1)確定民航安全信息管理人員能崗匹配測評指標集C={c1,c2,…,cn};
2)確定民航安全信息管理人員能崗匹配的評語集V={v1,v2,v3,v4,v5}={非常匹配,較匹配,一般匹配,較不匹配,非常不匹配},采用百分制的方法使用定量集Q={90,80,70,60,50}對結果向量進行賦值,評價等級的定量標準見表2。
表2 評價等級的定量標準
3)計算民航安全信息管理人員勝任力指標權重。利用DEMATEL分析指標之間相互作用關系,計算指標權重集A。計算步驟參考文獻[21]。
4)利用百分比統計法確定民航安全信息管理人員能崗匹配測評指標集對各評價等級的隸屬度,隸屬度集合為R=[ri1,ri2,…,ri5]。
5)計算民航安全信息管理人員能崗匹配分值,如式(2)~(3)所示。
B=A*R
(2)
E=B*QT
(3)
式中:B為測評指標的最終評價集;E為人員能崗匹配分值。
2.2.2 模型網絡結構與參數確定
1)模型網絡結構的確定
民航安全信息管理人員能崗匹配測評模型的網絡結構由輸入層、隱含層、輸出層組成,每1層含有多個神經元,每層神經元獨立存在。
在民航安全信息管理人員能崗匹配測評模型中,輸入層的數據是民航安全信息管理人員勝任力指標體系的量化數據,輸入層為民航安全信息管理人員勝任力模型指標,共有25個神經元。
輸出層代表的是最后的結果,民航安全信息管理人員能崗匹配測評模型輸出的是能崗匹配測評的量化值,因此輸出層的神經元數量為1。
隱含層神經元數量經過反復測試最終確定[22],如式(4)所示。
(4)
式中:S表示隱含層節點數量;n為勝任力指標數量,即輸入層節點數量;o表示輸出層節點數量;k表示1~10之間的常數。
2)模型網絡參數確定
為避免神經元的浪費,減少運算時間,選取newff函數自動產生初始權值與閾值。初始權值和閾值確定完成后,采用Bayes優化算法對其進行尋優,最終確定1組最優參數。
民航安全信息管理人員能崗匹配測評模型每層的連接,由激活函數決定。由于本文構建的測評模型用于回歸分析,因此輸入層到隱含層的激活函數選用非線性函數——雙曲正切Sigmod函數,隱含層到輸出層選用線性激活函數。
學習速率決定了權值和閾值的調整量,對于trainlm等函數建立的BPNN,為保持網絡穩定性,學習速率一般在[0.01,0.1]。經過多次實驗,選用自適應學習率的方法,學習速率為0.05。
數據收集階段共發放2份問卷開展問卷調查。第1份問卷為民航安全信息管理人員勝任力指標影響關系問卷,問卷采用李克特五點量表,邀請6名專家對勝任力指標之間相互影響程度打分,用于計算勝任力指標權重。其中4名為民航單位具備5 a以上工作經驗的行業專家,2名為開展安全管理研究15 a以上的學術界專家。
第2份問卷為民航安全信息管理人員勝任力調查問卷,選擇民航各企事業單位不同年齡段、不同學歷、不同從業時間的安全信息管理人員為調研對象,被調查者基于勝任力指標體系對自身的各項能力進行1~5分打分,收集的數據作為能崗匹配測評模型的輸入數據。共收集問卷106份,有效問卷102份,使用SPSS進行問卷信效度檢驗,Cronbachα系數為0.808,達到0.7以上,問卷的一致性水平較高;KMO檢驗值為0.879,Bartlett的球形度檢驗sig<0.05,說明問卷通過效度檢驗。收集的民航安全信息管理人員勝任力調查問卷數據具有合理性。
運用DEMATEL-模糊綜合評價計算102份訓練樣本的能崗匹配分值作為待評價樣本的能崗匹配期望值,計算得到部分樣本的能崗匹配分值見表3。
表3 部分樣本的能崗匹配分值
利用式(1)對收集到的測評模型的輸入數據進行標準化處理,準備參與民航安全信息管理人員能崗匹配測評模型的訓練。
由2.2.2可知民航安全信息管理人員能崗匹配測評模型輸入層的神經元數量為25,輸出層神經元數量為1,根據式(4),隱含層神經元的數量在[6,15]之間。因此,分別設置6~15個隱含層神經元數量進行網絡模型訓練,除神經元數量外其余參數均不變。使用基于Bayes優化的BPNN迭代100次,計算網絡模型輸出的能崗匹配分值與期望的能崗匹配分值之間的誤差,將該誤差值作為選擇最佳隱含層神經元個數的標準,誤差值越小,網絡模型的能力越優。訓練誤差結果見表4。當網絡模型隱含層神經元的數量為11時,網絡模型的擬合度最佳。模型初始參數設定見2.2.2。
表4 網絡模型訓練誤差結果
將標準化后的民航安全信息管理人員勝任力指標數據作為樣本輸入數據,將基于DEMATEL-模糊綜合評價計算得到的民航安全信息管理人員能崗匹配分值作為樣本輸出數據,利用scikit-learn的train_test_split() 函數將所有的102份樣本數據按照0.8∶0.2的比例隨機劃分為訓練集82份和測試集20份。由于民航安全信息管理人員能崗匹配測評模型的數據集屬于小數據集,在數據集并非充分的情況下,訓練過程選用5折交叉驗證的方式能夠大致反應模型的平均水平。
將20份測試集樣本輸入已經訓練好的Bayes優化BPNN的民航安全信息管理人員能崗匹配測評模型中,將仿真輸出的能崗匹配測評結果與測試集的能崗匹配結果進行對比,檢驗模型的泛化能力,評估模型效果,民航安全信息管理人員能崗匹配測評模型仿真值和期望值的對比如圖3所示。
圖3 測評模型的仿真值與期望值對比
均方根誤差(Root Mean Square Error,RMSE)可以反映測評結果與期望結果在數值上的差異[23],通常RMSE值越小,模型回歸效果越好。本文構建的測評模型RMSE為0.29;根據圖3,民航安全信息管理人員能崗匹配測評模型在數值仿真和趨勢擬合上均表現良好,驗證了模型的可行性。
在相同數據集上,對比基于Bayes優化BPNN與單一的BPNN計算得出的能崗匹配測評結果,對比結果見圖4。模型的精度和算法耗時對比見表5。
圖4 Bayes優化BPNN和單一BPNN的仿真結果對比
表5 模型的精度和算法耗時對比
由圖4可知Bayes優化BPNN的民航安全信息管理人員能崗匹配測評模型的擬合程度優于單一BPNN的擬合程度,由表5可知Bayes優化BPNN的民航安全信息管理人員能崗匹配測評模型相較于單一的BPNN,模型精度得到了提高,算法耗時也顯著減少,改善了單一BPNN模型不穩定、誤差較大、收斂速度慢的問題。
將目前全局優化算法中使用最廣泛的隨機搜索(Random Searching,RS)優化算法和Bayes優化算法分別對BPNN進行優化,對比2種算法的優化效果,參數尋優的精度和運行時間對比結果見表6。
表6 參數尋優的精度和算法耗時對比
根據表6可知,Bayes優化的BPNN,整體精確度更高,參數尋優過程中的搜索效果更加穩定;而隨機搜索優化的BPNN算法耗時相對更少,在數據規模比較大時具有一定的優勢。由于Bayes優化算法涉及到復雜的數學計算,因而耗時更多,針對該問題,可以嘗試優化計算資源,加快算法的運行速度。
以來自不同民航企事業單位的5名安全信息管理人員為例,運用訓練和驗證完成的民航安全信息管理人員能崗匹配測評模型對其能崗匹配情況進行測評,并與利用模糊綜合評價計算得到的結果進行對比。結果如表7所示。
表7 能崗匹配測評結果
從對比結果來看,基于Bayes優化BPNN構建的能崗匹配測評模型與模糊綜合評價對能崗匹配測評的結果基本一致。說明該測評模型具備模擬專家經驗思維的能力,可以適應專家的大腦思維處理樣本數據,能夠準確地反映安全信息管理人員能崗匹配實際情況。
1)構建包括數據科學知識、民航安全管理知識等一級指標和掌握通用數據知識、掌握數據工具的使用等二級指標在內的民航安全信息管理人員勝任力指標體系,該指標體系不僅關注信息管理人員的統計分析、上報能力,也關注數據科學和民航安全管理學科的交叉以及民航安全數據信息流動的全過程,體現了大數據環境對民航安全信息管理人員勝任力的需求。
2)構建并驗證基于Bayes優化BPNN的民航安全信息管理人員能崗匹配測評模型。相較于隨機搜索優化BPNN,基于Bayes優化BPNN的測評模型 RMSE降低了0.02,準確度更高;相較于單一BPNN模型,基于Bayes優化BPNN的測評模型算法耗時減少了2.25,RMSE降低了0.053,明顯地改善單一BPNN易陷入局部極小化和收斂速度慢的缺陷。