李 靜
(唐山市人力資源和社會保障局勞動能力鑒定服務中心,河北 唐山 063000)
隨著經濟進入新常態,我國工業進入了空前的發展階段,信息化、人工智能、識別技術發展突飛猛進,為企業檔案信息化的建設提供了可靠的支持。手勢識別系統在企業檔案信息安全管理系統體系成為研究的熱點[1-3]。在檔案安全管理中心利用相應的網絡模型將所得特征值進行處理,得到相應的手勢[4-8]。為了提高手勢識別系統的準確率,本文利用人工智能技術建立檔案信息安全管理系統交互識別模型實現對手勢的識別,在人機交互原理的基礎上建立信息安全的整合平臺和反饋模塊。通過建立顏色分布模型,對所得圖像進行二值化處理,實現對手勢姿態的判別,通過對圖像的歸一化處理得到最終的手勢動作。
在企業檔案管理信息安全體系中,人機交互系統是重要發展方向。該系統主要由使用者、系統、輸入和輸出等組成,在對手勢進行識別時需要懸停以實現用戶對命令的選擇,當靜止時間大于設定時間則表示選中,反之則重新開始計時。本文所開發的檔案管理系統隔空手勢識別以多通道的信息交互技術為基礎,通過引入信息安全整合平臺和反饋模塊,實現了整個系統的搭建,其具體結構如圖1 所示。
該模型主要由用戶、交互、表現、控制以及應用程序等多個模塊組成,其中檔案系統使用者模塊主要通過對象庫中的工具實現信息的輸入,人機交互模塊主要包括對輸入信息的管理及輸出設備的控制,將所采集的手勢動作轉換為交互的原語信號,并將結果輸出。通過手勢姿態信息可得到交互的原語,所有的原語均與設備相關,同時可通過該模塊接收反饋信息并傳輸給用戶。應用程序模塊主要是將處理后的任務發送到控制模塊,該模塊包括多個信息的處理計算部分,可將處理后的信息傳輸給用戶。
本文對模型進行處理時以MCG-Skin 數據庫為基礎,在YCrCb的空間內利用分量Cr和Cb建立如下顏色分布的表達式:
式中:μ 為顏色的均量化系數;α 和g 分別為顏色的分量系數和過濾值。
根據上文公式在對手勢進行識別時,通過去除手勢背景并對高斯模型進行混合處理,利用下式進行描述:
式中:α、μ、σ 分別表示對應概率密度函數的相關參數,其中αh+αf=1。
所采集的手勢一直位于身體前側,上式中的μh、μf分別表示手勢和身體的深度,那么深度的閾值可表達為:
將經閾值處理后的像素點帶入上文Pc(x)的表達式中,經過處理后可得到圖像對應顏色的概率分布,然后將其與灰度值[0,255]進行映射,即可完成對手勢圖像的重建,當對應的灰度值增加時相似度也隨之上升。利用最大類間方差法對圖像進行處理后,可通過灰度值表達膚色點,除去膚色的其它點都處理為黑色,這樣即可得到具體的手勢姿態。
在對手勢進行跟蹤時,首先應確定深度的直方圖,將灰度值在[0,L-1]范圍內直方圖轉換為以下離散函數:
式中:rk表示灰度等級為k 的相對深度;nk表示為圖像rk級別的像素總數。
通過下式對圖像進行歸一化處理,使其成為統一的標準形式。
式中:P(rk)表示為某級別灰度值所出現概率的估值。
根據像素點的絕對深度值可計算得到其相對深度最小值的絕對值,所以相對深度的范圍為[0,D-1]。由上文可知rk表示第k 級灰度值的相對深度,該級別所對應的像素數量為nk,其中k=0,1,…,D-1。
利用評價概率分布相似性方法對相對深度直方圖的相似性進行分析,利用下式對其巴氏距離的定義域進行判斷。
式中:Bs(p,q)為巴氏系數。通過下式對手勢進行跟蹤:
式中:x 表示手的運動速度。通過上述模型及對應公式即可實現對手勢的跟蹤。
在對企業檔案信息安全管理系統手勢進行識別時,首先需引入一組級聯學習器,通過學習器對手勢的運動模式進行不斷的學習實現對手勢的識別,可讓前兩級學習器學習姿勢較簡單的非控制姿勢,而讓級別較高的學習器學習較難的控制姿勢,進而提高手勢識別的效率,如圖2 所示。
在通過級聯結構對手勢進行識別時,級數越高時越能降低控制姿態和非控制姿態之間的不平衡性,在較高級別的學習器學習時應將重點放在兩種姿態的差別上,降低二者的不平衡性對整體效果的影響。手勢動作可由以下集合進行表示(手勢種類的總數為n):
當對手勢G1進行識別時,需使非控制動作滿足下式:
在所有姿勢中選擇一組樣本作為訓練數據,可表示為:
上式中第i 種姿勢的樣本總數為m。
任意選擇一組級聯分類器,可由下式表達:
上式中Mi表示第i 級分類器,其所對應的特征為Fi,進而可得到下式:
手勢識別的具體流程包括以下步驟:
步驟二,當C={G1}時,提取兩個集合中差異較大的手勢動作,將所提取的手勢歸入到集合中,則C=G1-。
步驟三,將集合F 中識別耗時最短的Fi與訓練識別{G,}的分類器Mi進行選取,同時令F1的值盡量接近1,將分類器Mi錯分的樣本歸入到集合G中。
步驟四,在分類器T 中加入(Mi,Fi)。
步驟五,返回分類器T。
利用相關軟件結合企業檔案信息安全管理系統使用者手勢進行圖像采集后,隨機選取100 幅圖像作為實驗對象,實驗所用計算機的運行內存為6 GB,處理器為雙核E5500。實驗分別采用本文模型和自學習稀疏表示法[9]和Leap Motion 模型[10],分別對抓和放兩個動作進行識別,采用F1對識別效果進行評估,該值越高表示識別的準確率越高。
式中:precision 和recall 分別表示準確率和召回率,這兩個參數的計算公式見式(14)(15)。
式中:tp表示識別正確的樣本數,fp表示識別錯誤的樣本數,fn表示被識別為其它類別的樣本數。
下頁圖3 所示為不同方法對手勢識別的實驗結果,觀察可發現本文所研究模型對手勢識別的準確率最高,得到了較理想的識別效果,所得評估指標F1的值高于96%,而自學習稀疏表示法和Leap Motion 模型的F1值低于93%,未達到想要的實驗結果,無法滿足精度的要求。
隨著工業經濟及信息安全管理技術的發展,企業檔案信息安全管理系統逐步與現代化技術接軌。為了提高企業檔案管理系統體系中使用者手勢交互識別的準確率,本文提出了一種新的手勢識別模型。根據手勢識別的原理建立了信息安全整合平臺和反饋模塊。本文研究可為企業檔案管理體系安全防護系統的開發提供一定的參考。