花逢春

摘 ? 要:現代社會是信息化社會,廣電產業經過多年的發展已經逐步建成了以有線電視網絡為核心的廣電網絡,將有線、無線和衛星通信三大行業交叉聯合構建了新的數字化的體系,形成了以廣電網絡為核心的綜合性多媒體信息平臺。廣電網絡所具有的開放性、交融性也對廣電網絡的運行管理帶來了極大的挑戰。巨大的信息量需要投入更多的精力用以規范圖片、文字等的內容,通過構建以計算機圖形工作站為核心的監控體系,加強圖像識別技術的研究與應用,進一步提升圖像的識別與管控效率。
關鍵詞:計算機圖形工作站 ?圖像識別 ?算法
中圖分類號:T391.41 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2019)02(c)-0138-03
視頻圖像特征分析與管理難度大、任務重,傳統的視頻監管主要采用人工審核的方式,利用人工建立的數據庫及各種視頻屬性來進行查詢管理。傳統方式任務重、效率慢無法適應當今需求。圖像識別技術的發展與應用將有助于提高對于圖像監管的效率與效果。本文在分析圖像識別關鍵特征的基礎上對圖像識別技術的算法進行了分析介紹。
1 ?人物視頻圖像識別關鍵特征的識別與提取
1.1 人物圖像膚色特征識別
計算機所呈現出的視頻圖像是由眾多的像素點所組成的,圖像識別中關于像素顏色的識別需要借助于色度理論學.根據色度理論學原理任何顏色都可由紅、綠、藍三基色按照一定的比例所混合而成。對于色度的表示常用的顏色空間主要有以下幾種:RGB(紅、綠、藍)、HIS(色度、飽和度、亮度)和YUV(亮度、色差)。人物圖像膚色識別特征主要是找出人體表層和人體真皮層所形成的不同反射光。其中,圖像中的人物膚色會由于表皮層黑色素含量的不同而呈現出一定的差異,其中人體表皮層的反射光起決定性因素。在圖像人物膚色檢測中并未有最優的顏色空間,不同的顏色空間對應著不同的檢測算法且各有優異。
1.2 圖像人物輪廓、形狀等紋理特征
在圖像識別中,圖像輪廓、形狀等紋理特征能夠有效地實現人物圖像的識別。其中,基于小波變換的邊緣檢測技術在圖像人物識別中能夠取得良好的識別效果,借助于小波變換技術能夠在圖像人物膚色特征的基礎上更好地識別圖像。小波變換圖樣檢測能夠融合泛函分析、數值分析、樣條分析以及調和分析的特點完成對于圖像的小波分析用以更好的檢測圖像在輪廓、形狀等的紋理特征。
1.3 圖像人物皮膚形態過濾
在人物圖像識別中人物皮膚的幾何形狀信息也可作為人物識別的重要特征之一。在圖像識別技術中對于皮膚形態識別的一般算法主要采用的是先得到皮膚區域而后利用人物圖像的幾何形態對人物的四肢及軀干等部分進行識別.在這一過程中受人物完整度與噪聲等因素的影響致使一般圖像人物識別算法未能發揮出較為良好的識別效果。在圖像識別技術中需要應用分形維計算法就圖像人物皮膚以零散破碎的幾何形狀進行計算描述,并將其作為圖像識別的重要特征。
1.4 以Kohonen神經網絡為基礎進行圖像樣本選取
傳統的廣電圖像識別管理模式數據處理量大且復雜,為提高圖像識別處理速度可以利用Kohonen神經網絡完成對于圖像數據的矢量化壓縮,通過對所需處理的圖像數據采取樣本提取和與分類的方式將能夠大幅降低圖像識別所需處理的數據量。Kohonen神經網絡具有自動聚類識別環境的特性,屬于自組織競爭型神經網絡。以Kohonen神經網絡為基礎所編制的圖像人物識別算法能夠在圖像人物識別處理中通過對圖像人物樣本植與各神經元權植進行對比并找出距離最小的神經,并通過調整其與鄰近神經元的權值獲取所需要的信息,完成圖像人物識別。
1.5 圖像人物識別前饋神經網絡
利用Kohonen神經網絡對所需處理的圖像數據進行篩選壓縮后,將極大地降低圖形人物處理的數據量,在這之后利用前饋神經網絡進行識別訓練將能夠有效地提升圖像人物識別的效率,利用前饋神經網絡進行圖像人物識別是一種極為有效的圖像特征識別方法。應用于圖像人物識別的前饋神經網絡主要由輸入層、輸出層、隱含層神經元以及各層之間的互聯部分所組成,在進行圖像人物識別時通過對所輸入的信號進行跟蹤識別,將輸入信號在各神經元之間相互傳,利用神經網絡完成對于圖像人物特征的正向傳播學習,并根據正向傳播學習過程中所產生的誤差來修正偏差,通過多次的調整校正將圖像人物識別輸入信號的誤差降至最低。前饋神經網絡的應用將原先的一組一種輸入到一種輸出的模式轉變為一組輸出模式,通過前期的調整校正訓練將能夠完成前饋神經網絡輸出模式的系統變換。前饋神經網絡算法能夠在圖像人物識別得到良好的應用,其核心在于將圖像人物識別轉化為輸入信號的正向傳播與識別信號誤差的反向傳播兩大不同的環節。在圖像人物信號的正向傳播識別中網絡的權值保持穩定,前饋神經網絡算法進行圖像人物識別中對于輸入信號僅僅在不同層級神經元之間單向傳遞,而當前饋神經網絡算法的輸出層的輸出結果與預期偏差較大時則前饋神經網絡算法將把誤差轉入反向傳播。反向傳播時在輸出端反向傳播未達預期的正向傳播的信號誤差值,反向傳播信號在前饋神經網絡算法中將進入到輸入層,并根據誤差信號動態調整前饋神經網絡算法中的各神經元層的連接權植,如此多次的正反向傳播調整校正將調整前饋神經網絡算法使其能夠滿足圖像人物識別所需滿足的精度。三層前饋神經網絡算法的結構模型圖如圖1所示。
2 ?廣電圖像識別監管系統
廣電圖像識別監管系統其主要用于對廣電播送的內容進行實時監控,通過圖像識別將所播放內容中不合格的部分篩選并按照相關規定進行處理。圖像人物識別關鍵是獲取視頻關鍵幀圖像,根據所篩選的圖像由廣電圖像識別監管系統所判斷并采取相應的處理措施。
2.1 圖像人物識別預處理
對于需要進行圖像人物識別的視頻資料,首先需要對視頻資料進行降噪處理,用以減少外界干擾在數字圖像數字化及傳輸過程中所產生的干擾噪聲,提高圖像人物識別的效率與效果。在完成降噪處理后對于所需要圖像人物識別的圖像進行場景增強,篩選并強化圖像中的關鍵特征信息,弱化圖像中的無關信息以使得處理后的圖像能夠獲得圖像視覺效果的強化。對于完成場景分析的圖像將根據需要進行區域劃分,將圖像劃分為若干有意義區域或部分處理圖像。圖像人物識別預處理通過降噪-場景分析-圖像處理-圖像分割-目標提取等將待處理視頻圖像中的目標圖像提取出來以待后續圖像人物識別操作。
2.2 人物圖像識別流程
完成圖像人物預處理后需要完成圖像人物識別操作。圖像人物識別過程中首先應根據圖像人物識別算法演算所生成的模式向量來對比對應的特征函數,并將圖像信號作為輸入信號輸入到所選定的特征參數中以此來計算圖像所具有的特征值,從而將圖像所具有的底層視覺信息轉化為語義信息便于后期查詢處理。
2.3 圖像人物識別的主要算法設計
為實現圖像人物識別需要多個算法相組合,其中包含有基于HIS顏色空間和R值的人體膚色檢測算法、小波降噪和多分辨率壓縮算法、分形維數形態過濾算法、Kohonen神經網絡算法等多個算法。
2.3.1 基于HIS顏色空間和R值的圖像人物膚色識別算法
為實現圖像人物膚色識別其關鍵在于以預先設定的閥值為基準對比提取膚色的像素點,以此完成對于圖像人物膚色的選取。據研究人員表明,紅、綠、藍三基色中紅色在數字圖像中占據著較大的數值,在一般光照下人物圖像中紅色數值在200±20的區間范圍內,而剩下的綠、藍原色則多在100以內。而在非一般光照下紅、綠、藍三原色的值范圍則會有所擴大,在高光條件下三原色中的紅色數值最大可以達到250及以上,而在低光條件下三原色中的綠、藍兩色數值最低可低于50,因此在圖像人物膚色檢測中僅靠所設定的閥值較難完成對于圖像人物的膚色選取,而在圖像人物膚色識別中選用H空間算法則不受亮度、對比度的變化而影響,是一種較為穩定的膚色提取方法。在圖像人物膚色識別算法中將主要利用HIS顏色空間中的分割闕值的方法來計算圖像人物中的膚色區域,由于人體膚色主要分為黃、白、黑、棕、紅,且各膚色之間差別較大,黃白色的皮膚膚色亮度較高,且SI對圖像人物膚色分割影響較大,在顏色空間的選擇上需要綜合考慮H、S、I、R四個方面以此來確定圖像中的人物提取區域。基于圖像人物膚色的初步提取主要利用像素點顏色特征來提取,為規避雜色像素點所帶來的影響,需要對人物圖像進行消噪處理,利用中值濾波法將能夠有效的消除雜色點所帶來的影響。中值濾波法其原理是利用一個含奇數個點的滑動窗口利用灰度排序法對滑動窗口內的像素進行排序,并使用滑動窗口內的中心像素的灰度值替代為中值。通過HIS顏色空間的處理數字可以將圖像人物中的非膚色區域進行良好的處理,利用工作站處理后的數字圖像非膚色區域經過檢測后盡管還含有一些錯處理區域但是大部分的人物膚色區域還是得到了正確的定位標識,針對過濾處理后所含有的一些錯標識區域可以利用皮膚紋理過濾技術進行再次篩選過濾,以此得到所需要的圖像人物膚色區域信息特征。
2.3.2 小波多分辨率壓縮算法
小波多分辨率壓縮算法其核心在于將輸入的原始圖像經過三層分割過濾,將原始圖像劃分為低頻部分和高頻部分,并將所過濾出的低頻部分按照上述方法再次進行高、低頻部分的過濾。經過小波多分辨率壓縮算法過濾后的原始圖像其低頻圖像保持了原始圖像的主要輪廓,將原始圖像中的人物輪廓大致的表現了出來。而分解出的高頻圖則將原始圖像中的各個細節表現了出來。小波多分辨率壓縮算法能夠將圖像各個方向上的輪廓信息分解出來,經過小波多分辨率壓縮算法處理后的圖像將能夠獲得到圖像人物輪廓的二值圖,在得到人物輪廓的二值圖后將能夠為下一步敏感部位的定位帶來方便。
2.3.3 分形維數形態過濾算法
在完成了小波多分辨率壓縮算法處理后的圖像將需要使用分形維數形態過濾算法進行后續處理,圖像經過了顏色和紋理過濾后使用分形維數形態過濾算法將能夠有效的將圖像中雜物所引起的誤差剔除出去,講過上述處理后的圖像將在通過腐蝕、膨脹等處理后所形成的四聯通候選膚色塊中篩選掉區塊較小的膚色塊,并統計計算剩余區域中膚色塊的分形維數。分形維數形態過濾算法應用中需要經過多次對比并選用合理的分形維數闕值用以過濾誤差,以確保圖像人物識別取得良好的識別效果。分形維數闕值在1.15和1.23時將能有效的將圖像中的人物與背景中的沙灘、植物等進行有效的區分。
2.3.4 Kohonen神經網絡算法和前饋神經網絡算法
對于圖像文件經過上述算法的處理后將從原始圖像文件中提取出32*32像素的24位像素塊,各像素塊所占據的字節數為32*32*3=3072字節,這一數值要遠遠高于一般三層前饋神經網絡的處理能力,為滿足一般三層前饋神經網絡算法的處理需求,需要將原始的32*32圖像塊分解為16份的8*8圖像塊來作為前饋神經網絡算法的輸入數據,通過上述劃分將32*32*3的字節劃分為16個8*8*3=192字節的圖像塊,192字節能夠滿足前饋神經網絡算法的128-256字節的處理能力。Kohonen神經網絡算法利用上述16個192字節的圖像塊來作為訓練樣本進行訓練,Kohonen神經網絡算法對上述訓練樣本完成訓練后將能夠得到一組代表聚類信息的權值矢量,權植矢量都為192字節并借助于Kohonen神經網絡的識別功能與所訓練的樣本權植進行逐一對比并歸類,通過Kohonen神經網絡算法能夠將8*8的矢量塊轉化為能夠識別的十進制編號,從而將原始的32*32圖像塊轉變為16個十進制數元素組成的新矢量而一個字節的十進制數可以表示256類聚類,通過上述劃分將能夠有效的解決數據量多且難以處理的難題。前饋神經網絡算法是一種非線性優化算法,針對前饋神經網絡算法應用過程中所出現的局部極小問題所帶來的算法不收斂問題需要在前期選擇合適的初始權值和闕值,以此來規避陷入局部極小點的問題。前饋神經網絡算法的收斂速度較慢,為提高圖像人物的識別效果,在應用前饋神經網絡算法時需要選擇好收斂闡述α。為提高圖像人物識別的可靠性與準確性需要加強對于前饋神經網絡算法的訓練, 前饋神經網絡算法的訓練需要多種樣本。
前饋神經網絡算法的實現需要按照以下步驟進行:(1)首先就各層的權值Wij進行初始化,使得Wij變成一個較小的非零隨機變量。(2)選取輸入樣本X0和期望輸出Y0并計算出實際輸出Y1與期望輸出Y0之間的誤差。根據預設的誤差取值E判斷實際輸出誤差是否滿足使用要求,如果實際誤差值在預設誤差E的范圍內則可以將實際輸出誤差作為一個樣本進行輸出。在對前饋神經網絡算法訓練時要求所有的樣本輸出誤差值都在預設誤差E的范圍內。如輸出誤差超限且訓練次數未達到闕值M,則執行下列部分:
3 ?結語
圖像人物識別是廣電系統監管中的重點及難點。本文在分析圖像人物識別技術難點的基礎上就如何基于圖形工作站開發應用圖像人物識別技術進行了分析闡述。
參考文獻
[1] 施琦,王涌天.一種基于視沉的增強現實三維注冊算法[J].中國圖象圖形學報:A輯,2002(7):679-683.
[2] 黃靜濤.檔案仿真復制中進行圖像處理的幾點體會[J].中國檔案,2011(11):60-62.
[3] 楊為民.漫談PC圖形工作站[J].計算機輔助設計與制造,2002(5):79-80.