呂東澤
大慶油田房地產開發有限責任公司,黑龍江大慶 163000
?
基于視頻流的圖像識別技術發展與應用
呂東澤
大慶油田房地產開發有限責任公司,黑龍江大慶 163000
摘 要首先針對流媒體環境下的圖像識別技術價值展開分析,對于當前流媒體圖像識別技術的主要應用領域以及需求狀態加以說明,而后從技術的角度針對當前該領域中的幾種主要技術展開討論,希望對于切實推動加深認識有積極價值。
關鍵詞視頻;流媒體;圖像識別;技術
流數據格式在當前網絡環境中愈加常見,其應用范圍已經突破了常規的傳媒以及安全領域,而進入到了更多的應用環境中,對應的制作工作人員也不再限于相關專業,更多專業和不專業的人參與到了流媒體的工作環境中來。這種情況,從客觀上要求在視頻流環境中引入更為自動化的工作方式,從而實現對于相關工作的支持,其中圖像識別技術就是首要的需求之一。
圖像識別技術在流媒體領域中有著較高的應用需求,主要的需求來源于對大量數據的有效存儲和閱讀,以及工業環境的實時監控兩個方面。對于前者而言,由于流媒體本身的特征,決定了它在存儲和查找的時候都無法做到像傳統數據格式那樣的快捷有效,甚至于一直以來對于流媒體的存儲、歸類以及檢索,都要依賴于工作人員添加的標簽才能完成,而這對于流媒體的相關操作效率的提升無疑有著不利影響。
當前圖像識別領域的應用已經日趨成熟,流媒體本身由眾多的數據幀組成,因此在圖像識別技術成熟的基礎之上應用到流媒體領域,無論從技術還是價值方面都有一定的積極價值。而從應用的角度看,眾多領域都存在顯著需求,突出表現的幾個方面,包括流格式數據的存儲與檢索,安全領域的自動識別應用以及工業環境中對于數字儀表的自動讀取,以及新聞視頻中的字幕信息自動提取等。相對而言,當前在安全和工業領域中的需求較為突出,并且也取得了矚目成果,但是從長遠的角度看,流格式數據的深入識別,必然能夠推動其存儲與檢索的優化,這對于帶動流媒體在多個領域中的深入應用都會存在積極意義。
當前在流媒體領域中,圖像識別技術的發展已經取得一定成果,依據不同領域中的需求狀況以及圖像特征,可以有多種技術供選用。在實際工作中,應當依據具體情況進行選擇,才能獲取良好效果。
對于流媒體數據格式中的文字識別而言,常規的方法有基于邊緣、基于紋理、基于區域的三種主要工作方式。其中基于邊緣的識別方式,主要是在圖像中尋找垂直邊緣來對文字實現檢測。其主要的工作方式是先確定出圖像的邊緣,而后通過平滑濾波或形態學膨脹的方法來將邊緣連接成為文字塊,最終加以識別。此種工作方式表現出良好的工作效率,但是如果圖像背景復雜文字區域反差小,也會造成誤碼率偏高問題的發生。而且基于紋理的識別方法,是利用圖像中的紋理特征去對比,從而確定一個像素點是否屬于文字區域。此種識別方式通用性較強,不僅僅能夠實現文字的識別,對于其他類型的圖像識別,諸如對運動物體等的識別也能發揮良好作用。但是此種工作方式在有效提取紋理信息的過程中可能會面臨較大運算量,從而造成系統整個運行緩慢,工作效率低下的問題,并且無法抵御高噪影響。最后,基于區域的方法則是基于文字像素均存在相似顏色的架設而展開,此種工作方式可以對于新聞視頻中的文字進行識別,但是無法對工業儀表等示值有效識別,整體效果和應用領域都相對有限。
除去對于文字的識別,對人臉的識別同樣也是
當前視頻流數據中圖像識別的重要的技術表現。相對于文字識別而言,人臉識別更為復雜,并且經過了更漫長的探索過程,至今都仍然處于不斷地完善之中。當前在人臉識別領域中,比較常見的方式是為人臉建立起對應的面部模型用于圖像中的識別和對比,實現匹配之后進一步對其面部數據進行分析和提取,最終實現識別。
無論是人臉識別,還是對于流媒體數據內相關信息進行識別,都需要必要的硬件以及軟件運算能力加以支持。除此以外,系統本身的學習能力,作為圖像識別技術前進的重要技術因素不容忽視。學習本身是系統的一種自適應體現,例如對視頻流字幕進行定位的過程中,即便是同一場景也有可能會出現字幕的不一致問題,包括位置以及大小、色彩等,都會發生變化,同樣的變化也會出現在工業環境中的儀表示值監測領域,因此系統必須能夠實現主動學習,才能切實展開圖像識別。除此以外,人工智能等方面技術的深入應用,對于流媒體系統中的圖像識別工作質量提升同樣意義重大。而實際在展開圖像識別的過程中,圖像數據的多幀平滑,以及多層前向反饋神經網絡等技術的應用,同樣也是推動該領域工作效果提升的重要武器。
對于視頻流媒體的圖像識別,關系到社會工作的多個方面,其有效存儲和管理關系到數據挖掘和分析的技術實現效果,并且從效率方面有著不容忽視的影響,而圖像識別更是相關領域自動化的堅實基礎和有力保證。實際工作中需要依據具體情況來對眾多技術進行選擇,確保能夠滿足準確和效率兩個方面的均衡需求。
參考文獻
[1]黃萬軍,尹寶才,陳通波,等.基于三維可變形模板的眼睛特征提取[J].計算機研究與發展,2002,39(4):495-501.
[2]李默,李弼程,鄧子健.新聞視頻主持人鏡頭的半屏幕檢測算法[J].計算機工程與應用,2005(15):183-185.
[3]王旭智,向長波,宋建中,等.實時字符識別在視頻讀表系統中的應用[J].電子器件,2006,29(4):1334-1337.
作者簡介:呂東澤,工作單位為大慶油田房地產開發有限責任公司。當前計算機相關技術與通信網絡的發展達到前所未有的高度,信息的消費對于社會環境中的生產生活而言,已經不僅僅是單純的提高效率,而是上升到了成為社會各類活動必要支持的高度。而在網絡環境中的數據格式,也隨著相關技術的進步有所變化,其中流媒體成為首當其沖的重點所在。
中圖分類號TP3
文獻標識碼A
文章編號2096-0360(2016)04-0026-01