
摘要:在現代信息技術不斷發展的背景下,圖像識別技術在我國得到了較大的發展和廣泛的應用,同時視頻通信業務范圍也日益擴大。本文主要就圖像識別技術的發展及其在視頻通信領域的應用現狀進行了探析,以期能夠更好地提升圖像識別技術的應用價值。
關鍵詞:圖像識別技術;視頻通信;發展 應用現狀
一、引言
圖像識別技術是以圖像為基礎,利用計算機對圖像進行處理后,將其中的目標對象識別出來并加以分析的技術。隨著20世紀60年代以來計算機技術與信息技術的發展,圖像識別技術越來越被人類所發掘和研究,圖像識別技術已經應用到人們的日常生活方方面面中。應用范圍包括醫學、航空航天、農業生產、工業工程、通信、交通、軍事安防等多個領域,如醫療診斷中各種醫學圖片的分析與識別、天氣預報中衛星云圖識別、遙感圖像識別、指紋識別、臉譜識別、智能機器人、電子警察系統等,其中最典型的應用是在通信工程和生物醫學中的應用。
隨著社會的發展和通信技術的進步,人們對通信的需求發生了巨大的變化,由最初單一的文字或語音通信提升為對視頻和音頻多方面的通信需求,通信領域的發展熱點也逐步轉向以傳送語音、圖像、數據和視頻為一體的視頻通信業務。不僅如此,在視頻監控、電視會議、遠程醫療和遠程視頻教育等方面,視頻通信也成了不可替代的一項技術。
隨著電子技術和互聯網的快速發展,視頻通信中對信息準確性及圖像清晰度要求的提高成為可能。與之相對應的是,如今的圖像識別技術更加先進,更加精準,能用納秒級的時間處理和加工非常復雜的圖像。因此,圖像識別技術在視頻通信領域的發展與應用是非常值得關注的。
二、計算機圖像識別技術的發展
計算機圖像識別技術模仿人類對于圖像的識別過程,通過分類并提取圖像的重要特征且排除多余的信息,然后對識別出來的信息進行整合,最終將分階段識別出來的信息形成一個完整知覺映像,從而判斷出識別目標。簡單來說,識別過程包括圖像預處理、圖像分割、特征提取和判斷分類匹配,如圖1所示。
從計算機圖像識別技術的發展階段來看,早在20世紀20年代,這項技術就已經開始在西方多國出現并且得到初步應用。50年代,計算機圖像識別技術還停留在數字、文字處理方面。60年代,隨著計算機性能大幅度提升,計算機圖像識別與處理技術發展勢頭迅猛,比如60年代出現的CT掃描進行疾病診斷,在70年代末被授予諾貝爾獎。到了90年代,圖像識別與處理技術真正進入到大規模發展階段,真正飛躍發展是在21世紀。
進入到21世紀,智能化時代已悄然來臨,人們的生活方式也得到了極大的改變,我們在通信的過程中也可以傳輸圖像、聲音、文字等信息。網絡能夠承載電視、電話以及綜合類型的數字通信,滿足人們的各種日常生活工作需求。移動互聯網、智能手機以及社交網絡的發展,使人們的生活充滿了海量的圖片信息,圖片與視頻成為通信交流的又一大主要媒介。在此環境下,計算機圖像識別處理技術顯得尤為重要。
三、圖像識別技術
圖像識別主要有模式識別和神經網絡兩種技術。
(一)模式識別
模式識別是指對表征事物或現象的各種形式的圖像信息進行處理和分析,通過計算機用數學技術方法來研究模式的自動處理和判讀、識別圖像所具備的多種特征。簡單來說,模式識別就是利用計算機對圖像的特征提取后進行分類,在錯誤概率最小的條件下,使識別的結果盡量與目標對象相符合。模式識別可用于文字和語音識別、遙感和醫學診斷等方面,但在當前的實際操作過程中,計算機圖像識別模式和人類大腦圖像識別圖形圖像的模式還存在著一定差異,在處理的過程中難免會出現一些錯誤信息。
(二)神經網絡
神經網絡具體來說,就是模仿動物神經網絡行為特征,進行分布式并行信息處理的數學模型。這種網絡基于系統的復雜程度,通過調整內部大量節點之間相互連接的關系,從而達到處理信息的目的。相比之前的模式識別,該方法取得了很大成功。當前在圖像識別領域廣泛應用的主要有多層神經網絡和卷積神經網絡技術。
1.多層神經網絡
多層神經網絡由輸入層、隱藏層、輸出層三個部分組成,其中隱藏層也被稱為中間層(可以從幾層到數百層)。每層都由多個神經元組成,層與層之間相互連接,每一個連接均有一個權重值與之相對應。在多層神經網絡中,每一個像素點都需要有一個神經元與之對應。顯而易見,這種方法費時費力,例如識別一段1000幀每幀1000像素*1000像素組成的視頻,輸入層將由10^9個神經元組成,導致計算成本過大,顯然此方法并不存在實際的應用價值。
2. 卷積神經網絡
為解決多層神經網絡所需樣本多和計算量大的問題,在中間層引入卷積層和池化層,將其稱之為卷積神經網絡。卷積神經網絡根據神經元間的相似性進行篩選與過濾,使得圖像計算大幅度簡化。對于某個給定層,輸入和神經元之間并不是一一對應的關系,而是專門限制了連接,這樣任意神經元只能接受來自前一層的一小部分的輸入(例如3×3或5×5)。因此,每個神經元只需要負責處理其中某一個特定部分,這樣所需樣本數量及運算資源顯著降低。
四、計算機圖像識別技術在視頻通信領域的應用現狀
邁入新時代后,社會文明和科技水平的發展日新月異,視頻通信應用越來越廣泛,成為眾多行業不可或缺的一環。現如今,在通信工程領域中,主要的研究方向是聲音、文字、圖像和視頻之間的結合,即所謂的現代流媒體通信,而其中最復雜的當屬數字圖像通信,主要原因在于圖像傳輸時對于數據帶寬的需求非常龐大。舉個例子,目前智能電視機傳輸帶寬必須達到100 M/s 以上。因此,在對于圖像信號進行輸送的過程當中,必須使用編碼技術壓縮信息量。
就目前而言,圖像識別技術在流媒體通信領域發展是非常顯著的,并且也取得了一定的成果。
(一)視頻通信即服務
在現階段發展中隨著寬帶網絡建設快速增長,移動互聯網有了明顯的變化,移動通信、社交媒體以及視頻通信等通信技術已經展現出了全新的發展趨勢。視頻圖像通信主要包括兩個過程,一是攝錄本地會場的視頻圖像、語音和數據信息并進行壓縮編碼處理,處理為適合信道傳輸的信號后發送出去;二是將接收到的各種信號進行濾波和譯碼等操作,把原始的基帶信號再現出來。目前視頻通信運營涉及以下兩個模式:第一,視頻會議電視,這是一種集圖像、語音為一體的常見的視頻通信業務,它利用互聯網,通過會議電視終端把相隔異地的會議室連接起來,使出席會議的人可以進行相當于面對面的交談。第二,基于互聯網基礎上的會議云服務,例如騰訊會議、ZOOM等軟件能夠同時支持多個人多路視頻圖像,具有瀏覽批注、共享電子文檔等功能。
(二)視頻監控
當前視頻監控系統遍布在我們生活和工作環境中各個角落。在安防設備布置過程中,智能化計算機圖像識別技術的應用有兩個好處。一是可以不再派人長時間駐守在監控前,有效降低人工成本。二是降低由主觀判斷所造成的疏漏,有效提升視頻監控的準確性,并且計算機對視頻監控的處理更加高效。視頻監控圖像的自動化、智能化處理,使得視頻信息可以成為事故鑒定的有效且主要依據。監控技術、運動檢測和圖像識別技術互相結融合發展,無人自動智能監控系統由此誕生,被廣泛應用于電力、交通、智能防火等領域。
(三)遠程視頻醫療
遠程醫療、在線診療的普及,使得醫生可以通過視頻通話、互動平臺與患者交流病情,醫生們相互之間也可以通過上述方法交流,共同對疾病及時做出綜合醫療決策。通過醫療設備拍片查看,比如常見的X 射線、CT 技術、超聲波、心電圖、顯微圖像、染色體辨別、癌細胞辨別等一些醫療診斷技術,都利用了圖像識別技術。這些顯示圖像可為醫生提供行之有效的診斷依據,進而對疾病進行針對性的治療手段。但是限制于目前的技術水平和音視頻質量,尚未滿足遠程醫療對于實時性和高畫質的要求。
(四)遠程視頻教育
遠程視頻教育是一種新興的教育模式。網絡開放課程打破了傳統課堂時間和空間的限制,更多的學習者能夠共享優秀的教育資源。然而,目前開放課程仍然存在諸多問題,比如:師生之間不能實時互動交流、缺乏行之有效的學習效果跟蹤手段等,這些因素都影響到了開放課程更大規模的應用,造成了許多優質教育資源的閑置與浪費。目前,利用實時互動、數字視頻通信、多媒體智能圖像識別檢索等關鍵技術,構建云計算環境下的大規模實時互動學習平臺是支持學習者隨時隨地、使用各種終端進行大規模在線點播互動學習的重要方式,使得開放課程的應用從單純的資源供給一方向課程與教學的轉變。
(五)基于內容的視頻信息檢索
傳統的視頻信息檢索采用基于關鍵詞的檢索方式,即通過對每一個視頻文件進行標注,然后僅需文本信息的檢索就可以完成對視頻內容的檢索。由于標注描述有限、手工標注速度以及主觀性強等等問題,當前方法已經遠遠不能達到成千上萬的視頻檢索的要求,因此基于視頻和圖像內容信息的檢索技術應運而生。該技術的原理是先令機器儲存大量的圖像或視頻,建立圖像數據庫。隨后對需要檢索的視頻進行檢索包含目標物體的圖像(或視頻片段),從而對該視頻內容自動進行歸納。
算法的核心技術是通過自動圖像識別或理解圖像重要特征的方法對視頻進行整合與歸類,從而實現按圖像內容從視頻庫中檢索圖像文件。底層視覺特征和高層語義特征的提取是圖像檢索技術在發展中遇到的兩大難題,從而導致目前還未大規模應用。
五、結束語
隨著人們對視頻通信服務的需求量與日俱增,人們對通信業務的服務質量要求也越來越高。由于當前網絡寬帶建設尚存不足,編碼也存在優化的空間,視頻會議、視頻監控和遠程視頻教育等的服務尚存在諸多值得改進的部分。因此目前相關人員需要著力解決視頻圖像技術亟待解決的問題,提升視頻圖像處理整體質量,以滿足大眾多樣化、高質量通信服務需求。
作者單位:高俊杰? ? 山東科技大學
參? 考? 文? 獻
[1]劉海洋.計算機智能化圖像識別技術的探討[J].中國新通信,2021,23(13):127-128.
[2]李亞奇.計算機圖像識別技術的發展現狀與應用實踐[J].信息與電腦(理論版),2019(14):30-31+34.
[3]馬晨.圖像識別的技術現狀和發展趨勢探析[J].中國新通信,2017,19(09):39.
[4]向曉華.計算機智能化圖像識別技術的探討[J].科技創新導報,2020,17(13):141-142.
[5]黃春.計算機圖像識別技術的現狀及改進建議[J].電子技術與軟件工程,2019(16):73-74.
[6]劉顯龍.視頻通信技術發展趨勢探討[J].電視技術,2019,43(13):78-80.
[7]張曉娟,高瑾.計算機圖像識別技術的應用及細節問題闡述與分析[J].電子技術與軟件工程,2016(06):89.
[8]張家怡.圖像識別的技術現狀和發展趨勢[J].電腦知識與技術,2010,6(21):6045-6046.
[9]馬晨.基于視頻流的圖像識別技術發展與應用[J].電子技術與軟件工程,2017(06):78.
[10]葉晨. 醫學圖像數字處理及識別技術研究[D].電子科技大學,2012.
[11]楊東.5G+人工智能機器視覺探索[J].通信與信息技術,2021(01):60-63.
[12]陳環宇,高鶯,李曉珂,余永華,周宇哲.基于圖像識別的在線視頻教育平臺[J].科技創新與生產力,2018(12):24-25+31.
[13]徐苑苑. 云計算環境下的開放課程應用研究[D].華東師范大學,2013.