基于神經網絡的計算機視覺探討

2018-10-26 11:38:58王瑞麗

科技資訊 2018年11期

王瑞麗

摘要：在大數據時代背景下，各個行業中都涉及到更加復雜的管理內容，為了實現更加有效的管理，需要行業具有針對大數據管理的方法，而神經網絡就是一種針對大數據的網絡處理結構，其在計算機視覺中的應用也有效提供了計算機技術的性能，下面，本文就針對基于神經網絡的計算機視覺進行探討，來了解其具體的實現和應用。

關鍵詞：神經網絡計算機視覺應用探討

中圖分類號：S126 文獻標識碼：A 文章編號：1672-3791（2018）04（b）-0017-02

計算機視覺應用作為一種新型的技術類型，其受到了人們的歡迎和追捧，為了更好地實現計算機視覺的功能，就可以利用神經網絡來建立相應的網絡結構來進行計算機視覺功能的實現，但是，由于神經網絡還處于一種探索的階段，在探索的過程中國也產生了多種神經網絡模型，本文主要針對卷積神經網絡在計算機視覺中的應用進行探討，來了解其對計算機視覺的實現。

1 計算機視覺的神經網絡模擬發展現狀

神經網絡模擬技術的發展還處于一種探索的階段，并沒有達到實時的處理效果，而隨著長期的研究和探索，目前國內外對于神經網絡在計算機視覺中的應用研究也在不斷進步，計算機視覺主要是將視覺感知到的處理以及表現進行綜合，進而實現其自動化處理的技術，在神經網絡的計算機視覺應用中，對于圖像的處理、統計模式的分類以及幾何的建模和處理等技術都比較實用，但是其研究中依然存在一定的難題。比如：利用相應的神經網絡實現了對圖像的恢復，但是其完成任務的過程中，需要神經元的數量過多，即所用的神經元數量至少要等于其輸入的圖像像素的個數。另外，神經網絡的計算機視覺應用中也取得了不錯的效果，比如：利用三層神經網絡對其紋理實現了有效分割，利用多值Boltzmann機來對其紋理進行分割，在其有限的迭代次數下，取得的效果卻不錯，在邊緣的檢測中，也取得了很大的突破[1]。

2 基于神經網絡的計算機視覺分析

2.1 神經網絡的結構

對于一個簡單的卷積神經網絡模型來說，其主要有兩個卷積層（C1，C2）以兩個子采樣層（S1，S2）交替組成。其原始的輸入圖像先經過3個可以訓練的卷積核可加偏置的向量來進行相應的卷積運算，進而在C1層呈現出3個具有特征的映射圖，然后針對其每一個特征映射圖局部區域來進行相應的加權平均求和，在通過增加相應的偏置后，通過其非線性的激活函數于S1層呈現出3個新特征的映射圖，這些具有特征的映射圖在C2層3個可訓練的卷積核中進行卷積，再經過S2層，輸出相應的3個特征的映射圖，最后S2層3個輸出特征圖像被向量化，輸入到其傳統神經網絡進行訓練。

2.2 圖像分類

圖像分類主要是通過對相關圖像進行分析，進而將相應的圖像劃分為若干類別中某一種，它主要用來強調圖像整體語義的判定。目前，常用評判圖像的分類算法帶標簽數據集有很多種，ImageNet的使用就比較頻繁，其包含了超過15000000張的帶標簽高分辨率的圖像，而這些圖像進一步被劃分成超過22000種類別，在訓練深度神經網絡時，一般常用歸一化的輸入數據預處理手段，它可以有效地減少網絡的訓練參數和初始權重，從而避免對訓練的效果產生影響，加快其收斂的速度，相關人員也將這種歸一化方法使用到了網絡內部激活函數中，從而實現對層和層之間數據傳輸的歸一化[2]。

2.3 物體檢測

物體檢測相對于圖像分類來說更加復雜，在對于一張圖像的處理中，其還可能具有不同類別多個物體，因此，這就需要針對這些內容，進行相應的定位和識別，要想在物體的檢測中取得好良好的效果，就比物體的分類更有難度，在物體檢測中，其深度學習的模型結構和構建也就更為復雜。卷積神經網絡在物體檢測中的使用，主要是利用R-CNN模型，這一模型是使用Selective search這一種非深度的學習算法來提出相應的待分類候選區域，進而再將其每一個候選區域進行輸入于相應的卷積神經網絡，并提取其特征，然后將這部分特征輸入于線性支持的向量機進行分類，為了保證其定位準確，R-CNN還訓練了一種線性回歸模型，對候選的區域坐標實現修正。

2.4 姿態估計

在計算機視覺呈現中，除了圖像分類以及目標檢測外，對于姿態的估計也是應用十分廣泛，比如：在很多網絡游戲、動畫視頻等中都需要用到，因此，這就需要計算機視覺快速實現姿態的估計，在姿態估計和檢測中，一般包含很多的類別，姿態估計也是目前計算機視覺實現中最關鍵的內容，主要是由于其應用于人物的追蹤、動作的識別以及視頻分析中，比如：生活中常用到的視頻監控以及視頻搜索功能等。對于姿態估計的網絡結構來說，其主要有5個卷積層以及3個pooling層和3個全連接層來組成，其每一層都能夠提取一定的特征進而進入于下一層的訓練中，再經過最后的全連接層得出一個2k維向量，就作為其輸出結的果，如果想要得出原圖的大小，還需要進行相應的逆操作[3]。

2.5 圖像分割

在以上的基礎上，對計算機視覺功能的發展就是對相應圖像的每個像素點進行預測，也就是對圖像的分割。對于圖像的分割來說，一張圖像可能會存在多個的物體、多個的人物或者多層的背景，這就需要對原圖上每一個像素點進行分析，進而預測其屬于的哪部分圖像分割內容，這也是計算機視覺應用中關鍵性內容。卷積神經網絡模型對于圖像分割的實現，先使用一些常用分類網絡，保留它們對圖像分類訓練的參數基礎之上，再進行相應的處理，將其轉變成圖像分割模型，然后，再將一些網絡比較深的層特征以及一些比較淺的層特征進行有效結合，最后再用相應的反卷積層放大到相應的原始圖像大小提供更加準確分割結果，這種網絡結構也被稱作跳躍結構。

2.6 人臉識別

人臉識別在圖像識別的領域是非常重要研究的內容，其在人們生活中也逐漸的得到了使用，人臉圖像功能的實現，需要其具有易采集特性，它也受到了很多行業重點關注，因此，其具有廣闊的使用前景以及巨大商業市場。對于人臉識別技術來說，其主要有人臉檢測、人臉識別以及人臉特征提取3個過程，人臉檢測主要是在輸入圖像以及視頻中，檢測和提取相應的人臉圖像，進而給出相應的人臉位置以及相應的主要的面部器官位置信息，一般采用Haar特征以及Adaboost算法的訓練級聯分類器來對圖像的各個矩形子區域實現分類，特征提取通過對一組數據進行人臉信息的獲取，其主要是提取人臉的特征，人臉特征一般有幾何特征以及表征特征[4]。

3 結語

神經網絡的計算機視覺應用對計算機技術的發展具有著重要的意義，其可以有效提高計算機技術的功能，進而更好地服務于人們，為了更好地促進其應用，需要相關人員繼續對神經網絡的計算機視覺應用進行研究和探索，這也是其發展中的重點內容。

參考文獻

[1] 盧宏濤，張秦川.深度卷積神經網絡在計算機視覺中的應用研究綜述[J].數據采集與處理，2016，31（1）：1-17.

[2] 李彥冬.基于卷積神經網絡的計算機視覺關鍵技術研究[D].電子科技大學，2017.

[3] 包曉安，張瑞林，鐘樂海.基于人工神經網絡與圖像處理的蘋果識別方法研究[J].農業工程學報，2004，20（3）：109-112.

[4] 戴逸松，陳賀新.人工神經網絡的研究及在計算機視覺中的應用[J].吉林大學學報，1991（2）：102-110.