楊風光
深度卷積神經網絡屬于類腦計算領域的一類比較重要的研究,已經在一些領域取得了突出的研究成果且被廣泛運用。其中在自然語言處理、信息搜索、聲音識別、計算機視覺以及語義理解等方面。因為這些成就導致在工業和學術領域人們開始對神經網絡進行研究,同時促進了人工智能的開發,只需在卷積神經網絡傳入數據,就可以根據數據表現出相應的癥狀。
1引言
很早之前,人類就幻想可以制造出機器人,擁有人類類似的大腦。為實現這一愿望,研究腦神經與心理的專家對人腦的構造進行了大量的研究,通過各種數據得到大量的相關結論,并運用到人工智能的開發領域中去。在這樣的情況下,一些專家提出了關于人工神經網絡的研究,其借鑒計算機模型來模擬人類大腦的神經結構,并將其進行總結歸納,構建神經網絡系統,然后經過大量的研究發展,成為了類腦計算領域的重要研究成果。
在這個方面,專業人員提出大量模型,其中比較著名的有反傳網絡、自組織映射網絡等,其在各種方式的識別中取得了一些成績,并進行廣泛的應用。
2卷積神經網絡及其相關技術
2.1增加網絡層數
卷積神經網絡是一種多層神經網絡,其形成是由于特征提取的卷積層與特征處理的采樣層疊加形成的,在多年的研究中,使用到了很多研究技術,其中增加網絡層數是一個比較重要的技術。其作用范圍是在標簽數據不變的基礎上,提高深度神經網絡的識別準確度。但是其在使用過程中存在一定的缺陷,首先對于比較大的網絡結構。其參數的需求量比較大,過多的參數會使網絡對訓練數據集的過擬合。另一方面是對于計算資源的需求量比較大。這兩方面缺陷的存在使技術的使用受到阻礙。
2.2增加訓練數據集規模
過擬合出現的原因是訓練的神經網絡比較大,且沒有足夠的訓練數據或者由于訓練的模型比較復雜,數據干擾大,對其準確度的重視度降低,一旦出現過擬合的現象,會隨著訓練的進行,其模型變得更加復雜,雖然會使訓練上的出錯率降低,但是在驗證集上的錯誤率升高。因此,為避免這一現象的出現,我們需要做的就是增加訓練樣本的數量。
2.3正則化
正規化是用來避免隨著訓練神經網絡的增大而出現的擬合問題的辦法。經過大量數據的分析可以看出,過擬合一般是出現在比較小的空間中,因為數據形成的函數值改變比較大,導致函數的參數值比較大,會使一些區間比較小的函數絕對值比較大。而正規化可以利用其阻止函數的浮動范圍太大,來降低模型的復雜程度,進而降低過擬合的出現。
3卷積神經網絡的應用
3.1目標檢測
目標檢測的作用是判斷檢測目標的類別,其監測的對象是定位的圖像中特定物體所出現的區域,這一應用是計算機視覺領域的一項基本內容。其檢測的目的更加注重圖像的局部區域與特定物體的類別集合,是一個比圖像識別更加復雜的識別問題。比較舊的目標檢測算法主要的使用原理是利用設計人的先驗知識,然后獲取樣本中的手工設計特點,使用比較少的參數,效率會提升。
3.2圖像分類
圖像分類是比較重要的應用,作用是利用計算機依據圖片的內容進行分類,并進行語義類別的標記,對象是特定的一張照片。
3.3圖像語義分割
在近幾年,人們對人工智能比較重視,因此,對計算機視覺和機器學習等方向的研究比較多,隨著其研究的加深,專業人員講重點放在了圖像本身,對其進行更加準確的分析和了解。而圖像語義分割正是在這樣的情況下提出來的,圖像進行分割之后,對其分割后所有分割區域與像素的語義類別進行分類,且可以準確識別,舊的圖像語義分割步驟有3種,其一圖像的底層分割,將圖片劃分成多個小的區域;其二是獲得小區域的底層特點,比如,形狀特征、顏色等;其三是從底層的特點到高層的語義空間的映射,其目的是為了識別圖像的具體區域與圖像的每一個像素的語義種類。
3.4人臉識別
人臉識別對計算機視覺方面是一個比較大的難題,技術比較難實現,其目的分為人臉驗證與人臉辨別。人臉驗證的目的是為了辨別出任意2張人臉是否為一個人的,這是一個二分類的問題,隨機猜測的正確概率為50 %。人臉辨別的目的是把一個未知的人臉照片分割成幾個身份類型之一,是多分類題目,隨機猜測的正確概率為N分之一,其正確率比人臉驗證更低,因此其挑戰更大。
4結束語
最近幾年來,經過專業人士的不斷研究,深度卷積神經網絡在計算機視覺方面的研究成就比較多,將這些成果進行總結改造,運用在人工智能領域,使人工智能方面得到快速的發展,不斷地滿足人們對人工智能的需求。但是在目前的研究中,依然有很多的問題需要解決,有很大的發展空間。