祝凌云
摘 要 人工智能主要研究機器行為、機器學習、機器思維等。這些看起來很難做的事,在人工神經網絡的發展下變成可能。本文首先論述人工神經網絡的由來,研究生物神經元的特點,并引出人工神經元模型及激活函數;進一步分析了幾種常見的人工神經網絡,主要包括目前廣為應用的反向傳播網絡、能夠有效避免局部最優問題的徑向基網絡、以及能夠有效實現記憶功能的自適應的諧振網絡;最后總結了目前在計算機視覺和自然語言處理的實際應用。
關鍵詞 人工智能;人工神經網絡;基本原理;反向傳播
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2019)237-0120-03
近10年來取得重大技術突破的人工智能技術,已經以各種方式進入到社會的方方面面,并起著舉足輕重的作用。目前世界各地關于該領域的研究都在如火如荼的開展,我國也在大力發展人工智能,并希望在2030年成為人工智能強國。許多中國公司已經相繼發布了諸多高科技人工智能產品,如Tmall Genie X、iFlytek translator 2.0與智能音箱等。而人工智能的發展當然也離不開它的核心技術——人工神經網絡[ 1 ]。
人工神經網絡作為信息處理系統,具有非線性、自適應的特性。每個神經元都處在興奮和抑制這兩種狀態,因此,建立非線性關系是必須的。進一步人工神經網絡的自適應,需要不斷在學習的過程優化和迭代。在面對不同對象與環境時,可將學習分為3類,分別為有監督學習、無監督學習和強化學習。目前人們對某種神經網絡的訓練,主要是調整神經元的閾值和權值,找到適當的值,可以提高神經網絡的效率,增加其容錯性。
1 基本原理
人類自古就對大腦的結構有著極大的興趣。研究發現,人腦在傳遞信號的過程中,神經元與神經元之間的突觸結構需要經過電信號-化學信號-電信號的轉換,因此人腦信號的傳遞比計算機計算速度慢很多。但自1997年“人類腦計劃”啟動以來,人們逐漸認識到人腦在對外界做出反應時,反而比機器更快,究其根本是因為人腦在不斷的學習與記憶使其無需繁瑣的機器計算,而是對記憶的搜尋與經驗的再現。因此,基于人腦信息處理機制的基本原理對設計人工神經元,構建神經元之間的聯系組成人工神經網絡有著重要意義。
1.1 生物神經元
雖然人類還沒有掌握生物神經元的功能與結構,目前所說的人工神經元與生物神經元之間也可能有很大的區別,但生物神經元是人工神經元的原型。因此對生物神經元的學習很有必要。
研究發現生物神經元主要由兩部分組成,一是細胞體,二是突起。細胞體,包括核糖體內質網,高爾基體等細胞器,可對信息即上一神經元傳遞而來的沖動進行處理,從而使細胞膜電位發生改變。當細胞膜電位超過某一閾值時,細胞就會興奮,并由軸突傳遞給下一神經元,否則細胞抑制無興奮傳遞。其中軸突是神經元的信息輸出端,其末端也稱為神經纖維,它可把興奮傳遞給下一個神經元。
上述的軸突為突起的種類之一,另一種則為樹突。樹突是神經元較短的分支,數量較多,形如樹枝,可用于接收上億神經元的刺激。上億神經元的軸突與下一神經元的樹突通過突觸相連形成生物神經網絡。
1.2 人工神經元數學模型
為了解決現實生活中的非線性問題,實踐過程中常引入激活函數[3]。在深度學習技術興起以前,Sigmoid函數是最為廣泛應用的,目前常用的則是ReLU函數。主要是因為ReLU函數計算簡單,速度快。尤其是在深層神經網絡在反向傳播的過程求偏導數時,Sigmoid函數導數會從0.25減小,當模型層數較多的時候,就會出現梯度消失的現象,而ReLU的梯度恒為1,能有效避免梯度消失和梯度爆炸的問題。二者都是對神經元電信號的一種模擬。公式如下:
2 常見的幾種模型
2.1 BP神經網絡
BP即Back Propagation指的是反向傳播。反向BP網絡是目前使用最為廣泛的網絡,它是深度學習核心訓練算法的基礎。BP神經網絡的訓練就是先將信息前向傳遞,再反向傳播調整閾值和權值的過程。它是一種有監督學習,未經訓練的模型輸出的結果與準確值會有偏差。通過損失函數和代價函數來量化和計算實際輸出與標簽之間的誤差指,再基于鏈式法則采用梯度下降的算法,使得誤差收斂到最優解即最小值。
BP網絡的組成通常由輸入層,隱含層和輸出層3部分組成,各層神經元之間全部相連,同一層神經元則無連接,其中復雜的神經網絡中可含有多個隱含層。
在信號向前傳播時,信息經輸入層傳入網絡中,其中每一個神經元包括兩步操作:其一為數據的整合,主要是對每個信號的輸入乘以權重并求和之后,再加上閾值;其二為數據的處理,即將上述的結果輸入到激活函數中進行非線性映射。訓練完成的網絡中,隱含層常抽象出物體的特征。如當輸入一個漢字的圖像,隱含層可能表示的是這個字的某個組成部分,且中間的隱含層層數越多,它便可分層次的提取高級特征。最后利用誤差函數計算神經網絡輸出與真實值的誤差,誤差函數值越小,表明結果越準確。利用梯度下降和反向傳播的算法,可將損失反向傳播,進而調整神經元間的權值,通過不斷的迭代訓練,達到優化輸出的目的。
2.2 RBF神經網絡
由于在實際訓練過程中,BP神經網絡存在局部最優的問題。1988年,人們提出了徑向基函數(radial basis function neural network, RBF),它也是一種前饋式神經網絡。通過利用徑向基函數,該網絡不僅解決了局部最優的問題,而且實現了最佳逼近,節省了大量的訓練時間。


2.3 ART神經網絡
自適應共振理論(adaptive resonance theory)的提出,是為了解決傳統神經網絡中知識遺忘的問題。ART神經網絡的記憶內容可隨學習的過程不斷增加,避免了遺忘。
共振,也是模仿人類對圖像的識別與記憶。其主要過程如下,首先環境輸入模式,ART神經網絡有一個判斷的過程,以相似度的參考門限為準,與神經網絡儲存的模式進行比較。判斷結果即有相似的模式和無相似的模式。若有相似的模式,就選擇最相似的模式作為代表,并調整該模式的參數,類似于共振,以強化并完善該模式的內容。若無相似模式,只需新建此模式,并設置權值和閾值,讓環境再次輸入的相似模式能與之匹配。
3 應用
3.1 計算機視覺
計算機視覺,簡單的說就是讓計算機能夠像人類一樣,從圖像中提取某些信息,讓計算機能夠看懂圖像。人類的視覺是一種感知。人們可以從自我的感覺中做出判斷,得出結論。計算機視覺技術基于現代心理物理學的研究成果,利用人工神經網絡,對圖像進行識別、檢測與處理[4]。在這過程中,攝像機代替人眼獲取圖像,人工神經網絡利用算法模擬人腦。
在某些方面,計算機視覺的表現突出,甚至能夠超越人類。人工神經網絡功不可沒,它具有優秀的圖像處理技術,如圖像分割、圖像平滑和邊緣銳化等;能夠根據灰度閾值將圖像分割;能夠將因為攝像機等設備自身原因造成的失真現象進行平滑處理;還能夠給圖像中的各個物體勾勒出其邊緣的線條。
但是在實際場景中,計算機視覺與其他技術和硬件,還不能夠完美的結合。例如,可移動機器人在未知環境中,還未實現全自動的行為能力。
3.2 自然語言處理。
自然語言指的就是人類使用的語言。計算機科學家希望能夠讓人們從復雜計算機語言中解脫出來,實現人與計算機的自然語言通信[5]。研究自然語言處理,不僅可以促進人與計算機的交流,提高人們的生活質量;而且也能讓人類了解自己的語言特征。自然語言處理包括自然語言的理解和自然語言的生成。語言的理解就是對輸入的文本進行對話處理、知識處理。語言的輸入可以是語音和文字的形式,這也利用了語音識別和計算機視覺的技術。語言的生成便是將處理的結果以自然語言表達出來。
自然語言處理具有廣泛的應用。例如iflytek translator 2.0、信息檢索系統。但是目前它還不能處理大規模的文本。自然語言處理面對的最大困難就是語言的不確定性,容易引起歧義。對語言的組成部分字符、詞組、句子,每一個都有多種含義。而一個含義又可用多種方式來表達。這不是僅僅研究語法或者開發程序可以解決的,人們在對話中往往是根據語境加以判斷。要克服句意理解的障礙,就必須研究人腦對語言的識別與判斷,使計算機能夠篩選出語境中有用的隱含信息,推理句子的指代和省略。
4 結論
自20世紀80年代人工神經網絡被提出以來,經過無數科學家的深耕細作,使其目前得到了突破性進展。本文主要介紹了人工神經網絡的基本原理、常見模型和應用。人工神經網絡是一種模仿人腦運作的網絡,其中反向傳播神經網絡是目前運用最為廣泛的一種,而自適應諧振網絡和徑向基網絡二者相比于BP神經網絡也各有所長。最后介紹了人工神經網絡在計算機視覺和自然語言處理等領域的應用與挑戰。相信隨著人工神經網絡的發展,它會給我們帶來更多的驚喜。
參考文獻
[1]王佳.計算機人工智能識別技術的應用瓶頸探賾[J].科技展望,2016,26(35):93-94.
[2]朱大奇,史慧.人工神經網絡原理及應用[M].合肥:安徽科技出版社,2006.
[3]李航.統計學習方法[M].北京:清華大學出版社,2012:6-8.
[4]李超波,李洪均,徐晨.深度學習在圖像識別中的應用[J].南通大學學報,2018(1).
[5]黃子良.深度學習應用前景分析[J].通信與信息技術,2017(3):54-56.