文/黃麗娟
遺傳算法是計算的一種模型,模擬生物進化的遺傳機制,是自然選擇的生物進化過程。它是一種最優解的方法,是通過模擬自然演化過程而來。人工神經網絡具有非線性自適應信息處理能力,克服了傳統人工智能方法在直覺識別、語音識別、非結構化的信息處理能力等方面的不足。并且成功應用在模擬識別、優化組合、預測等領域。人工神經網絡模擬人類認知的方向上得到了更為深入的發展。結合遺傳算法形成計算智能已經成為人工智能的一個重要方向,并將在文本檢索中得到發展。
遺傳算法作為一種現代的優化的方法,借鑒進化論和遺傳學的理論。它的本質是一種搜索方法。本文將遺傳算法應用于文獻檢索優化設計中,以獲得較好的全局最優解。遺傳算法的基本操作是基于編碼機制,模擬自然選擇和遺傳中的復制、交叉和變異現象,遵循優勝劣汰的原則,在潛在的條件下,逐一生成近似最優方案。求解種群,從而進行種群優化,最終得最優個體。
使用遺傳算法,首先,設計遺傳優化模型。設計遺傳算法的過程基本上可分為幾個步驟,編碼方案的制定、適應度函數的確定、選擇策略的確定、交叉和變異操作的設計以控制參數的選擇。遺傳算法的設計完成后,可以根據遺傳優化算法的結構進行編程和實現,可以解決具體問題。
作為人工智能研究的一種方法,人工神經網絡具有很強的非線性映射能力。人工神經網絡的拓撲結構,它屬于多層感知器結構,包括輸入、輸出和幾個隱藏層。在運行網絡過程中,首先,信息的輸入通過輸入層的節點傳到隱藏層。節點的激活函數計算后,將每個節點的計算的信息傳到輸出節點,得到最后的輸出結果。bp 算法是人工神經網絡中應用最廣泛的模型算法。本文將bp 算法應用于文本檢索的優化。在優化過程中,利用人工神經網絡計算檢索結果,保證了訓練樣本的準確性,大大減少了優化計算量,提高了計算效率。
所謂BP 算法,即反向誤差傳遞法,分為正向和反向兩個傳播階段。在正向的傳播階段,信息通過不同的交換從輸入層傳播到輸出層。這個過程也是訓練結束后網絡正常運行的過程。在此過程中,網絡執行以下操作:

式中:Xp表示第p 個樣本輸入,W(1)、W(2)、…、W(n)分別表示第1、2、…、n 層的權值向量,而F1、F2、…、Fn對應各層的激活函數;Op為網絡輸出值。反向傳播階段是根據最小誤差調整權重矩陣的階段。這兩個階段的工作一般應按精度要求進行控制。這里我們對第p 個樣本進行誤差測量:

式中:m 為輸出層的神經元個數;apn表示第p 個樣本的理想輸出向量所包含的第n 個元素。最后將網絡關于整個樣本集的誤差測度定義為

最早的感知器是一個線性分類模型,它是一個線性表達式,因此在二維草圖中不可能找到一條直線來區分兩類數據點。為了解決這個問題,出現了多層感知器。最重要的特點是神經元層次多,所以又稱為深神經網絡。
信息由第一層次逐步向更高層次傳遞。在圖1中,神經元的第一層是輸入層,最后一層是輸出層,中間層稱為隱藏層。重要的是,在深度的神經網絡,隱藏層中的數字沒有很嚴重的限制,可以根據實際使用需要來設計。在深層神經網絡中,信息的傳遞是一個從第一層到更高層的漸進過程。
假設第一層是輸入層,輸入信息是x1、x2、x3。對于第一層,L1 用于表示該層中的所有神經元,其輸出為y1。由多層神經元組成的深層神經網絡,本質上是通過在具有復雜網絡結構的多維空間中擬合高階多項式來表達的,從而避免了一階線性表達式的局限性,并求解類似的異或問題。
一般來說,深度神經網絡是按照一定的網絡結構設計的,輸出結果通過權值計算給分類激活函數進行分類。假設輸入是任意向量x,一旦網絡模型被訓練和確定,網絡本身本質上就是多維空間中的復函數。假設分類激活的值是y,那深神經網絡就可以理解成一個復函數的變換,使得y=F(x)。
深度神經網絡是人工神經網絡的一種重要的形式,在文本識別、大數據分析等領域得到了越來越廣泛的研究和應用。有效的網絡模型設計在不同的應用中會有所不同。為了便于理解,假設深層網絡已經過訓練,其識別過程只是一個簡單的前向函數計算問題。假設輸入是向量x,輸出y=f(x)?其中f 由訓練的網絡結構和參數確定。
以深部神經網絡為例,介紹了其訓練過程的基本原理。辨識過程:依據輸入計算網絡輸出正向的原理。總得來說,訓練過程是通過監督的學習來計算每一次訓練的誤差,并沿著誤差減小的方向逐步迭代參數,使網絡最終穩定。
獲得了每層的深度神經網絡的參數調整的方法,并且依據此方法進行連續迭代來完成訓練的整個過程。并且在實際的訓練的過程當中,有可能會出現如梯度消失、誤差振蕩等等異常處理的情況,這些問題都需要專業技術人員來分析和調整,從而給出相應的最優解決方案,以保證訓練效果。將神經網絡算法融到深度的學習中來,以此可以提高人工智能的深度和廣度的層次關系。它將可以廣泛應用在駕駛、智能的交通、圖像的識別、大數據的分析等等領域。
人工神經網絡是具有比較強的自我適應、自我學習、自我組織和大規模并行處理的能力中這幾年來,人工神經網絡廣泛應用在工業、科研、醫藥、商業等等的社會生活的領域。它的應用主要是在飛機型號的識別和預測上面。人工神經網絡在紡織業中也有廣泛的應用,但是如何高效地確定神經網絡的參數及結構,特別是確定神經網絡中隱層的神經元的數目,一直是神經網絡研究的重難點。為了得到合理的參數和結構,需要進行很多的實驗研究,目前還要進行訓練。雖然訓練速度慢,容易陷入局部最優的情景,并且全局搜索能力比較弱。所以遺傳算法的固有特點可以對人工神經網絡進行優化。雖然遺傳算法不凡也有缺點。如果問題的解空間較大或者實時性的要求比較高的時候,遺傳算法可能會面臨迭代次數過多,從頁導致的運行速度約束。并且遺傳算法也需要不斷地生成新的不一樣種群,每一個個體都需要計算出適應的度值,才可以大大地限制算法的運行速度。假如兩者能有機結合,相輔相成,新制度將兼有兩者之優點,就可以達到揚長避短的目標。人工神經網絡善于從數據中進行學習,但遺傳算法卻善于解決復雜的全局優化的問題,具有比較強的全局尋優能力。遺傳算法在搜索適應性、廣度等方面優于人工神經網絡,但人工神經網絡在學習精度和優化方面優于遺傳算法。兩種技術的結合將產生強大的生命力。
綜合以上的闡述,神經網絡在自動識別和學習等方面具有較強的優勢,但全局搜索能力卻比較弱,而遺傳算法對于全局優化問題卻具有較強的處理能力,全局優化效果明顯。因此,利用遺傳算法優化的神經網絡是可以處理復雜的非線性問題,能優勢互補。因此,將遺傳算法跟人工神經網絡相結合必將為人工智能的科學提供一條捷徑,所以本研究具有一定的可行性和前沿性。