王朝帥
遼寧省建筑設計研究院有限責任公司 遼寧沈陽 110005
在人工智能中圖像識別技術的技術原理就是利用計算機處理圖片,然后對圖片中的信息進行提取或者其他的智能處理,在經過我國科技人員的不斷分析和實驗得出圖像處理技術的技術原理,圖像識別技術在技術原理中并不復雜,如果把一個人當成一個計算機的話,那么人與人之間的每一次對視都可以說是完成了一次圖像識別技術,然后人根據對他人的印象在自己的腦子里面對他人的信息進行分析、搜索和記憶,計算機的圖像識別技術是同樣的原理,唯一不同的是在人工智能圖像識別技術中圖像對計算機提供的信息是依靠數據進行識別和分析的,如果事先沒有對圖片相關信息的存儲的話,還是需要人為操作對提取的信息的關鍵詞進行選擇的,人工智能中的圖像識別技術的原理是結合計算機處理數據的算法原理的,所以簡單的圖像數據信息的提取和分析階段可以結合計算機進行,但是在圖片信息模糊或者信息量比較大的圖片中,圖像識別技術的識別效率可能會降低,所以在分析圖像識別技術原理的同時還應該尋找更好更簡單方便的圖像識別技術原理來對圖像識別技術進行改變,使圖像識別技術的原理變得更加簡單,并且在實現功能方面和處理圖片方面得到更好的完善[1]。
人工智能中的圖像識別技術的重要組成原理是對圖片的模式識別,模式識別不僅是圖像識別組成原理中的重要組成部分,還同時是人工智能科技中的組成部分。模式識別主要是應用于圖像處理技術中對不同類型的平面圖片和立體圖片進行處理,達到對圖片和實體事物的分析。人工智能運用在圖像識別技術中主要配合模式識別對事物分析進行虛擬化,也就是說對于事物的分析就不再需要面對實物了,人工智能和模式識別可以對圖片進行三維化。在我們的現代醫學和建筑領域中這項技術的使用效果比較突出,在醫學中醫生根據拍片就可以對人體進行立體化分析,可以分析人的三維結構和分析病人的健康狀態。在建筑領域中,傳統的建筑結構是以平面圖為主,在現代科技的發展下,建筑師可以利用模式識別的方式對建筑平面圖立體化,使建筑成像更加清晰,同時建筑結構也能夠清晰表現出來。可以說在人工智能中圖像識別技術結合模式識別使圖像識別技術不僅僅是應用在平面圖片的處理中,還同時應用到了立體圖像的處理中,滿足了人們需求的同時也方便了人們運用。在我們的日常生活中,人的眼睛就是最好的模式識別,所以普通的模式識別技術注定無法滿足人們日常生活的需求,但是模式識別在結合人工智能之后,做到了人們無法做到的一些工作[2]。
不同類的對象有不同的特征向量,而后利用統計決策的原理對特征空間進行劃分,從而識別出不同模式類的特征向量。它包括參數方法和非參數方法。參數方法主要以Bayes決策準則為指導。其中最小錯誤率和最小風險貝葉斯決策是最常用的兩種決策方法。這類方法應用于圖像分割、圖像復原以及圖像識別等方面。在圖像分割中,假定圖中的數據是服從K個概率密度混合分布的樣本,然后估計概率密度函數的參數,最后計算后驗概率或風險,對像素進行歸類,從而達到分割圖像的目的。非參數方法在樣本數量不是很大的情況下直接設計分類器。
結構模式識別是利用模式的結構描述與句法描述之間的相似性對模式進行分類,是對統計識別方法的補充。每個模式由它的各個子部分的組合來表示。該方法模仿了語言學中句法的層次結構,采用分層描述的方法,把復雜圖像分解為單層或多層的簡單子圖像,主要突出了識別對象的結構信息。
1965年Zadeh提出了模糊集理論,該理論改變了非0即1的判別結果,而是將歸類問題轉換成了隸屬度的問題。一個對象可以在某種程度上屬于某一類別,而在另一種程度上屬于另一類別,隸屬度是被識別對象隸屬于某一類別的程度。一般常規識別方法則要求一個對象只能屬于某一類別。基于模糊集理論的識別方法有:最大隸屬原則識別法、擇近原則識別法和模糊聚類法。模糊模式識別具有客體信息表達更加合理,信息利用充分,各種算法簡單靈巧,識別穩定性好,推理能力強的特點[3]。
人工神經網絡的研究起源于對生物神經系統的研究。它將若干處理單元(即神經元)通過一定的互連模型連結成一個網絡,這個網絡通過一定的機制可以模仿人的神經系統的動作過程,以達到識別分類的目的。神經網絡側重于模擬和實現人認知過程中的感知覺過程、形象思維、分布式記憶、自學習和自組織過程。圖像識別利用該方法也較多,文獻采用自組織網絡對醫學圖像進行分割,并能夠將CT圖像中的病灶分割出來,取得一些令人滿意的結果。
綜上所述,本文在研究的過程當中提出了圖像模式識別的主要內容,以及圖像模式識別的方法,分析了人工神經網絡的作用,提出了在人工神經網絡下圖像模式識別的主要方法,在進行圖像模式識別的過程當中神經網絡系統需要訓練圖像的數據,再決定是否學習的過程當中,一方面輸出權值,而另一方面對圖像進行分類,最終輸出結果。在人工網絡系統下進行圖像模式識別,可以使得圖像轉向數字化的方式不斷的提升處理的效率以及處理的質量,從而得到非常廣泛的應用。