霍桂利
(山西建筑職業(yè)技術(shù)學(xué)院,山西 太原 030006)
所謂模式識(shí)別就是指對(duì)所表征事物或現(xiàn)象的各種形式的數(shù)據(jù)信息進(jìn)行分類(lèi)分析和機(jī)器處理,以及對(duì)現(xiàn)象或者事物進(jìn)行描述、分類(lèi)、辨認(rèn)和解釋的過(guò)程。主要組成是信息科學(xué)及人工智能科學(xué),應(yīng)用于圖像分析與處理、語(yǔ)音識(shí)別、聲音分類(lèi)、通信、計(jì)算機(jī)輔助診斷、數(shù)據(jù)挖掘等學(xué)科領(lǐng)域。分析和研究的方向集中在兩個(gè)重要方面:一是分析各類(lèi)生物體如何去進(jìn)行感知,為認(rèn)識(shí)科學(xué)的范疇;二是在確定的任務(wù)情況下,如何利用計(jì)算機(jī)來(lái)實(shí)現(xiàn)用模式去識(shí)別事物。感知是屬于生理學(xué)、生物學(xué)、心理學(xué)和神經(jīng)生理學(xué)的研究?jī)?nèi)容,識(shí)別則是利用信息學(xué)專(zhuān)家、數(shù)學(xué)家和計(jì)算機(jī)科學(xué)工作者的共同努力和研究;而模式識(shí)別還可分解為抽象和具體的兩種狀態(tài),抽象如人腦的意識(shí)、思想等,為概念識(shí)別研究范疇,即人工智能的研究方向。該研究方向指的模式識(shí)別是對(duì)地震波、語(yǔ)音波形、腦電圖、文字、心電圖、符號(hào)、照片、圖片、生物傳感器等內(nèi)容及對(duì)象的模式進(jìn)行識(shí)辨和分類(lèi)。利用計(jì)算機(jī)對(duì)一些事件和過(guò)程進(jìn)行識(shí)別和分類(lèi),識(shí)別的事物及過(guò)程可以是聲音、文字、圖像等具體的研究對(duì)象,當(dāng)然也可以是一些程度抽象的對(duì)象。把這些對(duì)象與數(shù)字的形式信息加以對(duì)比和區(qū)別,稱(chēng)之為模式信息。模式識(shí)別理論及技術(shù)現(xiàn)在已能成功地應(yīng)用于諸多領(lǐng)域,如指紋的識(shí)別、信件的分檢、生物醫(yī)學(xué)的細(xì)胞、故障的診斷、可以有視覺(jué)的機(jī)器人、汽車(chē)自動(dòng)駕馭系統(tǒng)和語(yǔ)言的識(shí)別等。
模式識(shí)別方法是利用模糊數(shù)學(xué)的概念、原理和方法解決分類(lèi)識(shí)別的問(wèn)題。對(duì)于一個(gè)完整的模式識(shí)別系統(tǒng),在其進(jìn)行模式識(shí)別之前,所應(yīng)用目的不同,則分類(lèi)識(shí)別方法也不盡相同,首先是特征提取,特征提取與選擇的基本任務(wù)及研究如何從許多的特征中尋找出有效的特征,壓縮特征空間的維數(shù)。從直觀上可知,在特征空間中,如果同類(lèi)模式分布比較密集,不同類(lèi)模式分布比較疏散,模式識(shí)別就比較容易正確,因此,為了給后續(xù)識(shí)別工作帶來(lái)方便,就要求在對(duì)實(shí)際對(duì)象提取特征或?qū)δ繕?biāo)的相關(guān)信息等進(jìn)行預(yù)處理時(shí),同類(lèi)對(duì)象差別較小,而不同類(lèi)對(duì)象差別較大。但是,通常描述的對(duì)象諸元素很多,提取的特征也沒(méi)有明顯的上述分布,或者得到的特征太多。這時(shí)我們就需要節(jié)約資源,節(jié)省計(jì)算機(jī)的存儲(chǔ)空間和特征提取的各項(xiàng)費(fèi)用,并且提高識(shí)別的正確率,即希望用最少的特征達(dá)到盡可能高的識(shí)別正確率。這就是特征的選擇。同時(shí)在實(shí)現(xiàn)目標(biāo)時(shí),需要制定特征的提取和選擇的準(zhǔn)則,由此構(gòu)造函數(shù)和判別的概率。為使機(jī)器具有分類(lèi)的識(shí)別功能,對(duì)機(jī)器學(xué)習(xí)的分類(lèi)就需要有學(xué)習(xí)策略和知識(shí)表示,學(xué)習(xí)策略是學(xué)習(xí)中使用的推理方法,把環(huán)境提供的信息通過(guò)識(shí)別轉(zhuǎn)變成新的形式,從而產(chǎn)生分類(lèi)識(shí)別的分析程序和規(guī)則。這種變換的性質(zhì)確定了學(xué)習(xí)策略的類(lèi)型。如記憶學(xué)習(xí)、傳授學(xué)習(xí)、類(lèi)比學(xué)習(xí)、歸納學(xué)習(xí)等。而機(jī)器進(jìn)行學(xué)習(xí)這個(gè)過(guò)程一般情況下要反復(fù)多次進(jìn)行,多種方法不斷地進(jìn)行錯(cuò)誤的修正和改進(jìn),包括修正之后的特征提取方法,修正之后的特征方案的選擇,判斷規(guī)則方法和參數(shù)的選擇等,結(jié)果將使系統(tǒng)的正確識(shí)別率的設(shè)計(jì)要求達(dá)到標(biāo)準(zhǔn)。
人類(lèi)的識(shí)別活動(dòng)是一項(xiàng)基本的活動(dòng),我們總是希望機(jī)器能夠代替人類(lèi)的活動(dòng)來(lái)進(jìn)行識(shí)別等工作,從而模式識(shí)別理論及方法將引起人們的極大興趣,因此進(jìn)行長(zhǎng)期的探討和研究,目前的發(fā)展是一門(mén)多學(xué)科的并且是一門(mén)交叉學(xué)科。該學(xué)科的理論與實(shí)際技術(shù)的應(yīng)用相當(dāng)廣泛,而且也涉及多種學(xué)科,如數(shù)學(xué)理論、心理學(xué)、計(jì)算機(jī)科學(xué)、信號(hào)處理學(xué)等。從根本上講,該學(xué)科是數(shù)學(xué)處理和信息分析,從性能上講,也可以認(rèn)為該學(xué)科是人工智能的一個(gè)子集。當(dāng)前的主流技術(shù)是:統(tǒng)計(jì)模式識(shí)別法、句法模式識(shí)別法、神經(jīng)網(wǎng)絡(luò)法、人工智能方法等,他們之間也存在一定的聯(lián)系。
統(tǒng)計(jì)模式識(shí)別:在統(tǒng)計(jì)學(xué)中,隨機(jī)性試驗(yàn)是指對(duì)隨機(jī)現(xiàn)象的觀察。隨機(jī)試驗(yàn)在完全相同的條件下,可能會(huì)出現(xiàn)不同的結(jié)果,但結(jié)果是可以估計(jì)的,即隨機(jī)試驗(yàn)的結(jié)果具有不確定性和可預(yù)計(jì)性,依據(jù)是否具有可預(yù)計(jì)性可以分為兩類(lèi):一類(lèi)是確定性的,此類(lèi)事物在一定條件下必然要發(fā)生或不發(fā)生;另一類(lèi)是隨機(jī)性的,此類(lèi)事物有很多可能的結(jié)果,在實(shí)驗(yàn)或?qū)崿F(xiàn)前不能預(yù)知會(huì)出現(xiàn)哪種結(jié)果,但是其有統(tǒng)計(jì)規(guī)律,這種統(tǒng)計(jì)規(guī)律可用概率分布(密度)函數(shù)或數(shù)字特征來(lái)刻畫(huà)。實(shí)際上對(duì)于許多必然性事物,當(dāng)我們對(duì)其發(fā)生、發(fā)展的一些條件不確知時(shí),或影響它們的條件是隨機(jī)的,其也表現(xiàn)具有隨機(jī)性。
句法模式識(shí)別:句法分析要求識(shí)別構(gòu)成句子成分以及它們之間的相互關(guān)系,確定每個(gè)動(dòng)詞的主語(yǔ)和賓語(yǔ),以及每個(gè)修飾性的詞或短語(yǔ)所修飾的成分。如果能把大量可能的輸入結(jié)構(gòu)映射為數(shù)量較少的結(jié)構(gòu),那么后續(xù)的處理語(yǔ)義分析就會(huì)簡(jiǎn)化。除此之外,如果在句法分析中選擇的結(jié)構(gòu)是恰當(dāng)?shù)脑挘髦^、述賓一類(lèi)的關(guān)系都可以在這個(gè)分析階段的結(jié)果中搞清楚。理論語(yǔ)言傾向由句法分析模塊來(lái)完成關(guān)系類(lèi)型,而計(jì)算機(jī)語(yǔ)言則完全放棄了句法結(jié)構(gòu)的規(guī)范化,讓語(yǔ)義分析模塊直接去處理各式各樣的句子結(jié)構(gòu)。在這一類(lèi)系統(tǒng)中,句法結(jié)構(gòu)的規(guī)范化實(shí)際上被包含在語(yǔ)義分析過(guò)程中了。那么這樣需要更復(fù)雜的語(yǔ)義規(guī)則,因此在自然語(yǔ)言處理系統(tǒng)中一般的做法仍然包含這樣一種結(jié)構(gòu)規(guī)范化的模塊。在現(xiàn)有的系統(tǒng)中,首先是先句法后語(yǔ)義:即強(qiáng)調(diào)在語(yǔ)言分析過(guò)程中存在一個(gè)相對(duì)獨(dú)立的句法分析階段,它的輸出結(jié)果是輸入句子的句法結(jié)構(gòu)。其次是句法和語(yǔ)義一體化:即這種分析策略的系統(tǒng)中不再單獨(dú)設(shè)置一個(gè)句法分析模塊,也不出現(xiàn)句法結(jié)構(gòu)這樣一種中間的分析結(jié)果。把這兩種觀點(diǎn)結(jié)合起來(lái)會(huì)得到一個(gè)更理想的分析系統(tǒng),這個(gè)分析系統(tǒng)既可以從句法入手也可以從語(yǔ)義入手來(lái)進(jìn)行分析,它們?cè)诜治鲞^(guò)程中都需要得到對(duì)方的幫助。然而要實(shí)現(xiàn)這樣一種設(shè)想的前提就是對(duì)句法分析和語(yǔ)義分析兩方面都必需有一個(gè)扎實(shí)的認(rèn)識(shí)。
人工神經(jīng)網(wǎng)絡(luò)法:神經(jīng)模型途徑是發(fā)展初期知識(shí)很少的通用的學(xué)習(xí)系統(tǒng),這類(lèi)系統(tǒng)通常稱(chēng)為神經(jīng)網(wǎng)絡(luò),系統(tǒng)包括一個(gè)由互連的元件組成的網(wǎng)絡(luò)。這些元件類(lèi)似于神經(jīng)元,它們實(shí)現(xiàn)簡(jiǎn)單的邏輯功能,這種系統(tǒng)的學(xué)習(xí)過(guò)程是逐步修改元件間的連接強(qiáng)度,一般是連續(xù)改變賦給這些連接的權(quán)值。系統(tǒng)的初始知識(shí)是選定輸入元件、網(wǎng)絡(luò)結(jié)構(gòu)和初始連接強(qiáng)度。現(xiàn)代模式識(shí)別對(duì)復(fù)雜的信息處理方面,已經(jīng)初步顯示出了識(shí)別系統(tǒng)具有一定的智能,但與人腦還不能相比。目前在計(jì)算能力上計(jì)算機(jī)大大超過(guò)人類(lèi),而關(guān)于人類(lèi)基本的智能,如視覺(jué)、聽(tīng)覺(jué),計(jì)算機(jī)的處理能力還很差。那么作為另一種技術(shù)新途徑,人工神經(jīng)網(wǎng)絡(luò)的技術(shù)將以嶄新的思路,優(yōu)秀的特性引起人們極大的研究與開(kāi)發(fā)興趣。對(duì)人工神經(jīng)網(wǎng)絡(luò)將采用可實(shí)現(xiàn)的器件或計(jì)算機(jī)通過(guò)硬件或軟件的方式,解決機(jī)器學(xué)習(xí)、識(shí)別、控制、決策等機(jī)器智能的問(wèn)題。當(dāng)神經(jīng)網(wǎng)絡(luò)元模型確定之后,神經(jīng)網(wǎng)絡(luò)的特征和能力主要取決于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及學(xué)習(xí)方法,如前向網(wǎng)絡(luò)、輸出向輸入反饋的前向網(wǎng)絡(luò)、層內(nèi)互連前向網(wǎng)絡(luò)、全互連反饋網(wǎng)絡(luò)、局部互連反饋網(wǎng)絡(luò)。在學(xué)習(xí)階段,外界將把輸入和輸出信息提供給神經(jīng)網(wǎng)絡(luò),并使網(wǎng)絡(luò)的輸入和輸出神經(jīng)元狀態(tài)與外界信息一致,在網(wǎng)絡(luò)運(yùn)行達(dá)到穩(wěn)定后,對(duì)所有的連接權(quán)進(jìn)行了調(diào)整。在工作階段,外界將把輸入信息提供給神經(jīng)網(wǎng)絡(luò),要求網(wǎng)絡(luò)給出相應(yīng)的輸出信息,外界提供部分信息,網(wǎng)絡(luò)輸出全部信息。
人工智能方法:人工智能是研究怎樣使計(jì)算機(jī)來(lái)模仿人腦所從事的學(xué)習(xí)、思考、推理和規(guī)劃等邏輯思維活動(dòng),以便解決人類(lèi)專(zhuān)家才能處理的一些復(fù)雜問(wèn)題。主要包括計(jì)算機(jī)實(shí)現(xiàn)智能的原理、制造類(lèi)似于人腦的智能計(jì)算機(jī)。它涉及到醫(yī)療診斷、石油測(cè)井解釋、氣象預(yù)報(bào)、運(yùn)輸調(diào)度和管理決策等課題。從實(shí)用觀點(diǎn)看,人工智能是一門(mén)知識(shí)工程學(xué);以知識(shí)為對(duì)象,研究知識(shí)的獲取、知識(shí)的表示方法和知識(shí)的使用。從認(rèn)知觀點(diǎn)看,人工智能僅限于邏輯思維范圍是不夠的,須考慮形象思維、靈感思維才能促進(jìn)人工智能的發(fā)展。數(shù)學(xué)常被認(rèn)為是多種學(xué)科的基礎(chǔ)科學(xué),它在機(jī)械運(yùn)動(dòng)中,復(fù)雜的無(wú)組織的如分子運(yùn)動(dòng)中都有重要的貢獻(xiàn)。數(shù)學(xué)還應(yīng)進(jìn)入語(yǔ)言、思維領(lǐng)域,人工智能學(xué)科不借用數(shù)學(xué)工具是不可想象的。人工智能的研究集中在抽象的、簡(jiǎn)單的現(xiàn)實(shí)世界的積木塊上,而數(shù)學(xué)在人工智能中遠(yuǎn)沒(méi)有發(fā)揮作用,僅限于標(biāo)準(zhǔn)的邏輯、模糊數(shù)學(xué)的使用。人工智能研究的目標(biāo)就是使計(jì)算機(jī)及其系統(tǒng)實(shí)現(xiàn)人類(lèi)智能,為人類(lèi)的工作、學(xué)習(xí)和生活帶來(lái)方便。利用知識(shí)以及知識(shí)表示就成了人工智能研究的核心。如知識(shí)工程、自然語(yǔ)言理解、計(jì)算機(jī)視覺(jué)等都是人工智能的主要研究方面。而專(zhuān)家系統(tǒng)及其開(kāi)發(fā)工具、自動(dòng)推理、機(jī)器學(xué)習(xí)已成為研究的熱點(diǎn)。人工智能學(xué)科要有理論也要有實(shí)踐,思維科學(xué)是人工智能的理論基礎(chǔ);可把人工智能列入認(rèn)知科學(xué)內(nèi)的一種工程技術(shù)學(xué)科。計(jì)算機(jī)是以程序來(lái)執(zhí)行一些任務(wù)的,衡量一個(gè)程序是否是一個(gè)智能程序,常常從其自然語(yǔ)言的理解能力,或者是自動(dòng)推理能力以及機(jī)器學(xué)習(xí)能力來(lái)分辨。如此來(lái)看,多數(shù)程序不是智能程序,少數(shù)程序可視作智能程序的雛形,根本原因是對(duì)機(jī)器學(xué)習(xí)以及自然語(yǔ)言理解的機(jī)理的認(rèn)識(shí)還是很不夠的。
[1]程民德.圖像識(shí)別論[M].上海:上海科學(xué)技術(shù)出版社,1983.
[2]王紹霖.數(shù)字模式識(shí)別[M].長(zhǎng)沙:國(guó)防科技大學(xué)出版社,1985.
[3]戴遺山,汪浩.概率論[M].哈爾濱:哈爾濱軍事工程學(xué)院,1983.
[4]周概容.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,1984.
[5]趙慶建,陳森發(fā).基于紋理分析的多源信息融合方法研究[J].信息與控制,2007,(2).
[6]陳艷琴,羅大庸.多信息融合技術(shù)及在無(wú)損檢測(cè)中的應(yīng)用[J].電子科技大學(xué)學(xué)報(bào),2003,(6).
[7]韓崇昭,朱洪艷,段戰(zhàn)勝,等.多源信息融合[M].北京:清華大學(xué)出版社,2006.
[8]楊露菁,余華.多源信息融合理論與應(yīng)用[M].北京:北京郵電大學(xué)出版社,2006.
[9]馬洪超,郭麗艷.人工神經(jīng)網(wǎng)絡(luò)信息融合及其在機(jī)場(chǎng)識(shí)別中的應(yīng)用研究[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2005,(8).
河北開(kāi)放大學(xué)學(xué)報(bào)2012年5期