袁振洲
(東南大學(xué)成賢學(xué)院)
人臉的自動(dòng)識(shí)別是生物測(cè)定學(xué)研究的內(nèi)容之一,是模式識(shí)別領(lǐng)域中的一個(gè)前沿課題。該課題的研究已有?30多年的歷史。人臉識(shí)別正越來(lái)越成為當(dāng)前模式識(shí)別和人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。目前,人臉識(shí)別現(xiàn)已成功應(yīng)用到機(jī)場(chǎng)口岸檢查、刑偵辦案系統(tǒng)、門(mén)禁系統(tǒng)等許多領(lǐng)域。
與指紋識(shí)別技術(shù)相比,因?yàn)椴恍枰苯拥闹w接觸,在應(yīng)用中更加受到人們的歡迎,很大的便利了人們的使用。人臉識(shí)別技術(shù)的研究雖然已有多年的歷史,但因在實(shí)際應(yīng)用中,容易受到光照、姿態(tài)、年齡、表情、尺寸、背景等諸多外界因素的影響,所以對(duì)其研究及改善仍然是個(gè)熱門(mén)話題。
人臉識(shí)別過(guò)程:
1.建立人臉圖片檔案:可以先用相機(jī)或攝像頭拍取頭像或照片文件,生成頭像編碼。
2.獲得當(dāng)事人的現(xiàn)成頭像,可以通過(guò)相機(jī)攝像頭現(xiàn)拍,或者通過(guò)圖像輸入,生成其編碼。
3.將剛獲得的圖像編碼與之前建立的圖庫(kù)編碼進(jìn)行對(duì)比,并進(jìn)行檢索,看是否符合。
圖片錄入編碼方法是通過(guò)當(dāng)事人臉部的特征和開(kāi)頭工作的,它可以不受光線、表情、發(fā)型、姿態(tài)以及眼鏡位置等其他外部因素變換的影響,從而可以從眾多不同的人中辨別出來(lái)。
在進(jìn)行識(shí)別的過(guò)程中,這一系列的過(guò)程都是自動(dòng)的、連續(xù)的、即時(shí)的進(jìn)行的,并且不需要太復(fù)雜的設(shè)備,所以實(shí)際應(yīng)用時(shí)還是很便利易懂的。與指紋識(shí)別技術(shù)相比,進(jìn)行指紋識(shí)別時(shí),是需要當(dāng)事人肢體即手指與設(shè)備進(jìn)行直接接觸的,這無(wú)疑有一定的不方便之處,也會(huì)帶來(lái)不必要的時(shí)間浪費(fèi)。而人臉識(shí)別技術(shù)則不需要進(jìn)行直接的肢體接觸,僅僅需要將面部對(duì)準(zhǔn)攝像頭即可,大大的便利了使用。
在攝像頭接收到當(dāng)事人的臉部圖像時(shí),系統(tǒng)將會(huì)實(shí)時(shí)的對(duì)接收到的頭像進(jìn)行一系列的圖像處理,一系列的處理后,再與之前錄入的圖庫(kù)進(jìn)行匹配。
人臉識(shí)別的發(fā)展可以追溯到20世紀(jì)60年代,通過(guò)了幾十年的探索及研究,大體可以將其分為三個(gè)階段:
第一階段是主要解決了人臉識(shí)別過(guò)程中需要的面部的種種特征。在這一階段中,Bertillon、Allen和Parke等人做出了主要的貢獻(xiàn)。在Bertillon的系統(tǒng)中,用一個(gè)基本的語(yǔ)句和圖庫(kù)中的某一張圖片相結(jié)合,提供了一個(gè)較強(qiáng)的識(shí)別系統(tǒng)。而Allen?則設(shè)計(jì)了一種有效的摹寫(xiě)手段,在這之后再交給Parke用計(jì)算機(jī)進(jìn)行實(shí)現(xiàn)。然而無(wú)論是用哪種方式,這個(gè)階段的識(shí)別過(guò)程仍然全部依賴于操作人員,還是需要很多人員的干預(yù),并不能實(shí)現(xiàn)人臉的自動(dòng)識(shí)別。
第二階段是人機(jī)交互式識(shí)別階段。研究人員用數(shù)學(xué)模型描述人臉圖像的五官特征,并通過(guò)歐式距離來(lái)進(jìn)行相似性度量。Harmon和Lesk利用多維特征矢量表示人臉面部特征,并設(shè)計(jì)了基于這一特征表示法的識(shí)別系統(tǒng)。在這之后,又陸續(xù)有人也采取了不同的方式,對(duì)幾何特征計(jì)算進(jìn)行了研究。但是,該方法仍然依賴于操作人員的知識(shí),仍然沒(méi)有擺脫人為的干預(yù)。
第三階段才是真正的機(jī)器自動(dòng)識(shí)別階段。在這個(gè)階段人臉識(shí)別技術(shù)有了重大的突破,很多經(jīng)典算法陸續(xù)出現(xiàn),如特征法,子空間方法,彈性圖匹配法,基于統(tǒng)計(jì)外觀模型和神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別等。同時(shí)也出現(xiàn)很多用于算法性能測(cè)試的公開(kāi)人臉庫(kù),比如ORL人臉庫(kù),YaleB人臉庫(kù),F(xiàn)ERET人臉庫(kù)等。在這個(gè)階段,人們發(fā)現(xiàn)主要的人臉識(shí)別技術(shù)對(duì)于一些外部因素比如光照強(qiáng)度、姿勢(shì)形態(tài)等由于收集數(shù)據(jù)的時(shí)候不是在理想情況下進(jìn)行的,或者是因?yàn)楫?dāng)事人在被收集圖像數(shù)據(jù)的時(shí)候不配合造成的變換魯棒性比較差。所以以上這些因素成為了當(dāng)時(shí)以及后來(lái)技術(shù)人員的攻克重點(diǎn)。也就是在這個(gè)時(shí)候,人臉識(shí)別技術(shù)的商業(yè)應(yīng)用得到了迅速發(fā)展。21世紀(jì)初,美國(guó)先后兩次對(duì)人臉識(shí)別的商用價(jià)值進(jìn)行了系統(tǒng)的評(píng)測(cè)。
總的來(lái)說(shuō),當(dāng)前的主要問(wèn)題是解決在非理想條件下,以及當(dāng)事人不配合以及人臉數(shù)據(jù)庫(kù)里面的數(shù)據(jù)過(guò)于龐大而產(chǎn)生的一系列問(wèn)題。
首先,就人臉識(shí)別技術(shù)的特點(diǎn)而言,人臉識(shí)別是一種精度很高、使用便利、不容易進(jìn)行仿冒的一種識(shí)別技術(shù),因此具有非常廣泛的應(yīng)用前景。在海關(guān)、交通、社保、公安、國(guó)防等多個(gè)行業(yè)和部門(mén)有著非常廣泛的應(yīng)用。
其實(shí),人臉識(shí)別技術(shù)已經(jīng)深深地走入了我們的生活,我們生活的很多方面都在和人臉識(shí)別技術(shù)打交道了。比如,在一些企業(yè)中,人們不在使用指紋識(shí)別技術(shù)來(lái)完成考勤任務(wù),因?yàn)橹讣y識(shí)別技術(shù)的一些技術(shù)上上的特點(diǎn)逐漸的顯示出其短板之處,更是有人會(huì)投機(jī)取巧從而并不能很好的完成它的使命。并且指紋識(shí)別技術(shù)需要進(jìn)行直接的肢體接觸,這些無(wú)疑帶來(lái)很大的不便,效率小了很多。所以人們嘗試尋求一種新型的方式,所以人臉識(shí)別技術(shù)被很好的利用在了工作部門(mén)考勤方面,人臉識(shí)別考勤非常方便,只需要刷一下臉即可,方便高效,深受企業(yè)歡迎。
正因?yàn)槿四樧R(shí)別技術(shù)給人們的生活以及方方面面都帶來(lái)極大的便利,而它的應(yīng)用潛力還遠(yuǎn)遠(yuǎn)不止于此,接下來(lái)技術(shù)人員仍然有大量的空間去發(fā)展人臉識(shí)別技術(shù),還可以運(yùn)用到更多可以便利到人們生活的方面。然而,盡管目前為止人臉識(shí)別技術(shù)方面已經(jīng)有一定的成就,還是存在許多技術(shù)上的不足,仍然會(huì)有一些不方便的地方,接下來(lái)技術(shù)人員仍然需要大力的去探索人臉識(shí)別技術(shù)的應(yīng)用以及消除某些方面還不夠成熟的方面,盡量的去填好技術(shù)上的缺陷。
在應(yīng)用過(guò)程中,人臉識(shí)別的速度和準(zhǔn)確率無(wú)疑是這門(mén)技術(shù)最關(guān)鍵的點(diǎn),而這也將是技術(shù)人員進(jìn)行不斷優(yōu)化和不斷改進(jìn)的關(guān)鍵。人臉圖像的識(shí)別會(huì)受到很多外界因素的干擾:人臉表情的多樣性;以及外在的成像過(guò)程中的光照,圖像尺寸,旋轉(zhuǎn),姿勢(shì)變換等。使得同一個(gè)人,在不同的環(huán)境下拍攝所得到的人臉圖像不同,有時(shí)更會(huì)有很大的差別,給識(shí)別帶來(lái)很大的難度。因此在各種干擾條件下實(shí)現(xiàn)人臉圖像的識(shí)別,也就更具有挑戰(zhàn)性。
所以總的來(lái)說(shuō),人臉識(shí)別技術(shù)得到如此迅猛的發(fā)展并不是偶然的,可以說(shuō)是因?yàn)槠錁O大的滿足了人說(shuō)所追求的人工智能的需求。目前,IT行業(yè)內(nèi)大數(shù)據(jù),云計(jì)算以及深度學(xué)習(xí)的算法無(wú)疑是技術(shù)新貴,行業(yè)內(nèi)花費(fèi)大量的人力物力財(cái)力去進(jìn)行這幾項(xiàng)技術(shù)的探索。而在這些技術(shù)取得一定的成果之后,對(duì)于人臉識(shí)別技術(shù)而言也是很好的催化劑,它們有助于人臉識(shí)別技術(shù)發(fā)展到更高的高度,這樣的話,大規(guī)模的商業(yè)運(yùn)用便是自然而然的事。在接下來(lái)的很長(zhǎng)時(shí)間里,基于計(jì)算機(jī)視覺(jué)方面的運(yùn)用,以及在視頻監(jiān)控領(lǐng)域中,對(duì)人的行為模式的識(shí)別、跟蹤和分析,這些方面都會(huì)成為一個(gè)非常大的市場(chǎng),當(dāng)然了,它的成熟度還有待于進(jìn)一步的檢驗(yàn)。
總的來(lái)說(shuō),人臉識(shí)別技術(shù)有著非常廣廣泛的發(fā)展前景,人臉識(shí)別也僅僅是一個(gè)發(fā)展支點(diǎn),更多方面的運(yùn)用還有待于進(jìn)一步的研究和探索。