于浩文
(英國南安普頓大學,英格蘭,So173sh)
人臉表情識別技術其實是一種將計算機技術與生物學聯系在一起的技術。這項技術的出現與創新,標志著人類未來的生活將會出現多種多樣的交叉型學科研究,這也意味著人類未來的計算機技術發展會有更多的可能性,但需要注意的是,想要使得人臉表情識別技術變得更加智能化、更加精準,仍然需要進行更加貼合實際人類需求趨向的技術改進,文章將從卷積神經網絡的角度出發,進行人臉表情識別技術的研究。
想要對基于卷積神經網絡的人臉表情識別進行深入的研究與探討,就需要對神經網絡理論以及人臉表情識別技術有一個更加深入的認知。
所謂的神經網絡理論中,神經網絡模型是較為重要的組成部分,該模型能夠對人腦的結構以及功能進行一個數據化的模擬反應。而神經網絡中最基本的單位是神經元,因此要進行神經網絡模型的構建,必須要對神經元的信息傳遞方式以及連接方式有一個深刻的認知。相關技術研究人員發現,使用神經網絡訓練的過程中要進行前向傳播以及反向傳播的訓練。相關技術研究人員通過對人體神經網絡日常信息反饋和分析的方式與方法研究,進行數字化模擬的神經網絡模型搭建。
卷積神經網絡是人工神經網絡的重要組成部分,它是一種十分高效的網絡,需要通過多層的神經網絡組合起來才能夠進行運用。卷積神經網絡有較為漫長的發展歷史,隨著人工智能技術的逐漸發展和創新,卷積神經網絡的技術也逐漸達到了新的高度。在傳統的神經網絡工作原理中,僅僅只能夠滿足兩層神經元之間的相互連接,但是在日常的計算機運算過程中,全鏈接層上的參數過多,因此這種傳統神經網絡的工作方式可能會導致整體的網絡訓練速度變得十分緩慢,甚至出現過擬合問題。而卷積神經網絡則完美的規避了這些缺點,能夠使得全鏈接層上的參數在計算機運行過程中有明顯的減少,這樣一來整個網絡訓練的速度就能夠得到提升與穩定[1-2]。在使用卷積神經網絡進行圖像認知識別的過程中,每個神經元只需要對圖像的局部特征進行辨識,而不需要每個神經元都對整個圖像的特征進行辨識,這不僅能夠使得圖像識別的精準程度得到提升,還能夠使得圖像識別的速度得到提升。因此相比較傳統的神經網絡在人臉表情識別方面的使用,卷積神經網絡的使用會變得更加方便、快捷。
想要成功地進行人臉表情識別,要經歷3個階段,第1個階段是人臉檢測階段,第2個階段是人臉表情特征的提取階段,第3個階段是人臉表情的識別階段。這3個階段缺一不可,共同完成一次人臉表情的精準識別。所謂的人臉檢測指的是在圖像中精準的找出人臉的位置,因此不論是第二階段還是第三階段的應用,都需要經歷第一階段,如果相關神經網絡技術的應用,無法在圖像中進行人臉位置的準確提取,那么第二階段與第三階段也就無從談起。能夠用來進行人臉檢測的方式有很多。在第一階段完成之后,到了第二階段,就需要進行人臉表情的特征提取,所謂人臉表情的特征,指的是面部肌肉以及紋理變化的相關特征數據化,通過數據化的呈現來進行準確地提取和分析。相關人臉表情識別技術不僅要運用到靜態圖像上,而且需要運用到動態圖像上。而運用到靜態圖像上的技術與運用到動態圖像上的技術有些微小的差別,因此相關技術人員必須要對不同圖像類型的人臉表情特征提取進行不同的基礎研究。到了第三階段之后,由于已經有了提取出的人臉表情特征信息,因此該步驟只需要判斷提取出來的特征屬于哪一類別,便算是完成了整體的人臉表情識別。這一步驟的完成也可以通過幾種不同的算法來進行。總而言之,人臉表情識別方式以及技術手段仍然有不斷改進的可能,在卷積網絡神經技術使用基礎上進行人臉識別技術的使用,更能夠保證其準確性。
為了使未來的人臉精準識別能夠變得更加高效準確,許多技術研究人員開始通過數據庫的建立來進行人臉表情的搜索與整理。現有的人臉表情數據庫在數據存儲量上并不符合使用軍機神經網絡來幫助進行高效表情識別的期待,因此為了使得研究變得更加精準合理,應當建立能夠使用卷積神經網絡技術進行人臉表情識別研究的人臉表情圖像數據集。下文將對數據庫集的建立進行深入的分析與研究。
想要使得相關人臉精準識別數據庫更具典型性與代表性,在相關數據的收集過程中,就應當以認真負責的態度來確保相關數據的真實性。具體到人臉精準識別數據庫的建立上,則表現為相關技術研究人員需要對人臉最具代表性的5大類表情:面無表情、微笑、哭泣、驚訝以及生氣進行最為精準性的收集。其中微笑表情的面部特征是面部肌肉強有力的收縮,面頰向上,眼角下的皮膚略微有些松弛,眼角的魚尾紋會皺起。而哭泣表情則是嘴巴張大,整個面部表情向下,眼睛緊閉或是上下眼皮靠攏。而到了生氣這一表情,相關技術人員所需要進行關注的面部特征是眼睛睜大,瞳孔變小,以及上下牙齒咬合在一起。而所謂的面無表情就是從表情分析上看不出人類想要表達的情緒[1]。驚訝表情則是嘴唇張大,眼睛張大,瞳孔放大,擁有這一類表情特征的圖片則會被標記為驚訝。當然技術研究在進行相關面部圖像表情采集的過程中,所需要運用到的采集技術有兩種:一種是爬蟲采集,另一種是手動采集。手工采集是一種較為原始和傳統的信息采集方式,需要靠技術人員在互聯網上進行手動的信息獲取。在進行人臉表情數據庫建立過程中所需要使用到的爬蟲技術是圖像數據爬取。準確無誤的使用該技術,可以更加真實的進行相關人員數據的獲取和整理,這對進行相應數據庫的建立是能夠起到助力的。
倘若相關人臉表情識別的數據收集較為真實且高質量,那么在進行下一步的相應人臉表情數據識別過程中,相關識別效率就能夠得到有效的提升。因此在進行數據庫的建立過程中,進行人臉表情識別準確性的提升是很有必要的。在數據的預處理工作完成后,還要對已經處理過的數據信息進行統一的尺寸修改以及格式修改和命名修改,通常情況下,人臉表情數據信息采集在進行了預處理過程后,都需要統一為JPG格式,并且相關的分辨率,通常情況下分辨率需要統一為227×27的模式,才能夠被當作原始的參照圖像資料存入庫中[2]。在這一流程完畢后,相關的數據庫建立便宣告完成。
雖然相比較傳統的卷積神經網絡模型而言,AlexNet具有無可比擬的優勢,并且能夠使得相關的人臉表情識別效率質量大大提升,但是在人工智能技術不斷發展與改進的過程中,相關技術人員仍然發現AlexNet網絡結構存在著一定的缺陷。例如使用該網絡結構對人臉表情進行識別實驗,最終的精準程度是74.91%。就是說它能夠識別大部分的人類面部表情,但仍然存在誤差,這意味著相關網絡結構在卷積操作的特征提取過程中所使用的卷積操作卷積核尺寸并不具備多樣性[3]。想要在未來的卷積神經網絡基礎上進行人類面部表情識別,并且使得相關面部表情識別變得更加精準和高質量,就需要對現階段所使用的AlexNet網絡結構進行進一步的改進與完善。
總而言之,在人工智能技術不斷發展與完善的過程中,想要使用卷積神經網絡來進行面部表情的識別與抓取,并且使得相關識別質量與速率能夠得到明顯的改進,就需要不斷結合人工智能技術的發展趨向來進行相關識別技術的完善,這項技術的改進能夠對人類的面部表情進行更好地解讀,也會在一定程度上促進人與人之間的良好溝通,使得人類日常的生活和工作變得更加方便快捷。