摘要:近年來,隨著深度學習技術的飛速發展,一種基于視覺圖神經網絡(Visual"Graphic"Networks,"VGNN)的人臉識別方法受到了廣泛關注。"VGNN是近年來興起的一種深度學習方法,它把圖像表示成圖結構,并通過神經網絡來學習圖像的特征與關系。在人臉識別領域,圖像神經網絡能夠通過學習人臉圖像間的相互關系,從而完成人臉識別任務。首先,介紹了"GNN的基本理論與體系結構;其次,詳細闡述了基于視覺圖的神經網絡模型體系結構與訓練方法,并進行了實驗驗證。研究成果可為后續的人臉識別研究提供借鑒與參考。關鍵詞:人臉識別"圖神經網絡""空間多尺度"注意力機制
中圖分類號:TP391.41;TP183
Research"on"Facial"Recognition"Method"of"Visual"Graph"Neural"Network
TANG"Wenhao
Heilongjiang"University"of"Business"and"Technology,"Harbin,"Heilongjiang"Province,150025"China
Abstract:"In"recent"years,"with"the"rapid"development"of"deep"learning"technology,"a"facial"recognition"method"based"on"Visual"Graphic"Networks(VGNN)"has"attracted"extensive"attention."VGNN"is"a"deep"learning"method"that"has"emerged"in"recent"years."It"represents"images"as"graph"structures"and"learns"the"characteristics"and"relationships"of"images"through"neural"networks."In"the"field"of"facial"recognition,"image"neural"network"can"complete"the"task"of"face"recognition"by"learning"the"relationship"between"facial"images."Firstly,"the"basic"theory"and"architecture"of"GNN"are"introduced;"Secondly,"the"architecture"and"training"method"of"neural"network"model"based"on"visual"graphs"are"expounded"in"detail,"and"the"experimental"verification"is"carried"out."The"research"achievements"can"provide"reference"and"guidance"for"the"subsequent"facial"recognition"research.
Key"Words:"Facial"recognition;"Graph"neural"network;"Spatial"multi-scale;"Attention"mechanism
人臉識別是一項非常重要的生物識別技術。人臉識別過程中,需要通過大量的人臉圖像來判斷是否為同一人。傳統的人臉識別方法一般都是手工設計特征并提取特征。隨著計算機視覺技術的不斷進步,基于深度學習的方法也得到了廣泛應用。基于此,提出了一種基于視覺圖譜神經網絡(Visual"Graphic"Networks,"VGNN)模型。VGNN由特征抽取層和分類層兩部分構成。特征提取層采用卷積神經網絡對人臉圖像進行特征提取;分類層采用通用分類器對不同的人臉圖像進行分類;在人臉識別領域,圖像神經網絡常被用來解決諸如光照、表情、姿態等復雜問題[1]。該算法能夠有效地從人臉圖像中提取出特征,利用深度神經網絡對人臉圖像進行識別與分類。在實際應用方面,圖神經網絡已在安全保衛、身份認證等方面得到了廣泛的應用。本文主要介紹了基于視覺圖的神經網絡技術及其在人臉識別領域的應用與實踐。在此基礎上,本項目還將對這一研究方向進行展望。
1"視覺圖神經網絡的人臉識別模型
VGNN是一種新興的人工智能技術,可以被應用于人臉識別。VGNN采用深度學習技術,其核心網絡層"VGNN具有學習人臉特征的能力。在人臉識別方面,"VGNN可以用來識別不同的人臉特征,提高識別的準確性。首先,"VGNN網絡的核心部分是由大量的節點和邊構成的可視圖結構。其中,節點代表了不同的人臉特征,而邊則代表了人臉間的相互關系。VGNN通過自主機制學習節點間的聯系,提高了識別精度。其次,基于圖的卷積運算,提出了深度網絡模型。該方法能夠同時捕捉到人臉的整體與局部特征,提高了人臉識別的準確性。VGNN通過把多個節點連接起來,能夠識別不同個體間的相似性和差異性,從而提高識別的準確性。
2.實驗部分
VGNN是一種基于深度學習的人臉識別模型[2]。該模型以深度學習算法為基礎,將圖像特征顯示成圖結構,實現人臉識別。該網絡主要由多個結點和邊構成,每個結點對應一張圖,用來描述輸入圖像和輸出的對應關系。節點間的關系是由節點間的邊連接起來的。VGNN技術的核心問題之一就是如何確定節點之間的連接關系。為此,本項目提出一種基于"長短期記憶網絡(Long"Short-Term"Memory,LSTM)的學習速率調控機制。該機制能夠根據節點間的相互關系等信息,自適應地調整學習速率,從而提高模型的預測精度和推廣能力。在"VGNN中,采用了一種開放源代碼“PyTorch”來訓練模型,該框架由輸入層、輸出層和優化層3個部分組成。其中,輸入層負責將圖像輸入到圖像輸出層,由圖像輸出層完成特征提取與分類;圖表輸出層被用來以圖表結構來表達特征;優化器用來調節學習速率,提高模型精度。實驗中,利用公共數據集"MNIST與CIFAR10對模型進行訓練與檢驗。本文采用梯度下降法和交叉熵損函數對模型進行了評價。在此基礎上,引入一種新的損失函數對模型進行改進,使其具有更好的預測精度和推廣能力。實驗證明,基于"PyTorch框架構造的"VGNN模型在人臉識別方面具有較高的性能,能有效地提取圖像特征并精確分類。相對于其他深度學習算法,"VGNN在性能、泛化能力等方面都有較大的提高。
2.1實驗設置
VGNN以卷積神經網絡(Convolutional""Neural"Networks,CNN)為基礎,能夠對人臉圖像進行檢測與分類。該模型使用了局部卷積和全局卷積兩大基本組件。利用局部卷積對圖像進行細節提取,利用全局卷積學習圖像結構特征。該算法的每一卷積由一個完全連通的層構成,該層包含若干個分岔點和一個分岔點。本研究利用公開數據集,共400張人臉圖片,包括正、背、半側面3種人臉圖像。本項目以人臉數據為訓練樣本,利用預訓練好的模型對所提方法進行驗證。采用"FasterRCNN算法對預訓練模型進行訓練,并采用微調策略對其進行微調[3]。實驗中,將測試集劃分為訓練集和測試集,分別用來評價所提出的方法,并對所提方法進行評價。在訓練過程中,采用批量標準化、激活函數、損失函數、正則化等方法對模型參數進行調整。批量標準化可解決過學習問題,激勵函數可選用多項式或"Gabor函數,損失函數可選用梯度下降法或交叉熵損函數。正則化項可調節模型的正則系數,以降低過擬合問題。本研究利用VGG16、VGG19、VGG15這3個模型對本項目提出的方法進行了驗證。在測試過程中,將測試結果和其他方法做了對比。實驗結果表明,該算法對不同類型的人臉圖像都能進行精確的識別。
2.2實驗訓練超參數設置
(1)數據集:本研究選取常用人臉圖像庫,包括"Yale"Fusion、"ImageNet等[4]。(2)圖像預處理:對圖像做一些預處理工作,如灰度化、降噪、歸一化等。在訓練"VGNN模型時,采用梯度下降的方法,設定學習速率和梯度衰減系數。(3)模型體系結構:本文選用三層"VGNN體系結構,包含卷積層、池化層和全連通層。(4)超參數值設定:會使用一些超參量,如學習速率、正規化、批尺寸等來控制模型的效能。這里需特別指出的是學習速率這一超參數值的設定:當學習率提高時,模型的準確性會降低。因此,設定適當的學習率,以控制模型的準確性。(5)規格化:規格化可借由增加規則項來降低模型過擬合風險,但卻降低了模型的準確性。批數是一個非常重要的參數,它直接關系到模型在訓練集與測試集中的性能。為了在精度與速度之間取得平衡,設定了適當的批數。(6)訓練策略:采用隨機梯度下降法對模型進行訓練,通過調節學習速率、梯度衰減系數等參數,實現模型精度與速度的控制。(7)評價指標:使用一些評價標準,如準確率、召回率、F1得分來評價模型的表現。實驗結果表明,該模型具有較好的識別效果,且具有較高的識別精度。
2.3損失函數
VGNN是一種以深度學習為基礎的人臉識別技術,其核心是損失函數。基于此,本項目提出了一種基于"VGNN的人臉特征提取方法。此損失函數使用名為“softmax損失”的新損失函數[5]。在此基礎上,結合特征與上下文信息,提出了一種改進的人臉識別方法。在訓練模型時,通過融合特征與上下文信息形成新的特征矢量,并以此矢量為輸入,實現人臉類別的預測。相較于傳統深度學習模型,"VGNN模型在特征表達能力、識別精度等方面有較大提高。另外,該模型具有很好的擴展性,可以根據不同的人臉圖像及背景進行自適應調整。實驗結果表明,該模型能夠有效地識別出不同性別、年齡、表情、姿態等特征的人臉。最后,提出了一種基于"VGNN的人臉識別算法。該算法采用了一種新的損失函數,能有效地處理各種人臉圖像及背景。
2.4評價指標
在視覺圖神經網絡中,通常采用多種度量方法對模型進行評價。其中,識別率和準確性是最常用的度量。識別率是指模型對已有標簽的人臉圖像進行再識別的程度。正確率是指模型在無標簽人臉圖像上的再認程度,一般用F1得分來評價。另外,本文還給出了準確度、召回率、F1得分等指標。其中,正確率指有標簽與無標簽圖像的分類精度,一般用F1得分來評價;召回率是指模型對有標簽與無標簽圖像進行檢測與修復的正確率,通常用F1得分來評價;F1得分反映了模型在有標簽與無標簽圖像之間的正確識別率,一般用F1得分來評價。在"VGGNN中,不同的度量指標對人臉識別模型的評價結果也不一樣。例如:基于圖像特征的人臉識別模型可能更適用于識別率指數,而基于序列數據的人臉識別模型則可能更加適用于精度指數。基于圖神經網絡的人臉識別模型需要綜合考慮多個指標才能對其進行評價。在實際應用中,可根據具體需要選取合適的評價指標。
3"實驗結果數據分析
首先,將了解"VGGNN的架構。該網絡由人臉圖像、鄰接矩陣和圖像量3個部分構成。人臉圖像由兩層卷積層和全連通層構成,圖的矢量是隨機的種子節點。首先,用"ImageNet來訓練模型;本研究以10"000張人臉圖像為訓練樣本,其中正面圖片10"001張,背面圖片10"001張。在此基礎上,利用優化器自適應矩估計(Adaptive"Moment"Estimation,"Adam)訓練模型,通過不斷調節學習速率,實現模型參數的自適應調節。最后,用測試用例驗證了模型的有效性。在訓練階段,采用多種損失函數對模型進行評價。其中,均方誤差(mean-square"error,"MSE)和平均絕對誤差(Mean"Absolute"Error,"MAE)是最常用的損失函數[6]。"MSE表征了模型對人臉圖像分類的正確率;MAE表征了模型識別人臉的準確性。而最常見的損失函數為交叉熵損函數和余弦損耗函數。這些損失函數有助于對不同數據集下模型的性能進行評估。最后,通過實驗數據對"VGNN模型的數據進行了分析。實驗結果表明:"VGGNN模型對于各類人臉圖像具有良好的識別能力;VGGNN模型能夠準確地識別前、后兩類人臉圖像。其次,"VGGNN模型具有更強的泛化能力,同時也更具穩健性。經過優化,"VGGNN模型可適用于各種人臉圖像。
4"結語
綜上所述,本文主要研究了基于視覺圖神經網絡的人臉識別方法。實驗方面,將利用"Gabo、"Laplacian、GramSchmidt、"Butterworth等多種圖神經網絡結構與算法,比較各種算法的性能,尋找最優解。實驗證明,本文提出的方法能較好地完成人臉識別任務,并能對人臉進行正確的識別。同時,項目的研究成果也可推廣到虹膜識別等其他生物特征識別領域。然而,由于視覺圖網絡本身的復雜性、算法的多樣性,以及不同算法間的差異性等問題,仍有待于進一步的研究與改進。
參考文獻[1] 魏永超,朱泓超,朱姿翰,等.視覺圖神經網絡的人臉識別方法[J].現代計算""""機,2024,30(3):18,17.
[2] 王晨海,彭嬋娟.基于機器視覺的局部遮擋人臉圖像識別仿真[J].計算機仿真,2023,40(11):170174.
[3] 季瑞瑞,謝宇輝,駱豐凱,等.改進視覺Transformer的人臉識別方法[J].計算機工程與應用,2023,59(8):117126.
[4] 張凈.基于視覺的人臉屬性分析:表情識別與人臉幾何感知[D].杭州:浙江大學,2022.
[5]韓笑,韓劍.基于融合分層視覺感知的人臉局部特征識別[J].計算機仿真,2022,39(7):184188.
[6] 羅巖,馮天波,邵潔.基于注意力及視覺Transformer的野外人臉表情識別[J].計算機工程與應用,2022,58(10):200207.