呂鑫+李月軍



摘 要: 針對國內(nèi)SNS網(wǎng)站進行調(diào)研,分析用戶群體特征及社會心理,剖析SNS網(wǎng)站流行的原因,在此基礎(chǔ)上提出了在SNS網(wǎng)站上運營好一款人氣高、粘性強的應(yīng)用組件。實驗研究并分析了主動形狀模型(ASM)和受限局部模型(CLM)的優(yōu)缺點,提出將兩者優(yōu)點結(jié)合的人臉面部特征定位提取方法,設(shè)計開發(fā)了一款應(yīng)用組件產(chǎn)品。通過用戶上傳照片或在線拍攝,捕捉出人臉頭像及面部特征,并按照用戶在圖像庫中選擇的照片進行合成,生成一張具有兩張人臉特征的新頭像。將組件接入SNS網(wǎng)站,通過一段時間的運營數(shù)據(jù)分析,結(jié)合互聯(lián)網(wǎng)的實際應(yīng)用,提出對組件進行優(yōu)化的方案。
關(guān)鍵詞: 人臉檢測; 特征定位; SNS網(wǎng)站; 應(yīng)用組件
中圖分類號: TN911.7?34; TM417 文獻標識碼: A 文章編號: 1004?373X(2016)23?0170?04
Research and design of SNS website application component based on face feature location
L? Xin, LI Yuejun
(College of Optical and Electronical Information Changchun University of Science and Technology, Changchun 130000, China)
Abstract: The SNS website in China is investigated to analyze the user group characteristics and social psychology, and dissect the popular reasons for the SNS website. On this basis, how to better operate a high?popularity and strong?stickiness application component on SNS website is proposed. The advantages and disadvantages of the active shape model (ASM) and CLM are studied and analyzed by the experiments. The face feature location extraction method combining with the advantages of the models is proposed. An application component product was designed and developed. The head portrait and face feature are captured by means of the user photos upload and online shoot. The photos selected in the image library by users are synthesized to generate a new head portrait with two face features. The component is accessed into the SNS website. On the basis of analyzing the a period of operation data and combining with the practical application of the Internet, the optimization scheme of the component is proposed.
Keywords: face detection; feature location; SNS website; application component
0 引 言
人臉識別是當前人工智能和模式識別的研究熱點,就其技術(shù)本質(zhì)而言,是通過圖像采集設(shè)備獲取用戶的面部圖像,再對其臉部的特征進行計算分析,進而和自身數(shù)據(jù)庫里已有的樣本進行比對,最后判斷出用戶的真實身份。人臉識別是當前人工智能和模式識別的研究熱點,在家庭娛樂、互聯(lián)網(wǎng)等領(lǐng)域已經(jīng)有了一些有趣的應(yīng)用,比如有一些智能玩具、機器人能夠識別家人的身份;某些游戲具備玩家真實面像等[1]。但目前人臉識別的廣泛應(yīng)用性較弱,尤其是針對當今流行的SNS社交網(wǎng)絡(luò)平臺。
1 基于SNS網(wǎng)站用戶的需求調(diào)研
1.1 用戶基本特征分析
目前國內(nèi)主要的SNS網(wǎng)站用戶中,男性用戶數(shù)量顯著高于女性用戶,其在男性網(wǎng)民中的滲透率也高于女性網(wǎng)民。當前國內(nèi)SNS網(wǎng)站用戶中,男女用戶比例約為0.621[∶]0.379。與整體網(wǎng)民年齡分布相比,SNS網(wǎng)站用戶更具低齡化特征,其中30歲以下用戶占九成以上。目前21~25歲這一年齡組為SNS網(wǎng)站用戶的主力軍,占整體的四成以上(42.7%);其次為16~20歲年齡組,約為三成(30.6%);30歲以下的用戶占SNS網(wǎng)站用戶的90%以上。
1.2 用戶行為分析
1.2.1 功能應(yīng)用概況
SNS網(wǎng)站的主要功能有隱私設(shè)置、日志功能、相冊功能、參與群組、分享功能、組建游戲,各功能的使用情況如圖1所示。
1.2.2 每周登陸SNS的情況
超過50%以上的用戶每天都有登陸,近一半的用戶每次登陸SNS停留的時間在半小時。如圖2,圖3所示。
2 算法實現(xiàn)與系統(tǒng)開發(fā)
2.1 基于Haar小波變換的人臉檢測算法
Haar是小波函數(shù)的一種,在圖像處理中采用小波變換提取特征應(yīng)用非常廣泛[2]。使用小波模板的好處是:它可以利用圖像小波系數(shù)的子集來定義和描述對象的形狀;它對于顏色和紋理的改變保持不變性:能夠定義復(fù)雜的對象實體;基于小波模板的模型可以從實例中學(xué)習(xí)得到,不需要運動信息和顯式的圖像分割信息。
如果選擇所有包含人臉的窗口的某個特征的平均值與背景噪聲的平均值有一定差距,那么就可以利用這種特征作為人臉特征。后來積分圖像的概念又被引入,實驗發(fā)現(xiàn)不同方向上的小波系數(shù)(水平、垂直、對角線)可以組合成具有很好區(qū)分度的特征向量[3]。因此可以快速計算人臉類Haar特征。
基于Haar小波算法的人臉檢測方法主要通過Adaboost算法學(xué)習(xí)訓(xùn)練出基于Haar小波變換的人臉檢測器,對膚色區(qū)域進行檢測確定人臉區(qū)域,對人臉區(qū)域利用人眼和嘴的顏色特征提取出眼、嘴的候選區(qū)域,最后根據(jù)面部器官的幾何結(jié)構(gòu)關(guān)系利用模板匹配的方法確定眼睛和嘴部的位置。
2.2 構(gòu)造Adaboost的分類器
Adaboost算法是利用大量分類能力一般的弱分類器通過一定的方法疊加,構(gòu)成分類能力很強的強分類器[4]。理論上,只要弱分類器的分類效果比隨機分類好就可以構(gòu)造出強分類器,其分類錯誤率趨于零,并具有很好的泛化能力。采用Adaboost算法做特征選擇的一個原因是其得到的特征集可以一一對應(yīng)到原始特征中,具有明確的物理意義[5]。在進行特征提取時,只需在指定的采樣位置、尺度和方向上計算出濾波結(jié)果,可以大幅減少計算量和存儲量。
首先,建設(shè)一個人臉頭像數(shù)據(jù)庫,從互聯(lián)網(wǎng)和照相館收集了上千張帶人臉的圖像和上千張非人臉的圖像作為樣本,并將每個圖像的尺寸像素歸一化,統(tǒng)一為400×500像素。接著通過Adaboost算法訓(xùn)練出輪廓、眉毛、眼睛、鼻子、嘴各項特征值,得到多個弱分類器。
另外,保證單個弱分類器也能達到理想的訓(xùn)練結(jié)果,采用局部Haar特征的AdaBoost學(xué)習(xí)方法,對每個樣本都賦予一個權(quán)值,然后進行迭代訓(xùn)練,每次訓(xùn)練后篩選出正確率最高的分類器,最終將多個弱分類器合稱為一個強分類器。該方法的優(yōu)點在于計算簡單,不足之處在于包含的信息量較少。
2.3 面部特征提取算法
2.3.1 基于主動形狀模型面部特征定位算法
(1) 建立主動形狀模型(ASM)
在每一個正面人臉頭像樣本上手工標注60個特征點,所有的特征點標注的位置主要是臉部輪廓區(qū)域、眉毛、眼睛、鼻子和嘴。定義方式如表1所示。
基于ASM提出了一種自動人臉臉型分類方法。首先利用各種臉形的樣本進行訓(xùn)練以建立臉型形狀模型庫,然后運用ASM算法自動定位測試樣本的正面人臉形狀,比較其與各個臉型形狀模型的距離,最后應(yīng)用最近鄰方法實現(xiàn)臉型的自動分類。仿真實驗表明,該方法優(yōu)于利用人臉輪廓曲率或下頜曲率的方法,能夠充分挖掘人臉形狀信息,分類結(jié)果穩(wěn)定準確,可以有效提高大庫人臉識別的速度和準確率。
(2) ASM迭代步驟
對于一幅給定的新圖像,ASM迭代過程如下:
① 預(yù)處理:對輸入圖像與訓(xùn)練集的人臉圖像進行三層金字塔采樣,初始形狀估計;
② 針對60個特征點進行局部尋優(yōu);
③ 更新相似變換參數(shù)和形狀參數(shù)[p,]并對其進行約束;
④ 判斷是否進入下一層進行搜索;
⑤ 是否滿足收斂條件[Δp≤ε]或達到最大迭代次數(shù)。
(3) ASM定位結(jié)果及分析
ASM定位實驗結(jié)果如圖4所示。
圖4 ASM定位結(jié)果
ASM定位的優(yōu)點:建模方便快捷;算法收斂速度快,運算效率高;對初始位置要求不高,搜索范圍大;對光照變化的適應(yīng)性較強。
ASM定位的缺陷:特征點定位精度較低;局部搜索采用固定模板向量,搜索方向單一。
2.3.2 基于受限局部模型面部特征定位算法
利用Haar小波算法檢測出人臉位置以及眼睛、嘴的大概區(qū)域,接著,利用受限的局部模型算法可快速收斂得到人臉的輪廓、眉毛、眼睛、鼻子及嘴邊緣。
基于受限局部模型(CLM)和凸二次匹配(CQF)的面部特征點[6]定位實例如圖5所示。
CLM定位的優(yōu)點:算法收斂速度快,運算效率較高;收斂成功時,特征點定位精度很高;對光照變化和未知紋理變化適應(yīng)性很強。
CLM定位的缺點:建模復(fù)雜,每片分類器需要單獨訓(xùn)練;對初始位置要求較高,搜索范圍小。
2.3.3 基于主動表觀模型的特征點定位
主動表觀模型(AAM)是對ASM的直接擴展。與ASM相似,AAM同樣需要采用統(tǒng)計分析的方法建立先驗?zāi)P?,然后利用先驗?zāi)P蛯D像中的目標物體進行匹配運算。其優(yōu)點在于該模型不僅包含目標物體的形狀信息,而且還包含目標物體的內(nèi)部紋理信息。紋理信息一般是組成目標物體像素的灰度值。同時選擇合理的匹配參數(shù)以提高匹配速度,使得AAM的定位能力更加健壯,定位效果更加準確。
(1) 統(tǒng)計并建立形狀模型。統(tǒng)計模型的建立需要分三個步驟:
首先是獲取樣本圖像中的信息;其次是樣本圖像集的歸一化處理;最后是對歸一化處理的數(shù)據(jù)進行統(tǒng)計分析,建立統(tǒng)計模型。
(2) 紋理參數(shù)化模型的建立。獲取人臉庫中人臉形狀輪廓區(qū)域內(nèi)所有像素的灰度值,也就是提取形狀無關(guān)的紋理值向量。然后利用主成分分析法對形狀無關(guān)的紋理進行分析建模。
(3) 獲得形狀圖像。將訓(xùn)練樣本的人臉圖像形變到平均人臉形狀中,使向量的維數(shù)統(tǒng)一起來并具有相同的對應(yīng)關(guān)系。
2.3.4 ASM與CLM,AAM算法的比較
從圖6中對三者的對比實驗可以看出,每一種方法都不完美。為結(jié)合ASM與CLM的優(yōu)點,提出了一種優(yōu)化的人臉面部五官特征定位算法[7],該方法先基于主動形狀模型的算法搜索出人臉輪廓及眉毛、眼睛、鼻子、嘴的基本區(qū)域,再通過CLM的局部精度搜索確保識別的準確性。
圖6 ASM,AAM和CLM算法性能比較實驗
2.4 實驗驗證結(jié)果分析
(1) 選取人臉樣本
實驗從Google以及照相館收集了500張人臉免冠照片作為圖像樣本,其中100張為背景單一的證件照片,100張為背景單一、側(cè)臉不超過15°的照片,100張為平面旋轉(zhuǎn)角度不超過90°的照片,100張為背景復(fù)雜或光線較暗的照片,另外100張背景單一的正面照片作為變臉庫模板。圖片統(tǒng)一裁剪為400[×]500像素。
(2) 測試環(huán)境
在局域網(wǎng)環(huán)境下,使用Intel奔騰雙核E5400,2GB內(nèi)存,Windows XP profession SP3的DELL Vostro V220商用臺式機,對人臉樣本進行測試。測試項分為:人臉檢測、臉部輪廓區(qū)域定位,眉毛眼睛鼻子嘴巴的五官定位,如圖7所示,測試結(jié)果如表2所示。
由表2可以看出,基于Haar小波算法的人臉檢測技術(shù)對于圖像的人臉檢測正確率很高。在五官特征點定位方面,采用ASM與CLM融合的特征定位算法對“證件照”和“旋轉(zhuǎn)照片”的識別效果較理想,對于“側(cè)臉照片”和“背光照片”的識別率稍低??傮w來說,本文提出的基于主動形狀模型與受限局部模型相結(jié)合的特征定位算法能夠運用于產(chǎn)品的開發(fā)。
根據(jù)系統(tǒng)的最終目標,是要得到兩張照片的合成效果。接著,選取100張證件照片與變臉庫模板進行合成。在同樣的測試環(huán)境下,輸出一幅400[×]500像素的新人臉的時間為50 ms。
2.5 系統(tǒng)實現(xiàn)和架構(gòu)
2.5.1 系統(tǒng)流程設(shè)計
考慮到SNS網(wǎng)站應(yīng)用組件的特性,即操作簡便,有趣味性,組件的流程設(shè)計步驟如下:
(1) 用戶登陸SNS后在應(yīng)用頁面可以選擇添加組件,添加組件后可進入首頁。
(2) 用戶根據(jù)自己的需求,既可以從本地上傳一張符合要求的照片,如果條件可以,也能選擇在線拍攝一張頭像。
(3) 進入人臉檢測、五官定位識別流程,該步驟由程序自動完成。
(4) 選擇想要變成的明星模樣。
(5) 變臉完成,輸出結(jié)果。
2.5.2 服務(wù)器軟件架構(gòu)
本系統(tǒng)主要采用三層體系架構(gòu)的方式,即數(shù)據(jù)層(DAL)、邏輯層(BLL)、表示層(UI) [8]。所謂三層體系結(jié)構(gòu)是在客戶端與數(shù)據(jù)庫之間加入了一個“中間層”,也叫組件層。這里所說的三層體系,不是指物理上的三層,不是簡單地放置三臺機器就是三層體系結(jié)構(gòu),也不僅僅有B/S應(yīng)用才是三層體系結(jié)構(gòu),三層是指邏輯上的三層,即使這三個層放置到一臺機器上。
分層式結(jié)構(gòu)的優(yōu)勢如下:
(1) 開發(fā)人員可以只關(guān)注整個結(jié)構(gòu)中的某一層;
(2) 可以很容易用新的實現(xiàn)來替換原有層次的實現(xiàn);
(3) 可以降低層與層之間的依賴;
(4) 有利于標準化;
(5) 利于各層邏輯的復(fù)用。概括來說,分層式設(shè)計可以達到如下目的:分散關(guān)注、松散耦合、邏輯復(fù)用、標準定義。
2.5.3 服務(wù)器硬件架構(gòu)
整個硬件架構(gòu)系統(tǒng)包含數(shù)據(jù)庫服務(wù)器、Web服務(wù)器、負載均衡器、備份服務(wù)器、監(jiān)控系統(tǒng)。考慮到系統(tǒng)包含了大量用戶信息及圖片信息,且數(shù)據(jù)量日益增長,需要的存儲空間較大,一旦受到破壞或是數(shù)據(jù)庫服務(wù)器硬盤存滿,就會對用戶產(chǎn)生負面影響,因此在硬件架構(gòu)中提出一套簡單易用的備份方案。
(1) 備份方法:增量備份和實時備份。對用戶上傳的照片以及完成變臉的照片實行增量備份,增量數(shù)據(jù)備份只備份新創(chuàng)建的文件,所以可以加快備份的過程;而對數(shù)據(jù)庫的增刪情況實行實時備份。
(2) 備份設(shè)備:主要從經(jīng)濟性和易用性的角度出發(fā),選用DELL刀片式服務(wù)器,購買了多塊較大較快的硬盤,并做了RAID0,保證數(shù)據(jù)存儲傳輸?shù)男阅堋?/p>
2.5.4 系統(tǒng)的界面設(shè)計與功能實現(xiàn)
本系統(tǒng)屬于娛樂工具類的應(yīng)用軟件,在滿足SNS網(wǎng)站設(shè)計規(guī)范的前提下,頁面的整體風(fēng)格主要追求簡潔,加上運營平臺是人人網(wǎng),學(xué)生用戶、年輕白領(lǐng)用戶居多,因此頁面設(shè)計中加入了少許可愛的圖標。系統(tǒng)首頁的上傳功能頁包含用戶上傳照片、人臉檢測、五官定位識別等功能。首先從本地選擇上傳一張照片,然后通過網(wǎng)頁提示進行操作。完成之后,頁面跳轉(zhuǎn)至組件首頁,此時可根據(jù)自己的喜好選擇右邊區(qū)域內(nèi)的明星模板,完成之后,點擊中部區(qū)域內(nèi)“我變”,即完成了變臉操作。
3 結(jié) 論
本文對人臉檢測方法和五官特征點定位算法進行了詳細地介紹和深入研究。重點分析了人臉檢測方法,并對傳統(tǒng)的主動形狀模型、主動表觀模型、受限局部模型算法進行了對比實驗分析,提出一種結(jié)合ASM和CLM兩者優(yōu)點的優(yōu)化算法。然后對人臉識別技術(shù)在SNS網(wǎng)站中的應(yīng)用進行深入地探討,結(jié)合SNS網(wǎng)站特點及應(yīng)用組件規(guī)范,開發(fā)了一款應(yīng)用于SNS網(wǎng)站的娛樂組件,并在運營過程中對該組件提出了相關(guān)優(yōu)化方案,最后用數(shù)據(jù)論證了其可行性。
參考文獻
[1] 付煒,孔祥棟.基于膚色和Adaboost算法的人臉檢測[J].現(xiàn)代電子技術(shù),2010,33(6):131?134.
[2] 茂林,戚飛虎.自組織隱馬爾可夫模型的人臉檢測研究[J].計算機學(xué)報,2012,25(11):1165?1169.
[3] 張九龍,張毅均.人臉檢測的貝葉斯特征判別方法[J].計算機工程與應(yīng)用,2014,40(29):164?165.
[4] XIAO R, LI M J, ZHANG H J. Robust multipose face detection in images [J]. IEEE transactions on circuits and systems for video technology, 2004, 14(1): 31?41.
[5] 張寧,李娜.基于Adaboost算法的人臉檢測技術(shù)的研究與實現(xiàn)[J].現(xiàn)代電子技術(shù),2011,34(14):4?6.
[6] LI S Z, ZHANG Z Q. FloatBoost learning and statistical face detection [J]. IEEE transactions on pattern analysis and machine intelligence, 2004, 26(9): 1112?1123.
[7] 王亮.SNS社交網(wǎng)絡(luò)發(fā)展現(xiàn)狀及其趨勢[J].現(xiàn)代電信科技,2009(6):9?12.
[8] 張書真,宋海龍,向曉燕.基于膚色分割及特征定位的人臉檢測算法研究[J].現(xiàn)代電子技術(shù),2008,31(14):82?84.