桂祺瑩
在專業人士眼中,目前的表情識別只能拿來玩。因為要讓計算機讀懂人的表情,確定和不確定因素造成的困難都很多。何況一個人的表情,另一個真人都未必能讀懂。
微軟曾經在Office 97中推出過一個“屏幕助手”。今天提起來,不知道有幾個人還能想起,那是個長著大眼睛的文件夾。這多少因為,“大眼夾”還沒在這個世界玩鬧多久,就“斃命”于用戶的抱怨。而在摩比源公司的工程師吳飛看來,“大眼夾”的失敗在于缺少表情識別,如果它能像虛擬視頻中的小人們那樣,懂得察言觀色,通過用戶表情,知道什么時候該咧嘴笑,什么時候該耍點小可愛,它的命運也許會有所改變。
顛覆你的視頻娛樂
趙愛華是一位75歲的老太太,華夏老年大學的一名學生。在視頻軟件Fix8的虛擬世界中,她擁有千張面孔,比孫悟空還厲害。剛開始視頻聊天,趙愛華只是為了能常常見到遠在美國讀書的孫女。慢慢地,她也跟著孫女學會了在視頻中添加音樂和背景,甚至用上了更為花哨的虛擬視頻。
坐在兒子新購置的電腦前,趙愛華熟練地點開軟件,選擇自己近期最愛的BOB頭、蛤蟆鏡外加一頂黑色禮帽,視頻中的老太太立刻變身成“活力女孩”。“我還可以變成櫻桃小丸子、蠟筆小新,不過我更喜歡把自己扮成年輕漂亮的女孩,美得冒泡美得理直氣壯。”趙愛華說著就沖進了Fix8的虛擬世界。
Fix8是摩比源公司2005年成立初期研發的產品,吳飛是研發者之一。他說:“普通的視頻欠缺創意,而虛擬視頻能讓人自由發揮。”吳飛一邊說一邊在電腦上打開網友上傳的視頻。
這是一段美國大選的視頻。Fix8將真實世界中的總統大選搬到了虛擬世界,選民變身成希拉里、奧巴馬或麥凱恩中的任何一個,通過YouTube平臺進行在線辯論。只要一個網絡攝像頭,“希拉里”、“奧巴馬”和“麥凱恩”們就可以跟隨著真人進行移位及演講。
“這個軟件的關鍵是人類表情分析和重組技術。我們可以將用戶的頭部做成虛擬形象,通過網絡攝像頭捕捉用戶臉部表情,顯示在電腦上,形象通過Internet進行傳輸,顯示在對方的視頻窗口里,讓用戶可以即時互動。”吳飛說。
眾所周知,人和人之間交談時,面部器官的結構特征是次要的,語言和面部表情才是傳遞信息的主要載體。現在,虛擬視頻僅僅通過網絡傳遞對方的語言和面部表情,并且利用面部表情信號驅動虛擬人的頭部模型進行相應的表情變化。這么一來,不僅能保護隱私,還能在大大節省帶寬的情況下,盡可能地傳遞要表達的信息。所以,敏感的韓國電信運營商SK電訊在Fix8推出沒多久就開始了和摩比源公司的合作。與此同時,虛擬視頻也迅速火熱起來。2008年5月10日,久游網和摩比源合作推出了勁秀團;9月,新浪與久游網攜手推出變臉盛宴SINA SHOW;緊隨其后的吐司網和9158視頻社區也將陸續推出虛擬視頻軟件。
那么,這些虛擬視頻就是傳說中的表情識別么?Fix8能夠通過定位和跟蹤人臉部的特征點,將面部肌肉線條的運動刻畫出來,但它并沒有涉及到情感計算。在另一位同樣研究表情識別的工程師陳浩民眼里,具有情感計算才能叫真正的表情識別,而且這樣的表情識別會有更多應用。
在情感計算上升級
王斌是一名出租車司機,夜班。每天下午7點到第二天早上7點,他都會在首都機場“趴活”。雖然白天睡了幾個小時,可到了凌晨2點,還是困得不行,腦袋再次和方向盤親密接觸后才徹底清醒。“好在不是在拉活的過程中打瞌睡,但不是每次都這般幸運。”王斌說。
瞌睡時,如果有個聲音能及時提醒,王斌會安全很多。
所謂人臉表情識別,就是計算機能對人臉的表情信息進行特征提取分析,按照人的認識和思維方式加以歸類和理解,能夠分析理解人的情緒并且作出相應的判斷。
人臉表情識別能應用的地方很多。譬如在人機交互當中,用戶可以利用表情來指示計算機。用戶眨一下眼睛,表示要求計算機取消當前的任務,眨兩下眼睛就表示要求計算機將任務保存。如果計算機再聰明一點,就能主動地從用戶的面部表情推測用戶的內心情感,并自動地給出相應的人性化的服務。特別是在動畫制作中,有了表情識別,動畫人物微笑、眨眼都不再需要很多張圖片組合起來,利用軟件就能簡單實現。
鏈接
情感計算
1971年,心理學家保羅·艾克曼與福里森最早提出人類有六種主要情感:憤怒、高興、悲傷、驚訝、厭惡和恐懼,每種情感以惟一的表情來反映人的一種獨特的心理活動。從解剖學出發,他們提出一種人臉表情運動的描述方法——人臉運動編碼系統FACS ,根據面部肌肉的類型和運動特征定義了基本形變單元,人臉的各種表情最終能分解對應到各個基本形變單元上來,分析表情特征信息,就是分析面部基本形變單元的變化情況。后來,美國麻省理工學院媒體實驗室的皮卡德教授提出了情感計算的說法。在實際操作中,主要是通過各種傳感器獲取由人的情感所引起的表情及生理變化信號,利用合適的“情感模型”對這些信號進行識別,從而理解人的情感并作出適當的響應。
表情如何識別
在表情識別系統中,計算機會通過對人臉樣本集和非人臉樣本集的學習,產生一個分類器。在對人臉表情特征提取和分類之前一般需要做幾何歸一化和灰度歸一化。具體說來,幾何歸一化就是指根據人臉定位結果將圖像中的人臉變換到同一位置和同樣大小,灰度歸一化是對圖像進行光照補償等處理,能夠一定程度地克服光照變化的影響而提高識別率。預處理完成后,開始人臉表情特征的提取與識別。表情特征識別的方法很多,其中之一是通過幾何特征的識別方法,也就是對人臉表情的顯著特征,如眼睛、鼻子、眉毛、嘴等的位置變化進行定位、測量,確定其大小、距離、形狀及相互比例等特征,進行表情識別。
(施月華摘自《新知客》)