董莉

去年底,騰訊在上海和深圳都舉辦了創想會。上海復旦大學逸夫科技樓的活動現場有一塊大屏幕,凡是在會議現場有登記的人員,靠著留下的“顏值”進出現場不再需要驗證。
同此前騰訊WE大會玩的“刷臉”簽到一樣,運用的人臉識別技術都是來自騰訊優圖團隊。
騰訊優圖在2012年初成立,是騰訊內部專注于圖像處理、模式識別、機器學習、數據挖掘等領域的核心技術團隊,如今隸屬于騰訊社交網絡事業群。目前團隊已經擁有數十項領先的圖像技術和千億規模圖像大數據計算能力,為公司超過50個業務提供圖像技術支持,并在QQ空間、水印相機、天天P圖等產品落地。
研究“面子”工程
從成立開始,騰訊優圖逐步積累了人臉檢測、五官配準、人臉度量學習等核心技術,結合語音、唇語、面部表情等各種手段,可以立體化地防范照片、視頻和人頭模型的攻擊。基于整個騰訊的社交網絡平臺,騰訊優圖為QQ、QQ空間、QQ音樂、財付通、微眾銀行等業務提供圖像和模式識別技術支持。
不過,騰訊優圖并不是從一開始就研究人臉識別技術的,也經歷了一個慢慢實踐和漸進的過程。騰訊優圖研發中心總監黃飛躍介紹,最初,團隊看到了圖像壓縮上的發展空間,開始切入研究,隨后還在圖片智能剪裁等方面進行嘗試。“在積累了一定量級的人臉數據時,我們便想要研究一些人臉識別相關的應用。”
2012年下半年,黃飛躍他們從QQ空間切入,相繼做出水印相機、天天P圖、空間相冊面孔墻、標注好友等人臉趣味應用。在之后的發展過程中,優圖團隊也開始同騰訊內部的財付通、征信、微眾銀行等金融業務部門合作。
黃飛躍認為,人臉識別技術能夠應用的關鍵在于三點:圖像識別核心技術能力、足夠龐大豐富權威的圖像樣本數據庫和廣泛靈活便捷的應用場景。
人臉識別的核心技術是深度學習,騰訊優圖自創了一些深度學習模型和框架,研究領域分布人臉分析、深度學習、圖像處理、人像美容等。在深度學習框架上,騰訊優圖首創了一個FCFOF框架。技術在識別物體的時候,會把它所在的場景和周圍環境相關元素都納入到分析模型里面,以相互提高驗證效果。目前,騰訊優圖的人臉的識別技術已經做到90點五官定位,偏差可以精確到1.6個像素,能夠識別性別、年齡、表情。
另一方面,騰訊的用戶群眾多,擁有數億級龐大用戶群的QQ、微信等資源,經過數年準備,騰訊采集標注了海量生活照訓練樣本數據,并自創了深度學習的模型、框架,積累了海量的數據和訓練的模型。
2015年4月,騰訊優圖與公安部全國公民身份證號碼查詢服務中心合作,可以7×24小時接入公安部查詢服務中心的數據庫,聯手傳統金融行業解決用戶身份核實、反欺詐、遠程開戶等難題。
除了金融、安防、身份識別類嚴肅應用,騰訊優圖的人臉識別技術還可以廣泛應用于社交溝通、娛樂等應用場景,目前已經應用在騰訊50多個細分業務上。
去年6月,騰訊優圖開放平臺正式上線,人臉識別等核心技術將逐步對外免費開放。優圖在騰訊云上的開放,助推了人臉識別技術在各行業的應用。兩個月后,開放平臺向開發者免費開放了兩個項目:UFace深度人臉識別系統,融入圖像大數據和深度學習技術,可以廣泛應用于人臉核身、人臉防偽、人證合一、身份查找等業務場景;另一個功能是88點五官定位,它是天天P圖美容功能的核心技術,開發者可以通過接口進行人臉識別相關的創意項目,也可以用于自己的生物識別試驗。
此外,騰訊優圖還推出了基于云計算的萬象優圖(Cloud Image),借助騰訊云的支撐能力,除了為移動開發者提供圖片云存儲,還推出了圖片加工、深度定制處理等接口。這其中“黃圖審核”接口是眾多網站的剛性需求,騰訊優圖識別的準確率超過99%。
除了上述的技術開放,黃飛躍介紹,未來優圖更多成熟的核心技術能力都將通過騰訊優圖開放平臺向整個互聯網行業開放。
相信“顏值”
征信是金融業務開展的基礎,而互聯網金融的發展也需要一套新的可用的征信評價體系。傳統上,征信數據主要源自信貸領域,而在互聯網時代,數據源更廣、種類更豐富、時效性更強。交易數據、社交數據等也能反映客戶社會關系和經濟行業的特征,間接反映個人信用狀況。
信用風險的第一步是欺詐風險,必須先確認身份再評估其信用風險。金融機構原來的身份確認必須由審核的業務員當面驗證,人臉識別身份驗證提供了另外一種可能。騰訊征信的人臉識別主要包括掃描身份證、人臉識別鑒定和活體識別。
打開手機上的應用,系統掃描二代身份證的正反兩面,自動抓取用戶身份信息;然后,用戶將臉部對準屏幕上的人臉取景框,系統自動拍攝視頻和照片;接著,用戶面對攝像頭,按照要求讀出系統隨機給出的一串數字。三步完成后,系統會給出攝像頭前的人與身份證上是不是同一個人的判斷以及評分。
據騰訊征信總經理吳丹介紹,整個人臉識別的流程中,需要通過兩個驗證:一是生物活體檢測;二是人臉成像識別。這其中的人臉識別技術由財付通和騰訊優圖合作完成,財付通負責流程設計和金融等場景應用,優圖團隊負責照片比對基礎技術。該項目在2014年初提出,經過3個月推出第一個版本,并不斷迭代優化。
活體檢測是人臉識別一個關鍵的步驟,但是單純的點頭、搖頭、眨眼等方式容易被破解。騰訊優圖團隊在活體檢測上采用念出屏幕上隨機數字的方式,結合語音、唇動和唇語分析來提高準確率,而用戶讀的數字則是隨機產生。“這類似于手機驗證碼,提前準備視頻是不行的,使用體驗也比一般的產品好。”黃飛躍說。
根據實際互聯網金融場景測試,自拍身份證對比可以達到萬分之一錯誤率以下,通過率95%以上。
不過,人臉識別不只是在互聯網金融領域發揮作用,它可以應用的場景有很多,比如政府、商場、交通、學校、會議等。最近,騰訊人工智能技術將接入到南京公安工作中,除了圖像處理、語音識別等技術,南京公安將通過人臉識別跟你“面對面”。