董莉

去年底,騰訊在上海和深圳都舉辦了創(chuàng)想會(huì)。上海復(fù)旦大學(xué)逸夫科技樓的活動(dòng)現(xiàn)場(chǎng)有一塊大屏幕,凡是在會(huì)議現(xiàn)場(chǎng)有登記的人員,靠著留下的“顏值”進(jìn)出現(xiàn)場(chǎng)不再需要驗(yàn)證。
同此前騰訊WE大會(huì)玩的“刷臉”簽到一樣,運(yùn)用的人臉識(shí)別技術(shù)都是來(lái)自騰訊優(yōu)圖團(tuán)隊(duì)。
騰訊優(yōu)圖在2012年初成立,是騰訊內(nèi)部專注于圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域的核心技術(shù)團(tuán)隊(duì),如今隸屬于騰訊社交網(wǎng)絡(luò)事業(yè)群。目前團(tuán)隊(duì)已經(jīng)擁有數(shù)十項(xiàng)領(lǐng)先的圖像技術(shù)和千億規(guī)模圖像大數(shù)據(jù)計(jì)算能力,為公司超過(guò)50個(gè)業(yè)務(wù)提供圖像技術(shù)支持,并在QQ空間、水印相機(jī)、天天P圖等產(chǎn)品落地。
研究“面子”工程
從成立開(kāi)始,騰訊優(yōu)圖逐步積累了人臉檢測(cè)、五官配準(zhǔn)、人臉度量學(xué)習(xí)等核心技術(shù),結(jié)合語(yǔ)音、唇語(yǔ)、面部表情等各種手段,可以立體化地防范照片、視頻和人頭模型的攻擊。基于整個(gè)騰訊的社交網(wǎng)絡(luò)平臺(tái),騰訊優(yōu)圖為QQ、QQ空間、QQ音樂(lè)、財(cái)付通、微眾銀行等業(yè)務(wù)提供圖像和模式識(shí)別技術(shù)支持。
不過(guò),騰訊優(yōu)圖并不是從一開(kāi)始就研究人臉識(shí)別技術(shù)的,也經(jīng)歷了一個(gè)慢慢實(shí)踐和漸進(jìn)的過(guò)程。騰訊優(yōu)圖研發(fā)中心總監(jiān)黃飛躍介紹,最初,團(tuán)隊(duì)看到了圖像壓縮上的發(fā)展空間,開(kāi)始切入研究,隨后還在圖片智能剪裁等方面進(jìn)行嘗試。“在積累了一定量級(jí)的人臉數(shù)據(jù)時(shí),我們便想要研究一些人臉識(shí)別相關(guān)的應(yīng)用。”
2012年下半年,黃飛躍他們從QQ空間切入,相繼做出水印相機(jī)、天天P圖、空間相冊(cè)面孔墻、標(biāo)注好友等人臉趣味應(yīng)用。在之后的發(fā)展過(guò)程中,優(yōu)圖團(tuán)隊(duì)也開(kāi)始同騰訊內(nèi)部的財(cái)付通、征信、微眾銀行等金融業(yè)務(wù)部門(mén)合作。
黃飛躍認(rèn)為,人臉識(shí)別技術(shù)能夠應(yīng)用的關(guān)鍵在于三點(diǎn):圖像識(shí)別核心技術(shù)能力、足夠龐大豐富權(quán)威的圖像樣本數(shù)據(jù)庫(kù)和廣泛靈活便捷的應(yīng)用場(chǎng)景。
人臉識(shí)別的核心技術(shù)是深度學(xué)習(xí),騰訊優(yōu)圖自創(chuàng)了一些深度學(xué)習(xí)模型和框架,研究領(lǐng)域分布人臉?lè)治觥⑸疃葘W(xué)習(xí)、圖像處理、人像美容等。在深度學(xué)習(xí)框架上,騰訊優(yōu)圖首創(chuàng)了一個(gè)FCFOF框架。技術(shù)在識(shí)別物體的時(shí)候,會(huì)把它所在的場(chǎng)景和周?chē)h(huán)境相關(guān)元素都納入到分析模型里面,以相互提高驗(yàn)證效果。目前,騰訊優(yōu)圖的人臉的識(shí)別技術(shù)已經(jīng)做到90點(diǎn)五官定位,偏差可以精確到1.6個(gè)像素,能夠識(shí)別性別、年齡、表情。
另一方面,騰訊的用戶群眾多,擁有數(shù)億級(jí)龐大用戶群的QQ、微信等資源,經(jīng)過(guò)數(shù)年準(zhǔn)備,騰訊采集標(biāo)注了海量生活照訓(xùn)練樣本數(shù)據(jù),并自創(chuàng)了深度學(xué)習(xí)的模型、框架,積累了海量的數(shù)據(jù)和訓(xùn)練的模型。
2015年4月,騰訊優(yōu)圖與公安部全國(guó)公民身份證號(hào)碼查詢服務(wù)中心合作,可以7×24小時(shí)接入公安部查詢服務(wù)中心的數(shù)據(jù)庫(kù),聯(lián)手傳統(tǒng)金融行業(yè)解決用戶身份核實(shí)、反欺詐、遠(yuǎn)程開(kāi)戶等難題。
除了金融、安防、身份識(shí)別類(lèi)嚴(yán)肅應(yīng)用,騰訊優(yōu)圖的人臉識(shí)別技術(shù)還可以廣泛應(yīng)用于社交溝通、娛樂(lè)等應(yīng)用場(chǎng)景,目前已經(jīng)應(yīng)用在騰訊50多個(gè)細(xì)分業(yè)務(wù)上。
去年6月,騰訊優(yōu)圖開(kāi)放平臺(tái)正式上線,人臉識(shí)別等核心技術(shù)將逐步對(duì)外免費(fèi)開(kāi)放。優(yōu)圖在騰訊云上的開(kāi)放,助推了人臉識(shí)別技術(shù)在各行業(yè)的應(yīng)用。兩個(gè)月后,開(kāi)放平臺(tái)向開(kāi)發(fā)者免費(fèi)開(kāi)放了兩個(gè)項(xiàng)目:UFace深度人臉識(shí)別系統(tǒng),融入圖像大數(shù)據(jù)和深度學(xué)習(xí)技術(shù),可以廣泛應(yīng)用于人臉核身、人臉?lè)纻巍⑷俗C合一、身份查找等業(yè)務(wù)場(chǎng)景;另一個(gè)功能是88點(diǎn)五官定位,它是天天P圖美容功能的核心技術(shù),開(kāi)發(fā)者可以通過(guò)接口進(jìn)行人臉識(shí)別相關(guān)的創(chuàng)意項(xiàng)目,也可以用于自己的生物識(shí)別試驗(yàn)。
此外,騰訊優(yōu)圖還推出了基于云計(jì)算的萬(wàn)象優(yōu)圖(Cloud Image),借助騰訊云的支撐能力,除了為移動(dòng)開(kāi)發(fā)者提供圖片云存儲(chǔ),還推出了圖片加工、深度定制處理等接口。這其中“黃圖審核”接口是眾多網(wǎng)站的剛性需求,騰訊優(yōu)圖識(shí)別的準(zhǔn)確率超過(guò)99%。
除了上述的技術(shù)開(kāi)放,黃飛躍介紹,未來(lái)優(yōu)圖更多成熟的核心技術(shù)能力都將通過(guò)騰訊優(yōu)圖開(kāi)放平臺(tái)向整個(gè)互聯(lián)網(wǎng)行業(yè)開(kāi)放。
相信“顏值”
征信是金融業(yè)務(wù)開(kāi)展的基礎(chǔ),而互聯(lián)網(wǎng)金融的發(fā)展也需要一套新的可用的征信評(píng)價(jià)體系。傳統(tǒng)上,征信數(shù)據(jù)主要源自信貸領(lǐng)域,而在互聯(lián)網(wǎng)時(shí)代,數(shù)據(jù)源更廣、種類(lèi)更豐富、時(shí)效性更強(qiáng)。交易數(shù)據(jù)、社交數(shù)據(jù)等也能反映客戶社會(huì)關(guān)系和經(jīng)濟(jì)行業(yè)的特征,間接反映個(gè)人信用狀況。
信用風(fēng)險(xiǎn)的第一步是欺詐風(fēng)險(xiǎn),必須先確認(rèn)身份再評(píng)估其信用風(fēng)險(xiǎn)。金融機(jī)構(gòu)原來(lái)的身份確認(rèn)必須由審核的業(yè)務(wù)員當(dāng)面驗(yàn)證,人臉識(shí)別身份驗(yàn)證提供了另外一種可能。騰訊征信的人臉識(shí)別主要包括掃描身份證、人臉識(shí)別鑒定和活體識(shí)別。
打開(kāi)手機(jī)上的應(yīng)用,系統(tǒng)掃描二代身份證的正反兩面,自動(dòng)抓取用戶身份信息;然后,用戶將臉部對(duì)準(zhǔn)屏幕上的人臉取景框,系統(tǒng)自動(dòng)拍攝視頻和照片;接著,用戶面對(duì)攝像頭,按照要求讀出系統(tǒng)隨機(jī)給出的一串?dāng)?shù)字。三步完成后,系統(tǒng)會(huì)給出攝像頭前的人與身份證上是不是同一個(gè)人的判斷以及評(píng)分。
據(jù)騰訊征信總經(jīng)理吳丹介紹,整個(gè)人臉識(shí)別的流程中,需要通過(guò)兩個(gè)驗(yàn)證:一是生物活體檢測(cè);二是人臉成像識(shí)別。這其中的人臉識(shí)別技術(shù)由財(cái)付通和騰訊優(yōu)圖合作完成,財(cái)付通負(fù)責(zé)流程設(shè)計(jì)和金融等場(chǎng)景應(yīng)用,優(yōu)圖團(tuán)隊(duì)負(fù)責(zé)照片比對(duì)基礎(chǔ)技術(shù)。該項(xiàng)目在2014年初提出,經(jīng)過(guò)3個(gè)月推出第一個(gè)版本,并不斷迭代優(yōu)化。
活體檢測(cè)是人臉識(shí)別一個(gè)關(guān)鍵的步驟,但是單純的點(diǎn)頭、搖頭、眨眼等方式容易被破解。騰訊優(yōu)圖團(tuán)隊(duì)在活體檢測(cè)上采用念出屏幕上隨機(jī)數(shù)字的方式,結(jié)合語(yǔ)音、唇動(dòng)和唇語(yǔ)分析來(lái)提高準(zhǔn)確率,而用戶讀的數(shù)字則是隨機(jī)產(chǎn)生。“這類(lèi)似于手機(jī)驗(yàn)證碼,提前準(zhǔn)備視頻是不行的,使用體驗(yàn)也比一般的產(chǎn)品好。”黃飛躍說(shuō)。
根據(jù)實(shí)際互聯(lián)網(wǎng)金融場(chǎng)景測(cè)試,自拍身份證對(duì)比可以達(dá)到萬(wàn)分之一錯(cuò)誤率以下,通過(guò)率95%以上。
不過(guò),人臉識(shí)別不只是在互聯(lián)網(wǎng)金融領(lǐng)域發(fā)揮作用,它可以應(yīng)用的場(chǎng)景有很多,比如政府、商場(chǎng)、交通、學(xué)校、會(huì)議等。最近,騰訊人工智能技術(shù)將接入到南京公安工作中,除了圖像處理、語(yǔ)音識(shí)別等技術(shù),南京公安將通過(guò)人臉識(shí)別跟你“面對(duì)面”。