廖紅陽
1988年出生的印奇,帶領曠視科技有限公司,僅用6年時間,憑借先進的人臉識別技術和商業布局,就發展成為中國人工智能領域的“獨角獸”公司。在去年底完成1億美元的C輪融資后,曠視科技已達到20億美元的估值。
緊盯前沿
85后創業者印奇是一位高材生,畢業于清華大學“姚班”——一個由圖靈獎得主姚期智主導創立的計算機精英班。和印奇一樣,在曠視科技的團隊中,超過80%的員工來自清華園,可謂高手如云。其中80%以上是工程師,30多人至少獲得過一項世界級編程比賽獎項,獲得國際奧林匹克競賽金牌的有7人,他們大多數有海外留學和專業機構工作背景。這個由高素質人才組成的智囊團隊,為曠視科技提供了強有力的智力保障。
說起創業緣由,不得不提印奇在MSRA(微軟亞洲研究院)的工作經歷。從大學二年級開始,印奇就在MSRA學習,參與人臉識別引擎的研發,出于對該項技術的熱愛,畢業后印奇又在MSRA全職一年。正是在此基礎上,印奇決定成立以人臉識別技術為核心的科技公司。很快,他找到同班同學唐文斌,向他提出自己的創業想法。印奇和小唐都是理科出身,一個擅長科研,一個更偏于工程化,能夠優勢互補,兩人一拍即合,并將學弟楊沫也拉攏到他們的創業隊伍中來。
2011年10月,曠視科技有限公司正式成立,團隊成員最初的想法是從人工智能技術出發,研制出“機器之眼”,并用它讀懂世界,這是大膽的設想,更是一次零起點的創業。由于在創業大賽中的出色表現,公司在短短兩個月內便獲得聯想之星幾百萬的天使投資。
但此時,印奇又有了新的想法。人工智能技術包括硬件和軟件兩方面,軟件背景出身的印奇希望能夠補全硬件方面的知識。沒過多久,印奇就踏上哥倫比亞大學的求學之旅。他一邊在校攻讀3D相機方向的博士,一邊還要處理遠在大洋彼岸的公司事務。盡管明確了視覺識別的方向,但如何讓技術落地還有待探討,在留學期間,印奇一直與團隊保持遠程視頻和通話。
最初他們開發了一款基于iOS移動體感的名為“烏鴉來了”的小游戲,在游戲中,玩家通過搖晃頭部,操縱游戲中的稻草人,從而攔截從天而降偷食的烏鴉。背后的技術原理是,用攝像頭拍攝玩家的身體活動,通過人臉識別和人臉追蹤等視覺識別算法判斷人物的運動姿勢,從而操縱游戲角色。這款游戲獲得了清華大學第三十屆“挑戰杯”特等獎,一度位居中國區APP Store排行榜前五位。但這一成績并未給印奇團隊帶來多少實質性收益,僅僅幾千元的盈利收入讓他們意識到,以技術起家、不了解游戲市場的他們并不適合做一家游戲公司。此外,Facebook收購以色列人臉識別技術公司face.com這一事件也給三人提了個醒:他們所掌握的人臉識別技術有著巨大的市場空白,市場潛力不容小覷。因此三人重新回歸“技術”本位,悉心鉆研這一前沿科技。
由于相隔萬里,團隊交流和公司管理極為不便,2013年,在完成兩年的博士學習并達到預期目標后,印奇毅然決定結束學業,回國全職創業。
技術至上
技術理想變為商業現實的創業之途并不平坦,雖然懷揣著人臉識別這一高端技術,但由于人工智能的行業應用市場還未得到充分開發,創業團隊又缺乏實戰經驗,如何使公司商業化運作成為擺在印奇他們面前的一道難題。一開始,他們走娛樂化路線,利用人臉識別技術滿足女性對美顏的剛需,使美圖秀秀成為公司最初的種子客戶,此外,阿里、360、陌陌、Camera360、魔漫相機、世紀佳緣、聯想等一批大型圖片、社交、設備類企業也相繼匯聚到曠視科技的生態進化鏈條中。
2014年,團隊發現人工智能為傳統行業賦能的商機,采用了to B(對企業)的商業模式,在互聯網、金融、安防、智能零售等領域拓展業務。只要一部智能手機,無論何時何地都可以“刷臉”開戶,這樣的“開戶神器”為券商在競爭中贏得砝碼。隨之,平安銀行、中信銀行、江蘇銀行等紛紛與曠視科技簽訂合作協議。在完成B輪4700萬美元的融資后,曠視科技又聚焦到金融行業的人臉認證、智能監控、智能家居等應用領域。兩三年間,數十億次外部信息的接收,不斷優化曠視科技的人臉識別算法,使它的性能和用戶量都達到國際領先地位。
被人臉識別技術廣闊的發展前景所吸引,曠視科技被馬云選擇并合作。作為阿里的戰略合作伙伴,曠視科技負責為支付寶開發人臉識別模塊。2015年3月16日,在德國漢諾威IT博覽會上,馬云親自為德國總理默克爾和中國副總理馬凱兩位貴賓,演示了螞蟻金服的Smile to Pay掃臉技術,并當場刷自己的臉在淘寶網上購買了一枚1948年的漢諾威紀念郵票。這套由螞蟻金服與曠視科技合作研發的“刷臉”系統,在購物后的支付認證階段通過掃臉取代傳統的密碼輸入,其識別率超過99%。
原創“刷臉”
在印奇眼里,過去六年,曠視科技只做了“刷臉”一件事,在人臉識別技術的商業化中,曠視科技完成了從技術研發到產品化再到商業化的過程,目前平臺在全球已擁有2.1億實名認證客戶。
要使人臉識別技術順利實現商業化,技術研發是基礎。帶有濃厚極客氛圍的曠視科技將技術視為核心競爭力,在內部設有專門負責基礎研發的研究機構。人臉識別功能的背后技術是深度學習,本質是標準化,因此技術壁壘的堆高需要遵守快的準則。除了與同行競爭發展速度,與黑色產業的賽跑也在所難免。在金融業,犯罪分子通過偽造身份信息或盜取他人身份信息進行詐騙,作為金融業人臉對比和活體檢驗技術的提供者,曠視科技必須與黑色產業進行正面較量。其市場總監謝憶楠提到,公司員工會潛伏在黑色產業群中,只要群里有人兜售破除人臉識別系統的技術,謝憶楠的同事就會主動買下,以便更好地研究黑色產業所使用的破解技術,有針對性地補上漏洞。
過去,3D假體面具、播放人臉視頻等冒充手段或許可以騙過人臉識別系統,但隨著技術的精密化處理,這些陰謀現在已經無法得逞了。曠視科技開始做人臉識別簽到機時,使用五點來識別身份,分別是兩個瞳孔、鼻尖和兩個嘴角。因為識別點少,系統識別靈敏度不高,如果識別對象換個發型、戴個鏡框眼鏡,就可能識別失敗。但現在,根據人臉識別系統的算法,曠視科技識別用戶面部的特征點已經達到83個,甚至不需要用戶配合看鏡頭,這就為人臉識別技術開拓了另一個可能的應用領域:安防。
印奇認為,一個人工智能創業公司除了掌握技術外,還要走商業化道路,技術平臺、商業落地的方向兩者缺一不可,唯有如此,才能最終快速實現數據循環。只有在商業模式、數據模式上形成網絡協同效應,公司才有可能形成行業壁壘,避免同行的技術趕超。
曠視科技涉及上億人的刷臉,通過云端平臺FaceID.com,曠視科技打通了Smart ID的線上和線下。無論是線上的賬號,還是線下的一張卡,一把鑰匙,或者一個智能門禁,都可能成為虛擬化的入口。曠視科技比較有代表性的客戶包括支付寶、Uber、萬科等,萬科是曠視科技在線下化的體驗,未來會實現一個智能園區。此外,曠視科技覆蓋了幾乎全部的移動出行領域,用來幫助平臺對司機身份進行審核。不難預料,未來在快遞、物流行業等越來越多的現實場景中,也需要這樣一個刷臉平臺,把互聯網用戶變成高附加值的商業互聯網用戶。
至于線下刷臉,在我國地鐵、飛機場、火車站等人流量較密集的場所,都分布有曠視科技提供的人臉識別系統,可用于交通綜合治理或者追捕逃犯等。在安防領域,刷臉技術有更多應用的空間。曠視的“天眼”系統和公安部門合作,搭建了“三逃”人員的身份證圖片庫,通過公共場所的監控攝像頭,進行實時比對。除了確認面部特征外,刷臉系統還會根據身高、體重、步態、穿著等進行綜合判斷。一旦攝像頭中的人臉與數據庫相匹配,系統就會瞬間報警,公安部門則會立即響應,進一步確認。不僅是抓捕逃犯,在人臉識別系統的幫助下,安防體系還會逐漸向事前、事中推進。比如,如果一個人在車站的出現頻率超乎正常旅客的范圍,又非車站工作人員,就要考慮是扒手的可能性。人臉識別技術和遍布的智能化監控攝像頭相結合,使得一個“7×24”小時監控的龐大系統成為可能。
綜合線上和線下的場景,曠視科技所做的就是用刷臉的方式來結構化物理世界,提取所有商業場景中由人產生的身份和行為等信息,以打通線上線下商業數據、傳遞商業價值。
事實上,在現階段,任何一家人工智能公司都不太可能覆蓋多個行業。這里涉及到“+AI”和“AI+”兩個概念,“+AI”是指人工智能公司實際上并沒有深入到任何行業,而只是給一些行業應用者提供了深度學習的能力或者作為某一項技術的外包方而存在;“AI+”是指人工智能公司能夠與行業深度結合,并使其成為由AI驅動的新行業,比如新金融、新安防。印奇認為,在過去一年時間里,第一批人工智能公司都在完成自己的商業化嘗試,但至少到2018年底,這些商業化嘗試的效果才能凸顯出來。
曠視三步
自2011年成立至今,曠視科技已由3人的初創團隊發展到一個有著70多人團隊的“獨角獸”公司,規模稱不上大,卻面臨著很多競爭對手。在曠視科技獲得1億美元融資之后,2017年7月,同以人臉識別為主營業務的商湯科技宣布完成4.1億美元融資。
在印奇看來,激烈的競爭并非是壞事,有競爭,才有進步。他將競爭對手分為三類:一類是近幾年在人工智能資本泡沫催生下的新公司,其中不乏在人臉識別垂直領域做得較好的公司,但在短期內不會對曠視科技構成威脅;一類是人工智能技術排在前列的外國公司:谷歌、Facebook、亞馬遜;一類是行業內的競爭對手,例如安防行業。印奇表示曠視科技現在規模還比較小,切入點也與那些大公司不同,因此還需要一段時間的沉淀。
除了應對外部激烈的競爭,曠視科技還面臨科學技術與倫理道德相互博弈的挑戰。近年來,隨著技術的不斷進步,人工智能領域已經引發了人們對于個人隱私泄露的擔憂。在一些國家,在十字路口抓拍違規行為都被視為侵犯隱私。
作為人臉識別技術的研發者,印奇始終堅持主流的“技術中性論”,他認為技術本身沒有對錯,關鍵是如何進行使用,法律法規和社會價值觀都可以引導人們正確地使用原本中性的技術。此外,他還相信,技術本身的發展也可以打消人們對于隱私泄露的顧慮。比如,一切私人場所的個人數據都需要被當事人授權后,才能被采集和使用。個人數據需要經過脫敏處理才能入庫,一張有姓名的照片會被隱去名字,以內部ID號儲存,公開數據則依賴于系統自身的訓練和提升。印奇認為,與技術本身相比,真正掌握技術的人所選擇的方向更為重要。
曠視科技將未來戰略分為三步:識人、識圖和機器大腦。識人即人臉識別。識圖即萬物識別,包括人臉、車輛、行人、文字等,這些信息是圖像中最有價值的部分。如果能夠實現對車輛、行人和交通標志牌的識別與計算,無人駕駛汽車就會呼之欲出。將視覺推而廣之,實現更廣義的機器思考,就是機器大腦。
提及未來的技術時,印奇預測,未來20年內,人工智能將是最重要的技術,很多科幻片里的場景都可能成為現實。感知型技術也就是語音和視覺技術,成為目前亟待攻克的AI技術,包括視覺的感知與理解、語音交互和自然語言理解,因為這關系著機器能否看懂世界并與人進行交互的重大命題。解決了這兩個問題,其他問題都可以迎刃而解。