姚堯
忽如一夜春風來,視覺人工智能企業如千樹萬樹梨花開,并迅速成長為高估值企業。
近來,許多人到銀行開戶已不必再到柜臺辦理,只需在遠程終端上利用“刷臉”功能就可以實現。不僅如此,各類門禁系統、手機“刷臉”等使用人臉識別技術的設備也在快速普及,而人臉識別其實就是視覺人工智能最重要的應用場景之一。
整個行業的突飛猛進源自2014年的一次技術進步。商湯科技有關負責人告訴《中國經濟信息》記者,那年,商湯科技創始團隊宣布,其DeepID系列人臉識別算法首次超越人眼識別率。這意味著,人臉識別技術已具備場景落地的技術基礎。
隨后資本蜂擁而至,而企業們也開始挖掘該技術在安防、金融、醫療、自動駕駛、電商等場景落地的潛力。有業內人士表示,對視覺人工智能行業而言,數據是基礎,算法是技術關鍵,資本投入是動力,但最終變現則取決于技術能否順利落地。
機器識人更準
視覺人工智能可以簡單理解為計算機視覺,而這一技術取得突破則源自于一場計算機競賽。2012年,多倫多大學教授Geoffrey Hinton和學生一同參加了ImageNet計算機視覺識別挑戰賽獲得了冠軍,并一舉將計算機視覺識別的準確率從74%提高至84%。這也稱得上是近年來AI人工智能領域的重要事件。
此后,全球大批計算機視覺研究者開始組建創業團隊。依圖科技創始人兼CEO朱瓏和聯合創始人林晨曦告訴《中國經濟信息》記者,他們也是自那時起才真正進入到視覺人工智能領域。林晨曦說:“選擇這一領域的原因之一是計算機視覺在人工智能里的難度系數中等,比語音識別要難,又比自然語言理解要簡單。它的結果相對比較直觀,更容易接受可見度的學習和訓練。”
據林晨曦介紹,當時公安系統有幾百萬人的數據庫,需要從中匹配出路上拍到的犯罪嫌疑人照片。那時供應商提供的技術首位命中率僅為20%,這樣的準確率面對百萬級別的大數據幾乎沒有可操作性。而依靠視覺人工智能技術卻能將準確率提升到85%。“這意味著在路上碰到十個人,有八個半能對出來是誰,其他工作流程就可以據此展開。人臉識別便在2014年落地了警務應用。”林晨曦說。
而依圖的經歷只是眾多這一領域企業經歷的縮影。
2014年3月,現在的商湯科技創始人湯曉鷗還是香港中文大學教授,其團隊發布的原創人臉識別算法,準確率達到驚人的98.52%,首次超越97.53%的人眼識別能力。機器看人能夠超越人類肉眼,對于眾多需要人臉識別的場景而言,這是技術已然成熟可以邁向市場的標志。
在算法領域,語音識別發展比計算機視覺更早,然而多位業內人士指出,語音識別的應用場景并沒有視覺人工智能豐富。2012年以來,人臉識別技術取得了長足進步,為廣泛應用打下了基礎。
創新工場創始人李開復也曾表示,圖像識別相比語音識別更能應用于場景。對機器而言,語音識別和自然語言理解是兩個步驟。目前的技術水平往往停留于語音識別層面,以語音識別軟件為例,一旦遇到中英文混合時就容易出現混亂。即便如此,語音識別領域也產生了市值達到約800億元的企業。由此不難想見視覺人工智能的“錢”景。
引燃安防市場
安防是視覺人工智能真正大顯身手的首秀。縱觀目前市場上的相關企業,拿到的第一張訂單基本都來自對安防有強烈需求的政府部門。
2017年,公安部公布了《公安科技創新“十三五”專項規劃》,指出要通過專項規劃的實施,開展知識創新、技術創新、應用創新與管理創新等四類創新。同時,有關部門也已準備將目前還分屬于政府各部門、社會機構的攝像頭及其后臺數據進行統一管理。這對視覺人工智能行業而言都是利好消息。
其實,視覺人工智能僅從技術上看,精確度已經相當高。從事該行業的上海某企業曾在國內的行業展覽中展出過一款產品,要鎖定對象現在的位置,只需要根據對象十幾歲時的照片就能實現。該企業有關負責人表示,這一系統對于公安部門維護社會治安具有十分重要的意義。
從中央到地方,公安系統在技術偵查方面的資金投入逐年增長。據悉,東部某沿海城市公安部門剛剛完成八億元的人臉識別項目招標,某直轄市公安部門在未來三年的相關預算高達數百億元。
深鑒科技創始人兼CEO姚頌一語道破視覺人工智能企業進入安防市場的三個原因。一是市場很大,2017年的市場規模已達到約6500億元。第二是安防市場足夠穩定,有利于企業增加收入。最后是安防市場非常分化,任何公司都有機會。
從技術層面看,目前視覺人工智能企業的能力與安防市場需求也相當吻合。曠視科技CTO唐文斌指出,視覺人工智能難度最高的應用在自動駕駛,因為這一場景關系人身安全,且高度依賴機器獨立完成。安防則不同,需要人機混合完成,而且機器所要解決的問題更為清晰。
他認為,未來的安防市場規模還將持續擴大,其中的原因主要是隨著政府部門的數據積累,加上視覺人工智能企業對算法和模型的研究更為深入,在安防市場必然還會有更多應用場景得到激活。
全面落地檢驗
自2016年起,伴隨視覺人工智能技術的進步和在安防市場的爆發,該領域企業正繼續推動這一技術在其他應用場景落地,而看到了商機的資本也不甘落后紛紛加入其中。
回憶起公司拿到的第一單,林晨曦依然記憶猶新。那是2013年,林晨曦獲得了向蘇州市某科技部門負責人介紹依圖科技的機會,而他最大的收獲卻是了解到交通系統對車輛識別的需求。
2013年前后,交通系統車輛識別的準確率只有約30%,而有關部門希望達到最少70%。而依圖科技的識別率卻達到驚人的95%。此后,人臉識別的訂單也紛至沓來。與此同時,曠視科技也在尋找機會落地,而他們則將目光投向了游戲,并使得該游戲在應用商店的下載排名名列前茅。
“這是雙向的尋找,視覺人工智能公司在尋找場景,而有技術訴求的場景也在尋找他們。”有業內人士表示。其實早在2015年,同樣擁有海量數據的金融系統就提出了對人臉識別遠程開戶的訴求,而現如今,大多數銀行已經裝備了具備人臉識別功能的發卡設備,提高了銀行的運行效率。
在安防和金融領域之后,醫療和物流也出現了視覺人工智能落地的需求。以依圖科技為例,其醫療用“胸部CT智能輔助診斷”產品已經進入浙江、上海、湖北等地的醫療機構,成為醫生日常使用的人工智能產品。
商湯科技則更為多元化,其視覺人工智能技術已進入14個行業。業內人士認為,跨行業之間有很大的協同作用。而2020年之后商湯科技會更多滿足交互類應用場景的需求,這就包括直播等。
向來敏銳的資本也嗅到了商機。2017年以來,視覺人工智能企業的融資規模出現“驟增”。依圖科技、商湯科技和曠視科技等都很受資本青睞。去年5月,依圖科技完成了3.8億元的C輪融資。7月,商湯科技則完成4.1億美元B輪融資,估值已經達到15億美元。11月,曠視科技則完成了4.6億美元C輪融資。資本的迅速介入似乎也預示著行業的春天。
而企業們則為滿足更多場景需求而努力加速前進。因為市場足夠大,只要各行各業還需要機器替代人工,視覺人工智能企業們就有得忙。endprint