撰文/朱輝杰
商湯科技CEO徐立:超越人類是人工智能廣泛應(yīng)用的開端
撰文/朱輝杰
2016年11月18日,備受矚目的第三屆世界互聯(lián)網(wǎng)大會在浙江省烏鎮(zhèn)舉行。作為中國與世界互聯(lián)互通的國際平臺,本屆大會的主題是“創(chuàng)新驅(qū)動 造福人類——攜手共建網(wǎng)絡(luò)空間命運共同體”,物聯(lián)網(wǎng)和人工智能成為了本屆大會的亮點。作為專注于計算機視覺和深度學習原創(chuàng)技術(shù)的創(chuàng)新企業(yè),商湯科技CEO徐立發(fā)表了以“互聯(lián)網(wǎng)上的機器視覺”為主題的演講。
徐立認為,判斷人工智能能否大規(guī)模商用的關(guān)鍵在于針對同樣一件事情,它能否比人類做得更好。只有達到超越人類的標準,才是人工智能實現(xiàn)廣泛應(yīng)用的基礎(chǔ),而隨之引發(fā)的,不僅是生產(chǎn)效率的大幅度提升,更將催生新的行業(yè)和新的應(yīng)用。

商湯科技CEO徐立
從早期的ImageNet視覺識別挑戰(zhàn)賽,到如今的AlphaGo,人工智能系統(tǒng)紛紛在各個特定領(lǐng)域中擊敗人類,在很多人看來,這都象征著人工智能的重大突破。但是談及人工智能實現(xiàn)大規(guī)模商業(yè)應(yīng)用的標準,很多人認為需要達到100%不出錯。
徐立表示:“判斷它能不能大規(guī)模使用的唯一準則,就是如果這件事情換成人,是不是能做得更好。如果機器的錯誤率遠低于人,那么就是可以接受的。”換句話說,人工智能只要在特定垂直領(lǐng)域中超越人的標準,就有廣泛的應(yīng)用意義。當前大部分人工智能應(yīng)用,更準確來說其實叫機器智能,因為這些功能的目的不是仿人,而是通過深度學習,不斷積累數(shù)據(jù),在特定垂直領(lǐng)域中超越人類,機器視覺即其中之一。
目前,商湯科技的機器視覺技術(shù)已經(jīng)廣泛應(yīng)用在智能手機、互聯(lián)網(wǎng)、金融、商業(yè)和安防等領(lǐng)域。生活中的例子比比皆是。例如,很多人拍照時都會遇到模糊的情況,現(xiàn)在通過算法即可對其進行還原,或者直接辨認出人眼無法捕捉的模糊圖像中的內(nèi)容。再如,在光線不足的場景拍照時,可以通過手機的暗光增強來將場景中肉眼看不到的細節(jié)體現(xiàn)出來,包括霧霾天的去霧處理,可以幫助人們排除霧霾對視覺的干擾。
除此之外,機器視覺還包括感知和理解。通過感知,可以賦予機器深度視覺的能力,感知三維場景中的位置。正如現(xiàn)在一些可以媲美單反的大景深效果的雙攝像頭手機一樣,其背后也運用了商湯科技的機器視覺技術(shù)。
這些大家最為熟悉的應(yīng)用中,無一例外都是通過機器智能獲得人類所無法獲取的圖像內(nèi)容,甚至做得更好。正是在這些特定領(lǐng)域中,機器智能超越了人類,使得這些功能具有實際意義,為我們提供更好的幫助。
人工智能或機器智能的廣泛應(yīng)用,將會掀起兩波浪潮,其一便是在強勞動力的行業(yè)中,機器大規(guī)模替代人力。這在中國勞動力成本不斷上升的環(huán)境下,可以為企業(yè)節(jié)省人力成本,從而創(chuàng)造更多的利潤,帶來更多的商業(yè)價值。
金融和商業(yè)領(lǐng)域中的不少企業(yè)利用商湯科技的人臉技術(shù),實現(xiàn)快速的真人和身份證信息匹配,無需額外人力,即可進行實名認證和遠程開戶等業(yè)務(wù)。而在這一場景中,還必須防止他人通過照片或3D模型來進行仿冒認證。基于商湯科技機器視覺技術(shù)的活體檢測服務(wù),可以防止高精度的模擬手段,最大限度地確保線上認證的安全性。甚至通過足夠多的數(shù)據(jù)訓(xùn)練,還能夠有效防止實時變臉等高級攻擊手段。
安防和智慧城市領(lǐng)域更是如此,借助商湯科技的機器視覺技術(shù),可以對人力根本無法看完的海量監(jiān)控視頻進行快速梳理和分析,包括道路上的車輛識別,公共場所中可能出現(xiàn)的人流堆積問題,以及小區(qū)街道上的打架斗毆情況。通過實時識別,及時做出預(yù)警,使人們更快地做出決策。
人工智能所掀起的另一大浪潮,便是新興行業(yè)或新型應(yīng)用。例如,眾多直播和短視平臺借助商湯技術(shù),可以提供包括變臉、實時美顏和動態(tài)貼紙等增強現(xiàn)實效果,為主播帶來了個性化的直播體驗,可謂是開創(chuàng)了娛樂互聯(lián)網(wǎng)行業(yè)的全新潮流。
除了對人臉的美化外,人工智能還可以開創(chuàng)藝術(shù)創(chuàng)作的新方式。例如,通過商湯科技的機器視覺技術(shù),可以教會機器從一副畫作中將作者的藝術(shù)風格提取出來,形成獨有的畫風,并以此來對另一幅畫作進行二次創(chuàng)作。因此,用戶可以將相冊中的照片,以油畫和水彩畫等方式重新生成,帶來不一樣的視覺感受。
從萬物互聯(lián)到萬物智聯(lián)的發(fā)展過程中,深度學習所引發(fā)的現(xiàn)代人工智能革命將發(fā)揮關(guān)鍵作用。在當前人工智能的浪潮中,機器視覺被認為是下一個前沿。作為在這一領(lǐng)域擁有核心技術(shù)的創(chuàng)新型企業(yè),商湯科技正在為互聯(lián)網(wǎng)、金融、安防、手機和機器人等各行業(yè)提供智能的核心,把人工智能廣泛地應(yīng)用在各行各業(yè)當中,引發(fā)行業(yè)變革。