文|王蘊韜

目前我國提供開放的人工智能語音語義服務平臺現(xiàn)在越來越多,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)前期已經(jīng)梳理了將近20家企業(yè),企業(yè)會把自己的技術,自己已有的數(shù)據(jù)積累,以及應用場景方面的產(chǎn)品或服務,打包成一個平臺服務的形式,從而降低人工智能使用的門檻,人工智能服務平臺化是大勢所趨。
語音語義是現(xiàn)在較為成熟的人工智能服務平臺,目前AIIA主要針對語音語義的功能性以及性能方面進行評測,雖然各家都有自己的特點,但背后的技術都相通,為了更好地規(guī)范發(fā)展,需要相關的評估評測工作。具體的工作思路是找到語音語義平臺背后基礎功能性模塊,比如語音合成,包括聲紋識別、語音識別、機器翻譯、理解交互等,然后針對每一個模塊來做相關的功能性以及性能評測。
人工智能更多的是依賴于海量的數(shù)據(jù),各家的數(shù)據(jù)量非常大,但有效樣本數(shù)非常小,真正能用的數(shù)據(jù)非常少。每個企業(yè)都有自己的數(shù)據(jù)標注團隊、數(shù)據(jù)采集團隊,但是人力、物力有限,最多一個企業(yè)能達到一百人的數(shù)據(jù)標注團隊,但是一百個人每天能標注的數(shù)據(jù)也非常有限。并且,雖然現(xiàn)在各家都有數(shù)據(jù)標注團隊,但每家的數(shù)據(jù)都沒有能夠達到互換交易共享的能力。如果能把大家收集到的數(shù)據(jù)做一個平等互換,這樣不但節(jié)省了成本,而且對于自身業(yè)務提高也大有裨益。
目前整個數(shù)據(jù)集建設沒有形成一定的規(guī)范,包括數(shù)據(jù)采集的規(guī)范、數(shù)據(jù)標注的規(guī)范、數(shù)據(jù)質量把控的規(guī)范以及數(shù)據(jù)交付的規(guī)范。由于缺乏這些規(guī)范導致各家使用數(shù)據(jù)的格式都不一樣,就算是交換以后也不能用,所以AIIA也想通過在數(shù)據(jù)方面的規(guī)模化來為企業(yè)提供服務。語音語義在目前人工智能發(fā)展中最為成熟,AIIA現(xiàn)在想以語音語義為抓手,先從語音識別的數(shù)據(jù)做起,未來形成一系列的評測理論規(guī)范。除了企業(yè),政府也有相當?shù)目紤],國家主要的政策文件,都對數(shù)據(jù)集有了明確的要求,搭建公共服務數(shù)據(jù)集。
自從開源的項目管理模式興起以后,計算機軟件業(yè)才真正發(fā)展起來。開源分成三個層面:底層是基礎技術,包括代碼、工具、數(shù)據(jù)庫等;上層是企業(yè)根據(jù)開源的底層技術打造的盈利性產(chǎn)品,包括定制化服務、基于開源軟件提供的軟硬件產(chǎn)品等;連接頂層和下層的橋梁是產(chǎn)業(yè)生態(tài)建設這一環(huán)節(jié),把連接上層和底層的生態(tài)建設做好,對于整個產(chǎn)業(yè)非常重要。
國家到目前為止,整個開源生態(tài)并沒有建設起來,目前很多企業(yè)都有自己的開源項目,都想把自己的項目貢獻出去。企業(yè)掌握的程序雖然是開源的,但一旦涉及到盈利點,知識產(chǎn)權限制就非常嚴格。代碼開放出去使用,并不意味著就能隨心所欲,所以還是需要自己來建開源的生態(tài)。AIIA這一中立第三方平臺,把開源框架搭建起來,協(xié)助大家把底層的基礎夯實,把生態(tài)做好。
我個人一直在深度參與聯(lián)合國國際電信聯(lián)盟(ITU)的工作,作為全球范圍內(nèi)信息通信領域的權威標準化組織,ITU分成三大部門,分別是標準化部門、無線電部門和發(fā)展部門。標準化部門主要做信息通信相關國際標準的立項輸出;無線電部門主要是涉及到頻率分配;發(fā)展部門主要是為發(fā)展中國家提供交流合作的平臺,通過項目的形式,把一些標準化的項目做好對接。我個人主要參加ITU標準化和發(fā)展部門的活動,ITU在標準化方面主要在做人工智能技術和網(wǎng)絡技術相結合的標準研究,下一步也將進一步擴大涉及范圍。
人工智能基礎技術標準在國內(nèi)是缺失的,AIIA會利用ITU的渠道,把工作放到聯(lián)合國平臺上,做出國際標準,雖然不具有強制性,但會以國際建議的形式呈現(xiàn)出來。參與建立國際標準,走在世界舞臺上就比較通暢。希望更多的國內(nèi)企業(yè)參與到國際標準建設中,人工智能是變道超車的好機會。
做人工智能的人才稀缺又昂貴,結果大家都在做相同的東西,就會存在同質化競爭問題。但是合理的競爭是必須的,不能一家獨大,這對于產(chǎn)品迭代、用戶體驗都不利。競爭是有必要的,但需要避免惡性競爭,目前國內(nèi)的人工智能公司,主要呈倒三角結構,大多數(shù)注重頂層應用,專注于底層基礎設施和中間層算法的公司比較少。 2017年以來,經(jīng)過大浪淘沙和去偽存真的過程,一些真正有實力的公司會逐漸地顯現(xiàn)和得到重視,形成一定的規(guī)模。
從上層應用來看,智慧城市豐富多彩,但落到基礎設施層,無非就是互聯(lián)網(wǎng)、數(shù)據(jù)中心、傳感器、數(shù)據(jù)采集和平臺。通過有效的手段采集數(shù)據(jù),然后通過可靠的傳輸網(wǎng)絡傳輸?shù)狡脚_上去做集中化的處理。背后的技術非常成熟、相互通聯(lián);應用在不同的場景下,能產(chǎn)生很多不同的效果。
目前,智慧城市最多的應用是視頻監(jiān)控,視頻監(jiān)控如果真正能夠做到預警或者對數(shù)據(jù)深度挖掘,都涉及到人工智能的技術。還有不同角度攝像頭之間智能協(xié)同的問題。市政基礎設施可以通過引進人工智能技術實現(xiàn)質的提升,但是實現(xiàn)質的提升需要克服三大障礙:第一是數(shù)據(jù),沒有人去收集數(shù)據(jù),沒有人去標注數(shù)據(jù)就沒辦法針對每一個場景有效搭建數(shù)據(jù)集;第二,數(shù)據(jù)整齊了,還需要搭建一整套平臺,需要開發(fā)人員做開發(fā);第三,系統(tǒng)建成以后,還需要運營人員運維;這些都是很大的投入。

在人工智能領域的貢獻,尤其在頂級會議的貢獻,我國貢獻率已經(jīng)達到了很高的水平,但是現(xiàn)在的情況是:企業(yè)去玩企業(yè)的,學術的去參加學術的,政府參加政府的,大家完全沒有形成合力,沒有形成一套機制。人工智能發(fā)展,更多的需要學術、產(chǎn)業(yè)、政府之間形成合力。這種工作的開展要依托于結合了政產(chǎn)學研用的行業(yè)組織、產(chǎn)業(yè)聯(lián)盟。
從基礎的技術儲備來說,大家都想掙快錢,把基礎性技術研究也都交給研究機構、高校,但是研究機構、高校不產(chǎn)業(yè)化,沒有實力去真正做好底層的技術,而且做出的技術可能跟產(chǎn)業(yè)結合得非常淺。所以說還是需要鼓勵企業(yè),更專注于底層深耕。
人工智能尤其是區(qū)塊鏈,炒作太猛烈,對整個產(chǎn)業(yè)來說并不是一件好事,熱錢來得快去得也快,而且很容易對國家金融穩(wěn)定造成威脅,人工智能的泡沫需要警惕。
對于人工智能探索已經(jīng)經(jīng)歷了這么多年,到現(xiàn)在為止還沒有做起來,很多的技術,比如傳感器、網(wǎng)絡等,都已經(jīng)有非常長的一條利益鏈,要把它們打包融合在一起很難。