李佳師

編者按:阿馬拉法則說,我們往往高估技術(shù)的短期影響力,卻低估技術(shù)的長期影響力。應(yīng)該說這個法則只針對那些被“炒熱”且正在開啟“商用旅程”的技術(shù),而事實(shí)上很多信息技術(shù)還在萌芽的階段,我們常常忽略它們的影響力。因此,本報開辟“影響未來5-10年的信息技術(shù)”系列報道,報道那些正在處于探索階段的未來信息技術(shù),解剖其背后的創(chuàng)新邏輯以及產(chǎn)業(yè)設(shè)計路徑,希望對信息技術(shù)未來的發(fā)展產(chǎn)生更多啟示價值。
在各種“感覺”上,AI科學(xué)家們一直在探索,在視覺和聽覺方面已取得相當(dāng)豐碩成果,但對于人類的味覺和嗅覺,AI探索進(jìn)展似乎并不大。
不過,最近有了突破。3月16日,英特爾與康奈爾大學(xué)在《自然一機(jī)器智能》雜志上聯(lián)合發(fā)表論文,宣布其利用英特爾神經(jīng)擬態(tài)芯片“Loihi”可以識別10種有害氣體。而在2019年7月,舊M研究院的科學(xué)家宣布其研發(fā)的“電子舌頭”能在1分鐘內(nèi)識別多種液體,可以用于食品安全、工廠質(zhì)檢、疾病診斷、環(huán)保檢測等用途。
為什么川識別嗅覺、味覺的腳步要遠(yuǎn)遠(yuǎn)慢于識別視覺和聽覺?AI味覺和嗅覺的解題為什么難?嗅覺和味覺的解題背后有什么樣的商業(yè)價值?
識別氣味與味道的挑戰(zhàn)
目前,還沒有一套完全的體系和方法能對嗅覺和味覺進(jìn)行數(shù)字化的建模和分析。
“人類的味覺是幾千年進(jìn)化的結(jié)果。它讓我們享受愉快的食物和飲料,并警告我們不要攝入有害物質(zhì)。另一方面,人造傳感器還沒實(shí)現(xiàn)接近味蕾識別物質(zhì)的程度。這是一個重大的技術(shù)差距,因?yàn)橛性S多物質(zhì),我們想‘品嘗卻沒有真正敢把它們放進(jìn)我們的嘴里。”PatrickRuch是IBM蘇黎世研究院的研究員,2019年7月5日他在iBM研究院博客上以這樣的開篇來講述IBM要做Hypertaste的原因。
在識別有毒有害的氣體與液體上,人類有很多種解題的方法,人造傳感器是其中之一,但人造傳感器并不十分給力,通常只能識別某種液體。當(dāng)然,對氣體的判斷也可以用警犬,不過訓(xùn)練警犬需要花費(fèi)很多時間。因?yàn)榍懊娴霓k法有局限性,于是科學(xué)家們想到了Al。
這些年將AI用于味覺與嗅覺的識別,其進(jìn)展其實(shí)遠(yuǎn)遠(yuǎn)落后于視覺和聽覺。為什么視覺和聽覺的進(jìn)展更快?
“其一是視覺、聽覺兩類數(shù)據(jù)相對容易獲得而且數(shù)據(jù)量較大。其二是這兩類數(shù)據(jù)的標(biāo)注相對容易。”英特爾中國研究院院長宋繼強(qiáng)在接受《中國電子報》記者采訪時表示。
深度學(xué)習(xí)做得比較好的領(lǐng)域都具備了這樣的特征——數(shù)據(jù)量足夠、有標(biāo)注好的數(shù)據(jù)、有訓(xùn)練的數(shù)據(jù)池和未來要處理這個問題的真正測試集合。然而嗅覺和味覺的數(shù)據(jù)量很少,且不易被標(biāo)注。
“利用信息技術(shù)識別氣味與味道的挑戰(zhàn)主要來自兩方面:一是人類對嗅覺和味覺的機(jī)理研究和了解還遠(yuǎn)遠(yuǎn)不夠,既不能充分知道它們自身的機(jī)理,也不了解人類是如何對它們感知的;二是還沒有一套完全的體系和方法能對嗅覺和味覺進(jìn)行數(shù)字化的建模和分析處理。”IBM壘球副總裁、中國研究院院長、大中華區(qū)首席技術(shù)官謝東在接受《中國電子報》記者采訪時表示。
“電子舌頭”和“電子鼻子”
“電子舌頭”和“電子鼻”的解決方案有一些共同的特征——高效率、識別多樣性、低成本和易用性。
在2014年IBM的“未來5年的五大技術(shù)”(簡稱five in five)項(xiàng)目里,有這樣的描述:未來傳感器將無處不在,傳感器可能會出現(xiàn)在手機(jī)和車?yán)铩K訦ypertaste的研究應(yīng)該是從2014年或者更早時間開始的。
據(jù)了解,“電子舌頭”使用電化學(xué)傳感器,每個電極會通過電壓信號對分子組合的存在作出響應(yīng),且電壓信號易于測量。其中的關(guān)鍵是電化學(xué)傳感器中覆蓋了每個電極的聚合物涂層。這些涂層被設(shè)計用來捕捉一系列化學(xué)信息,井允許高度微型化。Patrick Ruch和其團(tuán)隊(duì)在蘇黎世的實(shí)驗(yàn)室合成了這些涂層。
電化學(xué)傳感器并非今天才有,事實(shí)上從上世紀(jì)50年代就已經(jīng)出現(xiàn),但目前很多手持式電化學(xué)傳感器都只能檢測一種液體成分。而“電子舌頭”則不相同,它真的就像人類的舌頭一樣,通過組合檢測,識別出多種不同類型的液體,并且無需專門針對某種液體對設(shè)備進(jìn)行重新調(diào)整。
謝東認(rèn)為,“電子舌頭”的創(chuàng)新工作主要有兩部分:一是掌握快捷的液體分子組成檢測設(shè)備和方法;二是用AI的方法預(yù)測具有這種分子組成的液體最可能的氣味和味道。“電子舌頭”從測試上傳到獲得答案不超過一分鐘,它的實(shí)現(xiàn)除了憑借帶有特殊涂層的電化學(xué)傳感器,還利用了AI與云。
這次康奈爾大學(xué)與英特爾公司合作的項(xiàng)目,是利用英特爾神經(jīng)擬態(tài)芯片“Loihi”來識別爆炸物和毒品,它的靈感來源于人腦對于氣味的識別過程。
“英特爾與康奈爾的‘電子鼻構(gòu)造出了一個類似于人的鼻腔通道,里面放了化學(xué)傳感器、有機(jī)物傳感器,通過感知?dú)怏w流過時的分子接觸傳感細(xì)胞的時間、空間序列,形成一個時間上的脈沖序列,它有空間上的分布。再對這些數(shù)據(jù)進(jìn)行模型匹配,通過這一測試能把它的模式很好地記錄下來,記錄下來后再碰到這樣一種氣味,就能夠產(chǎn)生最高響應(yīng)。”宋繼強(qiáng)解釋道。
在英特爾與康奈爾的“電子鼻”項(xiàng)目中,核心是傳感器+算法+神經(jīng)擬態(tài)芯片。在一個“Loihi”芯片上構(gòu)造這樣的系統(tǒng),它的功耗非常低,往往只是毫瓦級別,無論是訓(xùn)練還是識別都不需要耗費(fèi)太多電,因此可以把它做成類似于“電子鼻”的小設(shè)備。
無論是IBM、英特爾還是康奈爾,其“電子舌頭”和“電子鼻”解決方案,都有一些共同的特征——高效率、識別多樣性、低成本和易用性。這是我們檢驗(yàn)“創(chuàng)新”的核心關(guān)鍵。
事實(shí)上,并不只有英特爾、IBM等公司在進(jìn)行探索。去年5月,有媒體報道了微軟公司與釀酒廠及科技公司的三方合作,推出了全球上第一款由AI制造出來的威士忌。根據(jù)微軟的說法,這是由微軟Azure云端及Azure認(rèn)知服務(wù)提供的Mackmyra酒廠的機(jī)器學(xué)習(xí)模型,并結(jié)合了現(xiàn)有的配方、銷售數(shù)據(jù)以及客戶喜好,讓AI透過大數(shù)據(jù)從超過7000萬個方式及口味中挑選出來制作。
與此同時,日本NEC公司與三重大學(xué)也曾利用傳感器向食物發(fā)射不同波長的紅外線,結(jié)合反射數(shù)據(jù)來勾勒出食物的“指紋”,然后將其與數(shù)據(jù)庫資料對比,可以辨別出數(shù)十種食物的味道和名稱。
中國輕工業(yè)聯(lián)合會在去年4月提交的一份報告顯示,自2015年以來,有超過10家傳統(tǒng)中國食品制造商參與了政府支持的“AI試昧”項(xiàng)目,在生產(chǎn)過程中通過AI測試食品味道是否符合標(biāo)準(zhǔn),保證食品安壘。
Al識別味覺嗅覺的未來探索
巨頭們關(guān)于味覺、嗅覺AI的探索將給我們帶來更多的啟示,讓創(chuàng)新靈感萌生、發(fā)芽、破土、生長。
回望這些項(xiàng)目,我們可以歸納出幾個關(guān)鍵詞——新型傳感器、新型算法、類腦計算和云計算。味覺、嗅覺AI的突破需要交互感知、材料學(xué)、動力學(xué)、分子化學(xué)、生物信息學(xué)等多種技術(shù)集成協(xié)作,通過感知不同的材料和電流的變化來獲得信息,結(jié)合AI算法、模型以及更適配的計算力,與數(shù)據(jù)庫的數(shù)據(jù)配對,獲得結(jié)果。總結(jié)這些味覺與嗅覺AI的項(xiàng)目,可以給我們未來的創(chuàng)新帶來更多啟示。
其一,當(dāng)我們希望突破更難的題目,多學(xué)科技術(shù)集成協(xié)作成為必要手段。事實(shí)上在IBM的“電子舌頭”項(xiàng)目中,神秘武器之一就是聚合物涂層,這些聚合物涂層捕捉一系列化學(xué)信息,并具有高度微型化,是復(fù)合材料領(lǐng)域的突破。
其實(shí),IBM研究院很多項(xiàng)目的突破都基于其深厚的多學(xué)科融合底蘊(yùn)。比如今年1月IBM宣布將基于海水研發(fā)電池,新型電池在多個方面的表現(xiàn)均超越鋰離子電池。
在多學(xué)科融合的解題中,“計算機(jī)科學(xué)并不僅僅是工具,更是方法論、理念、定律”。中國科學(xué)院院士李國杰表示,計算機(jī)科學(xué)家與其他領(lǐng)域的科學(xué)家密切合作,已成為當(dāng)代科學(xué)研究的特點(diǎn)。計算機(jī)科學(xué)技術(shù)不僅僅是其他領(lǐng)域的“工具”,也是認(rèn)識未知世界的知識源泉之一。
其二,對于算力的選擇已經(jīng)進(jìn)入“好馬配好鞍”的時代。有人說,這一輪人工智能的浪潮大舉進(jìn)入各個領(lǐng)域,是得益于算法模型的成熟。其實(shí)它是數(shù)據(jù)豐盈、算力澎湃、算法成熟三者交匯的結(jié)果。這一次康奈爾大學(xué)與英特爾聯(lián)合的“電子鼻”項(xiàng)目中,神經(jīng)擬態(tài)芯片“Loihi”是一個關(guān)鍵。為什么解題嗅覺、味覺要采用類腦計算,而不是基于量子計算或是傳統(tǒng)計算?
宋繼強(qiáng)給出了答案:第一,神經(jīng)擬態(tài)計算不需要依賴于大量的數(shù)據(jù),其從一個樣本的訓(xùn)練中就可以達(dá)到比較高的準(zhǔn)確率;第二是低功耗,這樣可以在很小的設(shè)備上做成“電子鼻”;第三是可擴(kuò)展,能夠做更多種類的氣體識別。
“在傳統(tǒng)的CPU上當(dāng)然可以模擬各種各樣的計算場景,但執(zhí)行效率肯定不如在‘Loihi上這么直接、這么低功耗。而量子計算是適合做大規(guī)模有并行選項(xiàng)和驗(yàn)證的事情,并不適合做嗅覺識別,因?yàn)樾嵊X識別是針對只有少量的、有時間序列的數(shù)據(jù),進(jìn)行快速判別。”宋繼強(qiáng)說。
類腦計算跟量子計算有著完全不同的理論基礎(chǔ)和技術(shù)路線。謝東表示:“類腦計算是要模仿人腦神經(jīng)元的模式進(jìn)行計算。從算力上看,它不僅專注于超強(qiáng)的算力,還希望通過模仿人腦的結(jié)構(gòu)模式實(shí)現(xiàn)超低功耗的計算。量子計算則是基于量子物理現(xiàn)象和過程實(shí)現(xiàn)的信息表達(dá)和計算。至于說哪個更適臺解決嗅覺和味覺的問題,二選一的話,我選類腦計算。”
其三,學(xué)術(shù)機(jī)構(gòu)十創(chuàng)業(yè)公司+大企業(yè)的“社區(qū)化”運(yùn)作,讓生態(tài)快速生成。英特爾的“Loihi”芯片從3月16日至3月19日連續(xù)爆出兩大突破:一是識別了十種有毒有害氣味,二是用“Loihi”構(gòu)造出了一個超過1億個神經(jīng)元的新神經(jīng)擬態(tài)研究系統(tǒng)“Pohoiki Springs”,突破了歷史規(guī)模。談及英特爾神經(jīng)元芯片為什么可以那么快速取得連續(xù)性突破,宋繼強(qiáng)透露了其中的關(guān)鍵——“Loihi社區(qū)”的建立。社區(qū)中不僅有神經(jīng)擬態(tài)計算研究的學(xué)術(shù)機(jī)構(gòu),也吸納了非常多不同種類的創(chuàng)業(yè)公司和全球五百強(qiáng)企業(yè),希望大家一起來探討神經(jīng)擬態(tài)計算能夠很好地解決哪些類型應(yīng)用領(lǐng)域問題,由此來驅(qū)動神經(jīng)擬態(tài)計算的發(fā)展。
IBM也同樣擅長此道。事實(shí)上IBM在量子計算領(lǐng)域就組建了這樣的社區(qū),IBM的量子計算社區(qū)里同樣是“學(xué)術(shù)機(jī)構(gòu)+創(chuàng)業(yè)公司+500強(qiáng)企業(yè)”的配置。中國的量子計算創(chuàng)業(yè)公司——本源量子公司副總裁張輝曾對《中國電子報》記者表示,本源量子公司在研發(fā)量子計算推動生態(tài)聯(lián)盟時,就學(xué)習(xí)了IBM的量子計算社區(qū)模式。