AlphaGo和AlphaGo zero接連戰勝人類頂尖棋手,讓更多普通人以“危機感”的視角關注人工智能。
究竟什么是人工智能?人工智能是研究、開發用于模擬、延伸和拓展人的智能的理論、方法、技術及應用系統的一門新的技術科學。該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。“人工智能可分為3個階段:計算智能、感知智能和認知智能。其中,認知智能是與人的語言、知識、邏輯相關的智能,是人工智能的高級階段。”科大訊飛研究院院長胡國平告訴筆者。
2014年,科大訊飛股份有限公司啟動“訊飛超腦”計劃,讓機器不僅能聽會說,還要能理解會思考。這個當時被很多人看來“很神奇”的舉動在3年后收獲了驚喜:2017年12月份,科技部批準依托科大訊飛建設認知智能國家重點實驗室,這也是在人工智能高級階段的第一個國家級重點實驗室。該實驗室重點攻關的領域及目標是讓機器掌握人類的語言和知識體系,并真正理解其內在邏輯。
實驗室的未來會是什么樣?“也許工作場景還如今天這般,但人工智能的系統可以更好地理解和處理人類語言,在偏通用的認知上尋找更大突破。”胡國平說。
應用廣泛
認知智能國家重點實驗室聚焦該領域的關鍵共性技術,也積極推進認知智能在各個行業落地
在科大訊飛研究院,沒有高精尖的儀器設備、沒有萌態十足的機器人,只見一排排工位、一臺臺電腦、一雙雙專注的眼睛。
“這就是認知智能實驗室的模樣。”胡國平指著眼前的場景說,“認知智能實驗室重點處理與人類語言相關的方面,所以在這里,看見的是計算機或超級計算機,還有像GPU這樣的處理器來訓練計算機深度學習。”
這是和很多計算機軟件公司類似的工作場景,但位于后臺的“大腦”提供的是基于語言信息的智能判斷。“兔子尾巴長不了,‘長讀chang還是zhang?”“爸爸舉不起兒子因為他太重了,這個他是指誰?”
為了處理這些對計算機而言還比較難的事,胡國平深知人才的重要性。除了培養研究知識圖譜和深度學習的研究員,認知智能實驗室也借助外腦。“2014年布局認知智能的時候,就與哈工大組建了聯合實驗室,現在與清華大學、浙江大學、加拿大皇后大學等都建有聯合實驗室。”
更為重要的是應用領域的行業專家。胡國平說:“認知智能研究必須要有各領域的專家一同參與,以便幫助機器更好地學習。”為此,認知智能實驗室和上海外國語大學高級翻譯學院、安徽省立醫院、最高人民法院等以不同方式形成聯合研究中心。
“目前,我們在自然語言方面有一些突破。雖然現在看起來還沒有本質的改變,但已有很大跡象表明將來機器有可能像人一樣去思考,用自然語言進行推理和理解,這是非常了不起的進步。”科大訊飛AI研究院副院長魏思告訴筆者。
“這一輪人工智能熱潮能否進一步打開天花板,形成更大規模,認知智能的突破是關鍵。”胡國平說,認知智能國家重點實驗室除了聚焦該領域的關鍵共性技術之外,還將推進認知智能在醫療、教育、司法等各個行業的落地。
認清“短板”
面向真實復雜的情況,如何能夠有效應對口語的自然語言處理,是認知智能系統應用中的難點
如今,在安徽合肥廬陽區雙崗街道衛生服務中心內,前來看病的市民發現,醫生身邊多了一個機器人“曉醫”。它由科大訊飛和清華大學聯合實驗室共同研發。
在學習了海量醫學書籍、一線專家經驗后,“曉醫”在2017年國家臨床執業醫師資格考試綜合筆試評測拿到456分,不僅超過360分的分數線,而且在所有考生中名列前5%。現在“曉醫”可以幫助醫生輔助診斷150種常見病。科大訊飛智慧醫療事業部總經理陶曉東介紹,目前“曉醫”已在北京301醫院、北京協和醫院、上海瑞金醫院、安徽省立醫院等近50家醫院“上崗”。
認知智能正在各行各業“大顯身手”。“比如輔助學生進行個性化學習時,通過借助大數據與人工智能技術,針對每一位學生生成個性化學情圖譜,精準推薦個性化學習資源,幫助學生高效學習。”科大訊飛教育BG副總裁丁鵬介紹說。認知智能還可以幫助整理出“錯題本”,“當學生做錯了一個題目,機器可舉一反三,給出基于錯題知識點的其他相似題目,讓學生不斷鞏固薄弱環節”。
實際應用中,認知智能系統也有“短板”。“比如醫學上說的‘三級疼痛,當病人形容‘疼得死去活來時,系統就判斷不出。”胡國平說,一方面,機器系統學習的是從教科書和互聯網上獲取的知識表述、病情案例,與真實情況下病人的現場表述有較大區別;另一方面,現實診斷中,醫生與病人需要對話和互動獲取更多病情信息,這對機器系統也是比較難的。
“認知智能技術面向真實復雜的情況,在用戶輸入不那么規范化、確定的時候,甚至用戶說得很模糊的情況下,如何能夠有效應對口語的自然語言處理,這是應用中的難點。”胡國平說。
市場對認知智能的需求越來越迫切。在司法領域,科大訊飛與上海高院啟動206項目,通過認知智能的算法,目前可對4類刑事案件進行輔助辦案。今年,結合市場需求,這樣的能力擴展到79項刑事案件。
前瞻技術
目前提及的認知智能很大程度上是限定的重復性腦力勞動,未來將把人類的理解能力復制給機器
認知智能國家重點實驗室建設明確,重點開展面向認知計算的深度學習共性技術、知識自動構建與推理技術等認知智能基礎理論的研究。究竟哪些是需要突破的共性技術?
“一個是語義理解,怎么理解人類的語言?第二是知識表示,怎么表示行業知識和通用知識?第三是邏輯推理,包括對知識的運用。”魏思告訴筆者。
這些技術會衍生出對人類產生巨大威脅的“仿生人”么?胡國平說:“至少在我們有生之年不用擔心。”他解釋說,目前所有提及的認知智能很大程度上是限定的重復性腦力勞動,接受明確任務、輸入輸出比較確定。“機器可以通過學習和訓練去改高考作文,但去改小說就不行了。真正人類的認知沒有那么多條條框框,自己會的就去用、不會的就要學,而機器還達不到這種通用的認知智能,更不可能有自我意識。”
實驗室下一步向哪個方向發展?“我們需要進一步賦予機器知識獲取能力、不斷學習能力和復雜推理能力。”胡國平說,“同時,我們也考慮建模真實世界的現象,讓機器形成更有整體感覺的認知智能,從而進行一些預測。比如,我們說‘這個人的性格像石頭一樣,人類在腦海中對石頭的概念不僅是這兩個字,還包括顏色、硬度、形狀等一系列綜合問題。這些關聯性的理解,機器目前無法做到,我們要把這種能力復制給機器。”
“當世界上所有機器都具備高質量的認知智能,就可以在更多領域和場景下幫助人類,創造出更大價值。通過不斷賦能,去建設更美好的世界。”胡國平說。
白海星 張沛