董超 畢曉君
【摘要】認知計算是人工智能的重要組成部分,是模擬人腦的計算機系統,近年來隨著大數據時代的到來得到廣泛關注.文中介紹了認知計算的相關概念,歸納總結了認知計算的國內外研究現狀,通過對計算機和人腦的區別分析,對認知計算的研究難點和重點進行了論述,提出認知計算的近期目標和遠期目標,最后給出認知計算的未來展望.
【關鍵詞】人工智能;認知計算;計算機系統;大數據
認知計算(Cognitive Computing)源自模擬人腦的計算機系統的人工智能.90年代后,研究人員開始用認知計算一詞,以表明該學科用于教計算機像人腦一樣思考,而不只是開發一種人工系統[1]。傳統的計算技術是定量的,并著重于精度和序列等級,而認知計算則試圖解決生物系統中的不精確、不確定和部分真實的問題,以實現不同程度的感知、記憶、學習、語言、思維和問題解決等過程[3]。目前隨著科學技術的發展以及大數據時代的到來,如何實現類似人腦的認知與判斷,發現新的關聯和模式,從而做出正確的決策,顯得尤為重要,這給認知計算技術的發展帶來了新的機遇和挑戰。目前國外關于認知計算的研究早于國內,但都屬于較為前沿的研究領域,發表的相關文獻較少,因此系統地了解認知計算,歸納總結目前國內外研究現狀,分析認知計算未來發展方向具有一定的重要意義,本文通過查閱相關資料,試圖給出較為準確的認知計算發展綜述。
1.認知計算的由來及定義
認知是人類的一個復雜行為動作,是人們推測和判斷客觀事物的心理過程,是在過去的經驗及對有關線索進行分析的基礎上形成的對信息的理解、分類、歸納、演繹和計算,人類的認知活動包括思維、語言、定向和意識4部分。
認知科學源于20世紀50年代,該名稱于1956年的一次信息論的科學討論會上提出。60年代,認知科學開始發展起來。1976年,《認知科學》期刊創刊,1979年由Roger Schank, Allan Col lins, Donald Norman及其他一些心理學、語言學、計算機科學和哲學界的學者共同成立了認知科學協會,使認知科學得到了迅速的發展,成為了一個備受關注的學術研究領域。90年代,有人將認知科學定義為研究智能和智能系統的科學[4]。如今世界上已有60多所大學擁有認知科學的相關課程。對于認知科學的含義有著多種不同的解釋,總體上,認知科學是一門以現代科學的觀點,用科學的方法研究人的精神世界的學科。認知科學是包含了心理學、語言學、神經科學和腦科學、計算機科學,以及哲學、教育學、人類學等許多不同領域學科的一門廣泛的綜合性科學。其中認知計算是認知科學的子領域之一,也是認知科學的核心技術領域,認知計算對于未來信息技術、人工智能等領域均有著十分重要的影響。
認知計算最簡單的工作是說話、聽、看、寫,復雜的工作是輔助、理解、決策和發現.認知計算是一種自上而下的、全局性的統一理論研究,旨在解釋觀察到的認知現象(思維),符合已知的自下而上的神經生物學事實(腦),可以進行計算,也可以用數學原理解釋。它尋求一種符合已知的有著腦神經生物學基礎的計算機科學類的軟、硬件元件,并用于處理感知、記憶、語言、智力和意識等心智過程。認知計算的一個目標是讓計算機系統能夠像人的大腦一樣學習、思考,并做出正確的決策。人腦與電腦各有所長,認知計算系統可以成為一個很好的輔助性工具,配合人類進行工作,解決人腦所不擅長解決的一些問題。認知計算時代,計算機將成為人類能力的擴展和延伸。認知計算意味著更高效的信息處理能力、更加自然的
人機交互能力、以數據為中心的體系設計,以及類似人腦的自主學習能力,這為人類應對大數據挑戰開啟了新方向。
理想狀態下,認知計算系統應具備以下四個特性[5]。
第一,輔助(Assistance)功能。認知計算系統可以提供百科全書式的信息輔助和支撐能力,讓人類利用廣泛而深入的信息,輕松成為各個領域的“資深專家”。
第二,理解(Understanding)能力。認知計算系統應該具有卓越的觀察力和理解能力,能夠幫助人類在紛繁的數據中發現不同信息之間的內在聯系。
第三,決策(Decision)能力。認知計算系統必須具備快速的決策能力,能夠幫助人類定量地分析影響決策的方方面面的因素,從而保障決策的精準性。認知計算系統可以用來解決大數據的相關問題,比如通過對大量交通數據的分析,找出解決交通擁堵的辦法。
第四,洞察與發現(Discovery)。認知計算系統的真正價值在于,可以從大量數據和信息中歸納出人們所需要的內容和知識,讓計算系統具備類似人腦的認知能力,從而幫助人類更快地發現新問題、新機遇以及新價值。
2.認知計算的國內外研究現狀
在國外認知計算受到了政府、研究機構以及研究人員的高度重視。2002年,美國國家科學基金會(NSF)和美國商務部(DOC)共同資助了一個雄心勃勃的計劃“聚合四大技術,提高人類性能”,將納米技術、生物技術、信息技術和認知科學看作21世紀四大前沿技術,并將認知科學視為最優先發展領域,主張這四大技術融合發展,并描繪了這樣的科學前景:“聚合技術以認知科學為先導。因為一旦我們能夠在如何、為何、何處、何時這四個層次上理解思維,我們就可以用納米科技來制造它,用生物技術和生物醫學來實現它,最后用信息技術來操縱和控制它,使它工作”。在歐洲,由歐盟資助的聚合技術及其對社會科學與人文科學的影響項目也同樣強調了認知科學的重要性.在學術研究界,2006年由IBM阿爾馬登研究中心發起了2006年認知計算會議,該會議取得了良好的效果。2007年又在加州大學召開了認知計算會議。美國國防高級研究計劃署信息處理技術中心2003年開始資助的認知計算項目的重點也是研制一種能夠對環境、目標和自身能力進行思考,具有學習能力,能與使用者互動并解釋其推理,以及應對突發事件能力的認知計算機系統。近年來IBM公司成為認知計算的研究先鋒,2011年,IBM開發的neurosynaptic(神經突觸)計算機芯片為現代認知計算的研究拉開了帷幕。2012年,在美國猶他州鹽湖城舉行的“超級計算機大會”上,IBM發布了其關于認知計算的最新研究成果——《Compass:一個認知計算架構的可擴展的模擬器》,這種芯片技術是模擬一個人腦,并且完成人腦的各種功能[6]。2013年10月2日,IBM研究院宣布成立“認知計算研究聯合會”。據了解,以IBM沃森(Watson)為代表的認知計算系統通過對大數據進行實時運算和分析,實現了自主學習并擁有了類似人腦的能力,它有效地提供信息,并且按我們的條件在人們每天面對的眾多的自然語言內容里搜尋關鍵知識。并且已經成功應用于醫療、金融和客戶服務等領域,以其更加智能、精準的大數據分析能力,降低誤診、拯救生命和提升客戶體驗。IBM近日又宣布將與卡內基梅隆大學、麻省理工學院、紐約大學和倫斯勒理工學院四所大學合作制造一種類似人類大腦的計算機,將能夠處理自然語言和非結構化數據,像人類一樣通過經驗進行學習。
我國對認知科學及認知計算的研究尚處于起步階段,多數研究是對國外相關研究的介紹和總結。國內涉及該領域的研究人員多數是哲學、心理學領域和信息技術領域。許多研究雖然涉及認知計算技術,但多數將其納入人工智能的研究,很少使用認知計算這一概念,至今還沒有關于認知計算的綜述文章。2008年國家自然基金委員會發布了“視聽覺信息的認知計算”重大研究計劃,重點包括多模態信息協同計算、自然語言(漢語)理解、腦-機接口、駕駛行為的認知機理和無人駕駛車輛集成驗證平臺等領域,該重大計劃的實施將有力地推動我國認知計算領域相關研究的發展,截止到目前已在視聽覺信息處理的基礎理論研究方面取得重要進展,在視聽覺信息計算以及與視聽覺認知相關的腦-機接口等關鍵技術方面取得重大突破。2013年10月11日,在北京舉辦以“從大數據到認知計算”為主題的認知計算研討會,達成“我們已經進入了認知計算(Cognitive Computing)的新時代”的共識,2013年11月13日在MDCC 2013移動開發者大會上中國工程院院士李德毅發表了題為《大數據時代的認知計算》的演講,充分體現了當前我國學者對認知計算技術方面研究的高度重視[7]。
3.認知計算目前研究的重點和難點
人類的認知主要依靠大腦來實現,為了能夠讓機器像人一樣具有認知能力,有必要深入探討和研究人腦與計算機在存儲和處理信息時的區別,來確定認知計算的研究目標以及研究的重點和難點。
就目前生物學家和神經學家對大腦研究成果可知,人類大腦將記憶和存儲整合成一體,重量小于3磅,占用體積大約兩升,卻比燈泡更加節能,人腦大約包含1011個神經元,每個神經元大約有103~104個樹突及相應的突觸,形成極為錯綜復雜而靈活多變的神經網絡,雖然每個神經元的運算功能十分簡單,且信號傳輸速率也較低(大約100次/秒),但由于各神經元之間形成的網絡結構具有極極度并行互連功能,使人的大腦能夠高速處理復雜信息。人類大腦的運行就像是一個大規模并行分布式處理器,屬于事件驅動方式,也就是說它對其所處環境中的事物做出反應,活動狀態時耗能較少,休息狀態下更少。人類大腦會重復利用神經元,并突觸、異步、并行、分布式、緩慢、不具通用性地處理問題,是可重構的、專門的、容錯的生物基質,并且人腦記憶數據與進行計算的邊界是模糊的。
而現代計算機是基于馮諾依曼結構的二進制存儲和中央處理器的分離機制,它的運行大部分是按照順序依次進行的,并由一個時鐘控制。這個時鐘就像是軍樂隊的一個指揮,將每一個指令和每一份數據驅動到下一個位置——就像有足夠空位的音樂搶椅子游戲。隨著時鐘增速以更快驅動數據處理速度,功耗也隨之大幅上升,甚至在休眠時這些機器也需要大量的電能。更重要的是,編程是必不可少的.它們由電線連接,并且容易出現故障。它們善于執行的是預定義的算法以及分析工作。一般情況下計算機使用固定的數字化的程序模型,同步、串行、集中、快速、具有通用性地處理問題,數據存儲與計算過程在不同地址空間完成。
由此可知,人類大腦和現代計算機具有完全不同的架構,它們的存儲和處理機制完全不同,無論我們再努力多少年,以現代計算機為基礎的認知計算無法模擬人腦的功能和實時反應,不能像人類大腦一樣實現靈活而高深的認知過程,完成這個任務需要一個新穎的架構,這正是認知計算目前面臨的難點和重點。
認知計算是一項系統工程,涉及多個領域的技術,目前研究學者公認的認知計算的四大關鍵技術為以下四個方面[6]。
第一,在認知計算最頂層的是機器學習、自然語言理解和人機交互等技術。
第二,大數據技術,包括以什么樣的方式來存儲、組織、管理及分析大數據等。
第三,計算機的架構。認知計算系統所要求的計算能力遠高于我們今天所能提供的計算能力。因此,如何實現以數據為中心的系統設計也是當前面臨的挑戰。
第四,在認知計算系統的底層還需要實現原子及納米等技術方面的突破。
在上述認知計算的四個關鍵技術中,由于人腦與計算機有著本質區別,就目前認知計算的研究現狀,其研究方向應該分為近期目標和遠期目標,其中近期目標是認知計算的研究重點,遠期目標是認知計算的研究難點。
作為認知計算的近期目標就是在計算機上盡可能像人類一樣實現具有輔助、理解、決策和洞察與發現的能力,通過研究人類的認知機理,建立計算機認知模型,然后用計算機模擬人類認知的過程來處理實際問題,如目前正在處于研究階段的人工智能機器學習、自然語言理解、視聽覺信息的識別以及智能人機交互技術的研究等,而基于計算機的任何認知研究成果都無法實現機器認知的實質突破。
作為認知計算的遠期目標應該是研究一個具有與大腦存儲結構相似的電子大腦,新的電子大腦完全不同于目前的計算機存儲和處理機理,而它像人類大腦一樣實現靈活而高深的認知過程,為此我們需要不懈的努力,真正弄清人類大腦存儲和處理信息的機理,建立合理的數學模型,并通過軟硬件設計實現在存儲和處理方面具有新機制的全新電子大腦結構,力爭創造一種能夠與真正人類大腦相比擬的新型智能機器。
IBM阿爾馬登研究中心在這個方面進行了有益而尖端的研究,給認知計算的未來發展帶來信心。他們設計了神經形態自適應塑料可伸縮電子系統,為大腦的接線圖繪制地圖并開始人工合成,2009年5月他們成功地模擬建立了一個由10億個神經元組成的系統,大約相當于一個較低等哺乳動物的大腦,系統結構同今天的計算機完全不同。存儲器與處理器組件被緊密結合在一起,它沒有時鐘,操作是不同步的、事件驅動的,也就是說,它們沒有預定的次序或時間表,像人類一樣依賴的是學習而非編程。但其處理速度是實際事件發生速度的千分之一,不足以執行人類基本行為:覓食、打架、逃跑和交配。
2012年9月該實驗室模擬大腦建成了一個較小版本的硬件裝置,只有256個神經元、26.2萬個可編程突觸和6.5萬個學習突觸,并且這臺機器運行能耗跟大腦的耗能在同一個數量級上。基于其原生態能力,這個“小型人腦”可以進行空間導航、機器視覺、模式識別以及聯想記憶等,并可以基于證據生成假設。它有一個“心靈之眼”,可以辨別出事物背后的模式,例如根據一個潦草的筆記,對其實際所代表的數字做出較為準確的猜測,這一成果已經比我們前寒武紀的祖先優秀了。
4.認知計算的未來展望
在下一個計算時代,計算系統將具備學習、適應和感知的能力,這將從根本上改善人們的生活、工作和人際交往的方式,這就是認知計算時代,計算機將成為人類能力的擴展和延伸。認知計算意味著更高效的信息處理能力、更加自然的人機交互能力、以數據為中心的體系設計,以及類似人腦的自主學習能力,這為人類應對大數據挑戰開啟了新方向。
可以相信,隨著認知計算技術的發展,認知計算系統所具備的四個層次的特性——輔助、理解、決策、發現,將是人類面對大數據時代的挑戰、做出智慧決策的保障.百科全書式的信息輔助和支撐,讓人類可以利用廣泛而深入的信息,輕松成為各個領域的“資深專家”;非凡的觀察和理解能力,幫助人類在紛繁信息中發現其內在的關聯和涌現的趨勢;快速決策能力,幫助人類定量地分析影響決策的方方面面,降低失誤,保障決策的精準性;發現及洞察能力,將實現從“演繹”到“歸納”的突破,真正讓機器具備類似人腦的“認知”能力,幫助人類發現當今計算技術無法發現的新洞察,新機遇及新價值。
目前作為認知計算系統的先鋒,IBM的沃森系統已經應用于醫療、金融和客戶服務等領域,以其更加智能、精準的大數據分析能力,降低誤診、拯救生命和提升客戶體驗[7]。
2013年9月18日國家自然基金委公布2013年度關于認知計算的重大研究計劃,重點支持如下兩個領域,將是目前我國在認知計算領域的未來研究方向。
(1)基于視聽覺認知機理的無人駕駛車輛與行駛環境理解。
針對無人駕駛車輛行駛需求,研究生物視聽覺信息處理不同階段的認知機理和計算模型:包括視聽覺信息早期處理(視聽覺信息預處理與增強)、中期處理(降維、特征選擇與提取)和后期處理(分類、識別與理解)等不同階段的認知機理與可計算模型。
1)基于視聽覺認知機理的無人駕駛車輛
該集成項目要充分集成和體現在本重大研究計劃資助下所取得的有關視聽覺信息認知機理與計算機視覺方面的重要創新性成果,同時還要集成和體現在本重大研究計劃資助下所研發的智能車關鍵技術與器件(如控制器、激光雷達、傳感器和芯片技術等),研制無人駕駛車輛平臺,實現復雜交通環境下高性能長距離自主行駛。
2)基于生物視覺機理的交通環境理解與目標檢測
研究基于生物視覺機理及其視覺皮層信息處理機制的交通環境理解新模型和高效視覺信息處理方法。
(2)先進腦機接口與腦認知圖像重建.
1)先進腦機接口
借鑒認知科學的已有研究成果,重點研究人腦行為意圖信息可靠、快速獲取、處理、分析和應用的新方法與新技術。
2)腦認知圖像三維重建
重點研究人在一種或多種腦神經影像設備下的視覺場景激勵方法、腦神經影像的表征與時空關聯關系以及視覺場景激勵與腦認知影像之間的數學映射模型,給出動態腦認知影像的三維重建模型和方法,探索理解與重現腦認知過程。
未來,認知計算在人類生活的各個方面都將帶來根本性的改變.可以想象,在實時金融風險控制領域,認知計算技術可以讓人們實現秒級的風險檢測與防范;在教育領域,認知計算通過實時分析技術,為學習者制定個性化的教育計劃并及時評估學習效果,以此優化教育方案,提高教育質量和效率。
5.結束語
認知計算是一個能夠給人類生活帶來不可思議變化的智能技術,文中通過對認知計算相關文獻的歸納總結,綜述了目前認知計算的國內外研究現狀,通過分析計算機與人腦的區別,給出了今后研究的遠期近期目標以及未來展望,對認知計算的總體認識和深入的研究具有一定益處。總之認知計算是一個貫穿整個計算機軟硬件的整體創新,它的實現需要來自各個領域科學家的共同努力,需要一個漫長而艱苦的研究過程,但是認知計算技術的發展,必將是未來科技發展的趨勢。
參考文獻
[1]史忠植.認知計算[M].合肥:中國科學技術大學出版社,2008.
[2]瞿心昱.基于仿人腦認知計算模型的機器人視覺學習方法[D].浙江:浙江工業大學,2012.
[3]王志良,鄭思儀,王先梅,王巍.心理認知計算的研究現狀及發展趨勢[J].模式識別與人工智能,2011,24(2):215-225).
[4]徐峰,冷伏海.認知計算及其對情報科學的影響[J].情報雜志,2009,28(6):19-23.
[5]郭濤.認知計算更好駕馭大數據[N].中國計算機報(數據中心),2013-10-21(18).
[6]何立中.認知計算架構突破傳統模式[N].中國計算機報(熱點觀察),2012-12-10(7).
[7]申明.電腦會思考,認知計算前景廣闊[N].科技日報,2013-10-28(4).
基金項目:國家自然科學基金項目(編號:61175126);中央高校基本科研業務費專項資金項目(編號:HEUCFZ1209);高等學校博士學科點專項科研基金項目(編號:20112304110009)。
作者簡介:
畢曉君(1964—),女,哈爾濱工程大學信息與通信工程學院教授,博士生導師,主要研究方向:智能信息處理、圖像處理。
董超(1984—),男,碩士研究生,現供職于哈爾濱工程大學,主要研究方向:智能信息處理。