999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

智能機器的認知學習機理及計算模型研究

2021-03-11 03:34:44吳麗華龍海俠馮建平
電子技術與軟件工程 2021年21期
關鍵詞:人類智能模型

吳麗華 龍海俠 馮建平

(海南師范大學 海南省??谑?571158)

1 機器學習及背景

學習是人類具有的一種重要智能行為,機器學習(ML, Machine Learnning)是研究如何使用機器來模擬人類學習活動的一門學科,它研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能并不斷改善自身的性能。機器學習是人工智能技術的核心,它根據生理學、認知科學等對人類學習機理進行研究,建立人類學習過程的認知模型或計算模型,并且通過學習算法建立具有特定應用的學習系統。近年來采用機器學習方法的計算機程序被成功用于機器人下棋程序、語音識別、信用卡欺詐監測、自主車輛駕駛、智能機器人等應用領域,同時機器學習的理論方法還被廣泛用于大數據集的數據挖掘。人工智能(AI)的概念在1956年達特茅斯會議被提出時,就是希望實現機器智能和制造智能機器人,實現機器具有人的感知、行動、推理與決策的智力,能夠用機器來模仿和執行人腦的某些智能功能。2006年深度學習、卷積神經網絡取得突破性進展,2016年的人機大戰AlphaGO 以4:1 戰勝圍棋世界冠軍李世石,機器智能(Machine Intelligence)開始受到世界關注,機器學習成為了產業和學術界的研究熱點。

當前機器學習行業應用有三種主要場景:

(1)第一種場景,機器能夠部分替代人工甚至完全替代人工作。這種場景機器在得到數據完全輸入情況下就可以準確輸出結果。如科大訊飛的智能語音識別技術,識別準確率已超過97%;香港中文大學教授團隊研發的DeepID 人臉識別技術的準確率也超過99%,比人類肉眼識別更加精準。

(2)第二種場景,機器無法完全替代人而是輔助人進行工作。在這一種場景下人和機器相互協作,輸入數據需要理解與知識推理、思維判斷的工作。2019年8月北京師范大學研究團隊發布了《2019全球教育機器人發展白皮書》,經過統計問卷調研結果發現,將不同用戶群體提出的需求匯總歸納出教育機器人可扮演 17 種角色,它們分別是機器人學習助理、機器人學習伙伴、機器人教具、機器人健康助理、機器人生活伙伴等,其中“智慧學伴”機器人作為學習伙伴可以參與學習者的學習過程、協助學習時間管理以及情感支持等。

(3)第三種場景,機器完全可以取代人進行創意和想象力的工作。這種場景下沒有輸入數據,主要靠機器創意的工作,創意的過程變為數據形成某種模型,這種模型運算之后產生的結果再進行評估,再迭代這種運算。比如兒童成長機器人就是“能理解會思考”,五米內語音識別率為97%,可識別25 種語言類情感,它具備自學的功能。但是當前所謂智能機器人可以繪圖、作曲和寫詩,都是數據驅動下編碼生成的作品。智能機器人會部分取代人類工作,可以在25 秒內生成稿件寫出一篇速報,但是它無法完全取代和做到像人一樣的有情感流露、想象力的創意寫作。

2 機器學習的三個認知層次

我們從智能機器學習認知的視角,當前機器學習演化發展的三個層次分別是:運算智能(底層計算)、感知智能(淺層感知)和認知智能(深度理解),各個層次都有實現達成的認知智能目標,如圖1所示。

圖1:機器智能的三個認知層次

第一層,運算智能(CI,Computational Intelligence)即機器具備超常的存儲能力和超快的計算能力,可以基于海量數據進行深度學習,利用歷史經驗指導當前環境。自1997年IBM Deep Blue(深藍)計算機擊敗了國際象棋冠軍卡斯帕羅夫,機器在強運算力、大數據存儲能力方面就戰勝了人類?,F階段隨著計算力不斷提升,存儲手段的不斷升級,機器的運算智能(底層認知)已經實現了。

第二層,感知智能(PI,Perceptual Intelligence)即視覺、聽覺、觸覺等感知能力,人和動物都具備能夠通過各種智能感知能力與自然界進行交互。機器在感知世界方面比人類更有優勢,人類都是被動感知的,但是機器可以主動感知,如自動駕駛汽車就是通過激光雷達、紅外雷達等感知設備和深度學習算法來實現感知智能,現在的智能機器人可以做到語音識別率為99%,可識別25 種語言類情感。無論BigDog 感知機器人還是自動駕駛汽都充分利用了深度神經網絡(DNN,Deep Neural Network)和大數據的成果,機器在感知智能(中層認知)方面已經接近于人類。

第三層,認知智能(CI,Ccognitive Intelligence)是讓機器像人一樣“能理解會思考”即機器思維,如專家系統、機器學習、計算機下棋、計算機作曲繪畫、計算機輔助設計、計算機證明定理等。迄今最新版AlphaGo Zero 自我學習能力,使用強化學習(RL,Reinforcement Learning)將價值網絡和策略網絡整合為一個架構,3 天訓練后就以100 比0 擊敗了上版AlphaGo。智能陪伴兒童成長的機器人當你問了一個它不懂的問題,第二次再問時它就學會了,這就是它自我學習的能力。

人工智能技術經過多年迭代發展,大數據、超運算力和深度學習算法將機器學習能力不斷提升,在運算能力和存儲能力、“聽、說、看”等感知智能領域已經達到或超越了人類水準,但在需要外部知識、邏輯推理或者領域遷移的深層認知智能領域還處于初級階段。未來機器的認知智能將從認知心理學、腦科學及人類社會經驗中獲取靈感,并結合跨領域知識圖譜(KG)、因果推理(CR)、持續學習等技術,建立穩定獲取和表達知識的有效機制,讓知識能夠被機器理解和運用,實現機器學習智能從淺層感知識別到深層認知理解的提升。

3 機器感知的計算模型

機器感知(MP, Machine Perception)研究如何用機器來模擬、延伸和擴展人的感知能力,主要包括:機器聽覺、機器視覺、機器觸覺等內容,如計算機視覺(CV)、模式識別和自然語言理解,而機器感知智能就是讓機器具備視覺、聽覺、觸覺等感知能力,將多元數據結構化或形式化并用人類熟悉的方式去溝通和互動。

3.1 感知器神經元模型

感知計算(PC,Perceptual Computing)作為AI 領域最新機器學習的熱點技術,著重于模擬復制人類思維過程,它基于對海量大數據的處理,理解符號化、概念化的信息,可以和人類進行最自然的人性化交互,模擬人類的思考和記憶方式,從而達到更高層的數據理解,比如蘋果Siri 和亞馬遜Alexa 等人工智能助理。感知器是由美國心理學家Frank Rosenblatt 于1957年提出的一種具有單層計算單元的神經網絡。感知器可謂是最早的人工神經網絡,如圖2所示給出了單層感知器神經元模型圖,單層感知器是一個具有一層神經元、采用閾值激活函數的前向網絡。1958年提出了模式分類問題的感知器(Perceptron)模型;1984年霍普菲爾德網絡被推出讓人工神經網絡具備了記憶功能;2006年深度學習、卷積神經網絡取得突破性進展。用于解決分類問題的感知器是一種二類線性模型,如圖3所示。感知器模型選擇f(x)為二值輸出,感知器的分類與參數{W,θ}緊密相關,要實現對輸入分類,就是確定如何調節參數{W,θ},這實際上就是一種學習的過程,如無監督學習的Hebb 學習規則模型、有監督學習的Delta 學習規則模型等。

圖2:單層感知器神經元模型圖

圖3:二類線性的感知器模型

赫布提出的Hebb學習規則為神經網絡的學習算法奠定了基礎,在此基礎上研究提出了各種學習規則和算法。Hebb 學習規則與心理學“條件反射”機理一致,赫布理論認為在同一時間被激發的神經元間的聯系會被強化,變化的量與兩個神經元的活性之和成正比,并且已經得到了神經細胞學說的證實。Delta 學習規則是一種簡單的有導師學習算法,根據神經元的實際輸出與期望輸出差別來調整神經元到神經元之間的連接權。

3.2 機器聽覺的語音識別模型

基于人工智能的語音交互技術能夠使機器像人一樣“能聽會說”,它的主要底層技術包括:語音合成、語音識別和自然語言理解,如圖4所示。語音合成也稱文字轉語音(TTS),它是將計算機自己產生的或外部輸入的文字信息轉變為可以聽得懂、流利的漢語或其他口語輸出技術。語音合成包括的步驟有:

圖4:語音識別與語音合成的示意圖

(1)語義分析,主要模擬人對自然語言的理解過程,使機器對輸入的文本能完全理解,如文本規整、詞的切分、語法分析和語義分析等;

(2)韻律處理,為合成語音規劃出音段特征,使合成語音能正確表達語意并更加自然;

(3)聲學處理及合成語音。

語音識別(ASR, Automatic Speech Recognition)是將人類的語音中的詞匯內容轉換為計算機可讀的二進制編碼或者字符序列,語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等。語音識別的方法主要有三種:基于聲道模型、語音知識和模板匹配以及人工神經網絡方法,其中模板匹配方法要經過特征提取、模板訓練、模板分類、判決這四個步驟。語音識別常用的技術有:動態時間規整(DTW)、隱馬爾科夫(HMM)理論和矢量量化(VQ)技術,其中最重大突破是隱馬爾科夫模型(HMM,Hidden Markov Model)的應用。1952年貝爾實驗室實現了10 個英文數字的識別,其識別方法是跟蹤語音中的共振峰,早期的語音識別系統是簡單的“孤立詞識別系統”。1960年人工神經網絡被引入了語音識別,兩大突破是線性預測編碼(LPC)及動態時間規整(DTW)技術。80年代語音識別開始從孤立詞識別系統向“大詞匯量連續語音識別系統”發展,兩個關鍵技術是隱馬爾科夫模型(HMM)理論和NGram 語言模型的應用,其中HMM 模型是用來描述隱含未知參數的統計模型,如圖5所示。2009年開始轉向基于深度神經網絡(DNN)的語音識別系統(DNN-HMM)的研究,其中DNN 的優勢在于:

圖5:隱馬爾可夫模型的狀態變遷圖(例子示意)

(1)使用DNN 估計HMM 的狀態后驗概率分布,不需要對語音數據分布進行假設;

(2)輸入特征可以是多種特征的融合;

(3)可以利用相鄰的語音幀的結構信息,如圖6所示。

圖6:深度神經網絡的語音識別模型

3.3 機器視覺的圖像識別模型

機器視覺(Machine Vision )是用機器模擬人類視覺,從圖像識別檢測實際生活中三維物體的形態及其運動情況。機器視覺的研究是從20世紀60年代中期美國學者L.R.羅伯茲關于理解多面體組成的積木世界研究開始的,羅伯茲在圖像分析過程中采用了自底向上的圖像分割方法。在圖像理解研究中A.古茲曼提出運用啟發式知識,表明用符號過程來解釋輪廓畫的方法不必求助于諸如最小二乘法匹配之類的數值計算程序。

70年代機器視覺形成幾個重要研究分支:

(1)目標制導的圖像處理;

(2)圖像處理和分析的并行算法;

(3)從二維圖像提取三維信息;

(4)序列圖像分析和運動參量求值;

(5)視覺知識的表示;

(6)視覺系統的知識庫。

機器視覺技術主要包括圖像增強、數據編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與圖像理解等。機器視覺系統能自動獲取一幅或多幅目標物體圖像,對所獲取圖像的各種特征量進行處理、分析和測量,并對測量結果做出定性分析和定量解釋。

3.3.1 圖像理解

如圖7所示,圖像理解有三個層次:一是分類,將圖像結構化為某一類別的信息,用實例ID 來描述圖片。二是檢測,關注特定的物體目標,要求同時獲得這一目標的類別信息和位置信息。三是分割,包括語義分割和實例分割,機器視覺技術會模擬人的視覺功能,并從所監測區域內的事物中采集、挖掘相關數據信息,并進行數據二次分析、提煉處理。機器視覺的應用有機器人視覺、人臉識別、無人駕駛汽車、文字識別和追蹤定位等。

圖7:圖像理解的三個層次

3.3.2 機器人的“像素”顏色分類識別

機器人的視覺識別主要是利用顏色、形狀等信息來識別環境目標,以機器人對顏色的識別為例:當攝像頭獲得彩色圖像以后,機器人上的嵌入計算機系統將模擬視頻信號數字化,將“像素”根據顏色分成兩部分:感興趣的像素(搜索的目標顏色)和不感興趣的像素(背景顏色),然后對這些目標顏色的像素進行RGB 顏色分量的匹配,如圖8所示。

圖8:視頻圖像的像素級分類

“像素”顏色分類常用的方法有線性色彩閾值法、最近鄰域法和閾值向量法等。

(1)線性色彩閾值法是用線性平面把色彩空間分割開來,其閾值的確定可采用直接取閾值或通過自動訓練來獲取,也可以采用神經網絡和多參數決策樹方法來進行自學習獲得合適的閾值;

(2)最近鄰域分類法分割圖像時,則利用隸屬度函數,根據最大的隸屬度來判斷這個顏色屬于的類別;

(3)閾值向量法是先使用一組事先確定的閾值向量來把色彩值在色彩空間中的位置來判斷其屬于哪種顏色。通常以上方法在色彩分類識別之后要對分類后的像素進行一次掃描,即將相鄰的同種顏色的像素連成色塊。但是相對于人類的視覺能力,這種視覺感知智能方法只有分類類別,缺乏對實例內涵與外延的抽象與延伸,缺乏對不同概念之間關系的理解,缺乏基于知識的推理及對常識經驗的利用等。

3.4 自然語言理解的詞向量模型

(1)詞袋模型:在自然語言處理(NLP)和信息檢索中作為一種簡單假設,詞袋模型把文本(段落或者文檔)看作是無序的詞匯集,忽略語法和單詞的順序,計算每個單詞出現的次數,常被用在文本分類中,如貝葉斯算法、LDA 和LSA 等。

(2)詞向量模型:深度學習帶給自然語言處理最大的突破是詞向量(Word Embedding)技術。詞向量技術是將詞語轉化成為稠密向量。在自然語言處理應用中,詞向量作為機器學習、深度學習模型的特征進行輸入。詞對文本內容的處理簡化為K 維向量空間中的向量運算,而向量空間上的相似度可以用來表示文本語義上的相相似度。Hinton 在1986年提出了考慮語義距離的詞向量表示方法,它是一種低維實數向量,最大的貢獻就是讓相似的詞在距離上更接近。

常用的詞向量模型主要有:

(1)LSA 矩陣分解模型,采用線性代數中的奇異值分解方法,選取前幾個比較大的奇異值所對應的特征向量將原矩陣映射到低維空間中,從而達到詞矢量的目的。

(2)PLSA 潛在語義分析概率模型,從概率學的角度審視矩陣分解模型,并得到一個從統計概率角度上推導出來的詞矢量模型。

(3)LDA 文檔生成模型,按照文檔生成的過程,使用貝葉斯估計統計學方法,將文檔用多個主題來表示,不僅解決了同義詞的問題,還解決了一次多義的問題,如差分貝葉斯方法及Gibbs Samplings 采樣算法。

(4)Word2Vec 模型,通過訓練將每個詞映射成K 維實數向量(超參數),通過詞之間的距離來判斷它們之間的語義相似度。其采用一個三層的神經網絡,核心的技術是根據詞頻用Huffman 編碼,使得所有詞頻相似的詞隱藏層激活的內容基本一致,出現頻率越高的詞語,他們激活的隱藏層數目越少,這樣有效的降低了計算的復雜度。Word2Vec 算法就是將詞表征為實數值向量的一種高效的算法模型,其利用深度學習的思想,通過訓練把對文本內容的處理簡化為K 維向量空間中的向量運算,而向量空間上的相似度可以用來表示文本語義上的相似度。Word2Vec 輸出的詞向量可以被用來做很多NLP 相關的工作,如聚類、找同義詞、詞性分析等。由于數據大幅度增強、計算力大幅度提升,以卷積神經網絡(CNN)、循環神經網絡(RNN)為代表的深度模型,可以隨著模型復雜度的增大而增強數據的映射關系,因此深度學習方法開始大量引入到自然語言處理技術(NLP)領域,在機器翻譯、問答系統、自動摘要等方向取得成功應用。

4 機器認知的計算模型

人類有了語言才有概念、意識、觀念和推理等人類認知智能的表現,概念是一個知識框架的組成部分。機器認知(MR,Machine Recognition)是研究如何用機器來模擬、延伸和擴展人的認知能力。實現認知計算要解決三個問題:

(1)提出一個既符合認知機理又與計算對應的認知計算模型,通過算法描述人類認知過程的細節。

(2)認知表征的描述和量化,心理學家注重外部世界的心理表征,而計算機科學家注重物理特征的抽取和表示。

(3)建立物理特征和心理表征的映射,能夠實現認知計算模型(Cognitive Computing),如借鑒心理學基礎理論和認知機制可構建視覺認知負荷、視覺顯著特征、舒適度與視頻特征、情感詞語等這些映射。

關于認知模型(CM, Cognitive Model)通??梢苑譃槿悾焊拍钅P汀祵W模型和計算模型。其中,認知心理學領域的認知模型是以概念模型為主,概念模型采用非形式語言定性描述事物的本質、關系和過程;而數學模型利用數學公式描述變量之間的關系。目前主流的認知計算模型主要分為:

(1)符號模型(功能模擬,認知心理學),以人腦的心理模型為基礎將問題或知識表示成某種邏輯網絡,采用符號推演的方法來實現搜索、推理和學習,模擬人腦的思維。如ACT-R,EPIC,SOAR 等符號模型通常用產生式規則去解釋、描述和支配腦部活動,因此只是從宏觀上近似地描述人類的認知過程和結果。

(2)神經網絡模型(結構模擬,認知神經科學),以人腦的生理結構和工作機理為基礎,對人腦的神經細胞及其構成的神經網絡進行研究,采用神經計算的方法來實現學習、聯想、識別和推理。2016年深度學習(DL, Deep Learning)作為一種類似于人腦結構的人工智能算法,應用于圖像和語音識別已經產生了突破性的研究進展。深度學習采用了學習分層特征表示方法,以深度卷積神經網絡(DCNN)為基礎帶來接近于人類的視聽覺感知能力,以及超越人類的棋類動態博弈能力,如AlphaGo 以深度強化學習與蒙特卡洛樹搜索的結合方法開啟了認知智能探索,且無需大數據支持且可自主進行學習。

目前“認知即計算”已經成為認知科學的主流,認知科學家們將人腦的認知過程與計算機處理信息的過程進行類比,從而構建認知的計算理論,使機器模擬人類認知過程成為可能。綜合認知心理學和認知神經科學關于認知加工階段和加工通路的研究,將人類的認知機理歸納為一個可計算的認知階段-通路模型,如圖9所示的PMJ 認知架構模型,建立了完整的信息加工過程和通路架構,給出了認知與計算的對應關系,圖中虛線框內可以為認知模型,概括了認知的主要過程,包括感知、記憶和判斷等三個階段和快速加工、精細加工和反饋加工三類通路。

圖9:PMJ 認知框架模型

5 結束語

目前機器學習在感知、認知方法方面還面臨著挑戰問題:

(1)缺乏認知水平的理解能力;

(2)缺乏知識推理能力;

(3)缺乏利用常識經驗舉一反三的小樣本學習能力;

(4)缺乏可解釋性以及高層規劃、決策與組織能力。

自2013 以來大數據和人工神經網絡(ANN)計算驅動的深度學習已成為計算機視覺、語音合成、自然語言處理和大數據分析的主流方法,深度卷積神經網絡使大數據感知智能取得突破性進展,獲得更加接近于人類水平的視覺聽覺感知能力和自然語言處理能力。當前急需發展下一代結合知識驅動的認知智能方法,迫切需要將數據驅動方法與知識驅動方法相結合,探索具有理解與知識推理能力的新一代認知智能理論與通用的賦能研究范式。

猜你喜歡
人類智能模型
一半模型
人類能否一覺到未來?
重要模型『一線三等角』
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
重尾非線性自回歸模型自加權M-估計的漸近分布
1100億個人類的清明
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
主站蜘蛛池模板: 在线观看91香蕉国产免费| 大陆国产精品视频| 丰满人妻中出白浆| 欧美日韩资源| 亚洲精品人成网线在线| 久久久久久久久久国产精品| 中文字幕在线欧美| 无码AV动漫| 婷婷激情亚洲| 波多野结衣在线一区二区| 综1合AV在线播放| 视频二区国产精品职场同事| 国产精品刺激对白在线| 成人一级免费视频| 白浆视频在线观看| 东京热高清无码精品| 青青草国产免费国产| 少妇高潮惨叫久久久久久| 国产麻豆aⅴ精品无码| 欧美午夜视频在线| 综合久久五月天| 久久香蕉国产线| 国产欧美日韩91| 国产大全韩国亚洲一区二区三区| 亚洲欧美成人| 伊人久久婷婷五月综合97色| 久久精品人妻中文视频| 第一区免费在线观看| 在线观看无码a∨| 丝袜亚洲综合| 亚洲国产高清精品线久久| Jizz国产色系免费| 国产一级毛片网站| 中文字幕亚洲专区第19页| 中文字幕亚洲综久久2021| 国产簧片免费在线播放| 怡红院美国分院一区二区| 91 九色视频丝袜| 欧美精品高清| 网友自拍视频精品区| 国产草草影院18成年视频| 久久亚洲美女精品国产精品| 久久中文字幕不卡一二区| 日韩区欧美国产区在线观看| 国产男人天堂| 婷婷成人综合| 麻豆精品久久久久久久99蜜桃| 免费观看男人免费桶女人视频| 中文无码精品a∨在线观看| 亚洲欧美自拍视频| 国产成+人+综合+亚洲欧美 | 熟女日韩精品2区| 伊人精品视频免费在线| 国产97视频在线观看| 呦女精品网站| 国产一级毛片yw| 国产sm重味一区二区三区| 美女无遮挡拍拍拍免费视频| 制服丝袜亚洲| 欧美在线国产| 中文字幕在线免费看| 国产欧美视频在线| 国产真实乱了在线播放| 一级毛片在线免费看| 亚洲天堂免费在线视频| 国产视频久久久久| 日韩一区精品视频一区二区| 夜夜高潮夜夜爽国产伦精品| 亚洲一区毛片| 自拍欧美亚洲| 亚洲av色吊丝无码| 国产精品吹潮在线观看中文| 亚洲自拍另类| 国产幂在线无码精品| 在线一级毛片| 国产男人天堂| 高潮毛片免费观看| 婷婷开心中文字幕| 国产成人8x视频一区二区| 国产丝袜无码一区二区视频| 天天综合网站| 欧美一级高清免费a|