張心悅
(山東師范大學 山東省濟南市 250014)
人工智能是與生物擁有的自然智能形成對比,用機器展示智能的一種機器智能,可以模仿人類“學習”、“解決問題”等認知功能。近年來,人工智能技術發展很快,許多基于自我學習能力的功能已實現商用,人們開始關注人工智能能取代哪些人類工作。要討論人工智能的未來,需要先分析人工智能發展歷程及現狀,以及未來的發展方向。
人工智能在歷史的小說如《弗蘭肯斯坦》中就已露雛形。與人工智能相關的任務也能追溯到1940年左右,那時候Warren McCulloch 和Walter Pitts 的研究表明可以經過互連的神經元網絡執行計算,而且Donald Hebb 也演示了赫布學習[1]。人工智能的研究則在1956年的達特茅斯學院降生。到20世紀60年代中期,美國國防部也對美國人工智能的研究進行了金錢、經濟方面的大量支持。但直到1974年,由于各方面施加的壓力和阻礙,美國和英國政府為了一些項目更有成效的資金保障,切斷了人工智能的研究,導致人工智能研究進程遲緩,被稱為“人工智能的冬天”。
直到20世紀80年代初,由于商業需求,人工智能再度復蘇。到1985年,其規模就已經超過了10 億美元,同時,日本開展了第五代計算機項目,這一舉措激勵了美國和英國對研究的資助。
20世紀90年代末期的離開和21世紀的到來,人工智能逐漸被醫學、物流等領域應用,并且人工智能與其他領域(如經濟學、統計學等)間也產生了一些新的聯系。在1997年5月11日,“深藍”成為了第一個讓加里·卡斯帕羅夫失敗的計算機象棋系統。同樣,2011年的沃森、2012年的Kinect 和2016年的阿爾法狗都引起了人們強烈的關注。
綜上,人工智能算法并不是新鮮事物,已經歷了早期概念、機器學習、深度學習等多次浪潮。得益于一些關鍵技術的不斷突破,近年來人工智能得到飛速發展,并且受到了各國政府高度重視。
支撐人工智能技術飛速發展的相關技術有很多,主要包括以下七種:
機器學習的覆蓋面很廣,涉及統計學、逼近領域等不同的領域,用來研究計算機如何模仿和實現人類的學習等行為,從而使機器“學會”學習,并不停將已有的知識結構進行重組從而使本身性能得到不斷地改善,因此,機器學習也被稱為人工智能的核心。而能夠對機器進行命令并使學習這一“行為”運行的方法便是編程,通過將所收集的數據進行處理并得出結果所依靠的是編程,我們可以通過一系列的算法進行運算,從而得出結論,比如地圖中尋找兩個地區的最短距離等。
知識圖譜本質上是結構化的語義知識庫,是由節點和邊組成的一種圖數據結構。由節點表示“現實”,由邊表示“關系”,從而形成一個關系網絡,根據這種技術,我們可以構造人工智能的神經網絡,這種神經網絡可以通過大量數據的聯系并進行計算,從而被應用在信用欺詐、天氣預報中。
自然語言處理是人工智能領域的一個十分重要的方向,它涉及到的畛域十分多,主要包括機器翻譯、問答系統和機器閱讀理解等。
而關于自然語言如何處理,則需要我們仔細思考。自然語言處理的主要步驟包含分詞,詞法分析,語義分析和語法分析等;分詞是用來將文章或句子依照含義,通過詞組的形式分開,而英文因為它的語言格式已經進行了分隔,但是像中文等語言便需要通過拆分一部分詞組;詞法分析則表示的是對各種語言的詞頭,詞根和詞尾等進行拆分,各類語言中名詞,動詞等一部分詞匯類型進行一定的分類,并對多種詞義進行一定的選擇;而語法分析是指經過一些算法,分析句子元素;語義分析則是指經過對詞的正確含意進行選擇,通過正確的句法指導,把句子的正確意義表示出來[2]。
(1)機器翻譯:機器翻譯指的是運用計算機技術完成多種不同的自然語言之間互相翻譯的過程,這種人工智能常應用在即時翻譯、語音識別上。
(2)語義理解:語義理解技術是運用計算機技術實現對文本的了解,并且對文本中的問題進行解答的過程。這種技術常被用來進行語音識別、設計聊天機器人等應用中。
(3)問答系統:問答系統是指使計算機與人類使用自然語言來進行交流的技術,常用在聊天機器人、智能座席中。
人機交互主要是研究計算機與人類的信息交換,是人工智能畛域的一個重要的外圍技術,與認知心理學,多媒體技術,虛擬現實技術密切相關。除了依靠傳統的鍵盤、鼠標、數據手套、壓力筆等輸入設備和打印機、顯示器等輸出設備,還包含情感交互,語音交互,體感交互及腦機交互等技術[3]。
如圖1所示,計算機視覺是可以使計算機對人類的視覺系統進行模擬的一種學問,使計算機領有與人類相類似的提取,處理,理解,分析圖像和圖像序列的能力;遵照圖像預處理,提取特征,建立模型和輸出等流程,在深度學習中大多數問題會采用端到端的解決思想[4]。
如圖2所示,生物特征識別技術是通過對生物體的生理特征或行為特征對個體本身進行辨別和認證的技術,分為注冊和識別兩個階段,注冊為對個體的特征的錄入,識別則是對采集到的個體的數據進行一定的處理,以此得到相應的特征后存儲。需要大量的個體數據。通用生物特征識別系統包含數據采集子系統、數據存儲子系統、決策子系統和比對子系統等,通過這些子系統可以完成生物特征識別的注冊、驗證和辨識任務。

圖1:視覺技術應用

圖2:生物特征識別應用
生物特征識別包括指紋識別、人臉識別、靜脈識別、虹膜識別、聲紋識別、行為識別、基因組識別和多模態識別。
而樣本的采集技術也很豐富,考慮到采集及數據處理的質量,樣本的采集技術主要有傳感技術、光學系統設計、智能定位和機械控制技術和人機交互設計。
生物特征識別是人工智能發展十分緊要的環節,生物特征識別應用可以提高人工智能在識別物體方面的能力。
兩者是以計算機作為核心的新型視聽技術。經過虛擬生成與真實環境中的對象進行交互,取得與真實的環境相似的體驗。而其要通過顯示設備、數據獲取設備、處理覺交互設備等實現。通過建模技術對三維物理世界進行數字化和模擬化,對數字內容進行分析并在網絡環境下進行大規模的數字化內容的流通、轉換、集成,建設自然和諧的人機交互環境,最后進行評估。
隨著各種商用人工智能技術的落地,人工智能在政府治理、商業活動、日常生活中都發揮著重要作用。但是,人工智能技術仍面臨著技術難題以及一些負面新聞。進一步分析人工智能技術的優點、不足,有助于展望其未來發展方向。
(1)在編碼正確的情況下,人工智能的正確率遠高于人類。人工智能有著極高的精度、速度和準確度。
(2)由于沒有一定的容器,他們幾乎不會受到惡劣環境的影響,因此比人類更有利于完成危險任務。
(3)它們并不會收受到類似于人類情緒、身體狀況的影響,成本低,能在重復、繁重的工作上更勝一籌。
(4)能夠更精確地預測用戶輸入、搜索等操作,能成為優秀的網絡助手。
(5)機器人寵物依靠人工智能,能幫助緩解抑郁、孤單等問題。
(6)可以在醫療領域發揮作用,利用人工智能系統初步診斷出病人所患疾病,提高醫治效率。
(1)嚴重依賴于數據,在研究數據質量欠佳時會出現結論不全面、不正確的情況。而物聯網、智能傳感器的飛速發展,有助于解決這一問題。
(2)過于依賴學習模型的類型,在構建人工智能的學習系統前要確定學習模型,如果學習模型構建不正確,分類效果就會下降,甚至出現大量錯誤。大量學者致力于學習模型的改進以及相關數學理論,學習模型的準確性近年來有了大幅提升。
(3)無法執行多種不特定的任務,人工智能的任務要事先規定好,只能在設計范圍內工作[5]。這一問題主要和設備的計算能力有關,芯片制造業的發展以及人工智能專用芯片可以幫助人工智能實現更復雜的工作任務。
(4)需要使用大量的金錢和時間進行構建或修復,由于其精密性使得構建和出現問題后的修復都需要花費大量的資源。隨著大量社會資源集中在人工智能研發領域,相信這一問題會有大幅改善。
(5)人工智能在認知領域有一定的局限性,它所處理出來的數據雖然精確,但是還沒有自主思考能力和足夠精密的傳感器,因此在一些無法利用數據的問題中難以產生正確的判斷,比如現在的醫療智能機器人只能判斷出病人患病的大致類型,后續診斷依舊需要醫生的判斷。
(6)記憶理論肯定了信息元的存在,但是人工智能目前還無法有效描述信息元對應的一部分知識。隨著生物學發展,對人的智能理解進一步加深,人工智能技術也有望找到新的突破口。
(7)人工智能能夠相互欺騙,安全人員可以使用人工智能優化威脅檢測系統,同時也會有不法分子使用人工智能規避檢測系統,如果這些惡意的人工智能通過了檢測,就可以暢通無阻地對用戶的信息等進行侵害,菜鳥快遞信息的泄露也凸顯了這一問題的嚴重性。
依靠大數據處理、先進算法和學習模型等關鍵支撐技術,以及大量技術人員的支持,人工智能擁有一定自我學習能力。但是人工智能無法實現同人腦情感、情緒和經驗等方面的自然交互,只能模仿人腦理性思維,無法模仿人的感性思維,無法跨越到意識領域。因此,人工智能只能取代人類的一部分工作,例如一些枯燥、重復、低技術含量的工作;在需要創新性的工作中,人工智能無法取代人類,頂多充當助手工作。從另一角度而言,人工智能所需要的數據由人類收集創造,模型依賴數學,也就是說人工智能的發展與應用深度依賴著人類的創新性活動。
一些關鍵支撐技術的飛速發展,也助推了大量人工智能技術的實際應用。隨著限制人工智能的技術瓶頸不斷被突破,越來越多的非創新性工作都將由人工智能所完成,人工智能技術的完善也將會在各行各業做出貢獻。