高塔
【摘 要】借力挖掘技術的發展,大數據推動了人工智能的繼續發展,且這一現象表現在科學實驗領域和日常生產、生活中。論文主要從人工智能感知、認知和展示幾個方面探究如何利用大數據挖掘技術推動人工智能繼續發展。
【Abstract】With the development of mining technology, big data has promoted the continuous development of artificial intelligence, and this phenomenon is reflected in the field of scientific experiment and in daily production and life. The paper explores how to use big data mining technology to promote the continuous development of artificial intelligence mainly from the aspects of artificial intelligence perception, cognition and demonstration.
【關鍵詞】人工智能;感知;認知;展示;大數據
【Keywords】artificial intelligence; perception; cognition; display; big data
【中圖分類號】TP18 【文獻標志碼】A 【文章編號】1673-1069(2018)05-0144-02
1 引言
大數據是一個巨量數據集合,其具有4個基本特征:數據種類多、處理速度快、數據容量大和數據價值高。人工智能(AI)源自1956年的達特茅斯會議,且其在互聯網與大數據的推動下達到了發展的高峰[1]。換而言之,大數據引領著信息數據未來的發展方向,而基于大數據的科學技術推動著人工智能的發展進程。下面,筆者主要從人工智能感知、認知和展示幾個方面分析大數據對人工智能的推動作用。
2 完善智能感知
與傳統的數據采集相比,大數據有助于虛擬世界采集大量的感知數據,從而實現了虛擬世界對真實世界的還原。在大數據時代,數據一般源自物聯網、互聯網和電信網等,且數據量呈指數增長。在物聯網技術發展的推動下,終端上裝配的傳感器能夠采集到大量不同種類的實時數據,而通信網絡技術的升級能夠完整地向云端服務器回傳數據,同時云計算技術為網絡與設備運營商實時存儲、并行處理數據提供有效途徑,從而實現了實時采集海量數據及有助于對數據進行智能處理。其中,物聯網主要采集接入終端設備的數據;電信網與互聯網主要采集終端設備的數據及用戶數據。針對大數據采集中存在的冗余數據,出現了優化方案。例如,物聯網解決方案中,由前端傳感器設備采集的數據先于網關處進行匯聚、初步處理,借此過濾掉低信息價值、重復冗余的數據,且僅上傳高信息價值、必要的數據,但該網關處的數據處理功能要求實現智能化,即實現智能感知[2]。
以智能交通系統為例。在智能交通系統中,數據采集系統可實時感知路面狀況、車輛狀態及周邊動靜態環境等,并與管控端隨時通信,但要求系統隨時掌握車輛精確的測量數據,因此各個傳感器需要通力配合。對于這一場景,智能感知的實現充分展現了大數據的特性,即:傳感器設備產生的數據具有容量大、種類多、結構復雜及冗余多的特點,因此要求實現數據應用的快速、實時性,而對于高價值數據的挖掘,要求確保數據的完整性及實現對一切細節的回查,注意數據完整性、高效性的配置應視實際應用場景與需求而定[3]。
3 加速智能認知
目前,人工智能認知已從推理階段發展到大數據時代,且面對數據量增長的海量態勢,定會引起量到質的改變。隨著計算機技術的發展,計算能力的增強推動了人工智能對“萬物皆計算”理念的運用,即其以認知計算為核心,具體通過分析、理解大數據來找尋數據的內在規律。
引自Richard Hamming的觀點,計算的真正目的是洞察數字的內在規律,而這一觀點體現了機器學習的核心思想。對于機器學習,T·Mitchell教授定義為:通過運用經驗知識,改進計算機系統的性能。在人工智能領域,機器學習是一個非常重要的分支,其是根據模型學習數據,繼而具有智能算法與理論,且對于大數據智能認知,運用機器學習挖掘大數據中價值較高的規律是一個非常關鍵的途徑。深度學習是一種特征學習法,即通過建立與人腦類似的分層模型結構,創建一種從底層信號映射到高層語義的關系[4]。研究發現,在更多的數據量與更強的計算能力情景下,深度學習的效果會變得更好。目前,深度學習已經在圖像分類、語音識別等領域得以成功應用。據此,美國政府于2013年開始對人腦的認知機制開展突破性的研究,即“人腦計劃”。以Alpha Go為例。Alpha Go利用棋譜做了大量的訓練,其既開展了數以百萬盤的對弈,又可從網上獲取棋局信息。據此,Alpha Go僅需總結棋局規律,便可快速變成“九段棋手”,即基于大數據的學習方式使得Alpha Go的認知得以加速,甚至能與人類的頂級棋手匹敵。
綜上,大數據可從既有數據中提煉出機器學習的“經驗”,而對數據的合理處理,可從中提煉出價值較高的信息用于訓練模型,從而使其與系統的實際性能相符。大數據是一種智能認知,其具有預測的特性,即:系統依據既有數據研判未來發展的一些可能性。據此,機器學習未來的研究重點應是:在大數據時代,預測性能緊隨數據量的增加而提高[5]。
4 助力智能展示
在科學技術的推動下,行業表現出明顯的專業性與細分趨勢。據此,大數據推動人工智能繼續發展的關鍵在于如何實現大眾快速對數據智能采集與處理結果的準確掌握。智能展示具有可視化、交互性的特性,從而實現了大眾對大數據成果的享用。其中,交互性是人工智能系統的重要特征,即:系統在展示結果時,可向觀眾提供更多的選擇及實現相互交互,繼而進行選擇性的展示。研究發現,在人類感知的總信息量中,視覺感知的信息量超過70%,表明目前的智能展示手段以可視化技術最為重要,而在未來的發展中,智能展示技術會朝向VR/AR技術發展。
當應用場景的規模達到一定程度后,增強現實、虛擬現實及視頻等展示技術都需以海量數據作為支撐,外加智能認知與處理會產生一定量的中間數據,因此數據的規模相當龐大[6]。為此,運用大數據技術對海量數據進行實時處理非常必要,從而保證視頻的流暢性及實現現實與VR、AR的無縫結合,并最終改善用戶體驗。自1956年誕生以來,虛擬現實技術因受硬件與大數據處理能力的制約而發展緩慢。但近年來,大數據并行處理算法與其軟、硬件都得以快速發展,且完全能夠滿足增強現實、虛擬現實對數據量的需求,從而推動了現實世界映射至虛擬世界。
5 展望
21世紀是一個數據時代,技術的一切參數都會編入大數據網絡中,并創造出人工智能領域,且在若干領域(現代軍事領域、現代農業領域、現代醫學領域等)中,以大數據為導向的技術性人工智能日漸發展成為科學技術的最前沿。據此,大數據為人工智能的繼續發展帶來了機遇,但同時也帶來如下挑戰亟待應對:
①大數據的垂直化應用對人工智能的發展非常不利,即:在大數據應用中,要求垂直行業具有較高的專業性,但從專家系統開始,人工智能便已意識到自身發展的最大阻礙是業務的專業性。
②對于機器學習和深度學習等智能技術,其在發展中面臨著巨大的挑戰,即:所有數據皆從已知世界中提取及未超越數據采集終端范疇,因此無法獲取到未知世界的數據信息。
③在大數據時代,人工智能的繼續發展要求以適宜的社會環境、倫理及法律作為支撐條件。例如,Alpha Go于2016年3月獲得勝利,為此掀起了大眾對人工智能的討論,即其是否會在未來的某一天超越乃至控制整個人類社會。為了平息此類的疑慮,要求大數據與人工智能領域的相關人員在未來的發展中做出進一步的探索。
總之,大數據與人工智能在當下的發展都不夠成熟,但隨著大數據等技術的發展,人工智能繼續向前發展毋庸置疑,且發展前景非常廣闊。
【參考文獻】
【1】蒲東齊.數據挖掘在人工智能上的應用[J].信息與電腦,2016(19):157,159.
【2】黃澤波.大數據時代的數據挖掘技術分析[J].農村經濟與科技,2017(12):294.
【3】何成芬.基于大數據與人工智能時代背景下的金融決策系統分析研究[J].商情,2017(26):66.
【4】宋麗玨.人工智能時代語料庫短語學考察[J].學習與探索,2017(12):78-85.
【5】喻國明,劉界儒,李陽.數據新聞現存的問題與解決之道——兼論人工智能的應用價值[J].新聞愛好者,2017(6):4-7.
【6】喻國明,劉界儒,李陽.大數據人工智能時代的智慧交通[J].軟件和集成電路,2017(8):86-87.