Isaac Sacolick
人工智能、機器學習和深度學習并非萬能的。一位首席信息官就企業投資人工智能之前應知道什么給出了建議。
當你每天都會面對鋪天蓋地的廣告宣傳時,怎樣判斷人工智能這類新興技術是否值得投入呢?我們著迷于一些驚人的成果——例如,AlphaGo擊敗了圍棋冠軍、自動駕駛汽車的進步、Alexa和Cortana實現的語音識別功能,以及Google Photos、Amazon Rekognition和其他照片共享應用程序實現的圖像識別功能等。
當谷歌、亞馬遜、微軟、IBM和蘋果這樣技術強大的巨頭在技術上取得成功并且媒體也大肆宣傳的時候,企業往往會認為這些技術也可以為其所用。但真會這樣嗎?如果是真的,又體現在什么地方呢?
每當有新技術開始成為主流時,下面這類問題是首席信息官們要思考的:
● 對首席信息官而言,這項技術值得投入、研究和關注嗎,或者應該將其忽略?我們怎樣向企業領導們解釋該技術對企業的適用性,它會帶來競爭機會還是意味著潛在的威脅?
● 對于那些好奇的員工們,我們怎樣通俗易懂給他們解釋該技術能做什么,幫助他們分清楚炒作、當今的現實和未來的可能?
● 當一部分員工表現出有興趣去探索這些技術時,我們是否應該給予支持,我們應該把他們引向什么問題,他們應該花時間學習技術的哪些方面?
● 當供應商在實際營銷中表明他們所取得的成績是由新興技術推動的,而且他們的員工中有專家博士幫助支持產品的開發,那么,我們怎樣評估哪些技術具有真正的商業潛力,哪些服務應用的還太早,而有的則純粹是炒作,并沒有實際價值?
人工智能到底是什么,它是怎樣實現的?
人工智能技術已經出現一段時間了,但我認為,這一技術真正始于1968至1969年間,那時SHRDLU自然語言處理(NLP)系統問世,發表了感知器和反向傳播的研究論文,全世界通過《2001:太空漫游》里的HAL知道了人工智能的存在。接下來的重大突破可以追溯到上個世紀80年代后期,在學習算法中使用了反向傳播技術,然后將其應用于手寫識別等問題中。人工智能在上個世紀90年代后期掀起了大規模的挑戰,出現了第一個聊天機器人(ALICE),而深藍打敗了國際象棋世界冠軍卡斯帕羅夫。
上個世紀90年代,我第一次體驗了人工智能。在亞利桑那大學的研究生院,我們幾個人采用C語言編寫神經網絡,以解決醫療、天文學和其他研究領域中的圖像識別問題。圍繞一些不精確的數據,為解決優化問題,我們嘗試了各種學習算法和技術,以及做出決策的方法。
當我們研究神經網絡時,我們會手工編程感知器的數學運算,然后遍歷網絡的各個層以產生輸出,再反向遍歷來應用反向傳播算法對網絡進行調整。我們要等待很長的時間,系統才能穩定地輸出。
當早期結果失敗后,我們確定不了是不是因為應用了錯誤的學習算法,沒有針對我們要解決的問題去優化調整網絡,還是在感知器或者反向傳播算法中出現了編程錯誤。
而發展到今天,很容易看到為什么人工智能在過去幾年中有了指數級的飛躍,這要歸功于幾個方面的進步。
首先是云計算,它支持在一群機器上運行大型神經網絡。計算是分布在大量的計算節點上,而不是逐個遍歷感知器,只處理一個或者兩個網絡層。這就實現了深度學習算法,它本質上是具有大量節點和分層結構的神經網絡,能夠在合理的時間內處理大規模問題。
其次,商用和開源庫以及TensorFlow、Caffe、Apache MXNet等其他服務的出現為數據科學家和軟件開發人員提供了把機器學習和深度學習算法應用于其數據集的工具,這就不需要對底層數學進行編程,也不必采用并行計算。在英偉達、英特爾、AMD等企業創新和相互競爭的帶動下,未來的人工智能應用是由芯片人工智能或者板載人工智能推動的。
不要把人工智能炒作和人工智能現實混為一談
一旦你知道了歷史,對技術有所理解,評估新興技術在其生命周期中的所處位置往往是很有幫助的。
Gartner認為機器學習和深度學習仍然處于熱炒時期,預測2020年之后將出現“通用人工智能”(能夠解決任何智能問題的人工智能)。Venture Scanner調查表明,在人工智能領域,大約有三分之二的啟動資金將用于早期的幾輪融資(種子資金、A輪和B輪),這表明很多銷售或者推廣人工智能解決方案的公司仍然處在產品開發和銷售周期的早期階段。McKinsey指出,在認識到人工智能重要性的公司中,只有20%采用了人工智能,50%以上的人工智能投資來自于科技巨頭和初創公司,而不是那些碰巧使用這一技術的企業。
看到這些統計數據后,任何首席信息官或者企業高管們在全面投入人工智能之前都應該靜下來想一想。盡管人工智能肯定會大有前途,但這些算法的大規模商用還為時尚早。
早期的勝利者將屬于那些大型科技公司和擁有人才、資金和耐心去試驗新技術的初創公司。大多數企業和中型企業很難有這樣的機會,還只是剛剛開始他們的人工智能之旅。
人工智能絕對是一種非常顛覆性的技術,所以你不應該忽視它。但是要謹慎行事,不能被人工智能炒作所迷惑。
例如,對于某些應用程序,語音成為比屏幕和鍵盤更好的人機界面時,或者聊天機器人變得比人類客服更聰明、更快時,很多企業將不得不利用這些技術來提升他們的用戶體驗。
同樣,當深度學習算法能夠更好地檢測欺詐、風險交易和安全威脅時,企業將不得不準備去使用這些方法。
當我們能夠越來越多地使用結構化數據,開始盡可能高效地從口語、音頻和視頻中提取出智能信息時,使用這些功能將為很多企業帶來明顯的競爭優勢。
“時機”才是關鍵詞。
大多數企業的目標應該是快速追隨者,而不是早期采用者。這意味著應盡早關注甚至嘗試人工智能,但要一直等到人工智能足夠成熟、經受足夠考驗而且能大規模交付時,才能完全信賴人工智能。
當你知道了人工智能能夠干什么后,應尋找工具和實例來幫助評估人工智能應用及其成熟度。實例包括:
● Forrester定義了9項基本的人工智能技術,并提出了一個構建模塊模型,這一模型以假設和研究開始,以三個層面的規范化應用結束。
● Workday發布了其成熟度模型,將人工智能應用于自動化,并在發現和轉換應用程序之前通知用戶。這是有道理的,因為把人工智能應用于人們已經解決的問題時,就更容易評估人工智能的結果。
● 業界有很多這樣的例子,包括保險、醫療、銀行、農業、法律、廣告、建筑、慈善和媒體等行業。
著眼于基本的業務目標,啟動你的人工智能計劃
人工智能和機器學習的大肆宣傳促使一些技術和業務領導們開始采用技術優先戰略。如果你是通過嘗試機器學習庫或是求助于那些大肆宣傳人工智能的供應商來開始你的人工智能之旅,那么你就錯過了一些關鍵的啟動步驟。
相反,首先應關注能帶來很大好處的業務問題和機會,以抵消研發成本。這些機會來自于你已經擁有的龐大的數據集,或者你很容易獲得并進行數據整合的數據集。應該從其他非科技公司能夠獲得成功的其他行業中汲取靈感。
從明確的業務機會開始的一個原因是,你能夠找到不需要最新人工智能技術的解決方案。如果需要某種形式的人工智能,這種明確業務機會的方法可以讓你對解決方案進行分類,評估所需人工智能的整體成熟度。
例如,如果你想自動完成一個非常依靠人工操作的業務流程,這包括對流水線上下來的部件進行目視檢查,那么你的解決方案中將同時包括圖像識別和機器人流程自動化。這些都是比較成熟的人工智能領域,這方面的各種成功案例和供應商解決方案證實了這一點。
另一方面,如果解決方案需要大量的認知評估和思考,那么你將進入一個不太成熟的人工智能領域。
衡量人工智能成熟度的一種方法是查看人工智能初創公司發布的各種供應商概況,例如,來自Venture Scanner的供應商概況、機器智能的現狀、O'Reilly的機器人概況,以及人工智能金融技術概況等。仔細看一下這些列表,你會發現很多初創公司都把注意力集中在離散問題集上,而不是更廣義的認知解決方案上。
當一個供應商說什么“把你的數據扔給我們的人工智能”,然后等專家情報反饋就行了,那么不要被此愚弄了。這是不可能發生的。
要想真正的工作,你的人工智能需要大量的數據
這就帶來了成功運行人工智能的第二個先決條件:你需要大量相對干凈的數據來訓練人工智能解決方案并評估輸出。
自動駕駛汽車之所以能夠實現,一個重要的原因是有大量的數據——這些汽車行駛一個小時,其激光雷達和其他傳感器便會產生4000GB的數據。對于只是關于汽車是否應該轉向、加速、減速或者完全停止的一些基本決定,這些數據的確是太多了。
很多成功的人工智能解決方案都屬于這一類——把大量的數據轉換成數量有限的決定。例如,在圖像識別中,我正在觀察的圖片中是不是有你?在協作過濾中,根據你過去的閱讀體驗以及其他閱讀選項,最近發表的文章是否更適合你?在評估一項交易時,它是否與欺詐交易有相似的模式?
在人工智能內部,則是通過逼近曲線來作出這些決定。例如,在深度學習中,網絡中大量的分層結構和神經元能夠逼近非常復雜的曲線來區分結果。為了開發這種網絡,你需要一個帶標簽的大數據集,這樣就可以通過把計算結果與你期望得到的經過標記的結果進行比較來訓練網絡。然后,使用反向傳播或者其他學習算法,利用產生的誤差來調整網絡,并且在所有標記數據上重復多次這種練習,直到網絡穩定至最優曲線為止。這些是采用訓練集開發的有監督學習解決方案。
如果數據沒有被標記,那么網絡可以使用無監督學習方法,這些方法依賴于對結果進行評估的熵表達式。例如,當谷歌的DeepMind被用來學習玩Atari游戲“突圍”時,它使用得分來評估結果。
除了數據集之外,企業還需要數據集成和自動化功能,這樣數據就能夠輸入和輸出任何人工智能處理引擎。如果你的企業習慣于讓人工運行腳本來推送數據,那么我強烈建議你在開展人工智能解決方案之前先投入自動化。
嘗試人工智能的幾個選擇
一旦你找到了業務機會,并且得到了大量經過清理的數據集,那就可以考慮人工智能之旅了。這兩個步驟是為你的企業準備人工智能的先決條件。接下來的主要步驟是考慮人工智能解決方案的類型和實施方法。如果你有這方面的天賦,那么可以嘗試TensorFlow或者其他的人工智能引擎。如果你沒有專業知識,那就認真考慮一下招人吧;科技巨頭們為稀缺的人工智能人才支付了巨額薪水,所以說進入這個行業的成本是非常高的。
還有一種選擇是借助于在其解決方案中嵌入了人工智能的供應商。Salesforce Einstein就是一個這樣的例子,這一人工智能平臺能夠采用Salesforce中存儲的CRM數據進行預測,以及實現其他功能。同樣的,你可以看看具體的行業解決方案,例如,Synechron為金融技術(FinTech)提供的Neo。
一旦你確定了一兩種方法,最重要的是要與相關方一起設定切合實際的期望。投入人工智能應開展敏捷實驗,因為你很可能會陷入僵局,需要反復試驗才能對其進行優化。預先設定好對預算、時間和人才的預期。
Isaac Sacolick是《數字化驅動:通過技術進行業務轉型的領導者指南》一書的作者,該書涵蓋了很多實踐,例如敏捷、開發運維和數據科學等,這些都是成功實施數字化轉型計劃的關鍵。Sacolick是公認的社交領域的最佳首席信息官,也是“社交、敏捷和轉型”以及CIO.com的長期博主,還兼任StarCIO總裁。
原文網址:
http://www.infoworld.com/article/3241904/artificial-intelligence/what-ai-can-really-do-for-your-business-and-what-it-cant.html