Peter+Sayer
谷歌、IBM、微軟和亞馬遜網絡服務都將人工智能功能置入到他們的軟件堆棧中 IT領域的人工智能競爭非常激烈,微軟和谷歌在五月份各自的開發人員大會——Build和I/O上都展示了適用于企業的、功能強大的、始終可用的人工智能工具。 這不僅僅涉及到工作:現在人工智能軟件的象棋、圍棋,以及一些老的視頻游戲比任何人類玩得都好,甚至汽車也比我們很多人開得好。盡管這些超人類的表現還只是體現在很少的領域中,也要得益于數十年人工智能研究的應用——越來越多的研究,例如Build和I/O,讓人工智能脫離實驗室,進入到現實世界中。 同時,像蘋果Siri、微軟Cortana、Amazon.com的Alexa和三星電子的Bixby等虛擬助手的人工智能語音技術盡管表現得還沒有遠超人類,但它們根本不需要超級計算機那么強的計算能力。企業可以在這些邊緣進行競爭,例如開發Alexa的“技能”,讓Amazon Echo所有者與公司進行互動,而不用致電其呼叫中心,或者使用各種基于云的語音識別和文本語音轉換“即服務”產品,開發自己成熟的自動呼叫中心。 人工智能的一些最早的工作旨在以計算機能夠處理和推理的方式來明確地模擬世界人類知識——即使是不能真正的理解。這導致了第一個基于文本的“專家系統”的商業化。這些早期的系統并不是像人類那樣通過專業知識,或者在職業生涯中通過經驗學習而實現的。相反,首先是經歷了人類對其他人類艱難的采訪過程,把他們的隱性知識提煉成明確的規則之后,把經驗灌輸給人工智能。 近年來人工智能研究取得的最大進步,最適合企業應用的是讓機器學習從經驗中獲取知識和理解。讓我們看看機器學習進步的直接結果——去年,由谷歌DeepMind子公司開發的一個程序AlphaGo,令人震驚地以4-1擊敗了曾18次獲得世界圍棋冠軍的李世石。 機器學習開始于神經網絡的建立——這種計算模型模擬神經細胞或者神經元在我們身體中傳播信息的方式。我們的大腦含有大約1000億個神經元,每個神經元與大約1000個其他神經元相連接。人工神經網絡模擬這些細胞的集合,每一個都有自己的輸入(輸入數據)和輸出(該數據的簡單計算結果)。神經元按照層來組織,每一層從前一層獲取輸入,并將其輸出傳遞給下一層。當網絡正確地解決問題時,對于能正確預測答案的神經元的輸出,提高其權重,通過這種方式,網絡得以學習。 分層越多的網絡會越準確,也就是所謂的深度神經網絡。早期的時候,它們對計算能力的要求非常高,很難滿足其要求。它們之所以沒有局限于研究,是由于GPU的并行處理能力——以前主要用于顯示游戲,而不是參與其中。 晶體管本身正是這樣做的 這些進步為企業提供了處理大數據問題的新方法——但是在某種程度上,要開發出所需的技術本身就是一個大數據問題。 谷歌工程總監Ray Kurzweil在3月份的Cebit全球大會上向與會者介紹說,我們人類所擅長的是能從很少的幾個例子中進行學習。 他說:“如果一個重要人物或者你的老板和你談過一兩次,那么,你就會從中學到一些東西,這就是人類智慧的力量。但是,在深度學習領域,有一句話是‘生命從十億個例子開始。” 換句話說,深度神經網絡等機器學習技術需要觀察一個任務十億次才能做得比人類更好。 為任何事情找到十億個例子本身就是一個問題:AlphaGo的開發人員在互聯網上找到了數千個人類玩家的圍棋記錄,以支持其13層神經網絡的初步訓練,但是隨著它變得越來越強,讓它與其他版本的自己進行對弈,產生新的比賽數據。 AlphaGo采用兩種類型的機器學習方法來贏得比賽。使用監督學習方法分析人類的比賽,把神經網絡應該學習到的響應標記輸入數據——在個例子中,標記是走出能夠致勝的一步棋。 然后,采用另一種稱之為強化學習的方法,讓AlphaGo自己和自己比賽。目標仍然是贏得比賽,但沒有了輸入數據。使用第二神經網絡,讓AlphaGo自己去產生并評估每一步棋,在第二神經網絡中,作為監督學習網絡,神經元開始時有相同的權重,但是隨著它發現超過人類的策略后,而逐漸修改這些權重。 第三種方法,即無監督學習,在商業中比較有用,但在游戲比賽中不太實用。在這種模式下,不給神經網絡關于其目標的信息,而是讓它自己去研究數據集,把數據按類別分組,并找到它們之間的鏈接。使用這種方式的機器學習成為另一種分析工具:它可能會發現可以通過多種方式進行游戲或者結束游戲,但是讓人類監督人員作出判斷應該怎么辦。 有很多公司,不論規模如何,提供了一些人工智能構建模塊用于企業應用程序和服務。小公司往往側重于具體任務或者行業;而大公司眼光更高一些,其工具可用于一般的應用。 很大程度上歸功于對Watson產品的大力宣傳,IBM在人工智能方面已經深入人心——盡管它傾向于采用“認知計算”這個術語。 Watson系列包括的工具可以用于創建聊天機器人,發現文本數據中的模式和結構,以及從非結構化文本中提取知識等。IBM還通過具體行業信息訓練了一些Watson服務,為用戶提供醫療保健、教育、金融服務、商業、營銷和供應鏈運營等定制服務。 IBM及其合作伙伴可以幫助把這些與現有業務流程集成在一起,或者開發人員自己去進行開發,因為可以從IBM Bluemix云服務門戶網站上通過API獲取大部分工具。 認知也是微軟喜歡用的術語。在微軟認知服務品牌下,它為開發人員提供了將機器學習技術整合到自己應用程序中的API。這些包括把語音轉換成文本并理解其意思的工具;檢測和糾正文本中的拼寫錯誤;翻譯語音和文本;研究學術論文、其作者和出版刊物之間的關系。還有一個稱之為Bot Framework的服務,用于構建聊天機器人,并將它們連接到Slack、推特、Office 365郵件和其他服務。微軟還提供一個開源工具包,企業可以下載它,采用自己大量的數據集來訓練他們的深度學習系統。 在5月初進行開發時,它提供了以前只能預覽的服務版本,包括面部標記API和自動“內容主持人”,可以準許或者阻止文本、圖像和視頻,將不好處理的案例轉發給人類進行檢查。還有一種新的定制圖像識別服務,企業可以利用它來訓練識別他們感興趣的對象,例如工廠中使用的零件。 谷歌提供了很多機器學習技術,這些技術曾作為谷歌云平臺的一部分在谷歌內部使用。這些系統可用來進行特定任務的訓練,也可以作為干凈的白板用于對您的數據進行訓練,包括圖像、文本和視頻分析、語音識別和翻譯等。還有一種自然語言處理工具,能夠從聊天機器人和呼叫中心使用的文本中提取出情感和含義。甚至還有一個備受關注的工作搜索工具,根據求職者的位置、資歷和技能來匹配空缺的職位。 對于亞馬遜網絡服務,它允許企業為Amazon Echo設備中嵌入的數字助理Alexa創建新的“技能”或者語音控制應用程序,并提供了支持Alexa“即服務”的很多技術。最新的是呼叫中心即服務,亞馬遜連接按照每次呼叫和每分鐘進行計費。這實現了與亞馬遜語音識別和理解服務的集成,支持企業創建更復雜的交互式語音響應(IVR)系統。 當明天到來時 這些服務都已經投入使用,但還有許多其他服務在等著我們。 例如,微軟已經邀請企業測試其他幾項服務的“預覽”版本。這些包括Emotion API圖像分析工具,可以識別照片中臉部表達的情感,給憤怒、蔑視、厭惡、恐懼、幸福、悲傷和驚喜等表情分配相對的概率。(您可以發一個自拍照,去試試看。)采用改進后的公司語音工具,企業可以調整引擎以適應特定的區域或者環境(定制語音服務),甚至能識別揚聲器。 一款名為QnA Maker的新工具從文本語料庫中提取出常見問題,供聊天機器人作為參考答案。目前為止的結果還讓人感覺有點笨拙,這可能是源文本而不是QnA Maker的問題,QnA Maker很可能還沒有讀取十億個常見問題來展開自己的學習。 在3月份舊金山舉行的谷歌2017下一代云大會上,該公司發布了其云視頻智能API的私有測試版,支持測試人員通過搜索描述內容的名詞或者動詞來查找相關的視頻剪輯。為進一步激發對其服務的需求,谷歌與風險投資公司“數據采集和涌現資本”合作成立了新機器學習初創公司,并在加利福尼亞州山景城開設機器學習高級解決方案實驗室,客戶可以在此與谷歌專家一起工作,應用機器學習來解決自己的問題。 兩個月后,在谷歌I/O上,該公司展示了用于手機的TensorFlow Lite平臺,以及運行機器學習工作負載的更強大的處理器,即云TPU(張量處理單元)。它還公布了自己內部使用的一些機器學習API的詳細信息。 雖然大公司在人工智能研究領域并沒有進行壟斷,但對人才的競爭卻是非常激烈的。臉書有自己內部的人工智能研究部門,組織內部培訓活動,以提高員工對機器學習的認識。 一些從事人工智能研究的大公司愿意公布其研究結果,并在開源許可下發布了大部分代碼。即使是大家關注的神秘的蘋果公司也在去年年底發表了第一篇研究論文。 但他們并沒有放棄“皇冠上的寶石”。這些機器學習工具包和云服務都非常好,很顯然,未經訓練的神經網絡對于典型的企業和對于16歲的高中畢業生來說都同樣有用。 就像參加招聘時經驗很重要一樣,像谷歌、臉書、亞馬遜甚至蘋果和微軟這樣的公司正在收集Kurzweil所說的數十億個例子。被點擊的每一搜索結果,被接受的每次購物推薦,被標記的每幅照片,或者要查詢的運動得分等等,都被添加到收集中。 當然,十億個例子并不總是必要的:計算機可以學習做一些事情,就像人類以很少的數據就能夠工作一樣,而且對于今天的很多任務來說,幾個例子可能就已經足夠了——特別是如果計算機能夠將其無法處理的情況提交給人類監督者的情形。 就在您身邊 無論如何,這是很多開發人工智能聊天機器人的企業所關注的。他們的數據點遠遠不到十億個,他們仍然希望像微軟QnA Maker這樣的服務能幫助他們以新方式為客戶服務。 一個例子是英國關節炎研究所,這是一個慈善組織,資助關節炎癥的醫學研究,并向患者提供咨詢。它正在使用IBM的Watson對話API來構建虛擬助理,回答有關關節疼痛的問題,并提出一些適當的鍛煉建議來緩解癥狀。 該組織的目標有兩方面:減輕現有電話支持人員的工作,創建一種新的對話渠道,通過它可以在將來提供其他服務。 助理已經學到了關于50種肌骨骼病癥常見問題的1000個答案。 英國關節炎研究所媒體活動經理Shree Rajani說:“我們將擴展其功能,以便在適當時候包括關于醫療和外科治療以及飲食的信息。” 最初的開發歷時大約五個月,其中包括第一輪測試,約有三百名試用用戶參與其中,但助理還沒有準備好迎接公眾。Rajani說,第二輪用戶接受測試正在進行之中,應該在今年下半年的時候出現在我們網站上。 沒有被接受的一個原因是名字:最初被稱為“Ask Arthy”,根據英國關節炎研究所的隱私政策,該服務現在被稱為“關節炎虛擬助理”。 該政策強調了歐洲企業的聊天機器人使用美國云服務時面臨的風險:雖然這一助理還沒有正式啟用,但是在隱私政策的2890個字中,大約460個字是專門針對虛擬助理的,在網站條款和條件中另外還有490個字是關于它的警告的。這實際是提醒用戶,他們告訴助理的所有內容將被傳送到美國的IBM服務器,因此他們不應該在對話中自愿地提供任何個人信息——當用戶被問及敏感的醫療問題時,這就需要微妙的平衡技巧。 另一急于采用機器學習來推動新一輪客戶服務,但也非常擔心隱私問題的領域是銀行。 埃森哲最近進行的一項調查發現,在未來三年內,78%的美國銀行將依靠人工智能在處理自動化系統時獲得更接近人類的經驗,其中76%的希望開展競爭,怎樣讓技術對客戶來說是不可見的。 不僅僅是美國比利時銀行BNP Paribas Fortis也正在采用聊天機器人來回答400個呼叫中心工作人員目前必須處理的一些問題。該銀行的零售部總監Michael Anseeuw最近告訴比利時報紙,當客戶更喜歡和人類交流時,聊天機器人甚至可以幫助員工更快的找到正確答案。 人類與機器之間緊密的工作關系使得機器更容易提高其性能。 數字推理公司創始人兼總裁Tim Estes說:“您希望以自動化的方式為人們提供支持,因為您所做的是建立基礎設施,從人類那里學到怎樣更好的進行抽象決策。” 其Synthesys產品將機器學習技術應用于業務信息分析,并且可用于識別潛在的欺詐性交易,以及出于合規目的,標記有風險的員工通信記錄。 Estes預計在不久的將來,如果在沒有計算機幫助的情況下進行這種“分類篩選”決定,會變得非常不經濟。 他說:“可以把人類的評估模式教給機器,并應用它們,但您不一定會采用機器做出的決定——重要的是采用還是不采用,在沒有人類參與的情況下最終做出決策。” 在接下來的兩三年里,機器學習系統最有效的應用是用來篩選人類做出的決定,確定哪些決定要優先考慮。 他說:“我不認為沒有機器輔助的分類決策會成為經濟高效的商業模式。” Peter Sayer——IDG新聞服務巴黎局局長,工作涉及IDG新聞服務的歐洲公共政策、人工智能、區塊鏈和其他技術突發新聞。endprint