石菲
要問現在最火的技術是什么?肯定是人工智能!
作為“智能+”時代的新動能,人工智能正在對我們的未來產生影響。
IBM云與認知軟件高級副總裁Arvind Kirshna在2019美國Think大會上曾這樣表示,“如今人工智能就像‘電一樣存在,并且在徹底改變商業社會。”
植物生長需要養分,汽車奔跑需要動力,未來商業社會最重要的能源就是人工智能。縱然人工智能已經成為新時代的“必需品”,但企業要應用好人工智能絕非易事,換句話說,人工智能不是你想上,想上就能上。
還記得董明珠在寧波“闖紅燈”被抓嗎?其實是在過馬路時由于公交廣告上董小姐的“大頭照”太過明顯,被闖紅燈人臉識別系統捕捉到,誤以為是真人。如果說這個烏龍屬于規則制定的不完善,如果數據出了問題則會直接導致人工智能應用的失敗。
2018年世界杯期間有研究機構試圖用人工智能預測比賽結果,但大多數預測結果都是完全錯誤的,原因只有一個:“無論你的模型有多好,它們都只是和你的數據一樣好……最近的足球數據還不足以預測世界杯的表現。”
數據是人工智能的基礎,沒有足夠高質量的數據,人工智能就會產生偏差。
那么,應該怎么做才能獲得人工智能所需要的高質量數據呢?
目前全世界最快的計算機是Summit和Sierra,由于其上運行著大量數據分析和人工智能應用,Summit和Sierra采取了和之前不同的整體存儲架構,不僅可以達到每秒2.5TB的帶寬,每秒鐘還可以在一個目錄里創造5萬個小文件。正是基于高可用的存儲平臺,才能夠支撐全球最龐大的人工智能系統順利運行。
這背后的秘密武器就是能夠快速、高效提供人工智能所需要數據的信息架構。
簡單地說,在人工智能應用需求逐步增大和日益復雜的多云環境下,企業需要通過一個統一、高效的平臺實現對數據的高效利用。
有數據顯示,盡管83% 的企業將 AI 視為戰略機會。但大部分企業領導者并不了解 AI 究竟需要什么樣的數據。即便他們了解AI所需要的數據,仍然有80% 的數據無法訪問、不可信或者無法分析。


所以企業需要一種具備合理結構的全面方法為人工智能應用打好基礎。簡而言之,要想高效應用人工智能,必須要有一個高效的信息架構。
近期,IBM總結并提出了人工智能階梯概念,幫助企業實現數據資產的現代化,加速人工智能之旅。具體來說,人工智能階梯是一種整合方法,可以幫助企業借助規范性方式加速人工智能的應用。
人工智能階梯分為四個部分。
第一階段收集數據。用于奠定穩固的數據基礎,確保數據簡單、可用。
第二階段組織數據。創建一個能夠為人工智能提供可靠數據且隨時可用的業務分析基礎。
第三階段分析數據。確保人工智能可以隨時使用數據,并為高級分析應用和建立人工智能模型做好準備。

最后一個階段是融合數據。在經歷過前三個階段后,企業已經具備了利用人工智能模型實現更高商業價值的基礎,這時候就可以將 AI 融合到企業的整個業務運營當中。
下面,我們就來具體看看這四個階段分別應該如何操作。
首先,企業應該如何收集數據?
數據分布在企業運營的方方面面,快速、靈活地收集不同類型、不同位置、不同數據源的數據可不是一件簡單的事情。
有一家太陽能面板制造企業,當產品生產出來后,會對每件產品拍攝一張照片,一方面可以對產品質量進行定級,另一方面為了方便以后進行質量追溯。由于生產制造環節遍布在全球十幾間工廠,加上產品的生命周期較長,這些數據需要存儲數十年甚至更長時間,數據的存儲成為難題。IBM為這家企業搭建了全球共享的數據資源池,并且用軟件定義存儲的方式將每一間工廠超過一定保留時間的數據自動存放在磁帶中,郵寄到總部,存入帶庫。不管數據源來自哪里,全球所有工廠都可以用同樣的方式進行訪問。在打好數據收集基礎之后,這家企業下一步計劃用圖像識別的方法對產品自動進行分級評定。
做好數據收集,讓數據變得簡單并易于訪問之后,下一步是組織數據。
許多企業其實低估了不良數據可能帶來的潛在風險。如果企業無法確保數據的可信性、完善性和一致性,他們就無法確信自己能夠實現數據的全部價值。更令人擔憂的是,如果一家企業并不知道自己掌握了哪些數據,也不知道如何使用數據,那么,這家企業可能因違規而面臨監管方面的挑戰。所以,組織數據就是要求企業對所有數據進行梳理,構建一個可信的、面向業務的數據基礎。
經歷了收集數據、組織數據,數據已經變得可以信任并易于訪問,可以隨時用于業務分析,企業的人工智能之旅就可以進入下一階段,讓數據產生價值。
通過分析數據可以為企業提供快速擴展的洞察力。比如某大型國際機場就利用AI視覺深度學習技術提高了安全性和管理效率,同時改善了客戶體驗。當發現無人行李或者尾隨人員時可及時作出反應,還可以進行人流分析,及時發現排隊情況并進行疏導,智能商圈管理還可以讓機場的商業設施更加符合旅客的需求。
最近IBM宣布與小罐茶合作的AI自動除雜生產線也是分析數據的典型案例,小罐茶是近兩年迅速崛起的現代茶葉品牌,對茶葉品質有著嚴格標準,除了在原料上精挑細選之外,對加工環節也有著苛刻的要求。在依托認知視覺檢測的生產線上,可以實現整箱毛茶自動開箱,將茶葉倒入暫存斗,經輸送帶震動整理傳輸,進入視覺監測區域,由攝像頭拍照并傳送到后臺進行視覺分析,定位各類雜質所在位置,然后控制機械臂將雜質挑揀并分離開來,達到標準后轉入收集和計量稱重環節。整個過程模擬了人工篩茶、鋪茶和挑揀的過程,但比人更加精確可控,而且效率更高。保守估計,一條這樣的生產線每天可以完成200公斤毛茶的篩揀除雜工作,相當于50-60個挑茶工的工作量。
以上三個階段都完成后,下一步就進入了將人工智能融入企業運營,實現更高商業價值的融合階段。
由于企業想要將人工智能試點和概念驗證轉化為更大規模的生產,所以,他們會遇到一個障礙——如何信賴人工智能驅動的應用。
比如大家都知道的今日頭條,會根據你的閱讀歷史進行內容推送。但很多人發現這種根據初始閱讀習慣進行的推送容易固化,容易讓你被定性為只喜歡某一類別,使你接觸不到其他信息,這就是數據產生了偏差,是人工智能模型普遍存在的一種可能性。


隨著人工智能被融入更多業務之中,這種情況會變得尤為明顯。這時我們就需要在保證數據可解釋、可信賴的前提下在企業中融入可信賴、可理解的 AI 驅動型流程。也就是說,和之前組織數據階段的可信不同,融合數據階段的重點是保證數據模型的公正。
為此,企業需要可以查看到模型提供建議的方式和原因,能夠跟蹤模型構建所用的系列數據和訓練,通過融合建立信任和透明度,并且可以將模型集成到工作流和流程自動化平臺之中,從而幫助企業更快地實現人工智能運營化。
通過人工智能階梯的四個階段,企業就可以實現數據資產的現代化,成功打造一個靈活、統一、高效且規范的信息架構,為企業利用人工智能進一步實現商業價值奠定堅實的基礎。
最后還要注意的是,未來的商業環境越來越復雜,擁有一個開放且統一的整合架構無疑會幫助企業加快人工智能發揮價值的速度。IBM Cloud Private for Data 可以為企業提供一個完全統一且可控的整合式平臺,是一種開放、可擴展的基礎,能夠將人工智能階梯上的所有功能整合到一個混合型多云環境中。在IBM Cloud Private for Data數據平臺中,開放源碼和現代云架構已然合為一體,可以說這是一種用于人工智能的云原生信息架構。這種架構能夠充分實現數據容器化、部署微服務架構,還能提供完全可控的自動化整合技術和工作流。