與1997年人機象棋大賽中的“深藍”不同,今年2月IBM沃森(Watson)在美國智力競賽節目“危險邊緣”中的勝利,使人們看到除了計算速度外,沃森更具有的是一個“智慧的大腦”。日前,IBM多位技術專家在“揭秘Watson大腦的智慧”論壇上,從軟件和整合系統的角度,闡釋了沃森的技術原理以及在諸多領域的應用。
優化系統凸顯優勢
毫無疑問,沃森的組成一定是硬件+軟件。這兩者的完美結合展現出IBM在工作負載優化系統和大數據管理與分析等領域的突出優勢。
IBM中國研究院信息分析與醫療保健計劃首席科學家潘越博士揭秘說,沃森的智慧來自于IBM Power7和InfoSphere BigData Platform的天作之合,Power7被認為是業界惟一經驗證勝任混合負載的平臺,而InfoSphere BigData Platform則是高度集成結構化數據和非結構化數據處理能力的數據倉庫平臺。這兩者的結合再一次集中體現了IBM優化系統(Optimized System)的顯著優勢,同時也組成了IBM智慧分析系統。
IBM認為,整合將給用戶帶來效能的最大化,尤其是軟件、硬件、應用的垂直整合更是能將效能發揮到極致。同時,IBM的集成與整合強調模塊化、開放性、用戶選擇權,這種整合可以更加有效地助力客戶長遠發展,投資未來。而相比之下,其競爭對手在成本維護和升級費用上則比較昂貴,軟硬件的結合也稍顯遜色。
數據分析應對大數據
在沃森的“大腦”中,它所具有的知識相當于100萬本書籍、約兩億頁的文本數據,存儲在500 GB的磁盤陣列中。它之所以在比賽中取勝,關鍵是其基于龐大數據之上的數據分析能力,也就是IBM InfoSphere平臺。IBM軟件部高級售前工程師周雄志透露說,InfoSphere數據倉庫能同時應對結構化和非結構化數據,有效地將企業數據分布到低成本、高可用和高擴展性Big Insights hadoop平臺上,通過實時訪問Big Insights hadoop和數據倉庫中的數據,幫助用戶快速分析不斷變化的數據格式和類型,有效應對商業社會中諸多數據難題。
IBM InfoSphere平臺依靠良好的線性擴展能力,提供了PB級別數據和上千用戶的處理能力。其中InfoSphere BigInsights可以與IBM數據分析軟件Cognos和SPSS深度集成,提供更為強大的分析能力;同時,該平臺的高度可擴展性和高效分析能力還體現于在數據倉庫中運行第三方的分析模型,并與分析應用和分析模型進行端對端集成,避免海量數據的加載等。
潘越認為,沃森代表了IBM百年以來在技術研發和創新方面的制高點,其展現出的在業務分析和優化方面的能力,正在被應用到眾多行業領域,尤其是在需要分析并篩選海量數據,根據答案的可信度進行排列,從而幫助決策的實際工作情景中,如幫助準確診斷病人等。