本刊記者|石菲

2011年,我們通過Watson知道了認知計算。當時人們還不知道這項吸引眼球的新奇技術能做些什么,而隨著大數據和云計算時代的到來,認知計算的商業化轉化越來越值得期待。但非結構化數據的分析難度和中文語言的博大精深,讓認知計算在中國的應用變得難上加難。
女王范、實際、欣賞美、有條理,喜歡在人群當中處于支配地位,這是喜歡梅西的球迷的性格分析。這些數據來自于2014年世界杯期間社交平臺上的球迷討論。IBM和騰訊根據網絡媒體平臺及社交網絡上發布的海量公開信息及數據,進行精準的大數據分析,獲得關于球迷話題、球迷類型、球迷個性分析等一系列洞察。
在和騰訊的合作中,為深度挖掘社交平臺上形式豐富的非結構化信息,提取有指導意義的洞察,IBM構建了社交大數據分析系統,利用機器自學習方法和自然語言分析技術來傾聽網民的“心聲”。
其中用到四點關鍵技術。命名實體識別是指在處理非結構化數據時,不管球迷通過任何設備錄入信息,都有一些文字沒有標點符號,不同的短語在中文里有著不同的含義,需要IBM利用技術把人名、球隊名等識別出來,以便進一步的分析;話題檢測則用于幫助識別網友討論的話題;在理解球迷討論的話題后,利用語義情感分析可以判斷球迷的立場是支持還是否定,從而獲得球迷情感上的傾向;最后,社交平臺上聚集了眾多球迷,討論各種類型的話題,利用網絡關系抽取技術,對球迷集中討論的眾多話題進行綜合分析,從而將話題間真正有價值、有分析意義的內容關聯出來。
IBM大中華區全球信息服務部云計算服務總經理余忠寧表示,“這個項目的技術熱點有兩方面,一方面是IT基礎架構的支持,SoftLayer可以為大數據的抓取提供最直接和最有力的支持,保證了實時、靈活、穩固、可擴展的計算力支持。另一方面是認知層面的計算能力。只有讓計算機理解人類的語言,理解人類的行為,才能幫助客戶找到價值亮點和洞察未來的方向。IBM目前已經可以讓機器像人一樣了解語言表面和語言底下的信息?!?/p>
近幾年社交媒體和移動互聯網的火爆使得人人都可以很方便地發表觀點,這些數據蘊藏著巨大的商業價值。社交媒體上的討論不僅體現了球迷對球隊和球員的關注,在深入挖掘后也可以為商家帶來新的商機。比如根據喜歡不同球星的球迷分類,精準定位哪位球星適合某一類商品的廣告代言。
就在前些日子,IBM收購了人工智能創業公司Cognea。Cognea開發了一個基于認知計算和對話的人工智能平臺,致力于為銀行呼叫中心等企業客戶提供能夠個性化對話的虛擬助手。在IBM提供的虛擬展示中,沃森只借助一份內部備忘錄就可以總結出一份虛構的公司戰略和決策算法,同時它還具備了語音控制功能。經過與虛擬高管的多次對話,沃森不斷地縮小相關結果的內容,并最終得出一個結論。
認知計算的商業化應用也許會在不久后為我們帶來不可思議的變化。