
在歷經一段時間的概念炒作后,大數據如今已經被人們所普遍熟知。人們關注的焦點也不再停留在什么是大數據、大數據有怎樣的特點,而是更多將注意力集中在大數據該如何落地,即我們如何處理這些數據,從而幫助我們分析決策。當然伴隨大數據受關注程度的日益增加,各種有關大數據的分析模型、平臺、工具也層出不窮。
“要處理這些數據,首先要對各種不同類型的數據進行整理歸類,找出規律所在。這其中很重要的一點就是將Web、社交網絡等產生的半結構化以及非結構化的數據變成計算機可以理解的內容。”惠普軟件集團Autonomy信息分析部副總裁兼總經理Rohit de Souza在接受本報記者采訪時表示。
不難看出,數據歸類整理是整個數據利用過程的基石,也是大數據發揮價值的關鍵所在。
對此,業界各類解決方案的普遍做法是首先將大量的各類數據集中到統一的數據倉庫中,然后進行整理分類,從而為下一步分析應用做準備。不過其中也有不同,惠普Autonomy便是這樣一款大數據分析工具。
“在信息爆炸式增長的時代,將海量的信息移來移去無疑會增加成本和難度。”Rohit表示,惠普Autonomy數據分析工具能夠直接對接各類應用所產生的數據,并進行分類整理,而無需數據倉庫的介入,這無疑大大增加了數據的處理效率。
這僅是Autonomy數據分析工具的優勢之一,類似的領先之處還有很多。比如,其能夠根據實際情景、結合上下文,智能識別來自各種應用的各類數據。Rohit還舉了一個形象的例子來說明該特性。他說,同樣是Apple,它是指水果還是手機?恐怕只有結合實際情景才能做出判斷,而Autonomy能夠很好地做到這一點。
再比如,Autonomy能夠處理各種類型的數據,包括視頻、音頻、郵件、短消息等,而這些數據可以來自微博、微信等社交媒體,也可以來自傳統的企業應用。據Rohit介紹,Autonomy通過連接器能夠直接對接400多類應用,幾乎囊括了目前市面上的所有應用類型。
正是由于其多方面的優勢,Autonomy收獲了不錯的市場反響。據悉,目前惠普Autonomy數據分析工具已經在包括電信、金融、傳媒等在內的多個行業的多種場景得到應用。如中國移動使用該工具可檢索任一手機中的應用數據,而中央電視臺未來廣告則用其捕捉視頻中商標等內容的出現頻次,同時利用情感分析功能,從觀眾所發出的微博、微信內容中抓取情感部分,二者相結合以完成二次、三次營銷。
從目前情況來看,無論是市場方面還是技術方面,惠普Autonomy在大數據時代都取得了一定的成績。談及Autonomy在中國的規劃時,Rohit表示,一方面惠普會不斷完善產品、提升性能;另一方面惠普則將繼續結合中國用戶的實際需求,加深產品的本地化程度。
而就在近日,惠普Autonomy剛剛更新其產品線,推出了HP IDOL 10.5版本。其除了加強與HP HAVEn大數據平臺的關鍵組件(包括HP ArcSight、HP Vertica和Apache Hadoop)的集成程度外,還大幅提升了HP IDOL的分析能力、可靠性和易用性,以幫助用戶更好地對數據進行整理歸類。