及時、可靠地提取高度可信的數據是發揮其作用的前提,也是企業當前普遍面臨的難題,而一個高效的數據集成平臺可以在一定程度上解決這一難題。
數據是企業的關鍵資產,今天越來越多的企業認識到了這一點,希望更好地管理好自己的數據資產,讓它發揮最大的價值。然而,數據的管理和利用并不是一件容易的事情。數據駐留在多個系統、數據質量參差不齊,僅僅只是從系統中提取數據這一個需求,也可能需要IT部門投入幾周的時間,更何況企業的數據仍處在不斷增長過程之中。根據今年3月份IDC發布的一份研究報告,未來5年每年的結構化數據增長率為20%,非結構化數據的增長更是達到60%。隨著更多的IT系統投入使用,這個問題將越來越嚴重。
“數據的有效利用已經成為企業面臨的一個普遍問題,很多企業為此投入了大量的人力物力而效果卻并不理想,而一個專業的數據集成平臺可以起到事半功倍的效果,更能幫助企業成長為數據驅動型企業。”Informatica的高級副總裁兼CIO Tony Young對記者表示。
數據價值
為何難以發揮?
Tony Young把企業的IT系統建設分為三個階段,即IT基礎設施建設階段、應用系統部署階段、數據整合利用階段。這三個階段面臨的困難逐級遞增。他說,隨著信息化建設的推進,企業已經陸續地進入到數據整合利用階段。比如,商務智能在金融、電信等企業已經成為一種普遍的應用,而數據的集成和整合就是商務智能首先面臨的問題。
作為Informatica公司的CIO,Tony Young負責Informatica全球信息系統和技術基礎架構的戰略方向,他對企業在管理和利用數據方面面臨的困難深有體會。
“數據來源繁多,雜亂無序是企業最常見的問題,有些管理者甚至根本不知道到自己擁有哪些數據以及數據在何處。”他說,“有時,即使他們知道擁有所需要的數據,要想導出這部分數據也是一件很困難的事情,因為要花費很長時間。”
數據的質量也是影響數據發揮其價值的因素。比如同一個數據在多處出現,一個地方有了修改而其他地方沒有修改; 同一個數據采用了不同格式以及對輸入的數據沒有審查導致錯誤的數據進入系統等。
“數據質量直接影響到最終決策的科學性。”Tony Young說,“而解決數據質量問題,除了事后引入專業的工具進行數據清洗之外,還需要建立一個長效的數據治理機制。”
數據的利用之難還表現在IT與業務人員協作困難上。IT人員通常不了解業務需求和業務詞匯,而業務人員也不了解IT,這就導致雙方很難真正溝通。
做數據驅動型企業
數據驅動型企業是Informatica推出的一個概念,它把那些已建立起管理其數據所需的組織、流程和基礎架構,從而可以確保隨時隨地按所需方式為業務提供相關的可靠數據,以支持瞬息萬變的業務需求,最終實現數據業務價值的最大化,這樣的企業稱為數據驅動型企業。
“簡單地說,數據驅動型企業就是能及時、可靠地提供有高度相關性數據的企業。”Tony Young解釋說,Informatica的愿景就是讓企業不再受數據之苦,讓它們成為數據驅動型企業,而Informatica新近推出的開放式數據集成基礎架構平臺Informatica 9正是建成數據驅動型企業的最有效工具。
據Tony Young介紹,這個統一的集成平臺能幫助企業解決數據集成、數據質量、B2B數據交換、應用信息生命周期管理、復雜事件處理和云數據集成等問題,并且還能使數據集成生命周期的每個步驟都實現自動化。這個集成平臺有三個最為突出的特點:
1. 支持業務部門與 IT 部門的協作。Informatica 9 通過基于瀏覽器的分析工具、報表的自動生成以及公共元數據存儲庫等手段,消除了為數據定義業務需求的業務人員與負責技術部署的 IT 團隊之間的協作障礙,讓他們可以直接溝通、高效協作。
2. 基于 SOA 的數據服務。Informatica 9提供的信息目錄服務、多模態的數據提供服務等可以幫助企業迅速找到并理解業務所需要的相關數據以及訪問這些數據。它還讓用戶可以快速建立數據服務,以便隨處重復使用數據。
3. 全面的數據質量保證。Informatica 9 可以為幾乎所有數據制定數據質量規則,而且一次制定就可反復使用。同時,它還采用基于角色的工具,讓所有相關人員都能掌控只有他們最了解的不同的數據質量要求。