每一家企業都必須對如黃沙般一望無際的海量數據提高警惕,不要天真的認為自己的海量空間像地球一樣可以容納它們。
我每天都聽到身邊的人在抱怨硬盤又被無數的數據給塞滿了,于是不得不去購買更大的硬盤或者尋求光盤刻錄機的幫助,然后再去裝載那些不知道為何總是膨脹不休的數據。而企業數據的迅猛增長,同樣讓每一個企業的CIO都顯得有些措手不及。
我在幾年前曾與企業的CIO們談起過企業內容管理。當時,他們所談到的都是數據分析、知識管理或商業智能等理論性話題,但是現在他們總是打電話問我:為什么我購買了一塊又一塊的硬盤,一臺又一臺的存儲設備,卻怎么也不能裝下我的那些數據?而且在我需要它們的時候,它們卻總在和我捉迷藏?
我總是對他們說:僅僅依靠海量的存儲容量是無法解決他們所遇到的問題的。
之前我聽說Google(www.google.cn)曾經希望通過用色彩來幫助用戶搜索圖片,我感覺到那很有意思,因為圖片、視頻、音頻這些非結構化的數據往往包含著豐富的意義。
很多CIO對我說,他相信自己的系統,尤其是數據庫,已經裝下了所有的東西,并且可以隨時搜索到,但是當我問他們:你對企業內的影音文件、分散的非結構化數據做好準備了么?他們往往啞口無言。
對于如何解決非結構化數據,我的建議是:針對內容管理上的不同階段,恰如其分地引入應用,制定具有不同針對性的策略,全面涵蓋數據的創建、保護、遷移、歸檔和應用。同時,自文件創建之日起,為它們做好規劃。
企業制定良好的存儲策略的基本原則是把數據妥善分類,按重要性分為動態數據、靜態數據和受控數據,配合適當的管理和保護規律。舉例來說,我的建議是將所有的數據都進行標記、索引與分類,并將日常需要的數據放在性能最好的在線存儲設備上,雖然他們的價格稍高,但是可以保證隨需隨用,然后,如果能以近線設備而不是在線設備保存需妥善歸檔數據,可用性及成本效益就會大大增加,而那些需要應對法規遵從卻很少被用到的數據可以放在離線存儲設備之中。
在當今這個IT界百家爭鳴的時代,企業選用不同品牌不同架構的情況可謂司空見慣,在企業中能看到不同架構、不同品牌的存儲設備,由此形成了“集百家之大成”的混合IT架構。
這種“集百家之大成”的混合IT架構給企業造成了極大的兼容性問題,即便有著充足的容量也無法解決問題。
我常常聽到,某家企業希望通過采用統一品牌的產品來解決這個兼容性問題,但是往往卻失敗了。這是因為同一品牌的產品也可能基于不同的平臺,由低檔、中檔到高檔,由NAS到SAN再到專門為存儲不變數據、以符合法規遵從要求的固定存儲系統,各不相同。
每次提起這個問題,我都想到“統一存儲”,這種新興的存儲系統把NAS、SAN、IP SAN(iSCSI)及光纖通道SAN整合在一起,通過虛擬化等先進技術將不同硬件平臺融合在了一起。通過統一存儲,企業可以節省置購多重存儲系統的成本,也減少了管理多元結構的人力和物力。最重要的是,徹底解決了兼容問題。
曾經有人將無限的數據比喻成沙子,他說這些沙子如果善加利用,可以成為我們生活中最美麗的東西,比如水晶玻璃,或成為IT業界的核心—處理器。但是,如果我們以為地球足夠大,因而任由沙子在我們生存的地球上到處飄揚,它們卻只能成為人們所厭惡的沙暴,毫無用處。我覺得這個形容非常貼切,每一家企業都必須對如黃沙般一望無際的海量數據提高警惕,不要天真的認為自己的海量空間像地球一樣可以容納它們,否則,結果一定非常的可怕。