沈建苗
由于副本數據管理(CDM)和數據庫虛擬化設備(DVA)之類的數據虛擬化解決方案,數據克隆技術取得了顯著進展。這類技術在過去4年迅速得到了采用。《財富》500強中有100家企業采用了數據虛擬化技術。這些采用者發現,存儲需求大幅降低,開發項目時間大幅縮短,這歸功于數據虛擬化技術能夠在短短幾分鐘內生成數據副本,幾乎沒有任何存儲開銷:不是拷貝數據,而是共享初始數據副本,同時為每個副本單獨存儲變化的數據,允許每個副本進行讀寫訪問。
為何副本數據管理(CDM)和數據虛擬化對企業來說很重要?因為數據虛擬化解決方案緩解了生產數據副本造成的數據散亂現象。
由于應用程序開發、質量保證、用戶驗收、生產環境支持、報告和備份,企業通常為每個生產數據源生成8到10個副本。因此,一個5 TB的生產數據庫會形成40TB到50TB的下游副本,而一家《財富》500強企業可能會有1000多個生產數據庫生成PB級的副本數據。有效管理副本數據所需的存儲量大得驚人。而數據虛擬化消除了所有的冗余數據副本,同時、而且更為重要的是縮短了生成副本所需的時間,這就縮短了應用程序開發時間、質量保證時間和恢復時間。
如今,只有少數幾家公司致力于這個領域,更多的公司在進入這個市場,因而很難辨別廠商營銷炒作的真偽。
在概念證明(POC)階段,先要搞清楚哪些問題?可以通過哪些測試來證明?
POC之前先搞清楚這五大問題
1.支持我的環境?
第一個也是最明顯的目標是,找到一款很容易與貴公司的基礎設施、數據源和應用程序架構棧整合起來的解決方案。這包括內部部署環境以及可擴展到遠程環境或云環境。你還應該確保自己不被只支持單一源環境的解決方案牢牢鎖定。你是否需要不止一種類型的數據庫,比如Oracle、SQL Server、Sybase或MySQL等?是否需要支持某應用程序,比如Oracle EBS或SAP?是否需要多個主機操作系統,比如Linux、AIX、HP/UX、Solaris和Windows?該解決方案是需要專門硬件,還是可以在現有的系統資源上運行?
2.擁有必需的功能?
該解決方案是否擁有特定的內置功能,以滿足預期的業務目標和要求,比如
■加快應用程序的發布周期
■是否有特定的接口和功能來支持應用程序開發人員
■確保數據的隱私性和安全性
■包括屏蔽、審計和監管鏈
■加快集成測試
■該解決方案是否支持快速質量保證環境和專門側重質量保證的功能,比如破壞性測試所需的回滾(恢復原狀)。
■將數據遷移到云環境
■該解決方案是否支持云計算基礎設施?該解決方案是否支持從內部數據源復制到云數據源,反之亦然?
■改進備份和災難恢復策略
■該解決方案是否支持長遠和精細的恢復點目標(RPO)和快速的恢復時間目標(RTO)?
3.可擴展到新的使用場合
該解決方案通過在整個公司帶來其他應用場合,從而降低總體擁有成本、提供更高的投資回報率方面做得多好。比如,如果我的虛擬化數據與生產數據同步,以便用于集成測試這一應用場合,那么現在我能屏蔽該數據,將它遷移到公有云,讓分析團隊能夠對相同的數據集執行商業智能分析嗎?
4.推薦相關客戶
該廠商有沒有與我企業規模和業務需求相似的客戶?我是否要幫助廠商開拓新領地、因而經歷發展初期的困難,還是說廠商已經有金融、零售、制造、政府、高科技及其他行業垂直領域的領軍企業如今在使用其解決方案?
5.根據證明階段簡易又快速
該廠商是否愿意在實際的POC過程中向我展示所有這些功能?對方是否能夠在現場POC過程中做到所有的銷售和營銷宣傳名副其實,并有定義明確的成功標準?
POC過程中運行的五大測試
1.時間點配置
根據確切的時間點配置環境。用什么方法找到確切的時間點?該解決方案讓我可以具體根據分鐘、秒鐘或事務來配置數據環境有多容易?最終用戶(比如開發人員或業務分析人員)只要按一下按鈕就可以完成配置,還是說需要自定義腳本和多個人員(比如存儲管理員、數據庫管理員和系統管理員)才能完成?
2.環境的重置、分支和回滾
鑒于我已經配置好了父環境(生產環境的副本),我想做一些變化,配置該環境的分支(即子環境)。對子環境做一些變化后,現在我想讓子環境恢復到1個小時或6個小時之前。這如何完成?最后,我想把這兩個環境都重置到原來狀態。
3.用最新數據更新父環境和子環境
我已建立了許多父環境,又從這些父環境另外建立了許多子環境。有什么方法將最新數據從生產環境遷移到父環境和子環境?這個過程可以由開發人員或分析人員來完成嗎?要是有影Ⅱ向的話,會對生產數據有何影響?
4.根據同一時間點配置多個源環境
我有多個使用場合(商業智能、集成和災難恢復等),我需要根據某一個時間點來對齊和配置多個不同的數據源。(比如說,根據當地時間下午5點對齊我的所有源數據集)。這該如何實現?
5.自動化,自助服務,審計功能
我能通過自助服務式GUI控制臺來執行上述所有任務嗎?GUI的界面是否足夠直觀,以便為開發人員、分析人員和數據所有者提供自助服務?CLI用起來多可靠?有沒有一整套可充分利用REST的API以便與開發運營(DevOps)工具集成起來?最后,所有這些任務是否記錄下來,為訪問我數據的活動提供記錄源?
總之,頭號心得就是,應該確保廠商在POC階段向你證明其解決方案和功能特性。數據虛擬化解決方案有望大幅提升數據敏捷性和數據中心的利用率一一這種提升幅度是自十年前VMware普及服務器虛擬化以來所未曾見過的。由于這個原因,很快會有許多廠商追逐這股潮流,聲稱其解決方案提供本文概述的所有功能。你想看一看哪家是真正有實力的廠商,可能很簡單,只要讓它們證明一下。