Benoit Dageville

如果說多云是當今數據倉庫的發展戰略,那么跨云就是它們未來的發展愿景。這種預測來自于一種普遍性的需求,即在相同云服務提供商內部實現跨不同地區的無縫移動和交換數據,甚至是實現跨不同的云服務之間的數據無縫移動和交換。
地理位置和云平臺不兼容之類的情況阻礙了數據全球訪問的目標。這導致企業難以在整個企業中安全地共享數據,不同地理位置之間存在管理延遲,以及多個云服務之間出現數據孤島。
變革即將到來。不久,所有的企業數據將變得沒有國界。無論企業將數據存儲在何處或使用哪個云提供商,只要選擇訪問數據,那么他們都可以訪問存儲在任何地方的所有數據。
盡管云的優勢已得到了充分證明,但是由于兩個重要因素,云服務提供商尚未兌現其全部承諾:
·地理:云交付的本質要求公司使用區域云。原因在于只有當用戶靠近云端時,服務才能發揮最佳效能。任何試圖查詢或共享存儲在遙遠位置上的云端數據的人都知道延遲是一個問題。因此,企業通常會按地區創建個人賬戶。這些賬戶成為本地用戶存儲和查詢數據的實際場所。對于分布在多個地區的企業而言,這種設置并不理想,因為他們無法輕松地在整個組織中共享數據。
·專有API:主要的云平臺(Amazon Web Services,Microsoft Azure,Google Cloud Platform)在構建時都使用了專有的API。這導致采用多云策略的企業最終會將其數據分散在這些云平臺之中。如果無法便捷地實現共享,那么數據將再次變成孤島,這次是在云服務平臺中,而不是在本地服務器中。
當前的挑戰包括:
數據被在本地創建和存儲對于擁有全球業務的跨國企業來說是遠遠不夠的。盡管本地系統可能運行良好,但要匯集所有能夠回答重要業務問題所需的相關數據是一個復雜的過程。
連接跨地區、國家和大洲的數據中心需要復雜的基礎設施設置和持續性的維護,只有這樣才能確保安全無縫的連接。但是這項工作既復雜又昂貴,尤其是當它們需要跨很遠的數據中心移動大量數據時。這導致許多數據系統都沒有相互連接,無論這些系統是否在云端。
通常,數據復制是一個非常分散的過程,這使其設置成本高昂且管理復雜。只有財力雄厚的企業才能匯集到能夠解決此問題的資源和人力。
就像四十年前的企業不想被某個特定的硬件供應商鎖定一樣,現在的企業開始擔心被某個云提供商鎖定。企業希望自己能夠自由地移動數據和應用程序,以便從新服務或更好的價格中受益。數據可移植性成為一個艱巨的命題,尤其是當企業需要移動多個PB級的數據時。
在一個統一平臺上建立起一個互連的數據世界一直是一個美好的愿景。當我們在所有區域實例和云提供商之間建立橋梁,以便數據可以自由移動時,那么這種愿景就將變為現實。為了實現這一未來目標,我們需要跨云功能。
跨云有兩個要求。首先是創建一個中立的云層,該層在每個由云提供商構建的云區域的頂部提供了一個統一數據管理平臺。第二個要求是通過高吞吐量的通信“網格”將這些區域互連,該網格允許數據在任何區域之間,各大洲之內和之間,甚至跨由不同云提供商管理的多個區域之間移動。
簡而言之,無論數據位于何處或使用什么專有云系統,中立的云層和網格都可以在任何云系統上運行。這樣可以消除所有的數據障礙,創建一個“虛擬多云全球數據中心”,無論數據存儲在哪里,都可以通過便捷的方式以較低的成本訪問數據。
借助這種分析數據平臺,企業可以實現:
·橋接地理區域并輕松移動數據。可以在不同的云上運行相同的代碼以執行全球分析。
·在想要的任何云平臺上運行,并且真正成為多云。被某個云服務提供商鎖定的威脅將消失。
·使用復制解決數據的鄰近性和完整性,讓延遲挑戰成為過去。企業可以復制遠程數據并將其與本地數據結合起來,從而形成一個集中的單一位置來訪問所有全球數據,進而不必使用存儲在不同地區或不同大洲上的數據。
·通過現代化復制技術存儲兩個或更多數據副本對于故障轉移和業務連續性至關重要。在成本方面,企業建立高可用性系統的成本只有老舊復制系統的零頭。
我們正生活在一個全球化的商業世界當中。邊界正在消亡,這些邊界中就包括云壁壘。企業需要全球數據才能實現真正以數據為依據的決策。
跨云將兌現全球化數據的承諾,使企業能夠完全執行多云策略。通過讓數據自由地、安全地移動并整合為單一的真相來源,企業將發展成為真正的全球化企業。
本文作者Benoit Dageville為并行執行和自調優數據庫系統方面的專家,同時也是Snowflake公司的聯合創始人,目前擔任產品部門總裁。
原文網址
https://www.infoworld.com/article/3444587/whats-next-for-the-cloud-data-warehouse.html