王永
當數據成為企業核心資產和創新的主要驅動力,一個堅實的數據基礎是企業獲得數據價值的保障。作為數據處理中樞,數據庫是數據基礎很重要的一部分。
在數據爆炸時代,企業的IT架構如何應對海量、多樣化數據,現代化應用下的微服務又怎樣依托專門構建的數據庫以獲得最佳表現,快速開發和迭代需要平衡數據庫的成本與性能。顯然,隨著企業數字化轉型進入深水區,業務訴求也更加“專精”。
畢竟,傳統企業由于行業的特定應用需求以及歷史遺留數據等原因,面臨的數據挑戰也更為艱巨:無法快速擴展、高成本、迭代慢、不能支撐全球業務發展以及傳統關系型數據庫應對不同業務場景需求的能力存在瓶頸。
“亞馬遜云科技相信,云原生數據庫是打破固有瓶頸,充分發揮公有云架構優勢,釋放數據創新潛力的必選項,” 亞馬遜云科技大中華區產品部總經理陳曉建日前在接受筆者的采訪時表示,數據庫尤其是云原生數據庫由于具有強大性能、高可用性、可擴展性、支持多場景需求且具備成本效益等優勢,正成為越來越多傳統行業企業的選擇。
事實上,云計算解決了開源數據庫在易用性、可靠性、擴展性、性能等方面的問題,相比傳統商業數據庫,降低了高昂的成本。通過云上托管的數據庫服務,客戶可以用開源數據庫實現媲美商業數據庫的性能,而成本通常只有商業數據庫的幾分之一。同時,專門構建托管數據庫,為企業工作負載,尤其是現代化應用架構下的微服務提供極致性能,不同的問題由專門的數據庫來解決。
此外,基于云端海量資源池的云數據庫可以根據企業工作負載需求快速彈性擴展,無服務器的數據庫將這一特性發揮到極致。利用云端的其他服務,包括計算、網絡、存儲、安全、大數據、AI/ML,通過深度集成,將各種能力融會貫通。企業可以按用量付費,無需預置資源,且托管數據庫服務使客戶可以集中精力在高價值的應用開發上,并借助全球數據庫配合全球業務擴展。
也就是說,相比傳統IT,云原生數據庫能夠更好地運用云的特點。例如,資源的快速擴充就是很好的例子。起初客戶根據業務需要設置了固定的容量,但隨著業務的發展,容量逐漸無法滿足。傳統數據庫的可能選擇擴充實例,買更多的設備和機器更新,時間和成本急劇增加。而云原生數據庫可以實現后端存儲資源的快速、動態和自動的擴縮容。
而且,有了云原生數據庫,客戶就不需要專門去配備一個昂貴的DB團隊,因為這些工作完全可以由云服務商幫你解決。
談到云原生數據庫,很難不提到Amazon DynamoDB, Amazon DynamoDB是最有代表性的云原生數據庫,也是業界第一個真正意義上的云原生數據庫。
Amazon DynamoDB發布的背后,有這樣一個故事:2004年亞馬遜電商因商用數據庫負載過高導致擴展失敗,出現數小時的服務故障,后續統計表明:70%的數據訪問并不需要SQL事務級別的復雜性。因此開始研究NoSQL非關系型數據庫,并于2012年推出第一個云原生NoSQL數據庫Amazon DynamoDB。
在Amazon DynamoDB問世后的十年里,亞馬遜云科技對其進行的持續完善,不僅涉及底層可用性、持久性、安全性和規模等特性,還包括易用性等。現在Amazon DynamoDB已服務于全球眾多客戶,也包括亞馬遜自身。
Amazon DynamoDB十年來的實踐證明了云原生數據庫是打破傳統數據庫瓶頸的必然歸宿。

亞馬遜云科技一直通過不斷創新推動云上數據庫服務的迭代與發展,目前已推出15種專門構建的云上托管數據庫服務,既有SQL也有NoSQL的數據庫類型。
在SQL服務方面,亞馬遜云科技可以提供兩大類型的產品:Amazon Relational Database Service(Amazon RDS),開啟了托管數據庫服務的新模式,從最初只支持MySQL,到目前已支持6種常用的數據庫引擎:兼容 MySQL 的 Amazon Aurora、兼容 PostgreSQL 的 Amazon Aurora、MySQL、MariaDB、PostgreSQL、Oracle以及 SQL Server。
云原生數據庫Amazon Aurora,是2014年推出的產品,該服務是亞馬遜云科技歷史上用戶數量增速最快的云服務。
在NoSQL服務方面,Amazon DynamoDB:高性能擴展的鍵值數據庫,適用于海量數據場景,譬如電商、游戲;Amazon DocumentDB,高度兼容MongoDB;內存數據庫,極致響應延遲,常用于緩存、排行榜、廣告等場景;Amazon Neptune托管圖數據庫分析萬事萬物的關聯,用于欺詐檢測,社交網絡,推薦引擎;Amazon Timestream托管時序數據庫,常用于IoT;Amazon Quantum Ledger Database (Amazon QLDB)托管的分類賬數據;Amazon Keyspaces托管的兼容Cassandra的數據庫,可以用于工業應用場景。
除此以外,還有很多具有Serverless功能的數據庫,如Amazon Aurora serverless、Amazon DynamoDB、 Amazon Timestream、Amazon Keyspaces和Amazon QLDB等都支持Serverless無服務器功能,無服務器功能進一步簡化客戶在創建、維護和擴展數據庫方面的工作,讓數據庫的擴展性及自動伸縮容量達到新的高度,其中Amazon Aurora Serverless V2可以在幾分之一秒內將數據庫工作負載從數百個事務擴展到數十萬個事務,與按照峰值負載來配置容量相比,可節省 90% 的數據庫成本。
從行業來看,數據是驅動制造業企業加速發展的關鍵因素。除海量、多種類型數據的挑戰外,制造業企業往往還會面臨如管理不同生命周期數據、解決數據孤島等挑戰。
西門子成都燈塔工廠(SEWC)是西門子中國首座數字化工廠,它主要負責工業自動化相關的產品,主要的產品是PLC可編程邏輯控制器、HMI人機交互界面和IPC工業電腦。2013年上半年投產,作為首家中國的數字化工廠,通過數字化軟件、套件SIMATIC以及相關硬件實現了研發、制造、質量、管理系統的整體聯動。
SEWC主要負責生產SIMATIC工業自動化產品核心的控制器,比如PRC,還有人機交互界面HMI和IPC工業電腦,供應中國以及全球的市場。數字化工廠持續致力于通過數字化的解決方案,智能制造為客戶提供高質量準時交付的產品。
“如果在工廠領域,OEE系統作為一個核心系統是工廠怎么樣去判定機器利用效率的重要性,我們會通過這個系統收集各種設備的狀態信息。”西門子工業自動化產品(成都)有限公司信息技術部經理 楊健表示,每一次宕機的時候就要借助自動化或者人工處理以解決相應的故障。因為每一次機器設備故障的代碼是不同的,需要很有經驗的資深人員分析問題、尋找解決辦法,同時去更新維修記錄。所以在整個處理過程中會遇到比較嚴重的瓶頸。
引進亞馬遜云科技圖數據庫Amazon Neptune技術,西門子成都燈塔工廠實現基于故障的知識體系分析系統之后,有效解決了所面臨的挑戰:對于研發來說,可以更好地實現市場定位,快速提供決策支持,快速獲取各種產品與環境的關系,設計與生產的關系、設備與產品的關系、產品與零部件的關系、零部件與材料的關系以及供應商與采購商的關系,我們就能夠及時發現、及時處理。
對于生產制造來說,主要處理的是各種核心工藝、設備之間的關系,物料存儲之間的關系,質量檢測,生產、計劃、能力、消耗等等一系列知識結構的體系化,爭取能夠實現動態自動的處理,為生產人員提供快速準確的應對幫助。
對于運維保障來說,真正可以做到運維的支持,比如說結構、使用手冊、維護手段等等能夠把它很好固化起來,同時能夠通過非常友善方便而且及時專時專用的方式提供給我們的使用者。同時能夠提供多元化的方式,通過多種渠道進行相關的數據采集定位,找到問題,真正降低整個產線的故障成本。
“實際上,在整個生產的生命周期我們都擁有了這樣一個知識體系以后,就能夠真正做到知識的不斷推進。結合亞馬遜云科技圖數據庫 Amazon Neptune技術、Amazon S3存儲、計算服務等能夠真正實現基于工廠無縫的、無痛的基礎架構的運維支撐,同時,又能夠享受到高質量基于人工智能、基于圖數據庫的服務。這就是我們和亞馬遜云科技深度合作的原因。”楊健說。
在金融行業,亞馬遜云科技賦能融聚匯云原生一站式金融信息數據平臺,利用亞馬遜云科技云原生的高性能關系數據庫服務Amazon Aurora構建一站式金融數據平臺,已服務超過100+金融機構。
“基于亞馬遜云科技云原生的高性能關系型數據庫Amazon Aurora,我們將數據跨區存儲,實現了無感災難恢復,可用性可以達到99.99%;每秒并發查詢效率也提升了近5倍,進一步滿足金融業務場景高并發的需求;在成本方面,Amazon Aurora的彈性擴展能力還幫助我們節約了30%的硬件成本。” 深圳市融聚匯信息科技有限公司產品總監向坤表示,行情資訊數字化是客戶實現服務升級的核心驅動力。融聚匯深度應用亞馬遜云科技在數據庫、網絡、存儲等方面的服務,構建的云原生一站式金融信息數據平臺,賦能金融機構低成本、高效率地推進數字化建設。
總體來看,正是用戶的需求,使得基于云、專門為應用程序構建的數據庫近年來迅速興起:不僅業務應用的處理速度和數據級別遠超傳統關系型數據庫的能力,開源成為數據庫的一個重要趨勢;而且,現代化應用讓業務更加敏捷,需要全托管式的云數據庫來屏蔽底層復雜性。與此同時,數據庫架構在發生變化,微服務成為大勢所趨。
顯然,一個數據庫打天下不能適應未來現代化應用的需求趨勢,不同場景下往往需要不同的數據庫來滿足應用需求。而且,客戶更希望把大部分精力放在應用開發和快速創新,而不是在數據庫部署、管理等各種事務。
艾瑞咨詢研究總監王巍令表示:“云原生數據庫將會成為未來數據庫的重要趨勢之一。在調研和走訪中,發現不少企業盡管存在顧慮和實際困難,但是大多數也都表示愿意嘗試云原生數據庫。以亞馬遜云科技為代表的公有云廠商,提供豐富的云原生數據庫,使得企業可以安心地收數和用數,并聚焦核心業務。如果再考慮云上同時提供機器學習模型構建等服務,用數也變得簡單起來。”