羅杰

近日Gartner公布了全球數據庫最新排名,全球格局和十年前相比發生了巨大的變化,除了老牌的甲骨文、IBM、微軟、SAP和Teradata外,有5家新秀進入了全球前十。國內廠商里成績最好的阿里云,第一次入圍Gartner報告時僅排名全球第26名,用了不到6年時間,已殺到全球第7的位置,超過了老牌數據倉庫廠商Teradata,呈現不斷上升的趨勢。
數據庫與中間件和操作系統并列為全球三大基礎軟件技術,也是企業IT系統必不可少的核心技術,銀行、電信、制造、互聯網等所有行業都依賴于數據庫技術。這二十年來,商業數據庫市場仍然是IT行業最穩定、最具黏性的領域之一。由于其技術的高難度,數據庫長期以來被少數公司控制了絕大部分市場份額。據不同的統計口徑,全球數據庫市場在300億到600億美元之間,商用數據庫的領導廠商主要是Oracle、微軟、IBM和SAP。
數據庫并非新興行業,在50多年的發展過程中經歷了多個時代的演進,從傳統商業數據庫演進到了如今的云原生數據庫,到現在已經是百億美元的產業。
故事要從上世紀60—70年代講起。與現在硬件發展的步伐落后于軟件、算法截然不同,早期的科技發展幾乎都是硬件驅動軟件。當時計算機由晶體管時代進入集成電路時代,計算能力、內存容量都得到了大幅提升,計算機也不僅僅用于軍事領域,不少中小企業也開始使用它做數據管理。但遺憾的是,傳統的文件系統在面對更為復雜的數據時捉襟見肘,這主要因為數據共享性差并且無法描述數據之間的關系,而數據庫就是在這一背景下誕生的。
1970 年,關系數據庫之父、IBM研究員E.F.Codd發表了一篇名為《A Relational Modelof Data for Large Shared Data Banks》的論文,首次提出了關系模型的概念,并成為現代數據庫產品的主流,這是數據庫歷史上的一個重要轉折點,今天,我們看到的主流數據庫幾乎都是圍繞這一模型做研究。
事實上,市場上的相關數據庫產品直至1976年才誕生,霍尼韋爾公司開發了Multics Relational Data Store,開啟了商用關系數據庫的時代。彼時Larry Ellison正在一家名為Ampex的軟件公司工作,該公司正為美國中央情報局工作。
1977年,Ellison與 Bob Miner 和 Ed Oates創辦了一家名為軟件開發實驗室(Software Development Laboratories,SDL)的計算機公司(Oracle前身),并在創辦后的第三年里推出了第一個商用SQL關系數據庫管理系統。
而關系數據庫的提出者,IBM起了個大早,趕了個晚集,1983年終于將DB2帶入了商業市場;軟件巨頭微軟在1989年推出了另一個明星產品SQL Server。
傳統商業數據庫幾乎成為這些企業的專利,壟斷了整個數據庫行業市場。在市場驅動下,商業數據庫成為和操作系統一樣重要的軟件,幾乎每家大型企業都需要從Oracle買來大量的數據庫軟件,盡管價格居高不下,企業怨聲載道,但當時并沒有可替代方案。例如,在電商場景中,幾百萬人甚至是千萬人的同時在線購買,這樣的并發量跟過去的傳統業務場景相比是幾個數量級的增長,按照這個數量級去買商業數據庫,那是天文數字。
游戲規則從2000年開始改變。這時開源文化在美國和歐洲正濃,工程師們開始考慮一個新的問題——數據庫軟件是否也可以走出一條開源的路徑,于是MySQL、PostgreSQL等開源數據庫逐漸誕生,并吸引了大量擁躉,正式終結了關系型數據庫只能用 Oracle、SQL Server這些收費軟件的歷史。毫無疑問,對于很多對成本敏感的公司而言開源數據庫成為替代商業數據庫的另一種選擇。
另一方面,數據庫的應用場景正在發生改變。由于移動互聯、物聯網技術的發展,結構化與非結構化數據爆發。海量數據瞬間涌來,那些安裝在企業IT系統里的傳統數據庫系統早已不堪重負,云被認為是最好的解決方案。
在這一節點,云廠商逐漸成為數據庫領域的主要玩家,他們擁有兩種選擇,其一是把傳統的數據庫以及開源的數據庫搬到云上來,給客戶以租用的方式提供服務。
這種方式在短期內確實可以滿足用戶的需求,但單純地將現有數據庫產品移植到云上這條道路并不長久,從最近開源項目修改協議的趨勢可見一斑,Redis、MongoDB以及Kafka等都在修改協議,未來企業要在云上使用這些開源數據庫難度必然增加。
隨著互聯網時代流量的劇增,企業對數據庫的要求也在不斷提升,完全為云打造的數據庫才能更好地滿足業務快速增長的需求。于是,云廠商撕裂了傳統商業數據庫固若金湯的防線,將云原生數據庫帶入了IT行業。據Gartner預測,到2023年,全球3/4的數據庫都會跑在云上。
2014年,AWS發布了業內首個云原生的關系型數據庫Aurora;2017年9月,阿里云在國內率先發布了自主研發的云原生數據庫PolarDB,并于2018年4月正式商用。
相比傳統數據庫,云原生數據庫的優勢如下:云原生數據庫,天然擁有云計算的彈性能力,開源數據庫的簡潔易用和開放生態,以及傳統數據庫的SQL管理和處理性能等各方面的優勢,通過融合創新,換道超車,在云環境下能夠為用戶提供更好的數據庫服務。
舉例來說,企業搭建的傳統商業數據庫通常承載了ERP、CRM、OA等一系列系統,而數據模型也是基于老系統開發,如果沒有與之兼容的云數據庫,上云幾乎要重寫代碼。
阿里云用云原生數據庫PolarDB破解了這一難題,相對于傳統的數據庫,PolarDB實現了高性能、高容量兼具低成本特性,為互聯網海量數據以及超高并發場景而生,這些實實在在的好處,未來也需要通過更多客戶的采用,讓它的價值真正充分發揮出來。