張平平 李晨曦
“中國的移動互聯網用戶超過12億,人均上網時長6.9小時,每天提供在線總時長80億小時。”
近日,中國工業經濟學會會長、中國社科院大學教授江小涓談論數字經濟時表示,相信中國個人數據的流量產生是全球第一。
《數字中國發展報告(2022年)》顯示,截至2022年底,中國數據存儲量已達724.5EB(艾字節),同比增長21.1%,全球占比14.4%。
近年來,中國移動互聯網的發展帶來了數據量的爆發式增長,以及高度不確定的交易量變化,也催生了企業數字化轉型的強烈需求,而承載海量數據的存儲、處理等需求的主流數據庫產品仍沿用著數十年前誕生的傳統集中式架構。
在主流數據庫架構與中國移動互聯網業務場景需求的錯位中,國產分布式數據庫OceanBase應運而生。
在OceanBase CEO楊冰看來,主流數據庫設計者在40年前所作的假設正在經受現實的挑戰,過去說的“大數據”與當下的大數據已經無法相提并論。“這就意味著,需要新的假設、新的架構來解決新階段的問題。”楊冰表示,隨著數字經濟的發展,分布式架構將是支撐現代化數據庫的新架構。
近日,OceanBase2023年度發布會上,該公司披露已服務超過1000家客戶,去年一年客戶數增長150%。在1000家客戶中,30%將OceanBase應用于核心系統,為核心系統升級首選。在金融領域,OceanBase已成為市場占有率名列前茅的分布式數據庫。
數據庫,是和芯片、操作系統并列的現代信息技術領域的三大核心基礎之一,是基礎軟件“皇冠上的明珠”。在企業的數字化轉型過程中,數據庫的升級是關鍵環節。
數字化轉型先從應用層開始,很快觸碰到底層計算網絡等基礎設施瓶頸,從而推動云計算和大數據平臺的發展。作為PaaS層之一,數據庫下接IaaS層、上承SaaS層,數據庫的升級改造實際上是IT系統中最為關鍵、最為復雜的環節,是“最難啃的骨頭”。
過去十年,中國的IaaS層經歷了一輪“到云上去”的初步洗禮,而當IaaS層升級完成,PaaS層既需要匹配新的底座基礎設施、又要承接SaaS層的快速迭代,在此之外還必須具備數據庫應有的安全、可靠、穩定。
正如相關領域專家所言,構建數據存儲安全可信保障體系是時代的需要、歷史的使命。
IDC中國副總裁兼首席分析師武連峰也曾表示,對下一代數據庫的要求,至少有彈性擴展、穩定可靠、極致性能、融合分析、平滑遷移、多模能力、AI融合七大要求。
始于20世紀末的中國數據庫產業,在近十年快速發展,并伴隨數字化熱潮迎來新機遇。《數據庫發展研究報告(2023年)》顯示,2022年全球數據庫市場規模為833億美元,其中中國數據庫市場規模為59.7億美元,折合人民幣約為403.6億元,占全球的7.2%。
而到了當下,人工智能爆火,海量數據價值的挖掘和應用,成為推動創新的重要力量。這對數據存儲和計算的性能成本提出更高要求。
“從數字化轉型角度來說,數據庫更要滿足企業業務流程創新、用戶體驗創新、產品服務創新、商業模式創新、社會責任創新、風險管控創新等多個價值的需要。”在武連峰看來,對數據庫的要求越來越苛刻,這對國內數據庫產品來說既是挑戰,更是前所未有的發展機遇。
OceanBase創始人陽振坤曾說,從OceanBase誕生的第一天起,團隊成員的目標就是一致的:不只是做一款給自己用的數據庫,而是做一款能推動整個社會進步、推動社會生產力發生變化的數據庫。
毫無疑問,OceanBase是一款由業務場景倒逼出來的產品。十多年前,當成千上萬的用戶集中在一個時點支付貨款,瞬時交易峰值對電商和支付平臺IT系統的考驗猶如洪峰過境。2010年,淘寶“雙11”活動創造了超過9億元的銷售“神話”,而前所未有的巨大成交量也導致全國數家銀行網銀癱瘓。同年,OceanBase誕生。
2014年起,OceanBase開始逐漸取代Oracle(甲骨文)支撐支付寶核心交易系統,承擔“雙11”交易流量。2017年,替換螞蟻集團核心系統最后一個Oracle數據庫。2019年“雙11”,OceanBase錄得6100萬次/秒的數據庫處理峰值記錄。
隨著OceanBase數據庫支撐的業務從邊緣到核心,團隊對數據庫應用場景的痛點也不斷有更深入的感觸。在數據庫實際應用中,企業往往面臨著業務規模增長、業務場景變多、IT架構應用漸趨復雜的難題,造成數據庫越用越多、越用越復雜的現狀。
本著“把復雜留給自己、把簡單留給客戶”的產品理念,OceanBase團隊以一體化的設計思路,解決并控制了客戶使用的復雜度,致力于實現“用一款數據庫解決80%的問題”。
為此,在OceanBase誕生的13年中,數據庫代碼有過兩次重構。
第一次是從0.5版本到1.0版本,團隊將原有代碼推翻重寫,把數據庫代碼從最樸素的分布式變成工程一體化,初步解決了分布式架構帶來的高復雜操作問題。
第二次是2022年,OceanBase發布單機分布式一體化數據庫OceanBase 4.0“小魚”。該版本既可以實現單機部署,又可以在單機部署下實現分布式部署的完整功能,得以滿足企業從小體量到大體量的不同發展需求。
楊冰坦言,設計4.0“刀子動得很大”。也正是這次重構,讓OceanBase能夠觸達更多場景,變成了一個通用數據庫。
“從OceanBase整個演進來看,一體化設計就是OceanBase產品的DNA,未來OceanBase也將持續踐行一體化的產品戰略。”楊冰表示。
2020年,OceanBase誕生的第十年,這款經歷了數年“雙11”錘煉的產品踏上了正式商業化運作的道路。
正式商業化當年,OceanBase協助工商銀行完成了對公(法人)理財系統從大型主機到分布式架構改造。這也是工商銀行首次在螞蟻自主研發的數據庫上運行重要業務系統。
關于商業化的三年,楊冰介紹,在最開始,OceanBase深入探索了金融、運營商、政務等場景,把所有的路幾乎都走了一遍,在這些領域已經開始出現規模化復制的跡象;此外,2021年,OceanBase將核心的300萬行代碼進行開源,隨著開源生態的不斷成熟,已經有500家客戶將OceanBase的社區版本應用于實際的業務生產系統;2022年OB Cloud上線以來,公有云客戶數量已經增長150%。
但各行各業的需求有參差,隨著客戶的行業跨度增加,OceanBase也面臨著迥異的客戶需求。
在金融行業,大型機構、小型機構的需求、關注點是不太一樣的。大型機構基礎設施比較好,在TPS、響應時間等各方面要求會比較高,所以關注點不僅是分布式,還要有完整的單元化分布式整體解決方案和在分布式架構下如何構建高可用的技術風險體系。而中小型金融機構,首先需要數據庫的分布式能力,但在使用上根本不希望對此有感知,而是希望像集中式數據庫一樣使用數據庫。
運營商行業對數據庫的使用非常深,而且一般系統之間的耦合度比較高,數據的集中度也比較高,一旦涉及數據庫替換往往復雜度和風險要比金融機構還要高。這部分客戶會更關注數據庫的兼容性,以及數據遷移和評估等配套工具完善度和成熟度,以減少遷移時的風險。
某些行業,對宕機后的恢復速度要求不是最高,但對成本非常敏感;某些行業則特別看重秒級回切,可以回檔。
“數據庫是用出來的。”楊冰不無感嘆地說道。三年來,從金融核心到政企和大型國計民生的核心系統,再到運營商和新零售新制造的核心,OceanBase在千行百業的“關鍵業務”中邊磨邊干,才得以打拼出一條積極的商業化增長曲線,也為客戶創造出了更大的價值。
國際咨詢機構Forrester報告顯示,企業在采用OceanBase數據庫之后,存儲空間節約比例超過70%,服務器資源節約比例達到85%,平均每注冊用戶的數據庫成本節約超過50%。
從2010年發展至今,OceanBase從1.0進化至4.0,支撐系統也從邊緣應用走向“關鍵業務負載型的業務”。而從2020年只有18個客戶,到2023年客戶突破1000家,OceanBase只用了三年。