駱曉昀

烏蘭察布華為云數據中心(彭源/ 攝)
數字時代構筑于海量數據海洋之上:人們每天接觸的打車、餐飲、支付等生活場景;各類組織的人員管理信息、財務管理系統;國家機關的各類公文數據;商業銀行的存款貸款數據……數據已成為最重要的戰略型生產資料。
2023年2月,中共中央、國務院印發的《數字中國建設整體布局規劃》指出,要暢通數據資源大循環。在推動公共數據匯聚利用,建設公共衛生、科技、教育等重要領域國家數據資源庫的同時,還要釋放商業數據價值潛能。與此同時,要增強數據安全保障能力,建立數據分類分級保護基礎制度。
這對數據存儲與計算的基礎軟件——數據庫提出了嚴苛的要求:既要高性能,又要穩定及安全可靠。
數據庫產業是支撐國家數據要素流動、數字經濟高質量發展的關鍵力量,經過近十年的快速發展,國產數據庫主流廠家經過自主創新、開源和應用實踐,已具備數據庫“根技術”基礎,具備對國外相關產品替代的條件
國產數據庫,正在筑牢安全底座的基礎上,努力探求創新。
信息安全是關系到國家安全和社會穩定的重大問題,而數據庫作為三大核心基礎軟件之一,承載著所有企業最核心的數據資產。
1968年,IBM公司開發出世界上首個大型商用數據庫系統IMS;1980年,甲骨文公司研發出Oracle關系數據庫2.0版本,并在此后40多年成為全球數據庫市場的絕對寡頭。
2021年《中國軟件根技術發展白皮書》顯示,國內數據庫市場主要被Oracle(41%),IBM(11%),Microsoft(7%)等國外廠商壟斷,占據市場份額的90%以上。而國產數據庫廠商普遍存在“小散弱”問題,100多家廠商僅占有不到10%的市場份額。數據庫是最容易被“卡脖子”的關鍵領域之一。
正是因此,在政策層面,國家早已關注到數據庫自主創新的重要性。
早在2006年,《國家中長期科學和技術發展規劃綱要(2006-2020年)》就將包括基礎軟件的“核高基”專項與載人航天、探月工程等并列為16個重大科技專項,而數據庫則因其關鍵核心地位被譽為基礎軟件“皇冠上的明珠”。
華為云數據庫服務產品部總經理蘇光牛告訴《瞭望東方周刊》,“核高基”專項與此前的“863計劃”為高科技行業培養、鍛煉了一批人才,為中國企業數字化自主創新提供了應用場景,讓中國有機會發展100%自研的數據庫。
以華為公司為例,依托來自全球的千人專業團隊,持續投入15年,研發了金融級原生分布式關系型數據庫GaussDB,并在金融、財政、醫保、稅務、應急管理、電信、交通、能源、汽車制造、物流、電商等行業的2500多家企業中應用,包括工行、郵儲銀行、建行、陜西財政、國家電網、中國一汽、中石油、中海油等。
目前,GaussDB全球累計獲得授權專利715件,依托華為從底層處理器、計算存儲網絡硬件、操作系統、數據庫等基礎軟硬根技術的戰略投入、垂直的全棧優化與持續創新積累,成為當前國內唯一能夠做到全棧自主的國產品牌。
尤其值得一提的是,GaussDB做到了數據從傳輸、計算到存儲的全流程加密,并于2022年成為中國首家拿下數據庫領域國際最高級別CC EAL4+認證的廠商,在安全上已全面超越國外主流數據庫產品。
俄烏沖突期間,Oracle暫停了俄羅斯所有業務。
“數據庫在石油天然氣工業上廣泛應用于油氣田、勘探開發、物探測井、油氣儲運、煉油化工等領域。能源行業的生產管理系統都必須使用數據庫,才能真正實現能源大數據的智能化?!敝惺捅本┯蜌庹{控中心高級工程師姜勇說。
作為世界上最大天然氣出口國和第二大原油出口國,科技制裁對俄羅斯影響巨大。以此為鑒,姜勇表示,必須加快軟件國產化替代工作,數據庫是“首要中的首要”。
目前除閉源的Oracle之外,另一主流路線為開源數據庫。上世紀90年代,MySQL、PostgreSQL等開源數據庫涌現,目前MySQL已成為世界最流行的開源數據庫軟件,中國使用的大多數的開源數據庫都由其開發。而作為一個廣泛應用于中小企業的數據庫軟件和巨大的互聯網后臺系統應用,其在2008年就已被Oracle收購。
數據顯示,當前80%以上數據庫都是在國外等開源數據庫MySQL、PostgreSQL等基礎上二次開發而成,從屬地/屬人管轄角度看,與Oracle一樣存在風險。
2022年5月,美國商務部工業和安全局(BIS)發布的《信息安全控制:網絡安全物項》,就美國實體對相關國家及地區分享網絡安全漏洞設立許可申請,限制中國獲得網絡安全漏洞的能力。而漏洞無法及時修復也將帶來巨大的網絡安全風險。
以MySQL為例,當前使用較多的5.7版本按計劃將于2023年10月停服,屆時版本漏洞將不再披露和修復,而其升級版本8.0也將于2026年4月停服。這將對市場上絕大多數數據庫產品的安全保障帶來巨大難題。
曾有甲骨文技術人員把數據庫比作人們心臟,而華為云數據庫服務產品部總經理蘇光牛更愿意稱其為人的腰部:向下可充分發揮硬件算力,向上支撐上層的應用需求,是信息系統高效運行的基礎。
業內認為,國內大部分涉及國計民生的關鍵領域如政務、金融、能源等主要采用 Oracle 等國外商業數據庫,存在維保成本高、核心能力依賴國外等問題。信息安全是關系到國家安全和社會穩定的重大問題,而數據庫作為三大核心基礎軟件之一,承載著所有企業最核心的數據資產,相關替換勢在必行。
從全球趨勢看,數據庫領域正在經歷一場汰換,它不僅僅是國產化替代,更是技術創新引發的全面升級。
近年來,創新驅動發展、實現高水平的科技自立自強被擺在更加突出的位置,自主核心技術及生態得到快速發展。
近幾年國產數據庫開始崛起,華為云GaussDB、OceanBase等數據庫產品,如雨后春筍般破土而出。
“目前在全球市場,集中式數據庫Oracle的增量呈下降趨勢,由中國廠商引領的基于分布式架構的新型數據庫增量則在上升。從全球趨勢看,數據庫領域正在經歷一場汰換,它不僅僅是國產化替代,更是技術創新引發的全面升級。”蘇光牛說。
在數字時代,傳統集中式數據庫越來越難以滿足市場需求,分布式數據庫則將位于不同地點的眾多計算機通過網絡互相連接,共同組成一個完整的、全局的邏輯上集中、物理上分布的大型數據庫。這種新型數據庫能更好地應對海量存儲、高并發、容災運維等方面的需求。

2022年7月23日,福州第五屆數字中國建設峰會
2022年4月,中國郵儲銀行上線了新舊個人業務核心系統之間的在線數據移植,客戶數據全部遷移到新系統,而這個新系統中使用的,就有GaussDB數據庫。
數據顯示,中國郵儲銀行新一代個人業務分布式核心系統上線后可為全行6.5億個人客戶、4萬多個網點提供日均20億筆、峰值6.7萬筆/ 秒的交易處理能力,全天聯機平均耗時由93毫秒減少為65毫秒,比老核心系統降低30%,批處理時間也由過去的4.5個小時縮短為3個小時。在2022年9月末的三季度結息中,僅用時25分鐘,相比過去的140分鐘,實現了效率倍增,性能得到大幅提高。
“這充分驗證了高斯數據庫在國產核心系統上的承載能力,這不僅僅是替代,更是全方面的超越?!?中國郵儲銀行CIO牛新莊表示。
對此,蘇光牛認為,一家自身擁有自主驅動力的企業,才能堅持自主創新;一家把質量放在第一位的企業,才能研發出可靠的數據庫;一家有垂直調優能力的企業,才能將底層硬件、芯片、指令、驅動、操作系統、甚至編譯器的系統性能調整好;一家有人才有生態有底線思維的企業,才能進入數據庫企業頭部梯隊。
正如業內人士認為,我國數據庫產業有了自主發展的基礎,但是要做大做強仍需解決兩大問題:一是盡快加速市場化應用,培育頭部企業國際化競爭力,打破國外數據庫壟斷的市場局面;二是抓住推進國產化進程的關鍵窗口期,全面構筑自主數據庫產業競爭力。
國產數據庫,或將迎來黃金時代。