綜合報道/本刊高級主筆 徐姝靜

2021年6月,中國郵政儲蓄銀行發布一則關于數據庫采購的成交公告:美國數據庫企業甲骨文(中國)軟件系統有限公司中標,采購金額為1.45億元。
對于這次采購,郵儲銀行給出了這樣的理由:多個核心生產系統使用Oracle數據庫進行數據存儲和處理,無法替換,需向甲骨文采購,保證系統的正常運行和穩定。從中,多少可以感受到銀行方在數據庫應用領域不能完全自主選擇的些許悲憤。這件事也帶火了一個詞——數據庫。
那么,數據庫究竟是什么?
在這個離開手機和筆記本電腦就會被潮流拋棄的數字經濟時代,大眾是否都困惑過這樣一個問題:數字經濟大廈建立在怎樣的地基之上?
是工業互聯網、大數據,還是人工智能?
都不是,這些僅是數字經濟的支柱,而不是地基。支柱之下,是一個極為龐大和復雜的地基體系——基礎軟件。
所謂基礎軟件,就是數據庫、操作系統等的統稱。其中,數據庫是儲存和管理數據的軟件產品,所涉及的技術可謂極其復雜。相較于芯片,國產基礎軟件更加孱弱,甚至弱到似乎沒有什么人注意到它。有專業人士曾經為此表現過無奈:“芯片是短板,而基礎軟件幾乎是斷板。”
除了郵儲銀行,中國聯通也曾為數據庫付出過高昂的代價。早在2008年,中國聯通就收到過甲骨文6000萬元的“罰款”通知。
當時,甲骨文是中國聯通的數據庫供應商,后者的計費、結算、繳費等核心業務都搭載在甲骨文數據庫上。按照甲骨文的售賣方式,除了購買軟件時按服務器數量支付一次性費用,每年還需要繳納大概22%的技術服務費,一旦采購新版本的軟件,還得額外付費。
中國聯通認為這筆費用并不合理,所以一直沒有繳納。后來,中國聯通需要采購甲骨文的新產品時,對方提出必須先結清欠下的服務費,這也就是所謂“罰款”的來源。最終,中國聯通不得不繳納了罰款。
從中不難看出,“沒得選”是甲骨文在中國市場大賺特賺的重要因素。
如果把數據庫比作“大腦”,全世界最好的“大腦”便是甲骨文。早在1980年,甲骨文就開始為美國軍方供應數據庫產品,并很快實現商業化。后來,甲骨文成了第一個進入中國市場的大型軟件公司,又恰好趕上金融、電信等領域國企信息化的浪潮,順勢將大量市場份額攥在手中。
根據IDC的調研,2008年,甲骨文在中國的市場份額達到了頂峰,接近50%。
由于金融、電信、郵政這類業務對系統穩定的極高要求,同時,在一些關鍵服務上,中國數據庫產品拿不到開放端口,導致國產和進口的數據庫不能實現互通,這也形成了事實上的進口數據庫壟斷。對此,很多企業在很長一段時間里都充滿了無力感。
對于數據庫的研究和建設域,我國經歷了漫長且艱辛地探索和攻堅。
業界對于數據庫理論正式傳入國內有一個共識:1978年,中國人民大學經濟信息管理系首任系主任薩師煊第一次將“數據庫”三個字寫在了黑板上。
我國最早的數據庫學術論文,就是薩師煊發表在1979年的《電子計算機參考資料》上的數據庫課程口述稿。在1982年,他又起草了國內第一個計算機專業本科“數據庫系統概論”課程教學大綱。
1986年3月,以基礎科研項目攻堅為核心的“863計劃”出爐,由高校和科研機構牽頭圍繞“數據庫重大專項”展開技術突圍。如今,國內主要的數據庫公司幾乎都有當年“先吃螃蟹”那些人的影子。
2000年,我國在數據庫技術上雖然取得了重大進展,企業也有信息化的客觀需求,但是由于需求方所處的大多是對產品穩定性要求極高的關鍵行業,就算有意進行國產化替代,也因不同數據庫使用的語言和代碼不同所帶來的潛在風險望而卻步。這樣的境況下,國產數據庫走過了研發階段,卻停留在了產業化的前夕,遲遲無法邁出下一步。
國家數據局的成立標志著“數字中國”建設進入快車道,也意味著以數據庫技術為核心的數據安全領域有望迎來“大提速”。
甲骨文在中國市場的如日中天,其實就是彼時中國軟件產業在底層技術上積累薄弱的一個真實寫照。
2000年前后,中國互聯網商業熱潮興起,騰訊、阿里巴巴、百度等今日的互聯網巨頭和一大批互聯網企業先后創立并迅速發展。
此后,隨著用戶的快速增加,企業對數據庫的需求變得越來越大。如果繼續用甲骨文的產品,互聯網企業每年要支付數億元的巨額賬單,且還無法滿足一些定制化需求。
2009年,阿里巴巴喊出了去IOE的口號,決定用開源數據庫MysQL和服務器來替換相關產品。那一年,阿里巴巴的公司戰略多了這么一句話:“2010年后,再也不購買小型機。”
阿里巴巴自研數據庫產品有一個天然優勢:自身體系業務非常豐富,可以讓自己的業務試水,參與產品驗證過程,這也就克服了自研產品難以參與市場驗證、難以自我造血的問題。
閥門出廠前的開關時間均能達到小于10 s的要求,是廠家在受限條件下得到的數據。若在現場模擬廠家的受限條件,令L1=5 m,L2=10 m,Z=2 m,按2.1節的計算方法,閥門開關時間為9.6 s。因此,在與廠家簽技術協議時,務必要求廠家按閥門的實際布置以及環境溫度的變化調整相關參數,并出具閥門開關時間計算書,以確保出廠的產品能在一個很寬的范圍內滿足開關時間的要求。
2010年,阿里巴巴開始建設OceanBase數據庫,從淘寶的收藏夾業務開始,一點一點替換掉了甲骨文和MySQL。
到2013年5月17日,支付寶完全下線了IBM小型機和EMC存儲設備。當年7月,隨著淘寶廣告業務不再使用甲骨文數據庫,甲骨文徹底丟掉了亞洲市場最大的數據庫客戶。
騰訊的數據庫研發幾乎有著一樣的路徑。起因是甲骨文的更新周期無法滿足公司以天為單位的迭代需求,以及業務體量劇增產生的巨額費用。2007年,騰訊開始在內部孵化自己的分布式數據庫,即后來的TDSQL。到2014年,TDSQL已經為騰訊90%的計費業務提供支持。
此后,達夢、人大金倉、神通、南大等一批數據庫公司快速發展,數據庫產品代替甲骨文開始應用于關鍵行業、戰略性領域。國內互聯網公司也開始用上了國產數據庫。
數據庫在中國的研究和科普肇始于1978年。這一年,中國人民大學經濟信息管理系首任系主任薩師煊第一次將“數據庫”三個字寫在了黑板上。
數字時代構筑于海量數據之上。在中國,14億人口的體量決定了對數據庫更高的要求:中國僅微信用戶就超過10億,鐵路12306系統春節前后日瀏覽量超1500億次,淘寶在2018年的“雙11”實時計算處理峰值達到17.18億條/秒……
打車、餐飲、購物等各類生活場景;各類組織的人員管理信息、財務管理系統;國家機關的各類公文數據;商業銀行的存款貸款數據……龐雜的數據記錄著人們工作生活的方方面面,一切都在數據中奔跑。然而,作為最重要的戰略型生產資料,數據的安全性面臨著嚴峻考驗。
美股棱鏡門事件的影響至今余波猶在。從2007年起,美國政府啟動了一項絕密電子監聽計劃,旨在從美國網際網絡公司的中心服務器中挖掘和收集數據,多家科技巨頭也參與其中。
根據當時媒體的披露,美國國家安全局通過該計劃,可以獲取電子郵件、視頻和語音交談、照片和檔案等內容。斯諾登曾說:“主要攻擊網絡中樞,像大型互聯網路由器等。不用入侵每一臺電腦就可以接觸數以十萬計電腦的通信數據。”
這一事件不得不讓每一個國家重新審視網絡安全這一議題。而作為承載服務器、路由器、電腦系統安全性的核心之一,數據庫如果出現重大漏洞或者存在某些允許黑客侵入的后門,建立在基礎軟件地基之上的數字經濟就會“宕機”。
2018年后,技術短板引發的困境逐步顯現,持續的外部壓力促使數據庫走上了國產化替代之路。
2023年初,國務院進行機構改革,正式成立了國家數據局。
國家數據局主要負責協調推進數據基礎制度建設,統籌數據資源整合共享和開發利用,統籌推進數字中國、數字經濟、數字社會規劃和建設等。
2023年2月,中共中央、國務院印發的《數字中國建設整體布局規劃》指出,要暢通數據資源大循環。在推動公共數據匯聚利用,建設公共衛生、科技、教育等重要領域國家數據資源庫的同時,還要釋放商業數據價值潛能。與此同時,要增強數據安全保障能力,建立數據分類分級保護基礎制度。
這意味著,國家層面對數據存儲與計算的基礎軟件——數據庫提出了嚴苛的要求:既要高性能,又要穩定及安全可靠。這也標志著中國數據庫發展邁出了“關鍵一步”。
細看數據庫的發展歷程,這“關鍵一步”的跨越得益于“上云”的機遇。一方面,由于云計算的普及,大幅降低了企業IT的一次性投入,拓寬了整個底層軟件的市場空間,為中國企業創造了彎道超車的路徑。恰如中國直接跳過信用卡階段跨入移動支付時代。
另一方面,互聯網公司基于本身規模的增長和業務的多元化,可以讓自研技術在現實場景中反復摔打,解決了長期困擾國內數據庫公司“無法參與市場驗證”的問題。
今年3月底,數據庫領域權威測評機構國際事務處理性能委員會宣布:中國數據庫TDSQL以每分鐘8.14億筆訂單的處理能力,成為新的世界第一。
數據庫的功能特性極其明確,衡量標準幾乎只有速度,決定客戶采購與否的也就只有性能和成本,此次登頂幾乎完全證明了TDSQL的強悍實力。
從無到有、從弱到強,是一個產業建立影響力與話語權的必經之路,數據庫如此,芯片如此,科技產業亦是如此。
從1997年1月甲骨文CEO 拉里·埃里森乘專機到訪我國時的“強硬”,到如今,特斯拉CEO埃隆·馬斯克面對中國市場時,極力表現出的熱愛。
從中我們便能認清一個現實,“堅持自主創新”這六個字,是“數據庫該如何發展”的唯一正確答案。