齊旭
開源數據庫成為一種改變數據庫“游戲規則”的嘗試。近年來,谷歌、蘋果等企業也在開源數據庫領域積極布局。而由云廠商主導的云原生數據庫將這種“改變”推向了高潮。6月28日,Garmer發布的全球云數據庫市場份額榜單中,阿里云位居第三,成為游戲規則的改變者和全球云數據庫領跑者之一。7月4日,阿里云智能數據庫事業部負責人、達摩院數據庫首席科學家李飛飛在接受《中國電字報》記者專訪時表示,阿里云高度重視開源數據庫的發展,云原生數據庫polarDB等產品對開源社區具有重要貢獻。
多年實戰經驗催生自研阿里云數據庫技術領跑全球市場
記者:阿里云數據庫近兩年已進入世界各大研究機構榜單的前列,請問你是如何看待阿里云數據庫在國際市場定位的?
李飛飛:從Garmer發布的全球云數據庫的市場份額榜單來看,阿里云已經位列第三,超越了Oracle、IBM和谷歌。阿里云數據庫技術不僅運用到阿里自身的產品中,還在SIGMOD、ICDE、VLDB等國際頂尖數據庫技術交流會議E宣講,側面證明阿里云數據庫與國際知名云數據庫亞馬遜AWS、微軟SQL Server站到了同一高度。
記者:阿里為何自研云原生數據庫PolarDB,未來將有怎樣的技術布局?
李飛飛:隨著移動互聯網、物聯網的發展,數據量劇增,企業上云大勢所趨。傳統商業數據庫因昂貴、擴展性差、技術復雜、迭代慢飽受詬病。云原生數據庫天然擁有云計算的彈性能力,兼具開源數據庫的易用、開放特點,及傳統數據庫的管理和處理性能優勢,是云時代下企業數據庫的最佳選擇。
不同于傳統商業數據庫的單節點和計算、存儲綁定式架構,PolarDB具有的顯著運行優勢為整個開源數據庫做出重要貢獻。PolarDB能實現計算與存儲分離、采用分布式共享存儲,大幅提升了數據庫的存儲容量和數據吞吐量,巧妙解決了分布式事務處理等技術難題。此外,PohrDB還具有分鐘級備份恢復、秒級彈性擴容能力,充分兼容MySQL、Oracle、PostgreSQL等架構。
客觀來講,目前PohrDB的架構也還有改進空間。由于分布式共享存儲需要利用RDMA遠程快速訪問網絡來實現,這就導致該網絡能夠連接的節點數存在上限,在承受巨大并發量時容易出現問題。
完善后的架構將能更好地支持大體量、集中化的事務處理,實現多寫多讀、跨節點查詢,事務處理的復雜程度大幅降低。
賦能新興信息技術應用看好中國開源社區生態
記者:開源技術對人工智能、大數據、云計算、自動駕駛的發展有何推動作用?
李飛飛:當前,人工智能、大數據、自動駕駛等新興技術和系統已經發展到了非常復雜的程度,如果沒有開源生態的加持,我很難想象這些新興技術能發展到今天的高度。
首先,從供給側角度來看,開源式數據庫的體系架構較封閉式的數據庫系統能吸引更多有才華的開發者。參與的人越多,思維碰撞而引發的迭代演進就會越快。對于人工智能、大數據、自動駕駛這些極其復雜的新興技術和系統來講,任何一家閉源數據庫公司的資源和開發力量都相對有限,技術需要越來越多的開源人才貢獻力量。
從需求側角度來看,各個企業在使用開源系統做人工智能、大數據的技術支撐時,不僅可以免除被閉源系統的技術綁定,還可以在開源社區實現數據庫技術遷移,企業也可進行數據庫的個性化定制,實現大量的應用和代碼改造且系統間互相兼容。
記者:當前中國的開源社區生態如何?你是否看好PostgreSQL在中國的發展?
李飛飛:目前,MySQL在中國開源界占主導地位,其次是PostgreSQL,后者體量無法與前者相比,但市場潛力巨大。
這其中有一個有趣的插曲:MySQL是主流的開源軟件架構,但其被Oracle收購并控股。一方面,Orade將控制MySQL的競爭力,防止MySQL對其超越的可能性;另一方面,Oracle會隨對修改MySQL的開源協議,導致MySQL正在成為一個相對封閉的開源架構。
PostgreSQL的開源協議相對友好,不受任何一家公司的決策局限,有利于中國基于PostgreSQL發展自己的生態、貢獻智慧。此外,較MySQL而言,Post-greSQL對Oracle的兼容性也更好,這對傳統的線下市場、大量Oracle的存量用戶是重大利好,為數據庫大量遷移帶來便利。