焦旭
隨著數據庫的發展和應用,作為新一代的分布式數據庫,其架構與功能特性需要保證在與傳統數據庫全兼容的基礎上,擁抱微服務與云計算框架。基于此,分布式數據庫對于分布式交易與ACID必須保證與傳統技術完全兼容。同時,在面向微服務應用開發與云計算基礎架構時,新一代分布式數據庫必須支持彈性擴張、資源隔離、多租戶、可配置一致性、多模式(支持各類SQL協議)和集群內可配置容災策略等一系列功能。
日前,在第十屆中國數據庫技術大會(DTCC 2019)上,專注于SequoiaDB分布式關系型數據庫與SequoiaCM企業內容管理軟件的巨杉數據庫正式發布了旗下“金融級分布式關系型數據庫SequoiaDB v3.2版本”。
作為巨杉數據庫的聯合創始人、CTO兼總架師的王濤,在大會上還作了題為《分布式數據庫的發展與未來》的主題演講。
王濤表示:“未來是私有云和微服務應用的時代,作為分布式數據庫,我們不僅僅將其定位成過去某一個數據庫的替代。分布式數據庫的核心價值在于,能夠從數據庫的層面以服務資源池的形式,向上層被從煙囪式架構向微服務架構拆散的成百上千個小服務提供數據庫訪問能力的平臺。”
王濤指出,傳統單點數據庫的容量瓶頸,僅僅是分布式數據庫所解決的問題之一。更重要的是在未來微服務化應用開發以及云化平臺的趨勢下,應用不再以“煙囪式”的中間件加數據庫模式進行構建,而是采用數千甚至上萬的微服務程序構建成的復雜網狀模型。因此,分布式數據庫需要滿足以下能力,才能夠滿足上層應用的彈性擴展、高并發、高吞吐量、與靈活敏捷的需求。
王濤向記者表示,在技術需求驅動下,分布式數據庫核心技術能力分為兩個方面,一方面是對傳統技術的兼容,如完整的ACID支持,事務和一致性保證;以及SQL的完整支持,傳統數據庫如MySQL/PostgreSQL的語法完全兼容。
另一方面,則是技術創新,這包括分布式與擴展性,應對數據量的變化,實現存儲層和計算層的彈性擴展;多模式訪問接口,支持多類型數據管理和多種模式的訪問接口; HTAP交易/分析混合處理能力,復雜業務需求下,實現數據的物理隔離,互不干擾。
記者了解到,巨杉數據庫作為一款金融級分布式關系型數據庫,本身就是以分布式存儲底座與上層的數據庫實例兩層來進行構建的。其自研的原生分布式存儲引擎支持完整 ACID,具備彈性擴展、高并發和高可用特性,支持MySQL、PostgreSQL和SparkSQL等多種SQL訪問形式,適用于核心交易、數據中臺、內容管理等應用場景。
具體而言,底層的分布式存儲作為資源池,數據的存儲、分布式事務控制、記錄和表鎖等都在底層分布式存儲實現。而數據庫實例層則提供對上層應用程序的SQL服務,用戶可以創建mysql pg sparksql等結構化實例,也可以創建json s3和文件系統的非結構化實例。如此一來,每個實例中的數據在底層是存放在一臺機器還是十臺機器,對上層應用來說完全透明不需要感知。因此,在巨杉數據庫中,一個mysql表可以輕易存儲十億甚至百億級別的數據,開發者在寫SQL的時候完全不需要關注底層表到底被分散在多少臺物理設備中。
通過對架構的梳理和優化,以及性能的提升,巨杉數據庫最新公布的SequoiaDB v3.2版本具有:標準SQL支持,MySQL協議級兼容;金融級分布式OLTP;Multi-Model多模數據引擎;HTAP混合事務/分析處理;輕松實現PB級別數據管理;提高數據安全與多活容災等特點。
王濤認為:“未來,分布式數據庫的發展必將呈現出不斷增長的趨勢。”正是在這種信念下,自2011年以來,王濤帶領著技術團隊從零打造了巨杉的分布式數據庫。
如今,SequoiaDB已經擁有了超過50家大型銀行客戶,以及超過千家的企業用戶。SequoiaDB更是在2017、2018年作為中國首家數據庫廠商連續入選Gartner的數據庫年度報告。