余文
“我相信很多人都在談‘去O,但是我覺得單純談‘去O就有點out。”眾所周知,去IOE這個詞匯是阿里云提出來的,因此當筆者在北京云棲大會上聽到阿里云數據庫產品專家、PostgreSQL中國社區主席蕭少聰說出上述這句話的時候,難免大吃一驚。
“我們更應該從公司業務的角度,分清楚這些業務應該有哪幾種模型,根據這樣的模型,把原來按照系統上線的數據庫重新打散、拆分;按照不同的模型選用不同的產品,去解決今天的新問題,形成一個新的架構。”很明顯,蕭少聰的本意是從行業應用和DBA(數據庫管理員)未來發展的視角來看待”去O“這件事。
改變傳統商業模式
眾所周知,DBA是任何一家上線數據庫系統的企業的標配。這是因為,數據庫是企業的核心資產,而且在交易型業務里,數據庫承載著一天24小時,一年365天不間斷的關鍵業務的運營。比如銀行交易系統,或者企業的生產系統,一旦宕機,都會造成無法估量的損失。
打個比方,一個上線的交易型數據庫就好像空中飛行的飛機發動機,出現任何故障誰都承擔不起,更別說在飛行中更換發動機了。
相對于硬件產業鏈上下游較為成熟的分工合作方式,軟件提供商由于沒有硬成本的壓力,因此絕大多數軟件都采用了迭代開發的模式,一個產品的成熟通常需要很長的周期—即便是廣泛應用到金融、電信等大行業的以“高可靠、高可用和高穩定”自居的Oracle數據庫,往往在一個大版本的頭一兩個小版本,也會存在相當多的bug。
也正因為此,目前全球市場上較為成熟的大型商用關系型數據庫僅有 Oracle、IBM、Sybase、微軟SQL Server、Informix等五款,再加上新近受到市場熱捧的SAP混合交易分析型數據庫HANA,因此去“O”要遠比去“I”或者去“E”難得多。其實,“去O”或者去“IOE”并不是針對某一家或某幾家企業,而是更多針對傳統的IT商業模式。
眾所周知,傳統的企業級商用軟件的商業模式,不僅在采購初期收取軟件許可的費用和實施上線的費用,還要在每一年再收取接近采購價格20%的服務費,用于產品升級和系統維護。
但如今,云計算真正顛覆了這一模式。這也是為什么Oracle創始人拉里埃里森近期一改幾年前對云計算的不屑,拼命轉型云計算的原因。
“去O”副產品—公云運維自動化
云數據庫的興起,源于大型電商如亞馬遜、阿里巴巴等出于自身大型數據中心中運營的龐大數據庫所需支付的高額運維成本的考量,不得不自行研發低成本的硬件基礎架構和開源數據庫系統。也正因為此,誕生了公共云服務供應商AWS、阿里云。
當然,數據庫的研發不是一蹴而就的—無論是AWS還是阿里云,其背后都依托著亞馬遜、阿里巴巴這樣的巨型電商的各種資源的支持,并且經歷了雙十一、圣誕節等時段交易量爆炸式增長的考驗,才得以逐步成熟,并且開放提供商用云數據庫服務。
在這一從起步到成熟的成長過程中,數據庫運維服務,也正在從人工修復,到通過軟件定義的方式,形成自動化運維的體系,大大提高系統穩定性的同時,降低了手工操作的必要性。
“最初我們的DBA們一直在救火,后來我們逐漸有了能力不用到處救火了,因為部分系統已經完成自動化運維的工作。”阿里云關系數據庫服務內核開發和運維團隊負責人丁奇坦承,“剛開始部署自動化運維的時候,大家到了雙十一的時候,坐在那里還是很慌。這種情況一直到去年底徹底改變。所以我們今年的目標是雙十一不用再擔心系統運維了,不用再通宵在七樓值班了。”
丁奇說的很務實。
事實上,如今阿里云內部的ApsaraDB云數據庫大約運行著三百多個業務,已經基本實現自動化運維,整個工作只有一個DBA在看管—IT運維的絕大部分的工作已經交由系統來完成。
阿里云關系數據庫服務內核開發和運維團隊負責人丁奇(右)和阿里云緩存數據庫負責人、Redis中文社區的核心發起人子嘉(左)與筆者對話
據悉,為了達成今年雙十一自動化運維的目標,丁奇設立了全新的機制。“我們把系統集群當成我們的客戶來對待,設立了健康指標。”丁奇解釋說,“我們每天都在進行業務優化,但我們要知道業務優化的進展,比如我們限定雙十一的時候,健康指標要超過95分,那我們每個月一次去給這個集群打分,建立每個月的進度任務,就可以更容易地達成目標。”
DBA的新追求
很明顯,核心數據庫運維的自動化,開始讓DBA這個職業變得可替代。
“如今底層的IT運維服務,已經通過公共云或者軟件定義的方式,大大降低了手工操作的必要性,自動化運維逐步成為現實,而DBA們未來的出路就在于對公司業務、行業知識,與IT技術的結合。”蕭少聰表示。
據悉,阿里云內部的DBA,尤其是那些對業務熟悉的DBA正在變得越來越搶手。“這些DBA并不是基礎做得好,并不是擴容加機器加得特別快,而是他最了解業務,他能夠去以一個數據架構師的方案推動業務的改造。”在蕭少聰看來,“這才是他們核心價值,也是DBA目前能夠持續增長的價值。”
記得以前業界有個說法,就是阿里云的運維靠人壘,而某云拿這個說事兒,說自己早已實現自動化運維。當時筆者并沒有很在意,因為誰都知道,雙十一的量級是多少?換誰也都得鋪人上去。
沒想到,如今阿里云不僅已經可以基本實現自動化運維了,而且,DBA們正在轉型和升級。不僅如此,就連阿里云ApsaraDB也在轉型升級。這就是為什么本文開篇,蕭少聰所說的,單純談“去O”已經out了的原因。
“阿里云正在數據庫的新領域投入研發并穩步推進—HTAP是我們現在攻關的一個大方向。”丁奇介紹,阿里云的分析型數據庫GreenPlum已經在公測,未來還會推出名為“小數倉”的相關產品,目的就是幫助傳統的OLTP用戶,在一個系統里面實現數據的讀寫和計算分析,實現數據在內部系統之間實現平滑流轉。
實際上,對于業務應用來說,云并不能解決傳統IT架構應用孤島的問題,而這個問題的關鍵其實就出在數據庫上。
眾所周知,系統的核心是數據庫,而每個業務系統都是獨立上線,不論業務系統是否上云,還是本地的,其數據庫之間都是割裂的。更重要的是,一家企業中最關心數據的各個老總,原先看到的報表,都是分析型數據庫中月結的靜態數據,無法支持老總及時調整銷售戰術。
這樣的狀態,是因為HTAP(Hybrid Transactional/Analytical Processing),即混合交易/處理的模式長期不為業界看好—因為要實現分析查詢足夠的速度,以防止分析工作負載,從中斷操作處理。為了實現分析查詢的足夠的速度,OLTP(在線事務處理)的數據通常從一個或多個操作系統復制到數據集市或數據倉庫,再進行OLAP(聯機分析處理)。
而今,隨著硬件技術的不斷成熟,特別是HTAP的代表——SAP HANA得到廣泛成功應用之后,數據庫的技術發生了重大改變。如果真正想讓數據活起來,就必須讓OLTP與OLAP統合起來,這樣,任何分析報表所抽取的數據都可以從實時變化的動態的OLTP中來進行分析展現。
這就是為什么,阿里云DBA們今天真正關心的是與業務掛鉤。
在筆者看來,云棲大會北京峰會上的亮點,除了阿里云推出全新的品牌形象,表達“生于代碼”的本源和滿足海內外市場的發展需要之外,對數據庫的一些新動作,包括自動化運維、開源AliSQL、研發HTAP等,都將對數據庫行業、DBA職業的發展,以及軟件行業商業模式和企業用戶的管理模式產生重大影響。