“不是任何一朵云都能撐住像‘雙11’這樣的流量?!卑⒗锇桶图瘓FCTO、阿里云智能總裁張建鋒表示。
2019年天貓“雙11”再次刷新世界紀錄:總成交額2684億元,訂單峰值54.4萬筆/秒,單日數據處理量970PB。這是在阿里巴巴核心系統今年已100%上云的情況完成的創紀錄之舉。阿里巴巴這朵云經受住了“雙11”這一世界級流量洪峰。
用公共云承載一個萬億規模的核心系統,阿里云做到了??梢钥隙ǖ氖?,未來阿里的全部系統都將運行在阿里云上。
其實,從去年開始,阿里已經決定將整個阿里巴巴的核心系統全部遷移到云上。阿里為什么敢為天下先?首先,阿里云是阿里自己從頭研發的一朵云,每一行代碼都是自己的,累積、驗證、迭代了十年,這就是大家今天看到的“飛天操作系統”;阿里云將原來專用的技術變成公共云,所有核心系統都在公共云上,讓所有人都可以來享受普惠的服務。

今年的“雙11”已經證明,阿里云100%核心系統上云是成功的。這背后不僅僅是簡單的替換,上云之后,系統整體性能有了非常大的提升。在交易開始的前十分鐘,消費者基本沒有感受到任何抖動,購物非常順暢。這主要得益于阿里云在以下幾方面的優化:
首先,在核心虛擬機層面,阿里自研的神龍架構基于自研的服務器實現虛擬化,其性能的輸出是穩定的、線性的;其次,阿里自研的OceanBase 金融級分布式數據庫與PolarDB 數據庫同樣表現優異,其每秒峰值遠超原來采用的Oracle 傳統數據庫;再次,實現計算與存儲的分離,阿里巴巴有一個專門的存儲池,所有數據都是從遠端存取,存儲的擴展非常方便;最后,大規模采用RDMA 網絡,保證訪問性能。
今年的“雙11“總共處理了970P 的數據。在每個一個時間點,所處理的工作負載又各不相同,同時還要實現實時處理,難度就更大。阿里采用了分而治之的措施,在零點時,將大部分計算機資源分配給交易等應用,在一點之后,則把數據分配給數據處理系統。
今年“雙11”除了數據的批處理以外,還有大量的流處理,即實時處理所有數據,每生成一筆訂單,系統就會自動將數據逐層匯集上來。阿里采用的這一流式處理系統,每秒能處理25 億筆記錄。
飛天操作系統能夠在10萬臺級別以上的服務器中做調度。管理如此龐大的服務器,除了飛天操作系統之外,還需要管理所有的消息流轉。因此,阿里自研了MQ 消息系統,這是目前全球最大的一個消息系統。從飛天操作系統、大數據處理平臺到智能化應用,這些技術疊加起來,構成了一個強大的分布式的云平臺,才掌起了阿里整個經濟體的所有核心應用。
特別值得一提的是,阿里今年發布了自研的芯片含光800。明年的“雙11”,阿里大量的人工智能應用都會跑在自研的芯片之上。
硬件、數據庫、云計算操作系統,再加上核心應用平臺,阿里以自研為起點,始終保持快速創新、快速迭代,才能在“雙11”這樣的硬仗面前,游刃有余,從容不迫。