鐘嘯靈

支付寶的每一個產品背后,離不開IT團隊的有力支撐,他們如何鑄就這種技術能力?
余額寶從來不缺話題,縱然外面“吵得天翻地覆”,在阿里小微金融服務集團(以下簡稱“小微金服”,支付寶的母公司)內部,技術高層卻一如既往地低調。
在杭州黃龍時代廣場B座,小微金服的總部,首席架構師程立近年來第一次打破沉默。
雖然程立不是支付寶創始的3個人之一,但他見證了支付寶技術團隊從20人增加到如今的1000多人(占支付寶總人數的1/3以上)。在這段歲月里,程立不但參與和推動了公司內部三代技術架構平臺的更迭,也親歷了各式各樣的產品的成功與失敗。在程立看來,互聯網金融產品成功的關鍵點在于用戶價值,“產品背后的價值分析可能會非常復雜,但是用戶價值必須非常清晰,明眼人可以一眼看穿”。
為了打磨這些有價值的產品,支付寶需要沉淀一定的技術支持力量。在經歷了一系列平臺和產品的演進后,支付寶的技術團隊逐步建立了具有自己特色的管理模式。
看清目標摸石頭過河
作為一家純互聯網公司,支付寶的技術團隊從一開始就以互聯網創新方式進行運作,在這里,傳統的IT組織結構被拋棄,更強調效率的網狀的協同組織架構是主角。在這里,平臺技術部負責共享平臺和基礎技術,與專業的技術團隊和業務團隊一起進行業務創新。拿余額寶來說,它的項目團隊由理財技術部、平臺技術部和其他業務的技術部組成,同時會成立一個10人左右的專業委員會負責跟進每個子項目。項目團隊的負責人主要負責整體架構以及管理項目的推進情況,激發大家對下一個產品的想象。“我們對團隊進行更分散的設置,讓技術和業務結合更緊密,更快地推動業務。”程立說,“不過,技術平臺的穩定性、團隊整體的協同性并沒有任何減弱”。
一個項目成立開始并不意味著一定會成功,有的項目甚至沒機會推出市場,或者推出市場后便悄然無聲。“每年技術團隊內部都有產品規劃和重點產品,但是失敗的產品比成功的產品多得多。”程立表示。
支付寶一直努力建立自己的信用體系,2008年左右也嘗試過推出一個支付寶用戶的信用評分體系,不過當時的產品遭遇滑鐵盧。后來,技術部門通過沉淀的信用數據進行挖掘應用,促成阿里小貸的成立。“我們的方式是,看清楚目標,接下來每一步摸著石頭過河,不斷地在業務上試錯。”程立表示。
這樣的情形不斷上演,“今天人們看到的都是余額寶的成功,卻不知道余額寶之前有過很多不成功的產品。”程立感嘆。早在幾年前支付寶便希望進入理財領域,當時曾推出基金支付,希望支付寶用戶可以通過支付寶購買基金,不過這個產品推出后一直不溫不火,要么產品由于各種原因無法開放給用戶使用,要么上線后客戶不認可沒有用戶量。這樣的情況一直持續到余額寶的推出。“從用戶的體驗和用戶價值看,一個非常復雜的產品往往不會成功,它必須足夠簡單,富有價值感。”
為了推動持續不斷的創新,支付寶的管理團隊每年、每半年、每季度都會進行頭腦風暴。同時會在一段時間內舉行“敢問系列”會議,探討“我們有沒有將服務能力發揮出來,風控能力是否能為客戶提供價值”。此時,所有的技術專家和管理層會聚在一起進行各種形式的討論。這樣的碰撞也可能來自平時技術人員三言兩語聊天聊出來的點子,比如,核心數據庫的秒級故障切換技術就源于一次團隊外出兩位技術人員的閑聊,回來后這個想法迅速被論證、認可與并予以實施。而海量秒級監控平臺則是一位大學畢業不久的工程師鼓搗出來的玩意兒,這些都成為高可用支付平臺的關鍵支撐技術。這些點子的價值一旦被證實,便會迅速通過技術實現和推出。
雖然整個技術團隊的工作方式是純互聯網式的,不過面對具有金融屬性的產品,他們在內部則會奉行穩健的金融思維——更關注產品的安全、合規和穩定。當一項設想實現后,產品經理會看產品體驗是否足夠好,而風險團隊會關注安全性,合規團隊會看是否符合法規,而架構團隊則關注設計是否會破壞整體架構。“團隊內部會有競爭,會講求快速創新,但又關注協同,關注嚴謹,這是內部的一種文化。”程立表示,“這個過程會有一些沖突但我們盡量進行平衡,并對產品做不斷調整”。
為了保證內部技術團隊的持續創新力,支付寶在構建完整的培養機制。除了設立支付寶大學培訓機構,還采用師傅“傳幫帶”徒弟的方式培養技術人員。2013年,技術團隊做了一個“名師出高徒”的評選,選拔了小微技術領域最拔尖的6位專家,每個專家會6名徒弟組成一個研究小組,探索前沿的創新應用。與此同時,支付寶也會在世界范圍內尋求技術人才,以擴大前沿技術的探索。
不斷被考驗的架構
在程立看來,正是有了目前的架構支撐,支付寶從支付到金融走得很輕松。
支付寶的架構能力已經得到業內認可。從成立至今,支付寶經歷了三代的架構更迭。最初一批技術人員來自淘寶網,比較互聯網化,不過他們被要求不僅要像互聯網那樣快速擁抱變化,還要有金融意識,講求安全和嚴謹。
最初他們只服務于淘寶網,僅提供擔保交易和支付功能。到了2005年,隨著市場變化團隊的定位也在轉變——不僅服務于淘寶網,還要服務整個互聯網的電子商務支付。為此支付寶進行了兩項調整,一是將支付寶平臺從淘寶網獨立出來;二是向互聯網平臺開放支付寶的支付與賬戶體系。隨著向各個行業的滲透越來越深入,技術團隊不但要為每個行業定制更有針對性的解決方案,還需要設計一些通用的應用滿足客戶的普遍需求。在剛開始的階段,他們每遇到一項業務需求,便開發一個應用程序提供支撐。不過隨著時間的推移,整個支付寶的系統逐漸由一堆互不關聯的應用構成,隨著系統規模的擴展,各項應用之間存在大量的重復功能開發。
這種情況到在2010年被打破,在當年的“雙十一”大促那天,系統處理了3000多萬筆交易,系統的處理能力瞬間被撐大到平時的3倍以上,架構能力被發揮到了極致。程立清楚地記得“那是一個非常非常非常驚險的一天”。凌晨第一個高峰飆起來后,各種各樣的問題潮水般涌向技術人員,所有人處于一個精神高度緊繃的狀態,在大促快結束時,有一個數據庫只有30秒的挽救時間,當時他們做了一個重要決策挽救了這個數據庫。
在回憶那個驚險一天時,程立清楚記得,大促之后,大家非常興奮地慶祝,并把香檳灑在每個人身上。更讓程立記憶猶新的是,那一場大戰讓他們意識到當時的架構到了負荷極限,得想辦法往下走。
回溯過往,技術團隊已經經歷了第一代煙囪式的架構、第二代SOA架構,現在開始了第三代的云支付平臺。此時,技術團隊的架構構建能力已經非常熟練,只用了不到半年時間制定一個長達三年的前瞻性架構規劃,通過對架構進行劃分和分解,由若干項目群進行持續三年的運作,最終在2013年成功構建成云支付架構。2013年的“雙十一”大促,這個架構從2010年僅能支撐3000多萬筆,提升到可以應對1.88億筆交易,正式宣告了第三代架構的封頂工作已經完成。而“雙十一”也成為技術團隊檢驗和提升架構的能力的重大機會。
在第三代架構支撐下的支付寶系統也成為了一個“永動機”。此前,在第二代架構時代,每年支付寶會在凌晨停機幾次,將停機需要做的升級等事情在8小時內集中完成。但是第三代不再存在這個障礙,技術團隊將系統進行分布化設計,如果不是人為操作失誤,任何故障都可以做到分鐘級的快速切換。
為了持續提升技術團隊在系統上的技術能力,技術團隊每年會制定一個與業務愿景相匹配的愿景。對于第三代架構,技術團隊希望建立一個億級金融平臺,如果具體分解到每一年的目標中,2013年技術團隊的目標是1234,1是打造一個統一共享的金融業務核心,2是聚焦海量數據處理能力和云服務平臺。3是達到每秒30000筆支付的目標,4則代表小微金服系統99.99%的可用率目標,這些也都一一達成。
未來技術團隊將繼續針對互聯網金融進行技術攻,程立希望,通過互聯網的方式降低用戶使用金融服務的門檻,同時繼續加強平臺和產品的風險管理能力。