
阿里云開放數據處理服務(以下簡稱ODPS)從今年1月份開始公測,近日宣布正式商用。測試結果顯示,100PB的數據任務可在6個小時內跑完,這個數據量相當于1億部高清電影。而且定價0.3元/GB,花幾百元即可分析海量數據,目前已服務將近100萬的客戶。用阿里云總裁王文彬的話說,“從數據中心到最底層的技術平臺,再到整個云產品,阿里云已經有形成了一個完整的云架構體系”。
在對外商用之前,ODPS一直是阿里巴巴內部的秘密武器。阿里小貸是ODPS最早的服務對象。官方數據稱,有超過36萬人從阿里小貸借款,最小貸款額1元,而且能夠實現3分鐘申請、1秒放款、0人工干預。在這背后,阿里小貸每天需要處理30PB數據,包括店鋪等級、收藏、評價等800億個信息項,運算100多個數據模型……這些都是放在ODPS上存儲和分析的。隨后淘寶、支付寶等阿里巴巴最核心的數據業務也已基本運行在ODPS平臺。ODPS產品經理湯子楠接說:“我們每天從淘寶和支付寶把相關的商業指標收集到ODPS上來,經過金融模型的分析可以得出每個賣家的信用額度、貸款數額、到賬時間等,然后將得到的數據判斷自動發送給淘寶賣家。不僅省去了人工審核的環節,還極大降低了成本,實現智能化流程操作。“
其實這樣的操作模式已經展現了ODPS的發展方向。淘寶和天貓平臺上的大量電商數據存儲在ODPS,阿里巴巴再引入第三方ISV(獨立軟件開發商)來開發分析工具和模型進行分析,最后他們將分析結果拿到服務市場上去銷售給賣家——所謂針對淘寶天貓用戶進行的精準廣告營銷,就是通過這種方法得來的。
阿里云希望通過ODPS,能夠讓更多的中小企業感受和利用大數據的價值,除了產品本身外,后續還會推出一系列的服務,比如幫助用戶設計數據模型,引導用戶更合理更低成本的使用ODPS等。但隨著ODPS的開放,需要將更多類型的企業和數據放在ODPS上,包括一些阿里巴巴內部不太擅長處理的非結構化數據。從目前來看,ODPS開放的還只是數據倉庫功能,以及部分數據分析服務,但阿里云顯然并不想止步于此?!拔磥戆⒗锇桶鸵仓皇前⒗镌频囊徊糠挚蛻??!蓖跷谋蛘f,“阿里云的目標是成為一個云計算基礎數據服務提供商,不擁有數據,但擁有平臺和大數據計算的服務,搭建起一個數據交換的機制平臺?!?/p>
“基于ODPS,我們希望能夠建立一個由數據生產者、消費者、加工者和服務應用供應商組成整個的生態系統?!?湯子楠說。ODPS是一個強大的數據計算引擎,結果的輸出需要各種計算模型的支撐,一方面ODPS平臺會提供一些計算模型;另一方面也需要借助生態圈的力量不斷完善ODPS。根據王文彬介紹,這個生態圈伙伴包括四個方面:服務和應用供應商,提供商業智能和數據應用;數據的生產者,可以是企業也可以是個人;數據的加工者;以及數據消費者,包括廣告、客戶滿意度改進、模式創新、精準推薦等。
阿里云不可能單靠自己服務好所有的企業用戶,因此必須結合整個行業合作伙伴體系,但要構建這樣的生態體系并非易事?!笆紫?,目前我們主要的數據是交易數據和用戶行為數據,大多數都是結構化、半結構化,對于非結構化的數據支持,是ODPS需要探索的一個很重要的地方;其次,今天雖然有能力把各個不同的計算模型放到飛天上,但大家怎么解決統一的事情,可能也是下一個要思考和解決的問題。”阿里云產品經理湯子楠說:“迎接挑戰,我們的最終目標是讓用戶能夠真正享受到在一個統一的平臺上能夠做所有的大數據運算的樂趣?!?/p>