趙艷秋

被數據流通和應用所改變的用戶們。
2016年1月,阿里云在云棲大會上海峰會首次公布全面的大數據戰略和一站式大數據平臺“數加”。當時,參會者在展區圍住阿里云數據業務部高級專家陳鵬宇,甚至有企業在現場直接拉群,邀請陳鵬宇入群探討數據業務。
陳鵬宇2010年加入阿里巴巴,從負責螞蟻小貸業務的大數據技術開始,在早期就參與了阿里大數據業務的發展過程。在阿里云公布大數據戰略一年多后,陳鵬宇總結企業用戶在大數據實踐中的“三部曲”:看數據、用數據和跨行業打通數據。
“看數據”要像“看電視”
“Data 1.0階段是看數據,這是大部分企業的基本剛需?!标慁i宇說。雖然看數據的傳統BI工具已發展多年,但對企業老總和業務人員來說,看數據仍然不是一件簡單輕松的事。這是因為傳統BI都太復雜,企業還要花大量時間來解決數據孤島問題。
“現在有了云,數據采集后直接上云,天生就能融合在一起。只要有合適的工具,就能讓看數據變得簡單”。
阿里推出了看數據的工具Quick BI,突出“快”。它的理念是,老板和業務人員有需求,不再需要傳統上分析師轉化需求和數據工程師準備數據的過程,不用寫代碼,可直接連上云端的各種數據庫,用戶“拖拖拽拽”就能產生各種數據報表。而之前,“看數據”的響應周期是以周來計算的。
“我們希望今年把Quick BI做成阿里云的標配,就好比每家每戶都有電視機一樣?!标慁i宇說。
在“看數據”上,阿里云還有一種大屏產品DataV,據說這是阿里云上生意極為興隆的業務之一。它是一種軟硬結合平臺,無論阿里自己的日常業務展示、“雙十一”大屏展現,還是長江三峽工程、杭州城市數據大腦中都有這種大屏的身影。
今天在數加平臺上有3萬個大屏模板,都是客戶設計分享出來的?!拔艺娴臎]有想到,它很快就成了一個爆款?!标慁i宇說。
機器學習“不高深”
到了Data 2.0階段,數據要直接為業務所用,就像創新小貸業務,沒有信貸員,用數據決策貸款發放?!皵祿?算法就能解決業務問題。”陳鵬宇說,“其中最關鍵的是算法效果,這方面的人才很缺,我們叫他數據科學家?!?/p>
陳鵬宇觀察,目前市場上需求強勁的是個性化推薦。但以前只有淘寶、亞馬遜這些大公司才能玩,因為要寫算法、要有龐大的計算資源反復訓練模型。
中小電商、新聞網站、音樂社區能不能達到千人千變的效果?現在,阿里團隊把推薦算法和數據處理過程包裝起來,用戶只要按預定格式輸入三類數據——脫敏客戶信息、物品信息及客戶和物品之間的歷史行為,就可以得到推薦結果。
在新聞推薦上,陳鵬宇坦言《今日頭條》做的推薦算法不錯。“這要對新聞做比較完整的畫像,與商品推薦不同,要通過自然語言處理,提煉出新聞內容的關鍵詞”。
不難想象,推薦算法用到了機器學習,但這是一般企業都不敢碰的高深技術,同時還需要大量計算資源——一個個性化推薦算法,模型訓練周期很長,可能要跑好幾天。為此,2015年阿里云推出了機器學習平臺PAI,最近這個平臺剛剛發布2.0版。它把機器學習算法封裝好,將成百上千的參數隱藏起來,提供很多模板。
“你只要大概了解一下邏輯回歸、數據森林用在什么場景下,就可以開始工作了?!标慁i宇說,“有了這類平臺,做過數據分析和數據開發的工程師都可能往數據挖掘的道路上轉型?!?/p>
機器學習技術的普世化讓大量中小創新夢想成真。如利用PAI,墨跡天氣每5分鐘就可針對某一精準區域做一次天氣預報。
“受控的核反應堆”
到了Data 3.0階段,業界將交叉打通數據。
去年,曾有企業推出人工智能手機——手機能神奇地了解你的所需,并主動幫忙。例如,你外出旅行,飛機落地可以自動幫你叫車去之前訂好的酒店;你在電商平臺購物,它會貨比三家,還能在你走近快件儲存柜時,自動提示取件碼。僅僅這幾個場景,背后就需要打通航班、酒店、叫車、電商和物流等不同領域大企業的數據。
陳鵬宇預測,在Data 3.0階段,會有很多公司提供數據打通和應用創新服務。“而數據打通一定要有機制?!彼f,“我們說是在一個受控的核反應堆里,完成數據新能源的化學反應?!?/p>
這意味著,當不同企業的數據進入到受控平臺,他們可以寫程序,用到平臺中的各種數據,哪怕是用戶的敏感信息。但任何人,包括寫程序的人都看不到數據,這叫“數據可用不可見”,而且誰也拿不走?!拔覀兇_保數據的流通和使用權,但不是版權和擁有權。裸的數據拖來拖去,一定是不行的”。
今年春節后,菜鳥與物流公司在阿里數加平臺上構建一個受控的數據交換中心,叫菜鳥物流云數據池。菜鳥和物流公司都把數據放在那兒,并使用平臺上的配套工具分析數據,展現結果。如查看哪些包裹線路比較繁忙,物流公司可在倉儲、人力上進行更好地調配。
這樣的數據流通和應用機制,能讓一些公司改變態度?!耙驗楝F在基本上每家公司都想用別人的數據,但又不想把自己的數據給出去”。
傳統企業的積極姿態
對數據的應用需求不僅來自互聯網企業,傳統企業也找到大型互聯網公司尋求合作與創新。“特別是以前沒怎么具備數據化服務的行業,如地產、旅游和工業”。
協鑫光伏科技有限公司是全球第一大光伏企業。在太陽能面板生產中,生產良品率每提升1%,公司就能提高上億元收入?!拔覀兺ㄟ^歷史上每一次切割的參數值和最終切出來的良品率去做分析,最終找到影響良品率的600多個因素,協助協鑫調整生產工藝和流程”。這套方法論是可以復制的。同樣的,阿里也協助中策橡膠提升了3%到5%的良品率。
再如像波司登羽絨服,以前的渠道主要是門店,但“雙十一”購物大潮到來之后,波司登也有了很多電商渠道。如果這兩套系統不打通,倉儲和調貨會很麻煩。波司登利用阿里云企業級互聯網架構,打通了它的內部數據,把庫存降了下來。很多企業類似波司登,采用混合云,先把線下門店和線上門店數據跑通,來降低庫存。
陳鵬宇不斷強調云上數據的安全性。這是很多客戶的顧慮?!爱敂祿诰€化后,企業會擔心數據在一朵云上,會被云供應商管控了,其實這個擔心是沒有必要的?!标愑铢i說,“我們給客戶提供所有第三方審計,例如我們通過了公安部的等保三級認證,相當于金融服務水平。你把數據放在云上,就好比把錢存在銀行,或者放心打手機而不擔心被監控是一樣的?!?