本刊記者 韋順
政策肅清產業頑疾大數據步入快車道
本刊記者 韋順
大數據如今已不是什么新鮮事情,其本質是將單個可能沒有價值的數據收集起來,通過對多個數據的獲取、整合和分析,挖掘出新的信息,這個也是大數據的價值所在。我們現在每天電腦處理的數據已經超過10年前整個互聯網的處理量,互聯網底層沉淀了大量的數據源,這些數據加以整合,無論是對政府監管、對產業趨勢判斷、對企業風險以及戰略制定都有極高的利用價值。
隨著近些年中游大數據處理工具逐漸成型并走向成熟,大數據過去三年由概念逐步走向產業應用階段,未來兩年將進入穩步爬升恢復階段。今年產業政策不斷出臺,制約大數據發展的頑疾已被肅清,可以預見2017年大數據產業規模將繼續保持高增長。
全球第一家IT研究咨詢公司GARTNER被認為是IT行業最權威的數據發布者。2016年該公司發布了一張中國信息通信技術成熟度曲線圖,截止2016年7月中國大數據產業的期望值已經下降至泡沫破滅期的底部區域,這意味著大數據已經脫離了概念炒作周期,處于技術落地并加速向平臺發展的趨勢當中。2014年GARTNER也曾發布同樣的曲線圖,不同的是,彼時大數據產業剛剛過去期望膨脹期的最高點,而且預期的產業走向成熟期的時間是5-10年,但2016年的圖顯示產業距離生產成熟期的時間已經縮短到不足兩年,換言之,2018年前后大數據產業將走進成熟期。
大數據的產業趨勢同樣得到國內官方數據的支撐,根據工信部電信部門的大數據報告,2014年國內大數據規模僅為84億元,但到了2015年該數值提升至115.9億元,同比增長38%,2016年國內大數據產業規模進一步擴容,達到168億元,同比增速提升至45%,整個產業過去三年規模擴張已經翻倍。該部門還預計到2020年大數據年均增速將保持30%以上。
如果從微觀的角度看,大數據規模的持續擴大是存在內生邏輯的。大數據產業鏈可簡單分為上游的數據源,中游的底層軟件和數據分析工具,下游的大數據應用,其中中游工具是產業鏈價值變現的核心。處理軟件市場原來是由Hadoop統治,不過現在是Spark與Hadoop齊頭并進,與Hadoop相比,Spark可將輸出結果保存在內存中,解決了內存分析數據成本高昂的問題,同時Spark運行速度更快,編程更加容易,從而可更好適應冗繁的數據挖掘分析項目。工欲善其事、必先利其器,過去10年處理軟件成型并走向成熟是產業快速成長的關鍵點,包括亞馬遜、Cloudera、BAT都在加速Spark人才的培訓。工具的普及也使產業鏈的價值向上下游躍進,如三大電信運營商、華為紛紛將大數據納入戰略規劃中;國內三大互聯網巨頭陸續開放自己的大數據平臺;大數據在工業、公安系統、旅游、農業以及政府行政部門等領域運用。

表:部分大數據概念股一覽
大數據從2013年開始被炒作,隨后三年逐步回落至低谷,主要原因在于國內的大數據面臨多個問題,其中最為關鍵的是數據源開放問題,尤其是政府部門的數據源。
大數據的開發完全依賴于數據源,數據源是最基礎的資源,有了這個基礎大數據才能不斷的創作新的價值。正如美國人所言,這個和油田一樣,可以源源不斷挖掘出新的財富,而且越挖越有價值。目前大數據80%的業務量來源于政府,但多年來各地、各部門各自為政,數據源獲取難度較大,使得大數據業務難以開展。不過進入2017年,隨著多項政策落地,這一問題已經解決。
首先,今年1月份工信部就發布了《大數據產業規劃(2016-2020年)》,規劃提出了7項重點任務,目標到2020年,大數據相關產品和服務業務收入突破1萬億元,年復合增速將達到30%。《規劃》同時還提出,未來將培育10家核心龍頭、500家應用企業、建設10-15個大數據綜合實驗區等。該規劃出臺提高了行業進入門檻,對基礎設施建設布局有了新的規劃,對有技術沉淀以及行業布局的核心龍頭是利好。
其次,國務院近日印發了《政務信息系統整合共享實施方案》,方案提出到今年底,基本完成國務院內部政務信息系統整合清理工作,到2018年上半年,實現國務院各部門以及國務院與地方政府信息系統互聯互通。這是繼去年《政務信息資源共享管理暫行辦法》之后又一重磅文件。
再者,近期工信部表示,我國將建設過過一體化的國家大數據中心,推動公共數據開放和基礎數據資源跨部門、跨區域共享、提供數據應用效率和使用價值,同時加強安全監管,嚴厲打擊非法泄露和出賣個人數據行為,維護網絡數據安全。
上述三項政策正好解決了大數據在數據源開放、信息共享、應用領域等方面的問題,因此市場判斷行業可能會迎來新的發展契機。
個股方面,可關注東方國信、初靈信息兩家公司,其中重點留意東方國信。公司是大數據行業龍頭,原來是給聯通、電信以及鐵通做BI業務的,近幾年逐步向金融、工業、農業、旅游、醫療等其他行業大數據布局,目前是國內大數據產業鏈布局最完善的企業。剔除掉過去過去幾年并購承諾的業績增量,公司依靠在電信的大數據業務,也能實現穩健增長。目前公司估值僅有34倍,若今年能保持30%以上的增速,預期PE可降到25倍左右,估值明顯低估。
當然公司也不是沒有弊端,數據源是一個大問題。公司的數據源目前主要依靠外部公司提供,公司只是提供數據加工所需的技術和模型。硅谷大數據獨角獸Palantir因為擁有強大的數據庫,估值已經達到200億美金,東信的業務如果能向上游數據源延伸,發展成為平臺型企業,估值上千億元也不是沒有可能的事。
需要注意的是,當前大數據也存在瓶頸。大數據的根基在IT系統,但目前企業所用的IT系統是建立在IOE+Cisco模型基礎上的,這樣的模型不適合大數據發展,因為企業會面臨更高的成本與技術難題。現在產業提出去IOE化理論,但又面臨國家安全問題,突破這個瓶頸可能需要一次IT產業技術變革,難度很大。