姚瑋潔
游戲規則的存在及政府的背書,或會讓場內數據交易平臺比場外交易公司更讓人放心。
仿佛一夜之間,大大小小的數據交易與共享平臺陸續出現。
除了2015年成立并投入運營的貴陽大數據交易所(以下簡稱貴交所)、華中大數據交易所(以下簡稱華中數交所)、長江大數據交易所、東湖大數據交易平臺,2016年,新建設的數據交易平臺有哈爾濱數據交易中心、江蘇大數據交易中心、上海大數據交易中心(以下簡稱上交中心)以及浙江大數據交易中心等。有人預測,到2016年年底,全國類似的交易平臺數量可能達到15個到20個。
中國不缺少數據挖掘公司,但數據交換和流通起來才更有意義。這也是大數據交易平臺近兩年井噴的原因之一。
但是,前無古人的數據交易平臺,到底怎么玩?
數據交易平臺井噴
全國第一家以大數據命名的官方交易所,是在2015年5月8日成立的貴交所。
“全球第一家商品交易所是芝加哥商品交易所,全球第一家證券交易所是阿姆斯特丹證券交易所,但是全球第一家大數據交易所是貴陽大數據交易所。”貴陽大數據交易所負責人王叁壽告訴《瞭望東方周刊》。
2014年,貴陽做大數據招商引資,引得業內人士紛紛前往,但當時很多人沒考慮到“圈地”數據交易,只是打算做做數據挖掘。
當年下半年,貴陽陽光產權交易所倒閉,王叁壽跟貴陽市市委書記陳剛一拍即合,成立貴交所,貴州舉全省之力支持。
幾乎同一時間,國內最早做大數據的幾個團隊也正分別向湖北省各級政府報批,醞釀在湖北省建立大數據交易平臺。
同年年初,華中數交所遞交了材料,不過,其進展與貴州相比較為緩慢。到2015年年中,湖北形成了華中數交所、長江大數據交易所和武漢東湖大數據交易中心三個大數據交易平臺共存的局面。
不久后,2015年8月,國務院常務會議通過的《關于促進大數據發展的行動綱要》為數據交易平臺一錘定音,明確提出“要引導培育大數據交易市場……鼓勵產業鏈各環節的市場主體進行數據交換和交易,促進數據資源流通”。
以此為引,各地的數據交易平臺紛紛涌現。
政府為何積極搭建本地平臺
值得注意的是,幾乎所有數據交易平臺都有政府的身影。
比如,河北京津冀數據交易中心由北京數海科技有限公司與承德市國控集團合作成立,上海大數據交易中心由上海申能、中國電信和中國聯通等國有企業聯合控股,浙江大數據交易中心的實際控制人為浙江日報報業集團。
“因為BAT(百度、阿里、騰訊)不會跟其他人共享數據,而除了BAT,市場上可用的數據,70%都在政府手里。”王叁壽表示。
近年來,中央下發的各類文件也多次強調,大力推動政府信息系統和公共數據互聯開放共享,加快政府信息平臺整合,消除信息孤島,推進數據資源向社會開放。
政府為何要積極建立本地平臺?
北京數海科技有限公司創始人秦翯對《瞭望東方周刊》說,各地政府之所以一定要建立大數據交易中心,除了響應中央政策,也是認為數據交易為發展大數據產業重要的基礎設施。
他預測,為防止國有資產流失,數據資產早晚會納入國有監管體系。“一旦納入監管,國有數據資產定會在場內進行交易。
但是,目前數據平臺開放的總體情況是:開放數據總量低、可機讀率低、少動態數據、未嚴格符合開放授權。
多位受訪的數據交易平臺負責人說,部分地方對開放數據既矛盾又困惑。
“這里面主要有兩方面原因:一是哪些數據能夠開放并沒有清晰的界定,二是向誰開放、怎么開放沒有標準可循。”華中數交所總裁吳愛國告訴《瞭望東方周刊》。
在阿里巴巴張北數據中心,工程師對IT模塊進行設備調試
他認為,未來政府數據開放最有可能的路徑是,先開放政府指導統計類數據,再到政府實體服務或監管類數據,最后是政府核心數據。
得先定個交易規則
實際上,數據交易并不是在建立數據交易平臺后才產生的,它由來已久,有些是通過黑市達成的,比如騷擾電話。也有正規的民營企業主導的數據交易,他們的交易模式包括電商模式、API模式,等等。
秦翯認為,未來的數據交易將分為場內交易和場外交易市場兩種形式。
完善的數據賦權賦值及數據交易規則體系,定會讓場內交易走得更遠。
“一個上海人、一個江蘇人,語言不通,怎么做生意?得先定個交易規則。”上海大數據交易中心合伙人申翔宇向《瞭望東方周刊》介紹了數據交易的玩法。
上海大數據交易中心的游戲規則包括四個方面:基礎原則、負面清單(不能交易的數據)、數據整理準則、交易規則。遵守規則的買賣雙方主要以API數據接口形式交易。
比如青島海爾集團作為需方,想通過貴交所采購一批中國小家電的通關數據,基于這些數據輔助制定一些外貿、競爭、市場策略。
“我們幫助海爾集團建一個API管道,連到供方服務器上去,想要調取哪方面的數據,海爾擰開API水龍頭即可。海爾會在交易所預存一筆錢,調取一次,扣費一次。”王叁壽說,“我一直相信,未來社會調取數據就像用自來水、燃氣這么方便。”
但這種數據接口方式也有其“別扭”的一面:需方很可能不知道供方能提供什么樣的數據接入自己的應用。這時,可以根據自己的應用場景,將較為寬泛的需求在某一平臺或者網站掛牌,滿足條件的A供方、B供方、C供方看到后提出細致的約束條件,“如果供需雙方能夠碰攏,這個游戲就可以開始玩了。”申翔宇說。
隨著交易數量的增多,交易過程中的問題也逐漸暴露。
王叁壽估計,買方和賣方的數量比是4:1。“很多機構手握大量數據,但不想賣,也不敢賣。”
特別是,不少機構不知道怎么將這些原始的數據轉化為商品,如果把原始數據看成地下水,除非有第三方機構來幫助他們把數據清理成自來水,否則,“喝了地下水是要拉肚子的”。
一些交易所會有指定的關聯公司提供相關的服務,但實際上這并不屬于交易所的業務范疇,交易所這么做的主要目的之一在于培育市場。
同一份數據,價值會大相徑庭
王叁壽認為,大數據是一種可無限循環、復制的資產,可以同時賣給好幾家公司,但不是賣得越多越便宜。同一份數據,在不同場景、不同時間的價值會大相徑庭。
“比如,同樣的通關數據,賣給深圳潤泰物流和青島海爾的時候,價格就差了幾十倍。潤泰物流需要幾百種通關數據,這對支撐其業務幫助很大,海爾只需幾種,只用于輔助其做些市場決策。最終,給前者的數據賣到600萬元,后者賣了幾十萬元。”王叁壽說。
目前,華中數交所和上海中心正在探索數據交易的定價機制。吳愛國認為,數據交易的價格存在眾多影響因子,包括:數據品種、時間跨度、數據完整性、數據樣本覆蓋和數據時效性等。
在考慮買賣雙方的信息是否對稱及交易地位等因素的基礎上,華中所會采用賣方定價、買賣雙方協商、交易所撮合定價、參考股票交易進行系統自動定價和根據應用效果定價等模式。
此外,很多平臺都發布了數據資產的價值指數,就像人民銀行發布的人民幣匯率一樣,用于指導數據交易價格,但真正有用有效的指數或模型還有待市場檢驗。
有無數種可能和設想
在本刊所采訪的大數據從業者心中,將數據加工脫敏后與其他企業直接交易并非他們的唯一長遠目標。因為數據交易有更為廣泛的內涵:數據交易市場,未來關注點在于數據衍生品的交易。
目前,各地的數據資產評估機構正紛紛涌現,它們為衍生品交易提供了基礎,比如,讓初創企業融資渠道變多。
“數海推出了數據資產置權貸款業務,和貴陽銀行、華夏銀行等互相授信,在給企業做數據資產登記確權后將其推薦給銀行,拿數據資產抵押解決貸款難的問題。”秦翯說。
貴州東方世紀科技股份有限公司在中關村數海數據資產評估中心登記評估后,就拿到了全國的第一筆數據資產質權貸款。
這也得到了國家層面的政策支持。2013年,國務院發布了《關于金融支持經濟結構調整和轉型升級的指導意見》,提出依靠金融創新為新興產業發展提供切實有效的支持。2015年9月,國務院印發的《促進大數據發展行動綱要》也提出,要探索開展大數據衍生產品交易。
吳愛國介紹說,目前數據資產金融衍生品涉及三種形態,除了上述的數據資產質權貸款,還包括數據資產股權入股和數據資產的有價證券。
現在,已經有大數據平臺成立了數據資產管理公司,推動企業的數據資產到大數據交易所或數據交易中心掛牌上市。
2015年12月15日,訪客在貴陽大數據應用展示中心參觀大數據交易所實時交易情況
而第三種有價證券的形式,很多平臺尚在探索之中。2015年12月,經過河北省人民政府的批復,數海科技成立了全國首家數據資產證券化機構——河北京津冀數據交易有限公司,開展數據證券化服務。
“數據交易是一個萬億元級別的市場,有無數種可能和設想,我們一直在做這方面的準備,等待產業爆發的那個時機。”吳愛國說。
確權難題
現代法律規定,無形財產屬于創作者。比如,文學藝術作品的版權首先屬于作者,因為作品通過作者勞動而產生。
大數據顯然并不適用于這一原則。數據的價值,百分之百依附于被記錄主體,而非記錄數據的公司。
阿里巴巴和京東并不能聲稱擁有每個人在購物時產生的數據。
“一個平臺方或者一個企業,花了成本和精力采集數據,他們對數據當然有一定的使用權。”申翔宇說。但這個使用權的范圍到底有多廣,沒人能回答。
數據確權的第二個難點,在于其易修改性。王叁壽認為,必須確定,原有數據一旦被其他公司加工成新數據再賣,是否要給源數據公司支付費用?支付多少錢合適。
目前各大交易平臺正在研究如何利用區塊鏈技術追溯數據來源,也將進行此類政策探討。
成立大數據交易所、掛牌交易,等于暫時回避了所有權,用既成事實倒逼社會和法律重視這一問題。但有人認為,在尚未確權之前就進行數據交易,會造成“數據丟失、黑市交易、個人隱私滿天飛”。
“不排除有些平臺或者場外公司有唯利是圖的可能,但是,數據交易并不是在數據交易平臺產生之后才出現的,很早之前,它就已經在黑市存在。數據交易平臺的作用就是讓數據買賣在陽光下進行。”吳愛國說。
以上交中心為例,為了落實個人數據保護原則,該平臺匯集分析了十多份涉及個人信息的國家法律法規,參照列出了30多項數據的禁止清單,凡是與個人隱私相關的規定,不管是數據流通、數據交易還是數據共享,都不會觸碰。
在華中數交所,數據商品上架必須經過清洗和脫敏,剔除個人隱私、企業機密和國家機密等敏感信息。“這是正規的大數據交易所和地下數據交易的根本區別。”吳愛國說。
但有人質疑,清洗后的數據質量無法保證。
“清洗會造成數據的顆粒度加大,這樣數據的價值肯定會降低。但脫敏是必須做的。”秦翯說。