劉中顯 成卓
我國宏觀經濟運行正面臨諸多新問題新挑戰,迫切需要做好政策儲備。前瞻性地研判宏觀經濟走勢,僅僅依靠統計數據稍顯滯后。市場日趨復雜和多元,采用大數據分析方法一定程度上能夠彌補如此局限,是提高宏觀經濟研判效率、積極應對內外部挑戰的必要工具。阿里巴巴作為全球互聯網公司市值第五名企業,匯聚了海量經濟數據,在大數據應用于行業分析、景氣判斷、經濟預測等宏觀經濟研究方面進行了有益的探索,值得借鑒。
一、初期探索:前瞻性精準預判的優勢初步顯現
早在2008年初,阿里巴巴就成功地應用大數據預測出世界貿易拐點。根據常識,買家在采購商品前,會比較多家供應商的產品,反映到阿里網站統計數據中,就是查詢點擊數量和購買點擊量會保持一個相對穩定的數值。阿里綜合各個維度的海量數據建立了“點擊量—購買量”的用戶行為模型。2008年初,阿里平臺上歐美買家的查詢點擊數急劇下滑。根據該用戶行為模型,阿里前半年時間預測出了世界貿易的拐點。這成為阿里較早應用大數據研究宏觀經濟的成功案例,也顯示出大數據在宏觀經濟分析應用中所具有的前瞻性精準預判優勢。
二、基本邏輯:底層數據—指標集—經濟模型
隨著物聯網、云計算、人工智能等新一代信息技術的發展,阿里逐漸采集、匯聚、整理、分析和研究其平臺內外的數據,形成了“數據—指標—模型”的大數據研究宏觀經濟的基本邏輯。
(一)匯聚阿里生態圈全域數據
阿里主要采集的數據包括:淘寶天貓、新零售、飛豬、螞蟻金服、大阿云、高德、釘釘、大文娛、阿里健康、站外數據等阿里生態經濟圈的全域數據。具體包括電商、零售、生活、工具、商業基礎設施、外部等6大類13小類72種數據,其中既包括基本畫像、行為偏好、社會交往、財富狀況等消費者數據,也包括商品/品牌、行業/地域、風險/價值等商業數據。數據采集方式為數據庫接入、外部數據爬取、輿情數據,以及通過人脈、經驗、內部管理層級等手工錄入。之后進行數據清洗。數據清洗方法:一是根據統計局、省市縣、貧困縣、農產品等分類整理;二是對文本進行結構化;三是對輿情等數據進行情感分析,最后得到經濟與社會數據、人脈關系數據。
(二)提取經濟數據指標集合
基于匯聚起來的經濟數據,阿里從新零售、消費升級、產業發展、區域經濟、全球化、中小企業雙創、平臺經濟治理、數據技術政策、技術普惠和社會責任等十個維度提取經濟數據指標集合,共涉及28類指標。總體上看,這些指標包括主要四類:一是區域經濟發展指標,包括城鎮化、淘寶村等方面指標;二是行業發展指標,包括產業帶、小微企業活躍度、綠色產品、農產品、國產品牌、老字號等方面的指標;三是人的指標,包括消費升級、大學生、殘疾人、婦女等方面的指標;四是國家關系指標,包括貿易、旅游、金融等方面的指標。
(三)構建模型展開經濟研究
阿里在底層數據和指標集合的基礎上,構建模型開展經濟研究。模型的邏輯是通過A(指標)變化看B的情況:一是分析就業、消費者福利、普惠金融等領域指標,得出阿里價值;二是分析消費品價格、信息化、創業等領域指標,為政府價格監測、供給側結構改革、智能制造、雙創等政策提供決策支撐;三是分析AI/IOT/BC技術趨勢、平臺治理、數據規范等領域指標,對未來發展進行預測;四是分析數據經濟。如,通過母嬰用品指標分析二胎情況、通過冬裝指標分析氣候、通過食鹽指標分析人口分布、通過進口保健品指標分析供給側改革、通過人員流動指標分析房地產和區域發展不平衡狀況。
三、主要特點:圍繞數據全生命周期開展“小核心、大協作”的數據能力整合
阿里充分利用大數據時代的顛覆性數據算力,圍繞阿里生態內外海量數據的采集、匯聚、分析和反饋等核心環節,以“小核心、大協作”的內外部資源配置模式,組織“內部少量數據分析團隊+規模龐大內部數據清洗團隊和外部研究團隊”,探索開展宏觀經濟分析,并對數據全生命周期進行安全保障。
(一)體現了及時、精準、低成本、高顆粒度和大樣本等大數據獨特優勢
一是及時性。阿里互聯網平臺積累起來的數據存儲在開放、即時的網絡空間中,交易數據、價格數據、瀏覽痕跡、位置信息等一切信息從相關主體使用互聯網起,即刻被記錄在網絡平臺中。這些數據被特定算法提取出來并用于處理和分析經濟問題,不存在時滯。二是精準性。阿里互聯網平臺按照實際電子商務交易情況記錄數據信息,減少辦理人員人工登記的操作,提供相對更加原始的數據信息,而非人工搜集并經過處理后的數據信息,體現了分析精確性的特征。三是低成本。阿里平臺大數據是用戶使用過程中自動被記錄下來的,不需人工調查和搜集。用于經濟分析的數據是通過算法等技術手段提取出來加以整理獲得的,很大程度上降低了數據獲取成本。四是高顆粒度。阿里互聯網平臺匯聚了10萬余種具體商品的交易數據,擺脫了傳統經濟研究集中在國家總量數據、行業總體數據等非細化數據的局限,使得阿里可以開展更加細化、更加具體的經濟研究。五是大樣本量。阿里互聯網平臺生態中既有大企業,也有大量規模以下的小微企業,使阿里擁有海量的樣本數,可以相對獲取總體或者接近全體的樣本信息。
(二)內部以部門合作方式生成和分析價格變動等宏觀經濟指標
阿里巴巴以清晰科學的部門專業化分工開展大數據經濟分析研究,基本分工方式為:少量經濟分析人員+大量數據采集和清洗人員。經濟分析人員配置較少。通常情況下,一項大數據經濟分析任務僅配置3名研究人員左右、全職工作3—6個月完成。數據采集清洗人員規模龐大。阿里配置了常設的百人規模的團隊負責數據采集和清洗工作。具體的工作內容龐雜而細碎。例如,a為b購買商品,a在北京下單和支付,b在沈陽收貨。當經濟分析任務是研究區域消費購買力時,數據采集清洗團隊要通過算法識別出該“支付和收貨不同城”的交易類別,并將其歸入a所在的北京地區數據集。
目前,阿里巴巴生產的常規指數包括網購價格指數、區域電商指數、云棲指數(用于測度云計算應用情況)。其中,主要用于宏觀經濟研究的為網購價格指數。總體上看,網購價格指數由兩類指數構成。一是阿里網購核心商品價格指數(aSPI—core)。該指數是固定籃子價格指數,通過圈定阿里零售平臺上近五百個基本分類下接近10萬種核心商品作為“固定籃子”,每月追蹤“固定籃子”內商品和服務實際網購成交價格變化,以刻畫網購主流商品和服務的一般物價水平波動,從而從網絡零售渠道反映宏觀物價走勢。二是阿里巴巴全網網購價格指數(aSPI)。該指數用以反映全網總體網購支出價格水平的變化。它不但包含了商品層面一般價格變動,還包含了新產品涌現所形成的消費結構變動信息。兩組指數均由十大分類指數構成,分別是食品、煙酒及用品、衣著、家庭設備及維修服務、醫療保健和個人用品、交通和通信、娛樂教育文化用品及服務、居住、辦公用品和服務及愛好收藏投資。十大分類指數下還包括了近五百個基本分類價格指數。
(三)對外以項目制開展宏觀經濟單個領域研究合作
一是與清華大學合作開展京津冀“電商→區域一體化”促進指數研究。該研究采集阿里平臺在京津冀地區銷售大數據,度量電商對區域經濟一體化的影響效果。指數體系分為區域差異性指數、專業化分工指數以及城市間互動指數等三個“橫向”維度,另外還有區域層面和城市層面這兩個指數的“縱向”維度。指數間通過幾何加權平均方法進行合成,從而得到電子商務對區域一體化促進指數。
二是與國務院發展研究中心合作開展重點城市價格監測,選取阿里平臺在重點城市的重點產品消費情況,監測重點城市的消費發展。
三是與國家發改委的合作。采集阿里平臺消費大數據,分析消費構成比例變化,用于對“十三五”規劃中消費升級的評估。該研究分析中高端商品消費、信息消費、個性消費比例變動,判斷消費升級情況;分析長江經濟帶、粵港澳等地區消費占比,判斷消費的區域增長動力情況;分析盒馬鮮生、天貓小店等消費占比,判斷新業態消費發展情況。
(四)從數據全生命周期梳理出14個安全域設立50個安全管理過程
阿里大數據宏觀經濟分析涉及復雜的數據流程和龐大的數據量,并涉及阿里生態內外的多方數據主體。為此,阿里在數據產生、數據存儲、數據使用、數據傳輸、數據共享、數據銷毀等數據全生命周期共梳理出14個安全域。其中,數據產生環節包括數據權利管理、數據分類分級等2個安全域。數據存儲環節包括存儲介質安全、存數數據安全、數據可用性管理等3個安全域。數據使用環節包括身份認證與訪問控制、加密管理、數據使用行為監控、數據使用過程安全等4個安全域。數據傳輸環節包括網絡安全管理等1個安全域。數據共享環節包括數據共享基本原則、數據共享安全等2個安全域。數據銷毀環節包括數據清理、數據介質的銷毀等2個安全域。在每個安全域,阿里又細分出50個安全管理過程。在每個安全管理過程中,都制定了相關的規章、工作流程,并能夠對安全管理的結果進行量化分析和可視化展示。目前,這些數據安全管理流程逐漸被阿里平臺上的企業所使用,向這些企業賦能。
四、借鑒阿里經驗,推動宏觀經濟研究智能化發展
(一)探索推進智庫與互聯網平臺“經濟分析+數據采集清洗”模式合作
阿里與清華大學、國務院發展研究中心等高端智庫合作的分工,通常采取阿里的數據能力與高端智庫的研究能力結合。建議發揮高端智庫經濟研究人員規模較大、專業齊全的優勢,推進與互聯網平臺公司開展對接合作。通過研究需求導向,積極推進高端智庫與互聯網平臺溝通,逐步解決當前大數據宏觀經濟分析中數據編碼、分類、時間、空間等口徑不一致問題,解決基礎信息采集、分析、使用的困難。
(二)研究建立大數據宏觀經濟監控指標體系
大數據研究宏觀經濟正在發生三個轉變:從依靠傳統統計數據向依靠互聯網非統計數據轉變,從監測預測宏觀經濟總量向監測預測宏觀經濟先行指標轉變,從中長期監測預測向實時監測預測轉變。但也應看到,大數據應用宏觀經濟研究更多是對價格、消費等進行客觀描述,較少采用結構性的方法來分析,缺乏經濟理論支撐。因此,建議發揮高端智庫的經濟研究理論優勢,圍繞網絡搜索、社交媒體、電子商務、終端定位和業務交易等大數據源,探索建立基于非傳統數據的宏觀經濟監測預測體系,提升宏觀經濟形勢分析以及重點行業、重點區域發展實時監測預測的大數據應用能力,以及中美貿易戰等突發事件應急研究相應能力。
(三)著力解決數據使用中的安全隱患
互聯網平臺公司的大數據中,微觀數據主體是多元的。一方面,基礎數據和初步合成數據涉及生態圈中小企業、平臺企業商業秘密,有較強的企業數據隱私性。另一方面,當眾多微觀數據運用大數據技術合稱為宏觀數據后,會涉及國家經濟安全。因此,建議著力關注數據應用的安全問題。鑒于我國高端智庫的信息化團隊普遍規模較小,建議借鑒阿里等平臺公司對數據全生命周期的安全管理模式,建立智庫大數據使用規章、制度、流程,合理安全使用大數據。
(作者單位:中國宏觀經濟研究院、國家發展改革委經濟所)