□ 周海煒 陳青青
(河海大學 商學院戰略管理研究所, 江蘇 南京 211100)
隨著云計算、人工智能、物聯網、Web2.0等新一代科學信息技術的廣泛應用,數據的多樣性、實時性、多變性、價值稀疏性等復雜特征日益顯著,大數據時代已經到來[1]。許多國家已經認識到大數據的發展和應用是經濟社會高效穩定運行的重要手段,相繼出臺了多部大數據戰略規劃和相關法律法規,以此監管和指導國家大數據產業的高效發展。2015年8月,國務院印發《促進大數據發展的行動綱要》,首次明確指出加快建設數據強國,全面推進我國大數據發展和應用。2016 年發布的《中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》中首次將大數據發展定位為國家戰略,提出拓展網絡經濟空間,實施“互聯網+”行動計劃,發展分享經濟,推進數據資源開放共享,支持基于互聯網的各類創新,這些舉措充分體現了國家政府對大數據發展的統籌規劃。隨著各類大數據發展政策的出臺和實施,大數據發展政策體系逐漸復雜化,政策制定水平和實施效果仍存在突出問題。
大數據政策發展和完善是實施國家大數據戰略的重要保障[2]。我國大數據發展還不成熟完善的政策體系可以糾正市場失靈防范政府失靈彌補系統失靈修正倫理失范[3]。如何對已有政策進行客觀科學的評價,從而為新一輪政策的制定提供具體可操作的決策依據,實現大數據行業演進與政策制定的協同發展,是政府部門和大數據行業參與主體的關注焦點。因此,本研究通過文本挖掘和PMC指數模型建立大數據發展政策評價指標體系,通過8項大數據發展政策的PMC指數評分和PMC曲面圖,多角度直觀剖析政策合理性與可行性并提出相應的優化路徑,以期為下一步大數據發展政策的制定與創新提供借鑒。
數字時代的到來使得大數據發展水平成為國家競爭力的重要體現,大數據發展政策則為其提供了科學的政策指引。以往文獻主要采用定性與定量相結合的方法,包括文獻計量、內容分析法、圖論、網絡分析、知識圖譜等[4]。例如,范梓騰和譚海波[1]以省級政府出臺的大數據政策為樣本,從政策“目標工具”匹配的角度量化分析了地方政府大數據發展政策的主要內容、基本特征和發展趨勢,認為當下中國地方政府的大數據發展政策的主要目標是應用創新,側重于使用供給面政策工具。李樵[2]運用內容分析法,構建大數據發展政策工具的基礎資源維度、技術維度和領域維度三維分析框架,總結我國大數據發展政策工具選擇上存在的問題。徐蕾等[5]綜合運用扎根理論、詞頻分析和政策力度測量方法,通過共詞網絡分析大數據試驗區政策的關注重點與不足。季飛等[6]利用 Nvivo11 軟件對貴陽市發展大數據產業的42份文件做信息編碼和文本量化分析,得出供給型、環境型、需求型政策工具的使用都較為均衡合理的結論。劉亞亞等[3]從大數據政策的演進脈絡、政策關系網絡、政策主題詞演進態勢以及政策工具的使用情況等四個方面分析大數據政策。
綜上,目前研究關于大數據發展研究政策的樣本范圍較為局限,通常選取某區域的政策評價,或是專門針對國家層面的政策進行評價,研究深度也亟需加深,具體對政策本身內容的研究還較少,政策評價指標的多元性不足,難以從宏觀和微觀上同時把控政策水平,對某項具體政策的詳細解析研究較為缺乏。本文采用的PMC指數模型為大數據發展政策的研究視角提供了新思路。選取的8項大數據發展政策發布主體包含了國家級,省市級和地方級,樣本范圍相對寬泛,研究主題清晰明了,研究結果更具普遍參考和應用價值。本文基于政策情報進行文本挖掘,采用適用于大數據發展的PMC指數模型,由于評價指標體系本身就具備了大數據發展政策的特點,因此量化評價結果的精確度更高,避免了人為評價的主觀性。
PMC指數模型是Ruiz Estrada等[7]基于Omnia Mobilis假說思想提出的一種政策文本分析模型,主張萬事萬物都是不斷運動且相互聯系的,不應該忽視任何一個相關變量的影響。因此研究政策模型時選取的二級變量范圍應盡可能廣泛且不受限制,同時各變量權重應該相同。因此,作者采用二進制法平衡所有變量,通過PMC指數和PMC曲面從任意維度反映各政策優劣勢。 PMC指數模型已成為國際上較為先進的政策文本評價方法[8]。通常建立PMC指數模型的步驟如下。
步驟1:設定政策變量與參數;
步驟2:建立多投入產出表;
步驟3:計算一級變量值得出PMC指數;
步驟4:繪制PMC立體曲面圖。
為了保證研究結果的價值性與適用性,本文從不同級別機構發布的1500多份有關大數據政策文件中選取了8項富有代表性的政策,具體如表1所示。

表1 8項待評價大數據發展政策匯總
為了更具針對性的對我國大數據發展政策進行評價,本文參照Estrada[9]和已有文獻中學者對于大數據發展政策評價變量的設定并結合我國大數據發展政策的具體特點,確立了1個一級變量和43個二級變量。具體變量設計見表2。

表2 大數據發展政策PMC評價指標體系變量設計
設置好一級和二級變量后,運用文本挖掘的方法對二級變量進行賦值,當待評價政策滿足相應的二級變量內容時,變量取值為1,不滿足時取值為0。
多投入產出表是一種可存儲大量數據、對單個變量采用多維度測量的數據分析框架,由若干個一級變量和不受數量限制的二級變量組成。一級變量沒有固定的排列順序且相互獨立,二級變量構成一級變量,各二級變量權重相等[10],如表3所示。

表3 大數據發展政策評價多投入產出表
本文采用文本挖掘的方法確定二級變量的取值,運用ROSTCM6軟件將各項政策導入文本挖掘數據庫進行分詞處理,依據每項政策文本的關鍵詞對二級變量進行賦值,當政策文本包含二級變量對應的關鍵詞時,賦值為1,否則為0。相較于主觀性的專家打分,文本挖掘發更具客觀性和科學性。本文結合我國大數據發展政策的特點和研究現狀依據設定的變量,構建各項大數據發展政策的多投入產出表并依照上述方法對各項政策賦值。受篇幅限制,本文不再列出賦值詳情。
Estrada[9]將 PMC指數計算步驟定義如下:(1)根據政策內容建立一級變量與二級變量;(2)根據式(1)和(2),采用二進制法確定二級變量的具體數值,構建多投入產出表;(3)根據式(3)計算一級變量的數值;(4)通過公式(4)加總計算待評價政策的PMC指數。
X~N[0,1]
(1)
X={XR:[0~1]}
(2)
(3)
t=1,2,3,45,…,式(3)中t為一級變量,j為二級變量。
(4)
根據多投入產出表計算各項大數據發展政策的PMC指數,對各項大數據發展政策進行量化評價,評價標準為:8.5~10分(完美),7.5~8.5分(優秀)6~7.5分(可接受),0~6分(不達標)。評價結果如表4所示。

表4 8項大數據發展政策的PMC指數
PMC立體曲面有助于直觀立體的顯示PMC指數模型評價結果,更有利于分析各項政策的優劣勢。本文中由于X10的取值在8項政策中均相同,考慮到矩陣的對稱性和平衡性,去掉X10,按照式(5)建立三階矩陣繪制PMC曲面圖。
受篇幅的限制,本文僅列出了PMC指數排名第一和排名最后的PMC曲面圖即P1和P3。如圖1和圖2所示。

圖1 P1的PMC曲面

圖2 P3的PMC曲面
(5)
從上述PMC指數量化結果可知,8項大數據發展政策中5項政策評價結果為優秀,3項政策評價結果為可接受,沒有不達標的政策樣本。5項優秀政策中兩項是國家級政策,3項是地方政府級政策,表明國家在政策制定中起到較好的領導作用,地方政府也在緊跟步伐,結合實際情況制定高水平的大數據產業政策。從宏觀角度看,8項政策PMC指數平均值為7.65,總體處于優秀水平,表明國家和地方政府在大數據發展政策的制定上考慮較為全面,計劃較為詳盡,正在積極貫徹落實國家引導的大數據發展戰略。其中,X1政策性質均值為0.93,說明大數據發展政策在建議、預測、引導、監管等方面作用齊全;X2政策效力均值為0.42,說明大數據發展政策內容包含的發展目標期限值較為單一,在短期與長期時限上的具體規劃不夠全面;X3政策級別均值為0.33,說明大數據發展政策的發布機構單一,大多是國家層面機關或地方政府層面機構單獨發布;X4政策評價均值為1,說明大數據發展政策制定的依據、方案、規劃有理有據;X5政策領域均值為0.92,說明大數據發展政策涵蓋范圍全面,內容涉及我國經濟、政治、社會等多個領域;X6激勵措施均值為0.76,說明大數據發展政策含有多種激勵方式,以促進大數據產業的持續發展;X7政策重點均值為0.76,說明大數據發展政策制定重點內容突出,引導性較強;X8政策受體均值為0.80.說明大數據發展政策適用對象全面;X9政策視角均值為0.75,說明大數據發展政策中對宏觀和微觀內容的把握與解析較為具體。
同時,結合PMC立體曲面圖,從微觀上對8項政策分別進行深入解讀,并提出對應的優化路徑。結果如下:
P1的PMC指數為8.16,排名第1,評價等級為優秀,是2015年為全面推進我國大數據發展和應用,加快建設數據強國,由國務院發布的《促進大數據發展行動綱要》。其中,只有X2政策效力低于均值,其他均大于或等于均值,表明我國在制定大數據發展政策時對各維度的指標考慮較為充分。P1主要考慮長期規劃,其原因是P1作為全國大數據發展引導性文件,在長期總體目標上必須制定清晰,而短期具體規劃需要各地政府結合當地實際經驗。
P2的PMC指數為8.0,排名第2,評價等級為優秀,是2015年國務院辦公廳關于運用大數據加強對市場主體服務和監管的若干意見。其中,X1政策性質和X7政策重點低于均值,這與政策發布目的相關,P2的出臺的主要作用是運用大數據監管市場主體,因此政策重點落在了監管上,忽視了審批流程、試驗區建立等政策重點。表明未來在政策制定過程中,要著眼于政策內容籌劃全面性,豐富大數據發展工具的使用。建議優化路徑為X7—X1。
P3的PMC指數為7.39,排名第7,評價等級為可接受,是2017年工業和信息化部關于印發大數據產業發展規劃(2016—2020年)的通知。其中,X1政策性質、X2政策效力、X5政策領域和X9政策視角評分低于均值,此項政策是在P1的指導下發布的著眼于當前短時期內的政策,政策時效較短,缺少對環境方面的關注度導致政策領域分值較低,涵蓋的政策重點也是從宏觀角度出發,對各領域的細分度不夠。建議優化路徑為X5—X9—X2—X1。
P4的PMC指數為7.66,排名第4,評價等級為優秀,是2016年上海市人民政府關于印發《上海市大數據發展實施意見》的通知。其中,X2政策效力、X8政策受體、X9政策視角評分低于均值,由于政策屬于地方性文件,政策效力與政策受體較為單一,但制定時仍可以從完善政策視角層面出發,制定更加詳實的政策計劃,避免宏觀上的指導力不足。建議優化路徑為X9—X2—X8。
P5的PMC指數為7.86,排名第3,評價等級為優秀,是2016年江蘇省政府關于印發江蘇省大數據發展行動計劃的通知。其中,X1政策性質、X2政策效力、X8政策受體評分低于均值,對于地方級別的文件,普遍存在政策受體較少的局限性,未將政策上升到國家層面。政策中的目標期限值為5年,導致政策目標難以匹配當前大數據發展需求。建議優化路徑為X1—X2—X8。
P6的PMC指數為7.63,排名第5,評價等價為優秀,是2016年山西省人民政府關于印發山西省大數據發展規劃(2017—2020年)的通知。其中,X5政策領域、X6激勵措施、X8政策受體評分低于均值,政策領域涉及經濟、政治等多方面,但大數據在制度領域的運用涉及內容較少,導致X5得分較低,此外,激勵措施較少,僅在政府補貼和政策法規上采取措施,對于人才培養、基金設立等方面考慮不足,激勵措施的豐富性對于大數據發展能力至關重要。因此建議優化路徑為X6—X5—X8。
P7的PMC指數為7.39,排名第7,評價等級為可接受,是2015年農業部關于推進農業農村大數據發展的實施意見。其中,X2政策效力、X5政策領域、X7政策重點、X9政策視角評分低于均值,該政策是農業農村大數據發展規劃,中國農村大數據發展較為落后,應重視基礎設施建設和技術水平的提升,該政策涉及的發展重點較少,缺乏國際交流合作、產業融合創新和試驗區等較先進領域的政策計劃,政策整體落實難度較大。建議優化路徑為X7—X5—X9—X2。
P8的PMC指數為7.49,排名第6,評價等級為可接受,是2019年交通運輸部關于印發《推進綜合交通運輸大數據發展行動綱要(2020—2025年)》的通知。其中,X2政策效力、X5政策領域、X7政策重點、X9政策視角評分低于均值,作為近期發布的交通運輸大數據發展政策,政策重點還有待完善,可參照P1在行政審批和建立大數據試驗區方面加以完善政策重點。建議優化路徑為X9—X5—X2—X7。
本文從大數據發展政策評價指標體系構建的角度,利用文本挖掘和PMC指數模型對我國大數據發展政策進行量化評價,選取8項大數據發展政策進行實證分析,通過構建1個一級變量和43個二級變量,利用PCM指數計算結果和PMC曲面圖直觀清晰的展示政策各項指標的完整性與優劣性,從宏觀和微觀層面分別分析了政策特點并提出相應的優化路徑,為我國正在制定和將要制定的大數據發展政策提供參考。本文的研究結論主要如下。
首先,從宏觀層面看,一方面,我國大數據發展政策普遍存在政策效力單一的問題,在長期、中期、短期目標的制定上還不完善,目標與政策工具未能一一對應;另一方面,在政策涵蓋重點、政策領域、激勵措施的設置上還不完善。
其次,從微觀層面依次分析每項政策發現,8項政策中有5項評價為優秀,3項評價為可接受,PMC指數均值為7.65,表明我國大數據發展戰略總體制定水平較高,國家在政策制定中發揮了良好的指引作用,但也存在部分指標一級變量得分多數低于均值的情況,本文對每項政策的不足提出了對應的改進路徑。本文使用PMC指數的優勢在于,多投入產出表和PMC曲面圖能夠快速找到某項政策的指標得分并且識別得分差異度,明確改進方向,提高后期政策完善的效率。
根據PMC指數模型得出的研究結論和綜合分析,本文對大數據發展政策的優化提出以下建議。
第一,國家和地方政府在出臺大數據發展政策時,要立足于國情和當地具體情況,在總體目標的引導下分階段制定操作性強的小目標,兼顧政策的宏觀層面和微觀層面,提高大數據發展政策的可實施性和實施效果,同時,建議成立專門的大數據政策制定機構,協調不同政策制定主體間的行為。
第二,政策內容中激勵措施的豐富性,在政府補貼、技術支持、稅收優惠、專項基金、人才激勵等都要考慮,豐富的激勵手段有助于大數據發展水平的快速提升,同時建議在強調數據共享重要性的同時加強大數據信息公開和知識產權方面的立法與執法力度,為大數據產業的應用提供堅實的保障。
第三,加大政策宣傳力度,可先在某些大數據發展較成熟的領域開展政策落實示范區,隨后再逐漸拓寬應用領域,如醫療健康領域、電子商務領域等,重視大數據產業間的緊密聯系。□