謝明+++劉愛民
摘要:盡管大數據的理論和應用已有著相關學科的各類研究,但既有的研究缺乏對不同政策適用大數據方法進行評估的考察。文章的目的就是檢視不同政策適用大數據方法進行評估的情況。文章基于對大數據相關文獻的介紹和梳理,分別從理論邏輯、現實應用、實證經驗三個維度對使用大數據方法進行政策評估的可行性進行分析,最后構建“數據收集—數據分析”矩陣來描述何種政策可使用大數據方法進行評估。
關鍵詞:大數據方法;政策評估;收集數據;分析數據
政策評估在我國發展至今,其重要性已經得到一定的認可,但無論是作為政策理論研究的重要內容,還是作為政策實踐的關鍵環節,政策評估的地位及其在政策活動中應發揮的作用都有待進一步發掘。問題的成因之一可能在于國內學界目前缺乏對政策評估方法的研究,導致政策評估難為“無米之炊”。
黨的十八屆三中全會提出治理能力現代化的目標,并強調加強頂層設計。這對公共政策領域也提出了全新的要求,引入更加科學、規范、有效的評估方法是新時期政策評估發展的題中之義。傳統的政策評估方法主要包括規范研究方法和實證研究方法,兩者各有所長,又都有局限。面對日益多元而復雜的政策環境,運用單一的研究方法進行評估已經難以滿足現時政策發展的需求。運用大數據方法進行政策評估正是在此背景下應運而生。
一、 基于大數據進行政策評估的邏輯
一般認為,規范研究和實證研究是政策評估中彼此分立的兩種評估思路。目前國際上主流的政策研究人員也據此形成兩個旗幟鮮明的陣營:主張政策評估應以價值判斷為主從事規范研究的傳統政治學家,以及具備定量分析背景并強調量化指標進行實證評估的經濟學家。雖然兩種方法論的支持者觀點不同,但是不同方法論本身的關系并非完全對立,而是相輔相成,互為補充,更有學者倡導二者的混合與共融。事實上,無論采用何種方法進行評估,都必須基于數據(包括簡單的計數數據和高度復雜的數據信息)的獲取。缺乏數據的評估方法不能成其為科學嚴謹的評估方法。政策評估的嚴肅性要求評估方法必須用事實說話,憑數據定論。可見,政策評估本質上應該是一種“循數評估”——通過分析數據來研判具體采取何種評估方法的“數據驅動”型評估模式。
嚴格來說,循數評估的有效實施必須基于一個運行著大量數據的環境,數據無處不在,隨時可用,這顯然是傳統的社會和科技條件所不支持的。大數據時代的到來為循數評估創造了條件,海量數據、強調相關性分析、實時、動態等方面與循數評估的要求不謀而合。我們知道,政策評估的內核是分析因果關系,必須指出,“因果關系不過是相關關系中的一部分,分析相關關系也正是為了間接得出對因果關系的認識”。這就是大數據與政策評估相契合的邏輯。
二、 大數據方法在我國的現實應用
1. 既有對大數據的認知。大數據的概念在不同的研究中表述不一,關于其界定尚未形成共識。大數據通常被視為有價值的產業信息,是一系列體量巨大,尚不能運用現有管理和分析手段對之進行有效處理的數據集。大數據的開發利用對國家治理具有重要意義——大數據既是國家治理的環境和工具,又是國家治理的對象和結果。作為國家治理的重要內容,政策評估也將受益于大數據的發展。
隨著大數據時代的到來,數據成為一種新的自然資源,作為重要生產要素的大數據已經滲透到各行各業。大數據的分析方法隨之應運而生,如可視分析技術、人機交互、任務建模理論等方法技術的應用將帶來新的變革契機,人類社會進入科學發現的“第四范式”。
2. 大數據在我國的現實應用。目前,大數據的分析方法已廣泛運用于智能交通、環境監控和災難預警等方面。國家治理層面,利用大數據的方法能提升國家的智慧決策水平、公共服務能力、防治腐敗能力和風險治理能力。借助大數據的分析方法,可以提高公共管理的透明度、發現公眾需求、提高政策的針對性、進行輔助決策、引導管理部門實現內外創新。大數據方法通過數據多維采集,提供即時線索,提高相關動態數據的采集精度,從而無限逼近社會真實狀態。在此背景下,運用大數據方法可實現評估數據多維采集、評估數據集成挖掘和評估可視化解析,無疑是政策評估的全新范式。
3. 運用大數據方法的其他路徑。總體看來,現有的大部分文獻對大數據方法做了可觀的技術性探討,且以介紹性的描述居多,而研究內容上則主要圍繞大數據的概念、方法、意義展開,側重宏觀分析。相比之下,針對社會科學實務層面的應用研究較少,尤其是將大數據方法與政策評估結合起來展開研究尚處于起步階段。本文試圖厘清大數據方法與政策評估方法論之間的關系,在借鑒國外運用大數據方法開展政策評估經驗的基礎上,嘗試對可能存在的大數據方法適用于政策評估的規律做出總結。
三、 來自國外的經驗
國外對利用大數據方法推進政策評估已有一定研究。宏觀來看,許多發達國家確立了本國的大數據戰略,競相增加該領域的研究投入,試圖從中找到新的國家治理思路。具體而言,不少學者在SSCI的國際主流期刊上相繼發文,論述自己的研究發現。以下,我們列舉兩例:
1. 利用搜索查詢的大數據來評估環保態度的研究。Donghyun Lee等在“Energy Policy”上發表的文章介紹了基于大數據的思路利用搜索查詢的大數據對環保態度加以評估的研究。文章圍繞在政府能源政策制定和執行過程中發揮越來越大作用的公眾意見進行實證檢驗。為了對當地民眾隨著時間而不斷變化的環保態度進行量化,作者采用互聯網大數據的方法,對特定地域民眾的谷歌搜索查詢的數據做了采集,并通過普通最小二乘法的結果對民眾的環保行為進行驗證。為了檢驗這種方法的政策評估適用性,該研究再次考察了美國州政府制定的三項廣為人知的綠色電力政策--可再生能源份額政策、凈計量規則政策和公益基金政策。由于各州實行這三項政策的情況不一,作者選取的是右偏數據,運用累進失敗時間序列模型的方法進行雙重計量。研究發現控制其他傳統時變政策選取的因素后,州域內民眾的態度對政策的影響具備統計學意義上的顯著性。尤其是綠色能源政策中的反環保意見對政策的影響程度更高。據此,作者認為地方政府可以制定出更有針對性的環境政策。文章最后特別指出,能源政策領域內與民意相關的問題都可以借鑒這種方法進行討論。endprint
2. 利用谷歌趨勢及推特大數據來評估空間政策民意的研究。Wendy N. Whitman Cobb在“Space Policy”發表的題為“Trending now: Using big data to examine public opinion of space policy”的文章介紹的是關于利用谷歌趨勢和推特網的大數據評估空間政策民意的研究。文章首先對傳統測量民意的方法做了介紹,然后提出全新的民意測量工具,進而通過新舊測量方法的對比得出結論。作者認為,民意在美國空間政策中扮演著至關重要的角色,而谷歌趨勢和推特網的大數據分別為之提供了新的宏觀和微觀的視角。對比蓋勒普等民調組織的調研統計,大數據的方法能更加靈活地獲取反映民意的即時有用數據,相關機構皆可從中受益:就空間政策而言,空間領域和政治領域的政策企業家都可以利用通過大數據方法獲取的數據來游說國會和行政部門,以爭取他們更多支持和資金投入以幫助NASA進一步開展活動;科學界可借助大數據方法將他們的研究與大眾的興趣結合起來,以增進外界對其工作的了解和支持;而華盛頓的官員則可以在不具備相關專業背景的情況下,通過大數據方法讀懂高度專業化的數據信息。
3. 小結。民意,或謂之公眾態度,在政策的制定和執行過程中發揮著關鍵作用,獲取即時有用的民意數據并及時評估,可以有效推動政府制定出更加符合民眾預期的政策,同時還能降低政策演變的成本。國外的經驗表明,大數據方法已經為政策評估的這一需求提供了解決思路。不可否認,大數據方法仍存在一定局限,比如大數據的產生和發展較晚,缺乏長期數據;處理大數據的難度較大;收集的大數據僅來源于可接觸互聯網的人群等。但這些局限都不足以影響將大數據方法作為一種可行的政策評估思路。
四、 基于大數據方法的政策評估分析矩陣
以上我們探討了將大數據方法運用于政策評估的理論邏輯、現實依據及國外經驗,由此明確大數據方法可用于政策評估的結論。那么,何種類型的政策才能適用這一方法?為回答這一問題,基于Forte和Ward等學者在信息和數據方面的已有貢獻、Economist Intelligence Unit (EIU)的“發展階段”概念,以及Joseph Amankwah-Amoah對不同國家開發大數據的國家能力所做的分析,我們開發出用以檢視一項政策是否可通過大數據方法進行評估的“數據收集-數據分析”矩陣。首先,我們設定數據收集和數據分析是一項政策可采用大數據方法進行評估的兩項重要指標。同時,我們認為不同政策通常在這兩個維度的具體分布不同。一些些政策可在互聯網等媒介搜索與之相關的大量信息,從而為大數據的收集創造條件,另一些則不然。因此,不同政策用做評估的大數據“基礎”分別處于“數據貧乏”到“數據豐富”區間的不同層次(見圖1)。
數據豐富,是指與政策相關的數據可通過互聯網或其他方式大量獲取。互聯?和社交媒體的出現意味著大數據的現實可用。信息豐富,指的是對數據進行分析,將其轉化為知識并加以理解,以作為公共政策評估的基礎和行動依據。為使分析矩陣的建立具備更為堅實有力的理論基礎,我們選定數據收集和數據分析這兩個關鍵指標,利用“2×2”矩陣對不同政策在這兩個維度上分布的情況進行分類,如圖1所示。這些模式強調影響不同政策可利用大數據方法進行評估的程度差異,各政策可在不同模式中進行轉換。鑒于僅掌握大數據并不能開展政策評估,因而用作政策評估的大數據必須同時滿足“可識別”和“能解析”的要求。接下來的部分將對“數據搜集—數據分析”矩陣進行重點介紹,從而揭示如何利用大數據作為政策評估的依據。
1. 模式一:數據現金型(數據豐富,信息豐富)。該模式具備將大數據運用于公共政策評估的清晰路徑。“數據現金型”政策通常是全國性的政策,其特點是:公眾在互聯網平臺可搜索與之相關的大量信息,最有可能從中獲取政策評估所需的大數據。這源于技術的進步使得對網絡、手機和社交媒體的大型數據進行收集和分析成為可能,進而為政策評估提供依據。該模式的另一特點是數據可在政府部門及其分支機構、服務提供商和政策評估方之間互通共享。大數據為彌補知識差距創造了機會,借助大數據中提取的有價值信息,可以幫助破解政策評估中信息不對稱的難題。
2. 模式二:數據期貨型(數據貧乏,信息豐富)。模式二中,政策的相關信息通常較少見諸于網聯網平臺,民眾搜索頻率不高,但偶爾可能出現的政策熱點會產生包含大量有用信息的大數據。這類政策已經具備較為成熟的使用大數據方法進行評估的條件,充分利用出現的時機對收集到的數據做出分析,就能對該政策做出有效的評估。一種可能的解釋是,一項政策在大部分時間運行平穩,當其做出調整,引發民眾大量關注,并在較短時間內在互聯網等媒介產生大量搜索。當然,也可能歸因于與該政策相關的大規模數據收集不被允許,從而轉向收集有限數據并作出高質量的分析。可見,掌握并運用大數據方法可以提高決策質量,改變政策評估的未來。
3. 模式三:數據原料型(數據豐富,信息貧乏)。該模式中政策的特點是:在互聯網或社交媒體上擁有與該政策有關的大量信息檢索,可收集的數據體量可觀,但這些數據與政策本身無關,可用性不高,或現有技術水平尚不能對之進行有效分析,只能棄之不用。此外,政府或其他機構的數據共享機制缺失也是可能的原因。進入21世紀,成箱的觀察筆記、軟盤,滿櫥柜的數據表以及各地詳實的數據表要么未經處理,要么沒有連接到中央數據庫的現象并不罕見,進而導致典型的“數據豐富—信息貧乏”綜合征。一些機構可能收集和存儲了大量與此政策相關的數據,卻由于未經有效加工而無法關聯,而從當地機構獲取數據來分析則費時且昂貴。久而久之,豐富的數據由于缺乏整合導致可從數據中提取有用信息的能力非常有限。另外一些政策相關的大數據收集可能涉及道德倫理問題,必須對二者做出平衡。相當數量的數據可能因此不被用于政策評估。最后,收集的數據“通常不是直接可用,或不可直接用做臨床和管理的支持信息”,此外,如果現有技術水平還不能對某些數據進行處理和分析,它們也同樣不能輔助政策評估。endprint
4. 模式四:數據稀缺型(數據貧乏,信息貧乏)。模式四為數據稀缺型,該類政策規范的內容與民眾缺乏關聯度,民眾對其關注度不高;或者政策相關信息很少公開,更是鮮見于互聯網;現有技術水平的局限尚不能對相關數據進行有效的收集和分析也是一種可能的原因。對于后者,技術的不斷進步會讓問題迎刃而解。數據稀缺性政策的評估缺乏大數據的基礎,因而大數據方法不可用于該類政策的評估。
5. 小結。基于對矩陣的上述討論,我們提出以下假設:
假設性命題1: 如果政策相關信息的公開程度越低,那么使用大數據方法對之進行評估的可能性越低;
假設性命題2: 如果在全國范圍內收集和分析數據的能力越弱,那么運用大數據方法進行政策評估的可能性越低;
假設性命題3:如果政策運行越平穩,民眾的關注度越低,那么運用大數據方法進行政策評估的可能性越低;
假設性命題4:如果收集的數據不能形成全國性的數據網絡,共享程度越低,那么運用大數據方法進行政策評估的可能性越低。
五、 結論與討論
本文通過檢視不同政策適用大數據方法進行評估的情況對大數據的運用做了擴展研究。研究揭示了數據與信息之間的關系。借助概念化構建了一個“2×2”的分析框架,用以呈現不同政策分別適用大數據方法進行評估的情況及其所屬模式。幾種模式分別是“數據現金型”“數據期貨型”“數據原料型”,以及“數據稀缺型”。
本研究的構想還有助于厘清大數據并不必然轉化為大知識、大認知的線索。運用大數據方法進行政策評估不僅是一種全新的評估范式,同時也有助于改善政策評估的質量。盡管已有學者對大數據信息系統做了探討,卻對大數據如何被用來幫助政策評估缺乏系統性檢視。需要指出,由于大數據方法本身不是盡善盡美,我們的“2×2”分析框架也存在一些固有局限。比如數據有時具有欺騙性,某些數據并不必然具備政策意涵等。
雖然本研究還存在一些不足,卻對這一方向的探索起到拋磚引玉的作用,這至少表現在兩個方面:“2×2”分析框架顯然不能囊括所有政策,開發一個更為全面的擴展框架勢在必行,本研究為這種探索奠定了一定基礎。此外,本文很大程度上忽視了包括道德問題在內的運用大數據方法產生的內生性問題。必須強調,能夠運用大數據方法進行政策評估也就意味著相關主體具備大數據收集和分析能力,這必然給公民的活動帶來巨大影響。相關問題的研究還有待于將來做進一步探索。
參考文獻:
[1] 和經緯.中國公共政策評估研究的方法論取向,走向實證主義 [J].中國行政管理,2008,(9).
[2] 邱東.大數據時代對統計學的挑戰[J].統計研究,2014,(1).
[3] Cobb W N W. Trending now: Using big data to examine public opinion of space policy[J]. Space Policy,2015,(32):11-16.
[4] Amankwahamoah J.Safety or no safety in numbers? Governments, big data and public policy formulation[J].Industrial Management & Data Systems,2015,(9).
作者簡介:謝明(1958-),男,漢族,北京市人,中國人民大學公共管理學院教授、博士生導師,研究方向為公共政策基礎理論、公共政策分析、中國公共政策研究;劉愛民(1987-),男,漢族,廣西壯族自治區資源縣人,中國人民大學公共管理學院博士生,研究方向為公共政策。
收稿日期:2017-09-11。endprint