胡媛 蔣天森 高薇等



關鍵詞: 開放政府數據; 元綜合; 影響因素; GTEV 模型
DOI:10.3969 / j.issn.1008-0821.2023.12.009
〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2023) 12-0100-11
當今社會的數字技術高度發展, 不斷生成的數據已成為一種社會生產新要素[1] 。政府數據作為公共數據的重要組成部分, 其開放與共享已成為不可逆的趨勢。開放政府數據(Open Government Da?ta, OGD)是指任何人都可以自由、免費、無需授權地訪問、獲取、利用和分享政府的數據, 進而促使建設參與、透明、協作的開放型政府[2] 。自2009年美國發布《透明與開放政府》并建立世界上第一個開放數據平臺以來, OGD 在世界范圍內迅速擴散。2012 年, 上海市拉開我國城市政府開放數據平臺建設的帷幕, 到目前我國已有200 多個地方政府數據開放平臺。政府數據在開放過程中, 不僅能實現提高政府透明度、加強公眾問責、促進公民參與等效益, 還能推動大數據的發展, 供社會進行增值和創新應用, 進而促進經濟增長[3] 。然而, 在各國(地區)高度重視并投入大量資源建設的背景下, OGD 實施仍面臨組織架構不合理、數據標準不統一、法律法規不完善、價值實現不順利等挑戰,OGD 仍需不斷發展。
1研究問題和研究設計
1.1研究基礎與問題確定
開放政府工作組提出, 政府數據在滿足完整、一手、及時、非歧視性、非私有、可獲取、可機讀和免于授權8 項條件時可稱為“開放”[4] 。與傳統的政府信息公開不同, OGD 更注重數據被開發利用后產生的價值[2] 。
當前, 國內外學者多從數據開放方探究OGD 的影響因素。如Conradie P 等[5] 提出有關開放數據的法律政策、組織、技術、經濟和文化五大影響因素;趙潤娣[6] 構建“政治—經濟—公眾” 三要素的影響因素分析框架。現有研究多將OGD 歸為創新擴散的領域, 認為其主要受到技術、組織、環境3 個層面的共同影響[7-8] 。但政府數據的利用不僅由政府進行, 還包括公眾、企業、社會組織等多主體對數據的利用。對于如何匹配用戶需求并利用數據產生價值, 陳美等[9] 基于UTAUT 理論構建用戶采納模型,段堯清等[10] 和陳玲等[11] 分別研究了公眾初次使用、持續使用政府數據的意愿的影響因素。
對于OGD 實施過程中各因素的關系, 學界基于生態系統視角從縱橫兩個維度建立了框架與模型。縱向維度方面, 學者們分不同的階段來闡述OGD 的實施過程, Evangelos K 等[12] 將數據開放劃分為4 個階段: 政府數據聚合、數據整合、與非官方數據的整合、與非官方數據和社會數據的整合;鄭磊[3] 建立了包括數據的生成、開放、利用、效果的動態系統。Harrison T M 等[13] 則從橫向維度構建了一個包含行動者、技術設施、組織和相關資源的開放數據社會生態系統, 并闡述各要素主體之間的相互作用關系。
綜上而言, 目前國內外對于OGD 方面的研究成果為本文提供了堅實的基礎, 但仍存在探索空間。現有研究大多僅從數據開放方或數據利用的角度研究影響因素, 少有從數據利用方、用戶參與、價值共創等多主體角度的全面分析; 隨著研究的深入, 納入研究的因素越來越多, 既有研究存在遺漏影響因素、解釋力不足等問題, 亟需構建一個完整通用的理論模型框架, 進一步分析各影響因素間的復雜關系。基于此, 本文以OGD 發展過程和實施質量的影響因素為主要研究問題, 對其進行解釋性元綜合研究, 并分析各因素間的互作用關系, 進而構建更為全面的因素整合框架, 以期推動OGD 發展并提高實施質量。
1.2研究設計和研究方法
本文采用元綜合方法對OGD 影響因素進行提取、匯總和綜合。元綜合是一種對于選定主題的相關文獻進行檢索、篩選、提取、解釋、融合、重建并詳細解釋的方法, 該方法將定性和定量的結果一同納入框架進行分析, 通過匯總眾多文獻中重要因素、重新定義含義重復的概念, 最終實現理論轉化和拓展研究。與學界進行綜合分析時普遍采用的Meta 和質性元分析相比, 元綜合對于文獻的選擇更具包容性; 同時元綜合對文獻的綜合性解釋能夠避免單一視角分析的弊端。
根據Christina H[14] 的研究, 元綜合的具體過程如下: ①明確研究主題并制定文獻檢索策略; ②確立文獻納入標準并篩選檢索出的文獻; ③選取適合的批判性評估標準, 并根據評估結果進一步篩選文獻; ④運用合理的方法對數據進行提取、歸類、綜合; ⑤對分析結果進行信效度分析, 判斷結果的質量。
2數據處理與分析
2.1數據獲取與預處理
2.1.1檢索策略
文章選取CNKI 數據庫作為中文數據庫來源,WOS 所有數據庫、Scopus 文摘數據庫、Proquest 碩博士論文全文庫作為外文數據來源; 檢索范圍為檢索日期2022 年7 月22 日以前的所有文獻。根據檢索策略檢索文獻, 合并去重后共計得到外文文獻2 023篇, 中文文獻1 815篇。
2.1.2納入標準
確定納入標準是進行文獻元綜合分析的必要條件, 有助于保障分析文獻的質量。本文文獻納入標準如下: ①研究主題涉及OGD 的影響因素, 包含探索性和驗證性的實證研究, 排除主題不相關文獻;②文獻的研究主體為政府開放數據的實施過程, 不包括對結果的滿意度等; ③文獻僅限于中英文期刊論文、學位論文, 去除書評、會議論文以及同一作者相似的論文等。通過上述納入標準篩選得到78 篇文獻, 包括42 篇外文文獻, 36 篇中文文獻。
2.1.3文獻質量評估
文獻質量與最終結論的質量有關, 高質量的文獻有助于提升結論的有效性與科學性。因此, 研究采用文獻質量評估工具對篩選出的78 篇文獻進行質量評估。本文采用圖書情報領域的EBL 評判工具[15] 對納入文獻進行質量評估。具體包括4 個部分: ①總體特征: 樣本的基本情況和文獻納入標準; ②研究設計: 選擇的研究方法是否適用、是否詳細充實以利于復制等; ③數據收集: 數據收集方法是否有效、是否帶有偏見等; ④研究結果: 結果是否合理, 是否清晰反映研究主題等。每部分有5題左右, 每題有是(Y)、否(N)、不清楚(U)、不適用(NA)4 個選項。梳理文獻內容并對照選項回答, 統計最終結果, 根據式(1) 得到的總分數≥75%或者根據式(2) 得到的總分數≤25%, 則該篇文獻通過質量評估。
需要說明的是, 評估表中A 部分“樣本數量”采用式(3) 判斷, 式中N 代表總人數, n 為樣本量, e 代表選擇95%的置信區間[16] ; “回復率” 以在線調查回復率大于30%、當面調查回復率大于80%為判斷標準[17] 。通過進行EBL 批判性評估后,最終選出56 篇文獻納入分析。
2.2數據提取和綜合
在對研究內容進行數據處理時, 結合Anselm S的編碼思路和“批判性解釋綜合” (CIS)方法對文獻進行解釋性編碼。Anselm S 等[18] 編碼可分為以下3 個步驟: ①開放式編碼標記文獻中與研究問題相關的陳述, 形成初始概念; ②主軸編碼對初始概念進行聚類形成泛型; ③選擇性編碼壓縮新主題形成核心泛型。CIS 本質是一種兼具“解釋性” 與“綜合性” 的研究模式, 通過回顧、匯總各種概念和因素并進行批判性思考, 綜合重復冗雜的概念以形成新的模型。具體步驟如下: ①研究文獻, 識別、獲取和理解相關陳述、概念和隱藏含義; ②將獲得的初始概念進行再表述, 整合相似概念; ③對照整合后的概念, 總結其中隸屬關系; ④歸納綜合概念, 最終整合為一個理論框架[19] 。為確保概念的普適性和有效性, 鑒于初始概念數量多且重要程度不一致, 因此選取次數3 為閾值, 將大于等于閾值的編碼歸入初始概念。
2.3結論檢驗
本文分別采取兩種方式來檢驗結論信效度: ①文章納入編碼的文獻前期均經過EBL 批判性質量評估, 且大多來自CSSCI、北大核心等期刊, 內容質量較高; ②根據Francis J J 等[20] 結論飽和度檢驗的研究, 本文首先將所有原始材料進行編號, 隨機選取其中3 份作為測試集, 剩余53 份材料作為實驗集正式編碼; 然后檢驗測試集材料中是否有新的編碼, 若沒有即認為理論飽和度檢驗通過; 綜上所述, 本文結論具有良好的信效度。
本文基于開放式編碼的結果, 并通過主軸編碼和選擇性編碼自下而上逐級提煉, 得到有關OGD實施影響因素的概念和范疇, 對結果進行梳理、歸納和綜合。最終得到75 個初始概念, 28 個范疇,11 個主范疇, 歸類為4 個維度, 如表1、表2 所示。主范疇分別作用于OGD 實施過程中的各要素主體, 與OGD 的實施具有指導、支撐、依據關系,如表3 所示。政府作為開放主體, 通過體制指導和能力支撐, 利用信息技術實施開放; 技術基礎、數據平臺技術、數據要求是數據開放行為全過程的基礎支撐和實施依據; 政策政治環境能在法律和行政上指導開放行為, 組織環境作為重要支撐因素, 公眾參與、社會環境作為重要依據因素, 作用于開放全過程并促進開放行為的有效實施與價值實現。
3 OGD實施影響因素互作用框架構建
本文基于編碼過程對概念的逐級解釋和綜合,以及主范疇間的互作用關系, 并結合數據生成、開放、利用的全生命周期, 構建出由核心因素政府組織(Government Organizations)、基礎因素技術保障(Technical Support)、促進因素內外環境(Internaland External Environment)、目標因素價值實現(Val?ue Realization) 組成的開放政府數據實施過程的影響因素框架(GTEV 模型), 如圖1 所示。政府組織作為數據開放方和相關政策制定者、實施者, 指導數據開放生成、開放、利用的實施全過程; 技術是開放行為實施的手段, 相關技術水平直接影響OGD 實施質量和效果; 實施過程中, 內外環境是深刻反映政府開放行為的內在關系和影響過程的促進變量, 同時影響技術的發展變遷; 開放數據的目標是通過促進各方的積極參與, 實現經濟、社會、政治方面的長遠效益。
3.1政府組織維度
政府組織作為數據開放核心與主體, 其內部體制和政府自身能力直接影響數據開放水平, 不同政府因組織結構、信息架構等不同, 對技術的接納和應用水平存在巨大差距[8] 。完善的政府體制、高效的政府能力才能使政府在組織層面充分實施開放數據, 如圖2 所示。
政府體制是組織運行的基礎, 指導OGD 的實施, 而政府管理體制則是政府體制的基石。處于龐大橫向組織網絡關系中的地方政府, 在實施OGD 時必然會受到組織網絡制度的影響[21] 。而我國尚未形成有效的管理組織架構[22] , 大量數據資源長期處于閑置、封閉狀態, 直接影響生成政府數據階段的效果。同時, 話語權和問責制的建立也對具體實施過程存在一定影響, OGD 的成功需要政府、公民、大眾傳媒等各界群體共同努力[23] 。在整體管理體制高效的同時也要關注對開放數據的單獨管理體制, 數據共享較為先進的國家(地區)通常會設置專門的數據管理機構[24] 。健全政府數據管理體制, 有助于打破部門、系統之間的數據壁壘, 以實現數據開放共享。而在具體的OGD 實施過程中, 如何將政府體制充分融入到開放活動中則依賴政府能力。
政府能力是組織體制的具體體現, 支撐OGD的具體實施。OGD 實施需要投入大量的人力、財力,豐富的資源為組織行為提供保障[25] , 各個城市經濟水平的不同一定程度上造成了城市之間OGD 水平的差異。具備良好組織能力的政府, 能夠協調組織資源的投入, 力爭要素的最大利用[26] 。OGD 作為一項政府創新工作, 政府制定、執行相關政策的能力是實施行為的最初動力, 直接決定OGD 實施的績效[27] , 同時保證了政策執行和公眾需求的迅速響應。在此過程中, 政府創新能力越強, 越能夠利用數據產生更大的價值, 對數據的需求也就越大,從而產生良性循環推動OGD 的發展。此外, 商業創新環境[26] 、創新戰略[25] 等因素也在宏觀或微觀層面影響政府創新活動, 間接影響OGD 的實施。
3.2技術保障維度
技術保障因素是OGD 實施的基礎與前提。OGD作為一種治理模式的探索和創新, 需要一定的技術能力作為支撐。當一個政府擁有較充分的技術支持,即便沒有充足的財政資源也能夠擁有較高的數據開放水平[28] 。技術保障主要從技術基礎、數據平臺技術和數據要求3 個方面體現, 如圖3 所示, 這些因素為OGD 的全流程實施奠定基礎。
技術基礎作為OGD 實施的重要支撐, 是指信息技術的發展水平和政府所擁有的技術能力。與傳統信息技術相比, 政府通過社交媒體、網站等渠道發布信息不僅提升了信息的傳播速度和效率, 還減少了數據獲取的限制[29] 。OGD 離不開政府自身信息技術的支撐作用[30] , 政府信息水平的高低將直接影響數據開放的實施。
數據平臺技術主要指建設政府開放數據一體化平臺、管理以及保障平臺安全。數據平臺技術是OGD 前端服務的保障和支撐, 平臺門戶直接展示信息, 其清晰度、可理解、有用性等基本性質影響OGD 的可讀性和有效性。作為數據的“承載” 和“傳播媒介”, 政府數據開放平臺應在政府體制的指導下根據用戶需求提供多元化的政府數據服務。而除平臺的多元化外, 信息類型、開放形式、分享機制等也對OGD 的實施績效有一定影響[31] 。此外,平臺的安全問題不容忽視, 要充分利用信息技術保障平臺的數據和用戶的使用安全。
數據作為政府開放的核心服務內容, 數據本身的安全、及時可用性、開放標準、數據內容質量等均對政府開放工作的績效起決定性作用。隨著數據開放數量的激增, OGD 出現了數據質量不高、數據利用方面成果少[32] 等問題。OGD 的主題覆蓋面、部門覆蓋率、高需求關鍵詞覆蓋率對其完備程度有直接關系, 但數據集數量并非越多越好[33] ,只有高質量且符合用戶需求的數據集才能促進OGD的有效利用。一定的開放標準, 包括統一的數據開放共享格式、完善的數據發布審核流程等, 有助于提升OGD 質量與效率。數據要與技術發展相適應,數據機器可讀性的提升, 能方便用戶發現并利用數據[34] 。OGD 應具有免費性、非歧視性、自由利用、自由傳播的基本功能, 統一的開放數據共享標準有助于數據互通, 避免“信息孤島”。同時數據可用性和及時性對OGD 的實施效果也有重要影響[35] , 及時動態更新數據內容, 保證數據的高效利用與及時可用。此外, 在OGD 實施過程中, 從技術層面、行業層面、制度層面保障數據安全, 有助于增加公民信任度, 擴大OGD 的范圍和深度。
3.3內外環境維度
內外環境代表OGD 實施過程中的內部與外部狀態, 與服務全過程實施有著緊密聯系。各國(地區)開放政府數據模式無論是社會需求推動型還是政府主導型, 都離不開內外環境中各因素的相互作用[36] 。其中, 內部環境因素包括政策政治環境、組織環境、公眾參與, 外部環境因素指社會環境, 如圖4 所示。
政策政治環境是其中最主要的影響因素, 頂層設計與宏觀規劃能指導OGD 實施的方向。相關政策的完善是OGD 實施的基礎和指導因素, 反之,政策的缺失則會降低政府開放的主動性與積極性,影響社會對政府數據的需求[37] 。目前, 我國仍存在法律法規建設薄弱、國家統一的法律體系遲滯缺位等問題, 在數據隱私安全、數據共享、政府數據等方面的立法仍需完善[25] 。同時, 法律制度的執行還需依靠積極的監管, 以保障政府機制的長效運行[5]。
組織環境即政府數據開放理念與政治壓力。政府作為最大的社會數據資源擁有者[38] , 其數據開放共享理念對OGD 的實施有重要支撐作用。開放的組織文化對OGD 工作有著積極意義, 而封閉的組織文化會使得政府人員在心理上產生排斥情緒[3] ,甚至成為開放政府數據工作的阻礙。在實施過程中, 通過培訓學習樹立正確的數據開放共享理念,能使政府人員主動接受數據開放。同時, 組織行為的發生往往依賴于過往的經驗、價值理念等, 當創新行為違背過去的理念時, 組織會消極應對[38] 。因此, OGD 需要自上而下的推動, 上級組織的支持、部署和壓力是OGD 的推動力量[8] 。
政府的具體實施很大程度依據公眾的參與情況。公眾參與首先體現在社會各界需求方面, 開放政府數據行為是為回應公民社會需求的行政行為[28] 。公眾需求間接影響政府數據的生成和利用。為回應公眾需求并增強社會穩定性、獲得公眾支持, 政府主體可能會積極提升政府開放水平[37] 。社會各界需求還涵蓋了社區組織、企業、媒體組織[39]等各個社會組織的需求。同時, 政府績效、監管質量等重要指標也與社會參與密切相關[40] 。OGD 的最終利用方是公眾, 公眾的信息素養在利用數據階段起決定性作用。公眾的信息素養包含了需求認知、及時檢索、使用、評價信息等方面, 影響著公眾對政府開放工作的認知度與對政府數據的利用能力。一方面, 公眾對數據開放有最直接的需求和使用體驗, 提升公眾認知度能為數據開放共享奠定基礎; 另一方面, 隨著技術的不斷發展, 公眾能通過自身能力利用數據創造價值并給予正反饋, 從而促進供給的上升。
社會環境是OGD 的外部因素, 主要指外界壓力對數據開放的推動。政府受到的信息共享壓力越大, 數據開放共享程度越高, 但僅依靠上方高層壓力和下方社會需求強制推動政府采納新技術, 只會使得政府機構更加分割, 導致OGD 呈現碎片化的狀態[41] 。而在橫向政治競爭壓力巨大與合作需求豐富的體制中, 推動開放式治理創新的動力才能經久不衰。從全球來看, 數據開放運動已是大勢所趨, 在時代背景的倒逼下, 會加快推進OGD 工作。
3.4價值實現維度
價值實現意圖利用開放數據以實現在經濟、社會、政治方面收獲長遠效益, 這也是OGD 的最終目的。在OGD 中引入價值實現, 促進不同利益的群體參與, 是解決開放數據利用問題的重要方法[42] 。在數據開放和價值實現過程中, 主要考慮兩個方面,即收益和風險, 如圖5 所示。
OGD 本身不能直接帶來價值, 只有當公眾、機構等組織利用其創造公共價值時, 開放政府數據才真正具有價值[3] 。OGD 能夠實現價值的提升, 進而促進政府開放的意愿和行為, 提高其他主體的利用率[43] 。同時在公民利用數據的過程中, “數據—信息—知識” 的轉變使公民能借助其做出決策。通過積極促進公眾應用數據, 將被動的溝通轉變為積極的公眾參與[44] 。而隨著公民更多地參與到政府決策中, OGD 的政治價值也開始展現[2] 。其政治價值還涵蓋個人或組織在政治中的角色及對政黨事務的影響等方面。價值實現對其他維度亦有著重要影響, 當前OGD 進入了發展窘境, 只有深入了解價值實現, 才能為OGD 的實施注入新的動力[38] 。而價值鏈揭示了OGD 價值實現的流程[45] , 價值實現的內在邏輯則與價值生成機制密切相關。因此,雖然OGD 的價值實現在組織和制度層面的阻礙已基本掃清, 但公眾利用方面意識不足、素養不夠、動力不足已成為OGD 價值實現過程中必須解決的問題, 未來應聚焦如何從用戶角度吸引公眾積極利用開放數據、參與開放數據的過程[38] 。
伴隨著巨大的價值, OGD 也存在較大風險。目前, 我國OGD 工作在開放內容、開放標準、使用權限、使用門檻等方面缺乏標準, 導致實施過程中存在相應的風險, 甚至危害國家安全[46] 。隱私泄露會影響政府公信力和工作成效, 阻礙政府開放數據的意愿[3] 。而低質、錯誤的數據也會導致決策失誤從而引發更為嚴重的結果。OGD 的風險還包括感知風險[47] 、公務員風險規避態度[48] 、數據安全風險等。未來應開展完善的開放數據流程梳理和風險評估工作, 以確保數據開放工作的安全、高效、快速的實施和深化。
4結論
本文采用元綜合分析方法, 通過制定檢索標準和EBL 質量評估, 從國內外大量相關研究中選取有效文獻, 梳理大量前人研究并對文獻進行細粒度分析和解釋性編碼。文章揭示了開放政府數據實施過程中的眾多影響因素, 厘清了影響因素之間的互作用關系, 最終構建了OGD 實施影響因素模型(GTEV 模型)。該模型包含政府組織、技術保障、內外環境和價值實現4 個維度與11 個主范疇。研究發現: 第一, OGD 作為一個復雜的研究對象,其實施過程受到政府體制與政府能力等內部核心因素的影響, 同時受到技術保障、內外環境和價值實現等外部各影響因素的共同作用; 第二, OGD 實施作為一個多因素相互作用的系統, 在縱向維度中可分為數據生成、開放、利用和反饋4 個階段, 從而實現開放政府數據完整的生命周期動態循環; 第三, 政府作為OGD 實施的主體, 其開放能力與體制直接影響OGD 的實施效果。因此, 政府應當在OGD 實施的各個階段, 協調統籌內外各影響因素,不斷提升OGD 實施能力, 以此實現OGD 的最大價值。
本文采用元綜合研究方法探索OGD 的實施,系統、全面挖掘OGD 實施的影響因素并探析其中互作用機制, 為OGD 實施提供了完整的分析視角,并在一定程度上拓展了元綜合方法的應用領域和適用范圍。本文構建的GTEV 模型, 綜合OGD 實施過程中不同階段的各影響因素, 闡明OGD 的實施與發展過程, 一定程度上推動了開放政府數據理論研究的發展。本文所探究的OGD 實施影響因素,更加完整闡述如何在政府組織下, 以技術為支撐,將內外部環境有效結合, 并積極地從用戶的角度考慮如何促進公眾的參與、開展完善全面的風險梳理, 能夠為政府在后續的OGD 實施中提供理論指導, 為提升政府的數據建設及大數據時代國家綜合競爭實力指明方向。
同時, 文章也存在一些不足, 本文研究對象(OGD)相關研究較為繁雜, 雖然檢索時盡可能擴大范圍并進行追溯檢索, 但仍可能導致文獻遺漏;OGD 作為一種實踐行為, 本文尚未對提煉的影響因素進行實證檢驗。未來研究中會結合實踐和理論的發展進一步探討并完善影響因素框架, 并通過實證研究驗證理論, 對框架進行修正和擴展。