朱曉峰 姜玉潔 蒙曉瑩



DOI:10.3969/j.issn.1008-0821.2021.10.002
[中圖分類號]D63-39 [文獻標識碼]A [文章編號]1008—0821(2021)10—0012—09
信息技術的快速更迭,為政府數據的開放共享提供了良好的技術環境。各國紛紛建立政府數據開放共享標準與相關戰略,并在國內和國際之間發布開放宣言。政府數據開放已經成為現代政府的重要工作內容,也是順應時代要求的體現。
如何實現政府數據開放一直是理論界關注的焦點,早期主要聚焦于政府數據開放的內外部環境,強調系統地開放數據制度與組織架構、協同式地開放數據共享與應用機制;關注用戶的隱私保護,建議綜合考慮使用主體、用途和可能的效益;評價網站服務質量,探索提高開放數據網站服務質量建設的可行措施。隨著研究的深入,學者們日益關注政府數據開放的具體落地與實現,如探尋政府數據開放的影響因素及其彼此關聯、解析立法條例以期探尋政府數據開放的立法路徑、通過強化領導驅動和完善職責體系實現數據開放平臺建設的縱深突破等。
令人遺憾的是,由于政府數據開放是一個系統工程,是一個不斷發展、完善的過程,導致單一維度的探索難以適應不同層級、不同階段政府數據開放的需求。政府數據開放的實現具有高度不確定性,一般性的對策建議缺乏適應性,難以有效推進政府數據開放進程。換言之,政府數據開放的實現,本質上是一個不斷進行路徑選擇的過程。
政府數據開放路徑選擇,就是政府在對其數據資源優化重組的過程中,選擇最適合其長期發展的道路,這實質上描述了政府以新的邏輯創造和資源利用創造新的價值的過程。在這個過程中,需要明確政府數據開放的關鍵因素和彼此關系關聯。NK模型的主要作用,正是用來通過分析系統內部元素間的相互作用來研究系統的演化規律。例如,劉凱寧等通過分析商業模式系統內部要素的相互作用研究商業模式創新路徑選擇;Celo S等利用NK模型分析跨國公司組織結構與績效之間的關系;湯洪霞等利用NK模型聚焦BIM情境下綜合設施管理組織合作關系內部要素的相互作用。這些研究表明,NK模型可以很好地模擬組織、管理中的復雜系統和復雜關系,同樣也適合模擬政府數據開放各個要素之間相互關系。
綜上,本文將政府數據開放視為復雜系統,考慮政府數據開放構成要素之間的相互影響和相互作用,并借鑒Gould S J提出的NK模型理論,通過采用計算機仿真方法給出一種政府數據開放路徑選擇的決策方法。
1政府數據開放的路徑選擇框架與影響因素篩選
1.1基于NK模型的政府數據開放路徑選擇框架
基于NK模型的政府數據開放路徑選擇框架,本質上是在識別政府數據開放諸多影響因素的基礎上,探索一種政府數據開放路徑選擇的規范方法。主要目的是解析政府數據開放的關鍵因素以及彼此關系,進而探索這些要素和彼此關系對于政府數據開放產生的影響程度和變化方向。
如圖1所示,基于NK模型的政府數據開放路徑選擇框架,首先通過理論分析與文獻梳理,分析已有文獻中關于政府數據開放的所有影響因素,再通過問卷調查法篩選出主要的影響因素;其次,探究影響因素之間的關聯強度,據此識別政府數據開放的關鍵因素數量(即參數N),以及因素間的相互作用情況(即參數K);再次,利用隨機分布函數為影響政府數據開放的關鍵因素選擇組合結果,隨機分配適應度值并繪制適應度景觀圖;最后,根據相應算法,利用計算機仿真工具對政府數據開放路徑進行優選,并給出具體選擇結果。
1.2政府數據開放影響因素篩選
政府數據開放的影響因素,已經有諸多專家學者分析研究并給出了眾多結果。但是,這些影響因素中哪些是最重要的、最需要解決的,以及改善這些影響因素的先后順序,鮮有人提及。所以,需要首先篩選和確定政府數據開放受到哪些影響因素的制約,進而確定哪些是最重要的影響因素。
通過在CNKI、Elsevier等數據庫中進行文獻高級搜索,主題為“政府數據開放”,篇名或者摘要或者關鍵詞為“影響因素”,共檢索出期刊論文65篇。分析這些文獻,不難發現,早在2012年,ZuideiwijkA等已經提出了影響政府數據開放的因素包括:社會性質、技術性質等;同一時期,Solar M等認為數據層面的原始性與完整性、組織成熟度等對政府數據開放有重要影響;Chan C指出影響因素為政府內部層面的創新戰略、平臺開放性、組織合作、平臺創新等;Conradie P等也指出機構、數據使用、數據存儲、公共服務等是政府數據開放的重要影響因素。在國內,湯志偉等認為政治要素中的政策數量、經濟要素中的地方經濟發展水平、社會要素中的信息產業發展水平共同影響著政府數據開放平臺的發展水平;陳朝兵從“質”和“量”兩個維度,將政府數據開放質量的影響因素分為:價值取向、公共政策、目標原則、開放平臺、政府數據、體制機制、公眾能力、公眾自身特征、公眾間溝通與交流和政府后續行為等。
近年來,政府數據開放的影響因素的研究,已不再是簡單的羅列,而是通過這些影響因素分析對于政府數據開放的具體影響。孟顯印等研究發現,問責制、話語權和法制監管環境對政府數據開放發展水平有顯著正向影響。門理想等從數據開放者、消費者等4個維度出發進行回歸分析,發現4個變量——“國內生產總值”“數據開發者開發能力”“開放政府數據的省域統籌程度”和“是否位于國家大數據綜合試驗區”,顯著正向影響政府數據開放建設的成效。李梅等提出,對于政府數據開放而言.最為直接的影響因素是數據開放統一平臺和政府數據管理機構;間接的影響因素包括開放評價機制、政府數據開放理念、戰略規劃與政策支持等。
在諸多文獻中,只挑選屬于SSCI、SCI、CSS-CI、北大核心期刊中的46篇論文作為具有代表性文獻進行進一步分析研究。為了找出最能準確描述和概括政府數據開放的影響因素(多次在論文中被提到的關鍵詞語),采用共現矩陣的方法對每篇文章的關鍵詞進行梳理分析。具體而言,通過Py-thon生成共現矩陣,使用NetDraw網絡分析軟件繪制出政府數據開放影響因素的相關文獻的網絡關系圖,如圖2所示。在圖2中,圓圈表示文獻中提到的政府開放數據的影響因素。其中較大的圓點諸如“數據質量”“制度規范”等,表示這些影響因素在46篇代表性文獻中多次被提到,可作為政府數據開放影響因素篩選的重要依據(初步篩選得到58個影響因素)。
在NetDraw網絡分析軟件初步篩選的基礎上,進一步運用德爾菲法對這58個影響因素進行專家意見征詢,從而對政府數據開放影響因素進行修正和補充,得到政府數據開放的主要影響因素。具體而言,選定來自高校和政府部門的20位研究政府開放數據的專家,通過發送匿名電子郵件的方式進行問卷調查。專家們依據李克特量表,按照“非常重要、重要、一般、不重要、非常不重要”5個等級對初步篩選的58個政府開放數據影響因素進行評價,5個等級分別賦值為5、4、3、2、1。專家調查中,采用α信度系數法對問卷量表進行信度檢驗,Cronbachsα系數為0.902,大于0.7表示信度較好。采用KMO進行效度檢驗,KMO統計量值為0.884,大于0.8,表明量表具有良好的結構效度。
綜上,篩選出政府數據開放的主要影響因素包含11個指標,分別是數據可用性、數據及時性、數據內容質量、公眾參與公眾能力、價值取向、行政生態、管理機制、組織能力、平臺功能、平臺安全和平臺隱私保護,如表1所示。
2政府數據開放路徑選擇的NK模型構建
本文構建的NK模型,是指通過計算政府數據開放主要影響因素的中心度和中心度閾值,識別關鍵因素(即參數N),計算關鍵因素之間的關聯度確定參數K,進而得出關鍵因素等位基因組合的適應度值,最后選擇政府數據開放的最優攀爬路徑。
2.1基于中心度和中心閾值確定關鍵因素
政府數據開放路徑選擇的NK模型,包括如下的基本參數,如表2所示。
最終,將政府數據開放關鍵因素等位基因組合的適應度數值映射到三維空間,得到政府數據開放的適應度景觀圖,此圖本質上體現了政府數據開放關鍵因素之間的所有互動關系和相互影響。
2.4政府數據開放最優路徑選擇
政府數據開放最優路徑選擇,是指對影響政府數據開放關鍵因素的選擇過程。當政府數據開放的某個或者某些關鍵因素發生變化時,政府數據開放的整體適應度值將發生改變,需要辨別適應度值增加的路線,將其顯示在適應度景觀圖中。在不斷識別的過程中,就可以直觀展現政府數據開放的最優路徑。
換言之,政府數據開放路徑選擇過程,是一個不斷辨別各關鍵因素對應狀態之間影響和變化的過程。如圖3所示,若將α作為起點,通過對附近關鍵要素的適合度值進行計算,找出最優路徑,分別經過b、c、d,到達圖中的最高點e。
3政府數據開放路徑選擇的仿真研究
為了驗證前述方法的可用性,本文選取尚未上線政府數據開放平臺的Y市為例,邀請10位對于政府數據開放有深刻理解的專家和Y市10名從事政府數據開放工作的實踐者,進行了問卷調查。采用李克特五級量表形式.被調查者針對表1中11個主要影響因素之間的關聯程度進行打分,分值范圍從1~5變化,分別對應“非常不重要”到“非常重要”。
根據式(1),將專家評價的各要素之間的關聯程度矩陣進行集結,得到政府數據開放影響因素直接關聯群體評價矩陣T,即各個專家打分的均值,如表3所示;依據式(2)得到規范化之后的政府數據開放影響因素直接關聯評價矩陣,即將矩陣歸一化處理,如表4所示;規范直接影響矩陣自乘,表示的是要素之間增加的間接影響,當把所有的間接影響都相加便得到間接關聯評價矩陣。依據式(3)計算得到影響因素的間接關聯評價矩陣,如表5所示;依據式(4)~(6)計算得到影響因素的中心度,中心度值越大,表明該因素在評價指標體系中越重要或所起的作用越大,中心度值大于閾值的影響因素即為關鍵要素,如表6所示。
依據式(6)和表6,結合設定的最大中心度比率X=0.93,得出政府數據開放關鍵因素的中心度提取閾值ξ=18.62,將中心度高于提取閾值的W2(數據及時性)、W5(價值取向)、W7(管理機制)、W9(平臺功能)作為政府數據開放提升的關鍵因素B1、B2、B3、B4,得到參數N=4。并依據式(7),得出關鍵因素的鄰接矩陣4為:
進一步集結矩陣4中的行元素,得到政府數據開放關鍵因素關聯度,忽略各因素對其自身的影響,結合式(10),將政府數據開放關鍵因素關聯度的平均值作為參數K=3.0。
將影響政府數據開放的4個關鍵因素抽象為4個主體,進行主體建模,同時更深一步挖掘各因素間的彼此交互關系和對政府數據開放的影響。基于NK模型的政府數據開放路徑選擇,就是政府數據開放的關鍵因素形態不斷改變的過程,也就是根據該因素與其他關聯因素之間的關聯關系,隨機抽取(0,1)區間的數作為適合度值的過程。所以,依據NK模型各要素狀態編碼及適合度計算公式,運用計算機仿真為每一個決策選擇結果隨機分配適合度值,整理得到政府數據開放所有關鍵因素的組合狀態集合,以及相應關鍵因素其組合狀態下的景觀適合度值,繪制政府數據開放系統適應度三維景觀攀爬圖。
如圖4所示,①、②、③、④體現了適合度景觀圖的攀爬過程。也就是說,Y市開展政府數據開放工作,首先需要考慮關鍵因素B4(即平臺功能),在適應度景觀上表現為從位置00(平面坐標0000)向位置①(平面坐標0001)攀爬的過程;其次,應通過改進關鍵因素B1來提升政府數據開放適合度,在適合度景觀示意圖上表現為從位置①(平面坐標0001)向位置②(平面坐標1001)攀爬。以此類推,要提升政府數據開放系統適合度應按照平臺功能、數據及時性、管理機制和價值取向的順序依次提升,即政府數據開放系統適合度的路徑為B4→B1→B3→B2。
具體而言,首先,考慮增強平臺功能中數據采集、處理、存儲、整合、分析、共享和安全等功能,將其作為承載政府數據開放最堅實的數據載體和技術基臺;其次,考慮提升數據的及時性,其體現了數據的時效性,與數據可用性及數據質量均息息相關;再次,考慮改革政府的管理機制,即建立統一的數據管理機構并優先建立數據管理協同機制及合作機制,提高政府數據開放的效力,為其注入新的動力;最后,當上述關鍵因素得到提升優化之后,堅定政府數據的開放價值取向,即明確政府在開發利用數據方面的獨特優勢,將政府數據開放投入到最有價值的建設中。
4結論
NK模型在經濟與管理領域已具有廣泛應用,它適合解決復雜系統中各要素的相互影響問題。本文基于NK模型針對政府數據開放的路徑選擇問題進行研究,并通過計算機仿真輔助找出最優路徑。本文的研究,實質上是提供了一套決策分析方法,幫助政府數據開放的實現提供具體的措施和步驟。該方法從系統的角度出發,考慮到各影響因素之間的相互作用、相互關聯性,克服了一些無法用實證數據測量的局限性,對于推進政府數據開放具有理論指導意義和實際應用價值。
需要強調的是,在政府數據開放實踐中,無論是尚未上線的還是已經上線的各級政府數據開放平臺,所處階段和水平各不相同。針對不同條件和狀態的政府數據開放平臺,其關鍵因素必然也各不相同,需要重新識別和辨析,從而得出適合自身情況的最優路徑。
(責任編輯:孫國雷)