


摘要:城市政府數據開放受到各類因素影響,由不同的因素組合模式推動。文章構建首席數據官視角下城市政府數據開放水平影響因素聯動模型,將數字基礎設施水平、公共數據活躍度、財政資源供給、試點實施范圍、創新活躍度和公眾需求作為驅動因素,運用模糊集定性比較分析法,發現首席數據官制度視角下城市政府數據開放水平具有3條影響路徑,為數字政府治理提供新思路與借鑒價值。
關鍵詞:政府數據開放;數字政府;首席數據官;數字治理
中圖分類號:C936;D63文獻標志碼:A
0引言
運用數據進行治理,推進數據開放共享是數字政府建設的重要內容和目標。黨的二十大報告提出,加快建設網絡強國、數字中國。深入推進數字政府改革建設,是適應信息化發展時代趨勢、加快建設數字中國的必然要求。2021年《廣東省人民政府辦公廳關于印發廣東省首席數據官制度試點工作方案的通知》(粵辦函〔2021〕63號)宣布廣東省首先試點首席數據官制度,推進政府數字化轉型。首席數據官制度是促進數據開放共享的一項新措施,旨在解決部門之間的數據孤島、內部與外部之間溝通不暢問題。本文基于文獻回顧和TOE研究框架,構建首席數據官視角下城市政府數據開放水平影響因素聯動模型,探索多重因素的組合模式,旨在豐富政府數據開放的解讀視角。
1文獻梳理與分析框架
11文獻梳理
大數據能夠驅動社會治理的創新轉向。政府治理困境可以通過技術的進一步突破予以解決。政府部門要轉變治理理念,主動根據技術變革的需求推動治理方式的重塑。公共決策中,運用大數據分析能夠精確定位復雜公共問題,有效應對公共管理的復雜性和不確定性,提高公共管理的預測與決策能力,優化公共服務水平,實現公共管理的科學化,進一步優化升級“互聯網+政務”服務[1-3]。數據開放與共享是數字政府的關鍵環節,政務服務數據共享是指各政府職能部門將其在服務過程中收集、生成的業務數據按照規定可復用的方式通過一定的共享機制,實現部門間業務數據的按需共享[4]。數字技術的引進推動政府職能轉變,賦能組織變革,帶來政府流程的重塑[5-6]。伴隨著數字信息技術革新應用,“數字思維”的深入普及也十分重要。大數據與智能化通過改變人們的思維方式、認知方式及思想觀念,來驅動政府改革以及治理模式轉變[7]。
盡管數據治理具有許多優勢,但也有學者指出由于制度障礙和能力瓶頸,政府利用大數據需要時間[8]。例如,政府橫向部門間的結構整合問題是一個難點[9],數據孤島現象頻頻出現在數字政府實踐中[10]。有研究提出公共部門改革的結果由環境動態所塑造[11]。本文梳理總結已有研究,發現學者多從技術、組織、環境3個層面闡釋城市政府數據開放,與電子政務研究領域的技術-組織-環境(Technology-Organization-Environment,以下簡稱TOE)研究框架具有很高適配度,本文后續研究內容和討論將基于該框架進行。
12分析框架
大數據等技術在公共管理實踐中的應用,本質上是公共組織采用和實施新技術。TOE理論框架能夠比較好地解釋這一問題。有研究者指出,在組織的環境中,有3類要素會影響其采用和實施技術創新的過程,即組織背景、技術背景和環境背景。TOE理論框架的提出基于企業技術創新,其應用已經拓展至公共組織研究領域,如電子政務的使用等。
技術層面包括數字基礎設施水平、公共數據活躍度兩個二級條件。技術基礎設施主要是指硬件、軟件、互聯網、數字系統等客觀存在的技術或具有物質性的機器和設備。網絡設施泛在互聯,是數字經濟、數字化治理和服務模式創新發展目標。公共數據包括政務數據和公共服務數據。公共管理和服務機構應當向公共數據平臺歸集公共數據,公共數據實行統一目錄管理,首席數據官編制本單位數據資源目錄。可供利用的公共數據目錄、數據集越多,公共數據也越活躍,越有可能有更多公民、法人和其他組織開發利用公共數據。
組織層面包括財政資源供給和試點實施范圍兩個二級條件。技術和組織相互作用,組織可獲取的資源越多,引進應用新技術的意愿也越強。財政資源越豐富的政府,其電子政務水平越高。首席數據官從事公共數據管理工作,所需經費納入本級財政預算。本區域、本部門、本單位主要負責人或者分管負責人擔任首席數據官,一般是分管數字政府建設的行政副職,部分地區是行政正職。更多部門設立首席數據官,推動公共數據開放、完善公共數據管理,資源池也會更豐富。試點實施范圍越廣,越多部門越重視數據整合與開放,同時通過協同合作處理相關問題,使公民、法人和其他組織更好地利用公共數據。
環境層面包括公眾需求和創新活躍度兩個二級條件。勞動力素質提高,在勞動生產和日常生活中對于數據資源的使用也會相應增加。同時,不斷提高的政府數據公開水平也要求受眾具備數據方面的需求和處理能力。越多人經常使用公共數據,則該地區的開放公共數據越有可能被利用起來,促進數據資源向新型生產要素發展,發揮數據要素核心驅動引擎作用。首席數據官結合各部門內外部數據需求,推動公共數據與社會數據深度融合和應用場景創新,強化數據整合共享和開發利用。重視開發利用公共數據的環境使得技術也能在實踐中不斷創新。首席數據官視角下城市政府數據開放水平影響因素分析框架如圖1所示。
2研究程序
本文從城市政府首席數據官制度角度出發,將城市政府數據開放置于TOE框架下進行分析得出前因變量。考慮到研究條件數據取值不適合簡單地被校準為0或1的類別變量,本文采用模糊集定性比較分析法(fsQCA)。本文有助于理解城市政府數據開放中的主要影響因素以及各要素之間的協同關系,為相關政策制定提供參考。
21研究樣本選擇
本文將范圍縮小到2023年《中國地方公共數據數據開放利用報告——城市》[12](以下簡稱“該報告”)中排名前50的城市,作為研究樣本選擇的范圍,再聚焦其中試點或實施了政府首席數據官制度的城市(截至2024年9月15日),試圖在首席數據官制度的視角下,考察城市政府數據開放水平的影響因素。本文共觀察21個案例城市。
22變量設計與測量
221結果變量
本文以該報告中的開放數林綜合指數作為結果變量的賦值依據。該報告是我國首個專注于評估政府數據開放水平的專業指數,具有較高可信度、權威度和認可度。根據該報告第2章,中國開放數林指數城市綜合排名中的綜合指數,可以得到案例選取的21個市的開放數林綜合指數為:杭州7988,濟南6377,上海6357,溫州6246,深圳5927,無錫5282,麗水4824,淄博4748,廣州4660,嘉興4383,武漢4331,廈門4302,天津4256,蘇州4083,北京4077,達州3681,德陽3675,舟山3543,泰州3536,紹興3399,佛山3377。此即城市政府數據開放水平。平均值為4717,最大值為7988(杭州),3377(佛山),中位數為4331。
222前因變量
運用定性比較分析方法進行研究時,選擇變量的過程應當盡力將變量數量保持在非常少的數量,特別是在小樣本研究設計中,最好選擇有限數量的潛在變量。本文對過往研究成果進行梳理,選取數字基礎設施水平、公共數據活躍度、財政資源供給、試點實施范圍、創新活躍度、公眾需求6項指標作為前因變量。具體變量選取及測量如下。
數字基礎設施水平。互聯網端口硬件設施支持著政府開放的龐大數據量和數據的調用使用。信息化水平越高,則數據產生、傳遞和接收的效率也會越高。本文以2023年固定互聯網寬帶接入用戶比為指標,測算數字基礎設施水平。固定互聯網寬帶接入用戶數來自各市統計年鑒、國民經濟和社會發展統計公報,人口戶數來自各市統計年鑒。
公共數據活躍度。城市政府向社會公開的數據量顯示數據池的深度和廣度。本文以人均公共數據開放量來測量開放公共數據的活躍程度。公共數據開放目錄來自政府數據開放平臺(截至2024年8月31日),人口數來自各市統計年鑒。
財政資源供給。政府數據開放,需要建設維護數據開放門戶網站、配置相關技術人員等,需要財政給予保障。本文以2023年人均一般公共預算支出作為測量財政供給水平的依據。政府一般公共預算支出和人口數來自各市統計年鑒、國民經濟和社會發展統計公報。
試點實施范圍。數據孤島是數字政府建設需要解決的重點,部門之間數據采集、共享協作,使得公共數據得到更好的整合開放。本文以各城市政府首席數據官制度試點/實施單位數量作為衡量試點實施范圍的依據。首席數據官制度試點/實施單位數量來自各市首席數據官制度試點實施方案、工作細則和政府門戶網站相關工作動態。
創新活躍度。一個地區數字經濟發展具有活力,相應的發明、實用新型等申請量和授權量也會層出不窮,繼而投入市場或科研領域,使開放數據轉化為生產力。本文以地區2023年人均發明專利授權量,作為創新活躍度的衡量依據。其中發明專利授權量來自各市國民經濟和社會發展統計公報、知識產權統計簡報、知識產權保護狀況和知識產權發展報告,人口數來自各市統計年鑒。
公眾需求。勞動年齡人口平均受教育年限的提高,對一個國家整體國民素質的提高、對國家的發展具有基礎性作用。本文以勞動年齡人口平均受教育年限作為公眾對數據的需求的衡量依據。其中,勞動年齡人口平均受教育年限來自《國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》、第七次全國人口普查數據、教育事業發展“十四五”規劃、各市“十四五”規劃等系列文件。
23錨點設置與變量校準
定性比較分析方法中,變量校準是極其關鍵的一步。校準之前,變量只能反映出案例與案例之間,相比較之下的位置。指標根據相應規則調整之后,可轉化為目標集合的位于0~1的隸屬分數。
通過模糊集定性比較分析方法校準變量前,首先需要設置3個錨點:完全不隸屬、最大模糊點和完全隸屬,使得校準后所有變量都以隸屬分數的形式落在0~1。根據研究案例情況、變量描述性統計情況,對于“公共數據活躍度”和“創新活躍度”兩個變量,樣本數據分布不均衡,個別極值對平均值的影響較大,所以用中位數代替平均值作為中間錨點的選擇,目標集合的3個錨點分別設置為上四分位數、中位數以及下四分位數;對于“數字基礎設施水平”“財政資源供給”“公眾需求”變量,數據分布比較集中收斂,平均值與中位數十分接近。因此,將第一個錨點、第三個錨點設置為10%分位數與90%分位數,中間點設置為變量平均值。
確定各個變量的校準錨點后,對7個變量“數字基礎設施水平(infra)”“公共數據活躍度(data)”“財政資源供給(money)”“試點實施范圍(depart)”“創新活躍度(invent)”“公眾需求(edu)”和“城市政府數據開放水平(open)”,在 fsQCA 軟件中開始對每個變量執行校準指令(calibrate),使每一個變量都轉變為隸屬度分數,落在0~1。生成的新變量命名為:infra1、data1、money1、depart1、invent1、edu1和open1。在fsQCA軟件中執行校準指令后,所有案例的具體變量數據都變成了0~1的隸屬度分數。
24單變量必要性分析
單變量必要性分析(NCA)意在探究單個條件變量對某一結果產生的影響程度,檢驗各個條件變量能否單獨作為某結果變量的必要條件。
一致性水平是衡量單變量與某種結果關聯程度的主要指標,數值越大,其一致性水平越高。當條件變量的一致性水平大于08時,則可視其為對應結果產生的充分條件;條件變量的一致性水平達到09以上時,則可認為其是對應結果產生的必要條件。
在衡量一致性水平的基礎上,再考察覆蓋率。覆蓋率表示某條件變量的解釋強度,即條件變量或者條件組態能夠解釋的案例在被納入分析的所有案例中所占的比重,數值越大,則其覆蓋率越高,其解釋力度也就越強。本文運用fsQCA軟件對校準后的數據進行必要條件分析。
由NCA分析結果可知,單變量的一致性水平均低于09,說明不存在首席數據官視角下,導致城市政府數據開放高水平或者低水平的單一必要條件,同時表明,城市政府數據開放水平受到多重要素影響,并不是由單一要素的作用導致的。因此,有必要運用組態分析的方法去進一步研究其多元要素形成路徑。
25真值表構建
真值表本質上就是組態表。構造真值表的過程,需要設定案例頻數、一致性閾值。案例頻數即表示符合條件(超過所設定的一致性閾值)的路徑組態被標記為“1組態”時所需要達到的最低數量。Ragin和Fiss提出,一致性閾值設置為“075”的情況為準入性“最低要求”,設置為“08”為“較好”,設置為“085”為“很好”。參考學界的主流做法,本文為中小樣本研究,將案例頻數設置為1,一致性閾值設置為075。當案例一致性閾值高于 075 時,結果變量“城市政府數據開放水平”被編碼為“1”(open1=1)。當案例的一致性閾值低于075時,結果變量“城市政府數據開放水平”被編碼為“0”(open1=0)。城市政府數據開放水平真值表如表1所示。
在排除了未觀測案例組合的基礎上,本文共保留了17種條件組態,其中能夠產生“高城市政府數據開放水平”結果的條件組態共有5種,即所有“城市政府數據開放水平(open1)”標記為“1”的案例,觀察發現,6個條件變量在大部分觀測案例中均有出現,說明高城市政府數據開放水平多影響因素相互作用的結果。
3研究發現
31組態分析結果
利用模糊集定性比較分析方法(fsQCA)進行實證分析后,會得出三類結果:復雜解、中間解以及簡單解。目前學界的相關研究中,優先采用中間解,認為其優于復雜解和簡單解,是fsQCA 分析中不可或缺的常規分析部分。
對于實行首席數據官制度的城市政府,可以通過3條路徑實現高水平的數據開放,也就是“組態”。3個條件組合的覆蓋度分別是023、04、013,根據覆蓋度的大小可以判斷,大部分城市政府可以通過第一個與第二個條件組合來取得高數據開放水平,即這兩個組合相對其他組合來說更重要。產生“高城市政府數據開放水平”的3條路徑,其一致性分數均超過了075,表明這些路徑都能很好地促進城市政府數據開放水平。
32路徑組合
本文通過模糊集定性比較分析方法,得到首席數據官制度視角下,3種類型的高水平城市政府數據開放的影響路徑,如表2所示。參考 Ragin與 Fiss的建議以及學術界主流做法,當前因變量在組合中出現時,用實心圓表示,該前因變量是核心條件時,用圖例“●”表示;該前因變量是非核心條件,用圖例“”表示;當前因變量在組合中以“邏輯非(~p)”的形式出現時,表示前因變量的缺失,用圓圈表示,是核心條件時用圖例“⊙”表示,是非核心條件時,用圖例“◎”表示。當前因變量既可以出現也可以不出現時,用空格進行表示。
路徑1通過“~數字基礎設施*~公共數據活躍度*~財政資源供給*創新活躍度*公眾需求”條件組合產生作用,將其命名為“強環境促進型”。該路徑一致性分數為082,高于08,說明實現了較好的一致性要求;原始覆蓋度為02345,說明樣本案例中有2345%的案例可由其解釋。代表性樣本城市為CASE 2濟南。作為政府數據開放水平較高的城市,濟南的創新活躍度和公眾需求都較高。數字山東建設強調以數字經濟賦能產業,山東發布了《山東省電子政務“十三五”發展規劃》等一系列文件,挖掘管理公共數據,不斷推進數字政府水平的提升。山東省每年舉辦首席數據官聯盟大會,進行各項榮譽頒獎,使濟南公共數據利用開發出更多場景,煥發更強大的活力。同時,濟南作為人口大省山東的省會,勞動力素質水平較高,公共數據的運用具有高關注度,基于公共數據開發的濟南地鐵App、地圖類應用和金融貸款應用等,貼近民生。
路徑2通過“~公共數據活躍度*財政資源供給*~試點實施范圍*創新活躍度*公眾需求”條件組合產生作用,將其命名為“環境-資金型”。該路徑一致性分數為074。原始覆蓋度為04036,說明樣本案例中有4036%的案例可由其解釋;唯一覆蓋度為02446,說明樣本案例中有2446%的案例只能由其解釋。其原始覆蓋度和唯一覆蓋度均為所有路徑中的最高,說明該路徑對相關案例的解釋力度最高。代表性樣本城市為CASE 3上海和CASE 5 深圳。上海和深圳作為政府數據開放水平較高的城市,創新活躍度和公眾需求較高,同時財政資源供給水平較高。上海是直轄市,我國的經濟中心,高水平研究型大學人才充足,2022年啟動首席數據官制度研究和試點,推動上海數字經濟核心產業增加值進一步提高,從而影響公共數據開放水平提升。深圳是經濟特區、改革開放前沿陣地,數字經濟發展勢頭強勁,同時依靠諸多知名高校的教育研究實力,創新活躍度高。
路徑3通過“數字基礎設施*~公共數據活躍度*財政資源供給*試點實施范圍*創新活躍度*~公眾需求”條件組合產生作用,將其命名為“組織-設施-創新型”。該路徑一致性分數為08832,高于085,說明實現了很好的一致性要求;原始覆蓋度為01364,說明樣本案例中有1364%的案例可由其解釋。代表性城市樣本為CASE 1 杭州。杭州作為政府數據開放水平較高的城市,數字基礎設施、財政資源供給、試點實施范圍和創新活躍度較高。浙江省自2023年起鼓勵在企業決策層設置首席數據官,全面負責企業數據管理工作。杭州互聯網經濟起步最早、發展迅速,基礎設施建設完備,數字經濟活力足,公共數據應用場景豐富。總部位于杭州的阿里巴巴是我國首個設置首席數據官的企業。杭州市作為副省級市,財政資源充足,高校研究機構林立,開發公共數據的技術實力強。
33穩健性檢驗
改變校準錨點。將前因校準的完全隸屬點、交叉點、完全不隸屬點的隸屬度分別設為095、05、005;改變一致性的閾值,將原始一致性閾值由前文的075提高到08,使用fsQCA方法進行穩健性檢驗。如果穩健性檢驗方法的一致性和覆蓋度不能導致實質性差異,則認為結果是穩健的;如果原分析結果與穩健性檢驗的組態間存在一定的子集關系,也可認為實證結果是穩健的。反之,則認為結果并未通過穩健性檢驗。
穩健性檢驗的單變量必要性分析結果顯示無gt;09的條件,即不存在單一必要條件。穩健性檢驗的組態結果顯示:(1)原分析的條件組合1“~數字基礎設施*~公共數據活躍度*~財政資源供給*創新活躍度*公眾需求”是穩健性檢驗得到的條件組合“~數字基礎設施*~公共數據活躍度*~財政資源供給*試點實施范圍*創新活躍度*公眾需求”的一個子集;(2)結果變量為高城市政府數據開放水平時,解的覆蓋度由076變為0675,解的一致性由053變為09239。總體來看,條件組態的組合與原分析結果存在一定的子集關系,解的一致性和解的覆蓋度稍有變動,表明定性比較分析方法的結果是穩健的。
4結論與建議
41結論
本文從首席數據官的視角出發,基于TOE框架從技術、組織和環境3個層面,結合相關文獻,提出了數字基礎設施水平、公共數據活躍度、財政資源供給、試點實施范圍、創新活躍度和公眾需求6個高城市政府數據開放水平的影響因素。本文運用fsQCA進行了單變量必要性分析和條件組態分析,得出結論。
(1)技術、組織和環境層面的因素均不能單獨推進城市政府數據開放邁向高水平,只有因素組合產生的3條實現路徑才能帶來較高的城市政府數據開放水平。一是以數字基礎設施、公共數據活躍度、財政資源供給、創新活躍度和公眾需求為因素的“強環境促進型”實現路徑;二是以財政資源供給、試點實施范圍、創新活躍度和公眾需求為因素的“環境-資金型”實現路徑;三是以數字基礎設施、公共數據活躍度、財政資源供給、試點實施范圍、創新活躍度和公眾需求為因素的“組織-設施-創新型”實現路徑。
(2)創新活躍度這一因素在3條路徑以及核心條件中均有出現。這表明環境層面的這一因素對于提高城市政府數據開放水平有強烈的正向影響關系。城市政府數據開放水平排名前6的城市(杭州、濟南、上海、溫州、深圳和無錫)中,有5個城市的人群創新活躍度隸屬度分數在08以上(杭州、濟南、上海、深圳和無錫)。這些城市均屬于經濟較發達、人口較稠密的地區,高校和研究機構集中分布,數字經濟發展驅動力較強。
42建議
本文探索了首席數據官視角下,高水平城市政府數據開放的因素及其組態,為實行首席數據官制度的政府部門推進數據開放提供了實踐啟示。
(1)試點或實施首席數據官制度的城市政府,需要具備整體性視角和組態思維,注重多種因素的配合,需要來自技術、組織、環境等層面多個因素共同作用,才能帶來較高的數據開放水平。
(2)注重因地制宜地采取適合的實現路徑。城市政府應從本地區實際出發,充分利用本地優勢資源,推動大數據等技術應用,貼近民生,豐富公共數據的應用場景。
(3)基于創新活躍度的重要性,各個城市應當注重科技創新、數字經濟的發展。發明專利不斷涌現,對于公共數據的轉化利用也更為積極,將為提高數字政府水平和治理能力提供推力。
參考文獻
[1]范如國.公共管理研究基于大數據與社會計算的方法論革命[J].中國社會科學,2018(9):74-91.
[2]陳一帆,胡象明.大數據驅動型的公共決策過程創新及效果評估:基于SSCI和SCI的文獻研究[J].電子政務,2019(8):14-27.
[3]王毛路,陸靜怡.區塊鏈技術及其在政府治理中的應用研究[J].電子政務,2018(2):2-14.
[4]黃璜. 數字政府:政策、特征與概念[J].治理研究,2020(3):6-15.
[5]李艷杰,蔡晨陽,張筱悠.首席數據官知識體系解析[J].信息技術與標準化,2022(8):27-32.
[6]范如國.公共管理研究基于大數據與社會計算的方法論革命[J].中國社會科學,2018(9):74-91.
[7]沈費偉,諸靖文.數據賦能:數字政府治理的運作機理與創新路徑[J].政治學研究,2021(1):104-115.
[8]周文彰.數字政府和國家治理現代化[J].行政管理改革,2020(2):4-10.
[9]周盛.走向智慧政府:信息技術與權力結構的互動機制研究:以浙江省“四張清單一張網”改革為例[J].浙江社會科學,2017(3):37-43.
[10]劉紅波,黃煜華.大數據背景下政府數據開放政策的文獻量化研究[J].數字治理評論,2018(1):1-23.
[11]鮑靜,范梓騰,賈開.數字政府治理形態研究:概念辨析與層次框架[J].電子政務,2020(11):2-13.
[12]復旦大學數字與移動治理實驗室.中國地方公共數據開放利用報告:城市(2023年度)[R/OL].(2023-11-11)[2024-09-15].http://ifopendata.fudan.edu.cn/report.
(編輯李春燕)
作者簡介:李嘉穎(2000—),女,碩士研究生;研究方向:數字政府,數字治理。
Abstract: "Urban government data openness is influenced by various types of factors and driven by different factor combination models.Constructing the model of factors influencing the level of urban government data openness under the perspective of Chief Data Officer, taking the level of digital infrastructure, the activity of public data, the supply of financial resources, the scope of pilot implementation, the activity of innovation, and the public demand as the driving factors, and utilizing the fuzzy-set qualitative comparative analysis method, we find that the level of urban government data openness under the perspective of the Chief Data Officer system has three influencing paths, which provides new ideas and reference value for the governance of the digital government.