朱紅燦 沈超



DOl:10.3969/j.isn.1008-0821.2021.10.005
[中圖分類號]D035-39 [文獻標識碼]A [文章編號]1008—0821(2021)10—0040—07
政府開放數據是由政府或政府控制實體產生或委托的,任何人都可以自由使用、重新利用和重新分配的數據,政府數據開放有利于提高政府透明度、釋放社會和商業價值、加強公民參與式治理。在“互聯網+”社會和信息社會背景下,如何滿足用戶對于政府數據開放的需求已成為我國政府部門當前的重大問題。2013年1月11日,工業和信息化部發布了《關于數據中心建設布局的指導意見》,指出要大力提升我國數據中心,特別是大型數據中心的合理布局和健康發展?!?020年中國地方政府數據開放報告》指出,我國地方政府數據開放已發展到了一個更為成熟的階段,因此政府數據開放的重點也應從準備基礎向數據利用等實際成效傾斜。截至2020年4月底,我國已有130個省級、副省級和地級政府上線了數據開放平臺,上海、山東、北京和貴陽等地舉辦的政府開放數據創新利用比賽持續受到關注,但要釋放數據能量、創造公共價值還有賴于科研用戶率先去研究和使用政府開放數據,如何將科研用戶的主動性與政府開放數據利用的迫切性結合起來,是實現政府開放數據更好更快利用必須面對的問題。基于此,本研究將對科研用戶利用政府開放數據影響因素進行深入挖掘和分析,探究影響因素的作用機制,對于進一步提升政府開放數據的建設效果和用戶利用水平,以及加強政府數據開放供需適配I生有參考意義。
1相關研究評述
國內外文獻關于“政府開放數據+用戶”的研究眾多,依據其側重點不同,可從供給側和需求側兩方面內容綜述。一是圍繞供給側研究:主要包括平臺建設、政策制定等內容。Mful-Dadzie E等在研究非洲OGD網站門戶現行基礎結構之上.以媒體從業者視角進行分析,得到關于發展中國家用戶所需的OGD結構。Kubler S等開發了一個開放數據門戶質量(ODPQ)框架,該框架使用戶能夠輕松、實時地進行數據處理。文獻[8]以用戶體驗為切入點,突出用戶體驗對于建立用戶滿意的政府數據開放平臺的指導意義。劉桂琴依據政府數據開放平臺的評論反饋內容做情感差異分析,明確平臺服務后期用戶的滿意狀況,為后續平臺持續建設提供思路;二是從需求側展開討論:涉及公眾采納、用戶需求和數據使用等內容。Taukder M S等以孟加拉國的一項實證為例,研究用戶接受和使用政府開放數據的決定因素。高天鵬等以技術接受和使用整合模型為理論框架,構建政府數據開放平臺用戶采納模型。李白楊根據利益相關者理論識別了我國政府數據開放的用戶類型,并通過內容分析法確定用戶數據主題、數據格式、數據質量、平臺功能、安全保障和其他共6個方面的需求。曾倩使用BP神經網絡方法對政府數據開放的用戶需求進行模型預測。陳水湘基于用戶利用的視角,對政府數據開放平臺的價值進行分析評價,并以19家地方政府數據開放平臺做實證研究。
總之,“政府開放數據+用戶”相關研究側重于公眾采納模型、用戶需求分析,較少運用扎根理論,對科研用戶的政府開放數據利用進行影響因素識別與路徑分析。同時,張路路等認為,用戶認知與用戶數據行為之間的關系,可為系統優化、用戶服務創新提供參考和借鑒。而認知因素包括:認知風格、認知能力、知識與經驗、情感等,科研用戶的數據認知行為包括:認知價值判斷、認知加工、認知采納和認知期望等?;诖?,本文通過分析科研用戶自身的認知風格、認知能力,科研用戶對政府開放數據的質量認知、價值判斷,科研用戶所處情境、面臨的任務等,探究各因素對科研用戶政府開放數據利用的影響情況,并深入剖析各影響因素的作用機制,以期從科研人員視角更進一步提高我國政府數據開放的供需適配性水平,為推進政府數據開放更好更快地發展提供參考。
2研究設計
2.1理論基礎
為了從用戶認知角度有效識別科研用戶政府開放數據利用影響因素,本研究采用扎根理論來進行探索性研究。扎根理論是經典的質性研究方法之一,要求從現象中系統收集原始資料進而分析、發現和發展理論,是一個從事實到實質理論,再到形式理論演進的過程。扎根理論法包括開放式編碼、主軸式編碼和選擇式編碼3個階段,由此形成的“程序化扎根理論”是目前應用最廣泛的版本。扎根理論主張不在研究前提出任何假設,從事實到實質,這對深層研究科研用戶政府開放數據利用具有很好的適用性,因此,本研究期望通過扎根理論的方法有效探究科研用戶政府開放數據利用影響因素,實際研究流程如圖1所示。
2.2數據收集
扎根理論要求對受訪者進行半結構化的深入訪談,研究者需要在訪談過程中不斷提問和不斷比較,從而針對所要研究的主題獲得更廣泛的內容和更精確的細節,使得訪談兼顧開放性和聚焦性。主要包括以下步驟:①確定訪談主題。本次訪談需要向科研用戶了解在其實際的數據利用過程中,哪些因素會促進或者抑制他們使用政府開放數據;②設計訪談提綱。在閱讀相關文獻和預訪談基礎上確定訪談提綱,并根據受訪者的實際回答深入交流。訪談提綱如表1所示;③確立訪談原則。圍繞訪談提綱所設計的6個問題,向受訪者提出“除此之外還有什么……嗎?”“能不能具體說一說……”“您對此的看法是什么”“為什么是這樣的?”等開放、探索的問題,以獲得更為豐富的原始訪談資源。充分圍繞訪談的核心主題,抓住科研用戶的特性,探討政府開放數據利用過程中的相關細節;④訪談資料的整理與分析。將訪談內容轉錄為文字資料,并對文字資料做進一步的整理分析。
考慮到受訪者對研究問題的認識程度,本研究選擇的受訪者是有政府開放數據的使用或相關研究經驗的科研用戶,或者曾經參與數據開放創新大賽,對政府開放數據有一定的認識,并對數據分析等有著豐富的工作或實踐經驗。本文選取40位與政府開放數據接觸較多的一線人員和專家,圍繞“影響科研人員使用政府開放數據的因素”這一主題進行深入訪談。在訪談之前與訪談對象溝通訪談主題、訪談目的和訪談大致內容等,使得訪問者充分了解研究內容。在訪談過程中不斷追問更具體更詳細的情況,充分挖掘訪談影響科研人員使用政府開放數據的因素。本研究以線下面對面訪談為主,同時輔以微信視頻電話的方式進行線上訪問,訪談時間保持在30~50分鐘。訪談結束后立即將語音信息轉化為文本資料,并在每次訪談結束后及時查閱相關文獻整理本研究的核心思路和主題,并完善訪談提綱和臨時提問思路。直到訪問過程中大量的內容開始趨于重復,達到飽和時終止訪談并整理出最終資料合集。選擇2/3的受訪者資料進行編碼分析和模型構建,剩余1/3的受訪者資料留作飽和度檢驗。其統計信息如表2所示。
由表2的受訪者信息可知,受訪者樣本女性18位,男性22位,性別比例均衡;受訪者年齡18~38歲占總受訪人數的70%;職業上學生和教師共21人,公司職員19人;學歷上以碩士為中堅力量。受訪者符合來自多個人群、多個領域,并對政府開放數據有充分了解,可以為調查提供更全面、更精準的資料。
2.3影響因素抽取
對基于扎根理論進行訪談所獲得的文本資料進行分析,從科研用戶認知視角,包括科研用戶自身的認知風格、認知能力,科研用戶對政府開放數據的質量認知、價值判斷,科研用戶所處情境、面臨的任務等,通過開放式編碼、主軸式編碼和選擇性編碼,不斷挖掘影響科研人員使用政府開放數據的核心概念,同時輔以質性分析軟件NVivo12進行文本分析。
2.3.1開放式編碼
扎根理論的第一階段即開放式編碼,也稱一級編碼,是將采訪所得的原始語料進行打散分解,命名原始代碼,再得出能清楚描述原始語料的原始概念,并將概念化的內容抽象、提升、綜合為范疇。編碼內容要求依據采訪的原始語句提煉,不遺漏重要的語料信息。本文對原始語料進行切分和提煉等操作后總計獲得248條原始語句。表3是通過開放式編碼所得到的12個范疇,并提取了部分原始語料與之對應。
通過開放式編碼得到的12個范疇分別為:B1基本素養、B2數據檢索與處理能力、B3數據質量認知、B4數據呈現、B5數據訪問、B6項目驅動、B7競賽驅動、B8資源投入、B9開放觀念、B10產業技術升級、B11法律法規、B12潮流壓力。接下來進行主軸式編碼,實現進一步的歸納總結。
2.3.2主軸式編碼
主軸式編碼是在12個開放式編碼的基礎上,對語料、概念和范疇進行反復比對、轉移和建立連接。尋找概念與范疇的相互作用關系,并對核心范疇進行精確從而完成主軸編碼,表4為主軸式編碼的過程和結果。通過主軸編碼得到數據利用能力、數據準備度、科研任務和科研情境共4個主范疇,這4個主范疇是影響政府開放數據利用因素的主要類屬。
2.3.3選擇性編碼
選擇性編碼是在開放性編碼和主軸式編碼后所精煉出的更具統領性的主范疇,為探究主范疇對科研人員利用政府開放數據的影響因素,圍繞主范疇來描述和解釋各范疇之間的關系并進行編碼?;趯蒲杏脩粽_放數據利用的影響因素的4個主范疇探析,數據利用能力、數據準備度、科研任務和科研情境均是科研用戶科研過程中政府開放數據利用的影響因素集合,從而將“政府開放數據利用影響因素”確定為核心范疇。
2.3.4飽和度檢驗
在3位研究人員完成選擇性編碼之后,由另外3位研究人員對剩余1/3的原始語料進行飽和度檢測,檢測結果顯示,剩余內容的編碼未超過科研人員利用政府開放數據的影響因素的四大范疇,未遺漏重要概念、范疇和關系。表明本扎根理論模型已經達到飽和。
3模型構建與分析
基于以上編碼分析,本研究認為影響政府開放數據利用的影響因素包括數據利用能力、數據準備度、科研任務和科研情境4個方面,以此構建的政府開放數據利用的影響因素如圖2所示。
3.1數據利用能力
科研用戶獲取政府開放數據后將直接對信息進行分析挖掘,所以用戶自身數據利用能力是影響科研用戶數據利用效果的關鍵因素,包括基本素養和數據檢索與處理能力兩個部分?;舅仞B包括科研用戶具有的數據認知素養和科研素質,數據認知素養即科研用戶對數據較為敏感,能夠發現和分析有價值的數據,對數據進行批判吸收并能夠根據自身需求與數據提供方溝通等,存在較大的個體差異性,也是科研用戶能否適應開放數據研究的核心因素,同時科研人員長期以來的科學思維方式和實踐經驗也會對開放數據利用產生影響。數據檢索與處理能力包括數據檢索和聚焦能力、數據價值判斷能力和合作創新能力。在訪談中發現,不同學科領域的科研人員對使用政府開放數據的目標、方法、態度和價值感知等均不相同,加之數據利用能力的差異,會直接影響到數據利用的科研工作中。如有受訪者表示“很難直接從現有開放數據中找到合適的研究選題”,而有的受訪者則表示“數據完全夠用,是方法和角度的問題”;另一方面,更多受訪者則表示“數據處理有關的科研和技術發展很快,持續性學習對科研用戶提出了更高的要求”。
3.2數據準備度
在政府開放數據從呈現到獲取過程的各個環節都可能影響科研用戶對政府開放數據的利用,數據準備度是影響科研用戶數據利用效果的基礎因素。數據準備度包括數據質量認知、數據呈現和數據訪問。數據質量認知是核心,是科研用戶對政府開放數據真實性、原始性、相關性、有用性、規范性、數據分類、層次性等內容質量的認知,具有真實性、原始性高的政府開放數據是科研用戶得到科學、準確的科研結論的基礎,同時政府開放數據必須與科研用戶研究內容具有相關性,數據對其科學研究是有用的,政府開放數據的規范性、數據分類、層次性等方面無疑可以為用戶感知政府開放數據的價值和數據利用提供便利;另一方面,在開放政府數據平臺呈現的數據,關鍵數據是否位置清晰容易查找,數據內容描述是否準確無誤,數據業務問題是否定義清晰易于理解等數據呈現方式,都將直接影響科研用戶對政府開放數據的利用。最后,數據開放平臺是否在省級或者國家級進行統一管理,政府開放數據平臺的交互體驗如何,如何獲得數據的詳細信息和下載使用權限,同時確保數據授權合理并能夠完成數據保密工作,都將在數據訪問層面對科研用戶利用政府開放數據產生影響。如有受訪者表示“如果能實現有用好用易用而且沒有風險,那政府開放數據肯定會成為大多數的選擇”。
3.3科研任務
在政府開放數據挖掘過程.科研項目驅動和數據競賽驅動是政府開放數據利用的兩大驅動力??蒲许椖框寗邮强蒲杏脩糁鲃舆x擇政府開放數據作為研究對象,包括項目申報前的選題資料分析,也包括項目進行過程中的數據內容挖掘分析。政府開放數據開發者競賽等類似活動則是地方政府或者地方政府與企業聯合對專項的數據進行開發和挖掘,吸引更多領域的學者參與到同一項數據業務中來。只要實現項目落地,解決現實問題,那科研項目驅動和數據競賽都能驅動科研用戶對政府開放數據的利用。如有受訪者表示“如果主辦方將現實問題定義成數據問題有待決解,那這就是很多擅長數據分析的專家的優勢領域了”,數據業務定義準確,形成具體問題,將有助于吸引不同領域的科研用戶進入到政府開放數據利用中來。
3.4科研情境
從科研情境來看,資源投入、開放觀念、產業技術升級、法律法規和潮流壓力等都會對政府開放數據利用產生重要影響。政府開放數據需要充足的資源投入,需要國家政策的扶持,政府需要在平臺建設上投入人力、物力和財力,需要數據領域專家來指導平臺的建設和數據的整合,需要有良好的推廣和激勵機制,在目標和行動上都做到面向用戶需求,以實現數據的公共價值。如有受訪者表示“目前政府開放數據平臺的交互功能不太好用”“數據質量參差不齊,太難用了”等,可見資源建設仍有較多的進步空間。政府對于開放的態度,對于開放內容的保守和開放程度,是否敢于承擔數據開放創新帶來的未知風險,既對政府開放數據的范圍及數據質量產生影響,也影響科研用戶對政府開放數據的認知和利用。如有受訪者表示“感覺目前開放比較謹慎,數據的內容不夠豐富”“開放得很小心,我們暫時也不敢大膽地使用”等。產業技術升級則是實現政府開放數據利用的重要推動力.隨著政府數據產生和收集的方式越來越豐富,數據的使用、流通、脫敏、保密、開發等技術隨之快速發展,信息技術新的進步以及跨領域合作都能為政府開放數據注入新的活力,可以推動科研用戶政府開放數據利用。如有受訪者表示“期待數據開放平臺能夠自帶一部分基礎的數據整理或者分析的工具”“希望數據能有更好的脫敏,這樣使用起來更方便也沒有更多的顧慮”等,均為科研工作者對政府開放數據技術的期待。法律法規在數據安全立法、隱私立法、數據使用協議等方面更清晰的界定可以規范開放數據使用行為,引導政府開放數據利用良性發展。潮流壓力包括國外開放潮流壓力、國內民眾對開放政府數據的期盼,民眾對現存政府開放數據的評價口碑等,也將影響科研用戶使用政府開放數據的意愿。如有受訪者表示“社會環境和法律環境實實在在地影響著我們選擇科研的內容和方向”。
4研究結論與展望
如何基于科研用戶認知來研究利用政府開放數據,既是對科研用戶數據科研工作的更深要求,又是對政府實現提升供需適配性水平的進一步發展。本研究通過對政府開放數據科研用戶的參與式觀察深入訪談.利用扎根理論的方法從理論層面構建科研用戶利用政府開放數據的影響因素分析框架,并對關鍵要素及其作用機制進行剖析,得到數據利用能力、數據準備度、科研任務和科研情境四大影響因素。本研究提出的框架能為后續面向用戶認知的政府開放數據管理與服務提供借鑒和參考。同時本研究也具有一定局限性,整體研究仍在理論層面上進行分析與探索,仍需要實證研究、實踐研究和量化研究來驗證與補充,以期為實現政府開放數據進一步提升提供更具體的意見和建議。
(責任編輯:郭沫含)