徐紅昌





關鍵詞:科研數據;共享意愿;影響因素;扎根理論
摘 要:為厘清科研人員科研數據共享意愿的影響因素和作用機理,提升科研人員的個人價值以及促進我國科技事業的可持續發展,文章采用扎根理論質性研究方法,構建了科研人員科研數據共享意愿影響因素模型,分析了科研人員數據共享的主要影響因素,并以此為基礎提出了相關對策與建議。
中圖分類號:G252 文獻標識碼:A 文章編號:1003-1588(2022)06-0102-06
1 背景
隨著大數據時代的到來,各類數據信息呈幾何級增長,并在社會發展中發揮著重要作用。在科學研究領域,科研事業的發展正朝著數據密集型方向發展,科研數據已經成為支撐科研事業發展的重要資源,很多國家和地區已經意識到科研數據共享的重要意義,紛紛出臺相應的政策和措施鼓勵科研數據的共享和二次利用。例如,20世紀90年代美國就已經意識到數據開放的重要性,將數據開放列入了基本國策;2011年英國提出以政府為主體建立數據開放研究所,并制定了數據開放的相關政策和標準;2013年韓國將數據開放寫入法律,為數據開放保駕護航。與國外相比,我國相關機構和部門對科研數據共享的重視程度不夠,有些科研人員不愿共享、不敢共享科研數據。為促進我國科研數據共享事業的可持續發展,提升科研人員科研數據共享意愿和行為,本研究以科研人員科研數據共享意愿為研究主題,借鑒扎根理論質性研究范式深入探討和分析科研人員科研數據共享意愿的影響因素和作用規律,以激勵科研人員科研數據的共享意愿,實現科研數據共享事業的可持續發展。
2 相關文獻回顧
在科學研究領域,科研數據一直被圖書情報領域重點關注,在大數據、開放存取等背景下,科研數據共享更是成為業界和學者研究的熱點問題。筆者梳理相關文獻后發現,當前我國科研數據共享研究主要集中在以下兩個方面:一是先進國家和地區的經驗介紹和研究。例如,王丹丹等以英國科研數據共享實踐為例探討了該國科研數據共享中的關鍵問題,為我國制定科研數據開放政策提供了借鑒[1];俞德風在介紹哈佛大學圖書館科研數據先進開放經驗的基礎上,對我國圖書館科研數據開放事業提出了若干對策和建議[2]。二是科研人員參與科研數據共享的影響因素研究。例如,鄧靈斌等以高校科研人員為研究對象,探討了高校科研人員科學數據共享意愿的影響因素[3];孫曉燕等基于計劃行為理論分析了科研人員科學數據共享意愿影響因素,結果顯示制度因素、機構因素是影響科研人員參與科學數據共享的重要因素[4]。綜上所述,我國關于科研人員科研數據共享影響因素的研究雖然已經起步,但研究體量總體偏小,且既有研究多是依托成熟的理論體系,通過預設研究、自上而下的形式探討科研人員的參與意愿與參與行為,基于我國社會情境和科研人員行為特點的相關研究較少。因此,本研究以扎根理論為基礎,依托我國社會情境、自下而上分析科研人員科研數據共享意愿具有重要的理論意義和實踐意義。
3 研究方法與數據搜集
3.1 研究方法
扎根理論是一種以社會現象和社會問題為研究對象的探索性的質性研究方法,通過深度訪談的形式獲取原始資料和樣本數據,經過結構化的分析與編碼,不斷地抽象與概括,最終得到科學合理的理論和模型,以深度解析當前的社會現象和社會問題。扎根理論作為結構化的分析方法,已經被廣泛應用于信息管理與用戶信息行為研究領域,并顯示出良好的適用性,如:張海以扎根理論為基礎,探討了網絡用戶信息繭房的形成機理和運行規律,深層次探討了網絡用戶信息繭房的概念框架[5];周陽等借鑒扎根理論研究范式分析了虛擬學術社區用戶參與行為影響因素,為后續相關研究奠定了理論基礎[6]。本研究的主題是科研人員科研數據共享意愿影響因素,是從當前社會發展過程中提煉出的社會問題,本研究采用扎根理論的研究范式,通過半結構化訪談的形式獲取原始數據,以開放式編碼、主軸式編碼和選擇性編碼三級編碼的形式,深入分析科研人員科研數據共享意愿的影響因素和共享意愿。
3.2 數據搜集
扎根理論對樣本數量沒有特別限制,但要求采集的樣本盡可能分布均勻,盡量反映社會的真實情況。為保證數據的客觀性和代表性,本研究選取的科研數據分布涵蓋農學、醫學、管理學、理學、工學等學科門類,選取的35名訪談對象包括高校科研人員、科研院所科研人員、相關企業科研人員以及博士研究生等,都具有三年以上科研經歷,并在其研究領域有一定數量的研究成果產出,所處地域涵蓋華北、華東、華南、東北、西北等區域,詳見表1。
4 編碼分析與模型構建
4.1 開放式編碼
開放式編碼是扎根理論編碼分析的第一步,開放式編碼主要是對原始訪談數據進行初步編碼和分析:首先將訪談樣本打散,以原始訪談樣本為基礎,逐字逐句進行壓縮和編碼,并重新賦予概念;其次對得到的概念進行比較和分析,把一些類似、重復以及出現頻率過低的概念進行合并、剔除;再次進行重新命名,確定范疇,賦予范疇化的概念。本研究經過上述步驟后得到情感認知、價值認知、風險認知等14個有效初始范疇,詳見下頁表2。
4.2 主軸式編碼
主軸式編碼是在開放式編碼結果的基礎上按照一定的邏輯和次序將初始概念進行合并、歸類的過程,是扎根理論編碼的第二個階段。課題組在對情感認知、價值認知、風險認知等14個初始概念進行深入分析、合并和歸類后,最終得到用戶認知、數據因素、社會環境等5個主范疇,詳見下頁表3。
4.3 選擇性編碼
選擇性編碼是在主軸式編碼的基礎上進一步分析主范疇和核心范疇的關系,是扎根理論編碼的第三個階段。選擇性編碼主要是通過梳理“故事線”的方式進一步明確主范疇和核心范疇之間的關系,通過原始樣本信息驗證的形式最終確定核心范疇與主范疇之間的關系,詳見下頁表4。
4.4 模型構建
課題組對30份(剩余5份用于理論飽和度檢驗)原始文本信息、14個初始范疇以及5個主范疇進行加工提煉,并經過選擇性編碼梳理出主范疇和核心范疇之間的“故事線”后,最終構建了科研人員科研數據共享意愿影響因素模型,詳見圖1。
4.5 理論飽和度檢驗
理論飽和度檢驗是對編碼過程和結果飽滿程度進行驗證,為保證理論飽和度檢驗的準確性和客觀性,本研究采用“樣本+專家”形式進行檢驗。一方面,課題組將余下的5份訪談樣本在專家的指導下進行編碼,編碼結束后將編碼過程和編碼結果反饋給專家進行檢驗,驗證結果顯示沒有出現新的概念和范疇;另一方面,課題組隨機對三位專家進行訪談,并對訪談文本進行編碼,編碼結束后也沒有發現新的概念和范疇。至此,基于扎根理論的科研人員科研數據共享意愿影響因素模型的理論飽和度檢驗通過。
5 研究結論與分析
5.1 用戶認知因素影響分析
用戶認知因素是影響科研人員科研數據共享意愿的重要因素,用戶認知因素分情感認知、價值認識和風險認知三個維度。就情感認知而言,約有2/3的受訪者認為科研數據共享是推動科研事業可持續發展的重要手段,在思想上和情感上能夠接受科研數據共享理念;就價值認知而言,幾乎所有的受訪者都認為科研數據共享是有意義和有價值的行為,約有1/3的受訪者認為科研數據共享在具體實施時會存在一系列問題,因此需要客觀冷靜地對待;就風險認知而言,有不少受訪者認為科研數據在共享過程中會產生科研隱私泄露和知識產權等問題,從而影響自身的科研事業,科研數據共享風險遠大于收益。由此可見,科研人員雖然在情感上認可科研數據共享理念,也認同科研數據共享的價值性,但科研數據共享過程中的風險會影響科研人員共享數據的意愿。因此,如何有效利用科研人員的情感認知和價值認同,合理規避科研數據共享過程中的隱私泄露和知識產權等風險問題,是提升科研人員科研數據共享意愿、實現科研數據共享事業可持續發展的關鍵[7]。
5.2 數據因素影響分析
數據因素涵蓋科研數據的規范性、開放性以及數據質量等。在規范性方面,約有1/3的受訪者認為科研數據在整理和共享過程中需要根據學科特點和研究領域的具體特征制定統一的模板,以保持科研數據的規范合理,并有利于提高科研人員的共享意愿;在開放性方面,約有1/2的受訪者認為科研數據是伴隨特定的科學研究產生和發展的,在產生過程中有其特殊性,有些科研數據涉及科研機密,不具有開放屬性,因此不會參與科研數據共享;在數據質量方面,不少受訪者認為科研數據在產生和發展過程中缺少質量把控,質量參差不齊,可利用的價值有限,低質量的科研數據共享不僅不會促進科研事業的發展,還會成為科研事業發展的絆腳石。由此可見,提升科研數據質量、規范科研數據合理性以及提高科研數據的開放屬性,是促使科研人員積極參與科研數據共享的重要因素[8]。
5.3 社會環境因素影響分析
社會環境因素包括政策因素、社會氛圍和意見領袖三個維度。政策因素主要是指與科研工作相配套的政策,不少受訪者表示當前與科研工作相關的配套政策還不完善,因此不太愿意共享科研數據;社會氛圍包括社群影響和社交關系影響,約有1/3的受訪者表示朋友和同事對科研數據共享的態度會影響自己的決策和行為;在意見領袖方面,不少科研人員表示會受導師、業界權威學者影響,從而不自覺地產生學習和模仿行為。由此可見,良好的社會氛圍有助于激勵科研人員積極參與科研數據共享[9]。
5.4 平臺因素影響分析
科研數據共享平臺是科研數據共享的前提和基礎,平臺主要包括技術因素、共享成本和有用性三個維度。本次調研的受訪者表示,現有的科研數據共享平臺不太完善,技術手段相對落后,難以滿足他們的需求。技術手段落后會增加科研人員的共享成本,在共享過程中需花費大量的時間和精力,直接影響了科研人員的參與熱情和參與意愿。有用性是指數據共享平臺的有用程度和可用程度,不少受訪者認為現有科研數據共享平臺的可用性一般,難以準確查找有用的科研數據。
6 結語
本研究顯示,科研人員對于數據共享是認可的,也有一定的數據共享意識,相關部門和機構應在宣傳推廣科研數據共享的基礎上,進一步強化科研人員科研數據共享意識,為科研數據共享創造良好的輿論氛圍,一方面可通過大力宣傳先進事跡和典型人物,強化科研人員對科研數據共享的認同感和責任感;另一方面可與學界意見領袖合作,借助學術名人的影響力提升科研人員的科研數據共享意識。此外,良好的社會環境是科研數據共享的基礎和必要條件,是促使科研數據共享健康發展的重要保證,相關部門和機構需通力合作為科研人員進行科研數據共享創造良好的社會條件,如:搭建完善的數據共享服務平臺,減少科研人員的科研數據共享成本和負擔;鼓勵科研人員積極進行科研數據共享,增強科研人員的使命感和責任感等。
參考文獻:
[1] 王丹丹,吳思潔.英國科研數據開放共享的關鍵問題思考[J].情報雜志,2020(9):163-167.
[2] 俞德鳳.哈佛大學圖書館科研數據管理服務實踐與啟示[J].圖書館,2021(10):47-53.
[3] 鄧靈斌,肖洪偉.我國高校科研人員科學數據共享意愿之實證研究[J].新世紀圖書館,2021(5):17-22.
[4] 孫曉燕,李希彬,王文玫,等.面向科研人員的科學數據共享影響因素的調查分析:基于計劃行為理論[J].圖書館學研究,2019(5):38-45.
[5] 張海.網絡用戶信息繭房形成機制的概念框架研究[J].情報理論與實踐,2021(11):60-64.
[6] 周陽,譚春輝,朱宸良,等.基于扎根理論的虛擬學術社區用戶參與行為研究:以小木蟲為例[J].情報科學,2022(1):176-183.
[7] 劉莉,劉文云.基于解釋結構模型的科研數據共享影響因素分析[J].情報科學,2020(5):27-33.
[8] 陳媛媛,王朔桓.科研人員數據共享的挑戰[J].圖書館論壇,2020(8):96-102.
[9] 陳媛媛,王苑穎.科研數據開放共享的利益相關者互動關系[J].圖書館論壇,2020(5):55-63.
(編校:徐黎娟)