




摘 要: [目的/ 意義] 完善科學數據倫理治理有助于規(guī)范科學數據收集、共享和使用, 發(fā)揮數據作為科研的關鍵資源與要素的功能, 優(yōu)化科學數據管理服務。[方法/ 過程] 本研究基于扎根理論分析英國科學數據倫理政策, 總結其政策框架與內容, 并通過矩陣編碼與社會網絡分析方法揭示治理特征, 提出我國優(yōu)化科學數據倫理治理的建議。[結果/ 結論] 研究發(fā)現(xiàn), 倫理政策框架包括治理環(huán)境、主體與策略3 層面。倫理治理環(huán)境內容分為適用領域、適用主體、概念定義、問題分析與現(xiàn)有政策; 倫理治理主體內容涉及治理主體界定與促進主體協(xié)作; 倫理治理策略內容涵蓋治理指導與各階段治理措施。其治理特征有3 維度: 注重定義概念, 明確分配主體權責與促進協(xié)作, 全面厘定治理策略與加強倫理風險防控。據此提出4 條治理路徑: 形成治理體系, 規(guī)范治理理論, 明確各方權責與協(xié)作方式, 細化各階段治理措施。
關鍵詞: 科學數據; 數據倫理; 數據治理; 政策分析; 英國
DOI:10.3969 / j.issn.1008-0821.2025.01.008
〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2025) 01-0112-12
隨著數據密集型研究范式發(fā)展, 數據成為科研的關鍵資源與要素。推進科學數據倫理治理有助于規(guī)范科學數據的存儲、再利用和價值開發(fā)[1] 。倫理包括“規(guī)制和道理”, 是對道德現(xiàn)象的哲學思考。倫理學常用于探討道德責任義務, 評估道德價值與準則[2] 。數據倫理是倫理學的新分支, 其內容涉及研究和評估與數據、算法及相應的實踐有關的倫理風險與道德問題, 以制定行為或倫理準則等解決方案[3] 。數據倫理亦指數據道德, 其規(guī)制范疇涉及數據安全風險、數據隱私泄露、數據所有權侵犯等問題[4] 。數據倫理治理被認為是不同主體為應對數據采集、利用、存儲等過程中帶來的倫理失范, 解決其中的數字鴻溝、數據濫用、數字身份、隱私泄露等問題,運用不同的政策、技術工具進行管理、規(guī)范并挖掘其價值的行為, 治理過程中需多方協(xié)調達成一致[5-6] 。科學數據倫理隸屬于數據倫理, 旨在評估科研活動中的數據收集、共享和使用可能對人和社會產生不利影響的行為[7] 。同時, 科學數據倫理還涉及科技倫理內容。科技倫理是開展科學研究、技術開發(fā)等科技活動需遵循的價值理念和行動規(guī)范, 遵循增進人類福祉, 尊重生命權利、堅持公平公正、合理控制風險及保持公開透明的原則[8] 。參照以上概念,本研究認為科學數據倫理治理是多主體在分析治理環(huán)境基礎上, 在收集、管理、使用與共享科學數據過程中運用政策規(guī)章、技術工具等規(guī)制倫理失范行為, 保障各主體免受數據技術侵害, 享有數據權利。科學數據倫理治理需制定數據倫理價值觀念和行為規(guī)范, 確保各主體落實數據倫理責任, 享有數據權利, 從而維護科技倫理和科學道德。其中數據責任指尊重他人數據權利、保障數據安全合規(guī)、數據技術服務于人等。數據權利包括研究者的數據產權、控制權和受益權, 以及參與者的數據隱私權、數據控制權、自主權與受益權等。
國際組織及各國高度重視數據倫理治理, 發(fā)布系列相關政策文件。聯(lián)合國發(fā)布《通用生物倫理與人權宣言》(Universal Declaration on Bioethics andHuman Rights 2005)、《關于COVID-19 的聲明: 全球視野下的倫理聲明》(Statement on COVID -19:Ethical Considerations from a Global Perspective 2022)等, 強調保障個人自主權, 確保隱私數據安全和合規(guī)使用。美國總務署(GSA)發(fā)布《數據倫理框架草案》(Draft of the Data Ethics Framework 2022), 強調在收集、管理或使用數據時保護公民自由、最大限度降低個人和社會的數據使用風險。英國中央數字和數據辦公室更新《數據倫理框架》(Data Eth?ics Framework 2020), 規(guī)定奉行透明、問責、公平3 大數據倫理原則。德國成立數據倫理委員會, 強調尊重參與者權利、面向公共利益使用和分析數據等治理原則[9] 。我國也陸續(xù)發(fā)布《科學數據安全分類分級指南》《科學數據安全審計指南》《關于加強科技倫理治理的意見》等, 推動科學數據倫理治理, 指出治理體制機制不健全、制度不完善、領域發(fā)展不均衡等問題。
當前政策主要針對多類型數據提出了整體倫理指導, 多為綱領性和原則性規(guī)制, 并未基于科學數據倫理具體問題提出可操作規(guī)則或指南。不同于政府數據、企業(yè)數據及個人數據等類型, 科學數據倫理治理在數據特征、治理主體、治理過程及倫理內涵維度存在差異。數據特征上, 科學數據屬于知識資產, 價值密度更高[10] , 絕大部分資助機構與出版機構規(guī)定研究項目數據公開共享[11] , 還因學科差異、獲取與存儲方式不同形成不同種類與結構。因此, 其倫理治理更注重平衡科學價值與數據權屬。治理主體上, 科學數據倫理治理的核心主體為科研資助機構、科研院所等, 其倫理治理應注重主體角色劃分與權責確定, 其關鍵治理對策也不同。治理過程中, 科學數據的收集、分析與開放具有非盈利性質, 治理中相對缺乏強制約束。這使其更需要完善的道德倫理規(guī)制, 加強對科學數據倫理的討論與監(jiān)管[12] , 根據科研項目需求細化倫理準則, 提升可執(zhí)行度。倫理內涵上, 科學數據倫理較少關涉企業(yè)規(guī)章、行政條例, 需更多融入科研管理、科技倫理、數據倫理概念相關聯(lián)內容。
本研究旨在探究科學數據倫理治理政策框架,分析其中涉及的內容主題與要素, 基于各主體治理重點歸納治理特征。本文以英國為例, 選取其政府、科研機構等多主體的科學數據倫理相關制度條例、政策文件、框架指南等多類型資料, 歸納政策框架,分析不同主體的政策重點, 揭示其治理特征并提出針對我國的治理路徑。
1 相關研究
1. 1 數據倫理治理
研究聚焦數據倫理治理問題與對策兩方面。一是探尋數據倫理治理存在的問題[13] , 基于領域數據治理實踐揭示數據倫理問題與風險, 如指出政府數據倫理治理涉及數據收集、處理和應用3 個環(huán)節(jié),需解決數據隱私與鴻溝等問題, 保障數據正義[14] 。認為智慧圖書館數據倫理風險包括損害讀者隱私、降低讀者信賴度、數據錯誤處理與濫用、算法歧視等[15] 。此外, 還關注其中的個人數據泄露[16] 、敏感數據安全[17-18] 等數據隱私、數據所有權分配[19] 、數據鴻溝[20] 等問題。二是針對倫理問題提出解決對策。如加強科研倫理審查的組織與能力保障[21] ,保障科學數據共享合規(guī)[22] 與科研中的個人數據隱私[23] , 加強人類學研究倫理規(guī)范與審查機制建設[24]及科研數據誠信與質量維護[25] 等。
1. 2 數據倫理政策
研究集中關注政策制定需求與具體內容。政策需求方面, 研究提出制定通用數據倫理規(guī)則和政策的重要性, 應對數據偏見、數據鴻溝、數據訪問不公平等倫理困境[26] 。也有研究通過分析政策發(fā)展,提出政策制定應聚焦數據隱私保護和數據使用合規(guī)性等主題[27] 。政策內容方面, 研究揭示了醫(yī)療政策中的倫理范疇, 包括關系倫理、患者權利、醫(yī)生權責等[28] , 強調了保障數據隱私、知情同意[29] , 建議制定數據自主權的保護指南[30] 。其中對科學數據倫理政策相關研究的關注則極為有限, 僅有研究分析數據管理政策中的倫理主題、治理規(guī)則[31] 與倫理權益[32] 。
總體來看, 現(xiàn)有研究從多視角探索科學數據倫理治理的問題及解決方案, 但仍存在不足。首先,對科學數據倫理治理面臨的問題分析尚不全面, 多關注數據隱私, 對數據質量、數據偏見等倫理問題的分類和剖析有限。其次, 主要基于單主體或學科探討治理實踐與建議, 缺乏對多領域政策或多主體協(xié)作的詳細分析, 較難形成完整的治理政策體系。最后, 科學數據倫理政策研究較為匱乏, 現(xiàn)有數據倫理研究的政策分析的粒度和深度有限。
2 研究設計與實施
扎根理論(Grounded Theory)被越來越多用于政策分析中, 能使研究者更準確地篩選分析樣本, 探索理論概念[33] 。鑒于科學數據倫理治理的概念有待剖析, 以及研究樣本的非結構化特征, 本研究采用此方法。研究分兩階段, 首先選取樣本, 隨后基于扎根理論開展定性文本分析, 參照程序化扎根理論研究過程[34] , 通過開放編碼、主軸編碼與選擇編碼三步進行文本分析, 歸納英國科學數據倫理政策的框架與內容, 隨后基于編碼結果使用社會網絡分析法, 構建共現(xiàn)矩陣, 實現(xiàn)治理網絡可視化, 揭示各主體政策的治理規(guī)劃與重點, 明晰治理特征。
2. 1 樣本選取
本研究選取英國作為研究對象, 有兩方面原因,一是英國數據治理意識起源早且重視科學數據倫理。英國數據制度發(fā)展歷程悠久, 完善程度較高。其數據法案可追溯到1984 年的《數據保護法》(Data Pro?tection Act), 且長期以來英國沿襲和發(fā)展著嚴密的歐盟數據保護政策體系[35] 。英國皇家學會(The Roy?al Society)調查報告也顯示, 英國的科學數據制度相對完善且尤其重視科學數據倫理治理[36] 。二是英國作為英美法系典型代表, 以單行法律、法規(guī)和判例法為主, 加之數字經濟水平較高[37] , 積淀了較豐富的執(zhí)法經驗與案例, 可供我國吸取其教訓,參考其經驗, 融通大陸法系與英美法系各自優(yōu)勢,進一步完善數據法治體系。
本文以英國科學數據治理的利益相關者頒布的政策、文件、指南等資料作為分析文本。利益相關者包括政府、科研機構、資助機構、出版機構、圖書館、數據庫及第三方機構。在確定主體代表時,綜合機構影響力、受認可度、可訪問性、政策相關性等選擇指標, 篩選出英國的政府主管部門、主要資助機構、QS 排名前五的高校及科研機構、全球排名50 強的出版機構、圖書館及第三方機構主要包括獨立監(jiān)察機構、數據公司與其他社會組織等。為保證查全率, 獲取樣本時, 在機構的官方網站檢索標題或內容中檢索含有“科學數據and 倫理”“數據and 倫理” “數據and 科研倫理” “數據or 科技倫理” 的內容, 相應英文詞包括“Scientific Data、Research Data、Data、Ethics、Research Data、Tech?nology Ethics”, 再逐條進行篩選, 優(yōu)先選取科學數據倫理專門政策, 若無專門政策則挑選內容中含有科學數據倫理的政策。最終獲取來自35 個代表機構的78 份政策文本(截止時間為2023 年2 月24 日)。樣本分布于2003—2023 年間, 統(tǒng)計最新修訂時間可知, 68%的政策文件頒布于2018—2023 年間,30%的政策文件頒布于2018 年以前, 2%的政策文件未標注發(fā)布時間。各主體政策占比依次為政府(3%)、科研機構(24%)、資助機構(28%)、出版機構(6%)、圖書館(21%)、數據庫(3%)及第三方機構(15%)。分析過程中按照政策頒布主體的英文首字母與數字確立各個政策的編號(如第一份政府發(fā)布的政策編號為G01), 瀏覽政策全文并從中篩選出科學數據倫理治理內容進行編碼分析。
2. 2 開放編碼: 識別政策概念與范疇
由兩位科學數據與數據治理領域專家進行編碼,通過試編碼, 比較一致性, 并在編碼過程中進行持續(xù)討論和對比以提升編碼可信度和質量。在開放編碼階段根據原文內容進行編碼, 提取初始概念, 并進行初步范疇化。將78 份政策文本導入Nvivo12,逐條進行編碼, 如表1 所示, 盡量用原文概念及詞語標識內容。最初得到392 個初始概念, 選取出現(xiàn)頻次為3 及以上的概念共206 個, 結合原文內容將初始概念歸納為11 個范疇, 如表2 所示。
2. 3 主軸編碼: 歸納分析政策主范疇
在主軸編碼階段深入探析范疇與概念間關聯(lián),對比分析范疇、概念與原文, 提取主范疇。最終剔除部分單一概念, 分析初始概念與范疇間的邏輯關系來形成主范疇, 得到4 個主范疇, 19 個范疇和205 個初始概念, 如表3 所示。
2.4 選擇編碼: 形成治理政策框架
在選擇編碼階段選取核心范疇與概念, 構建治理“故事線”, 厘清治理政策體系。基于主范疇挖掘核心范疇, 將所有范疇與概念串聯(lián)構建出英國科學數據倫理治理政策框架, 如圖1 所示。參考條件(環(huán)境或情境)、行動(研究對象及反應)和結果(行動的后果)的思路[39] , 其中參考條件指向科學數據倫理環(huán)境, 包括倫理治理理論內涵和其面臨的情境,行動指向治理參與主體及其協(xié)作行為, 結果指向科學數據倫理治理措施。核心范疇遵循“環(huán)境—主體—數據” 的邏輯, 圍繞科學數據倫理的治理環(huán)境、主體與策略展開。
2. 5 理論飽和度驗證
兩位編碼員在編碼過程中持續(xù)討論與分析概念、范疇與主范疇, 比較其內容, 分析關聯(lián)性。最后進行飽和度檢驗, 對預先隨機抽出的未編碼的8 份政策(文本編號為T07、F09、F20、R7、R18、L12、G02、D02)實施開放編碼、主軸編碼和選擇編碼,進行飽和度檢驗, 未發(fā)現(xiàn)新概念與范疇, 可以判定本政策框架具有較高理論飽和度。
2. 6 矩陣編碼與社會網絡分析
將編碼內容轉化為案例, 基于不同主體進行案例分類, 利用Nvivo12 的查詢功能分析不同類型主體案例在治理環(huán)境、治理主體及治理策略三方面的編碼參考點, 建立節(jié)點矩陣。隨后將矩陣數據導入到Ucinet、Netdraw 中繪制治理網絡結構圖, 實現(xiàn)政策治理網絡可視化。
3 英國科學數據倫理政策框架其政策框架
體現(xiàn)著英國科學數據倫理治理理念和實踐, 分為治理環(huán)境、治理主體與治理策略3 個維度, 如圖1 所示。其中: ①數據倫理治理環(huán)境意味著治理現(xiàn)狀與情境, 包括對政策適用領域與主體的說明, 對數據倫理相關概念的定義、對現(xiàn)有政策的引用及對倫理問題的分析。②數據倫理治理主體包括治理主管機構、分管部門、協(xié)助機構及促進協(xié)作。③數據倫理治理策略分為治理指導與各階段治理措施。治理指導主要包括數據倫理治理目標、原則、參考資源及常見問題。各階段治理措施覆蓋科學數據生命周期各階段, 即準備與計劃階段、收集與獲取階段、合作與分析階段、管理與保存階段、數據共享與發(fā)布階段及重用與引用階段。
3. 1 治理環(huán)境
科學數據倫理治理環(huán)境是政策制定與執(zhí)行的背景與情境, 包括適用領域與主體、概念定義、現(xiàn)有政策與問題分析5 方面內容。
1) 適用領域。說明面向的學科或專業(yè)領域, 介紹學科屬性、數據特性及研究需求。如“為網絡研究學者提供參考” (R16); “對于網絡研究, 學者通常需要避免……等數據倫理問題” (R17); “探討使用地理空間數據進行研究、分析和統(tǒng)計時的倫理考慮” (G02)。同時, 這些政策后續(xù)內容也具備領域特征, 如用于規(guī)范網絡研究的政策強化了社交媒體規(guī)范, 用于規(guī)范地理空間研究的政策強調對可識別地址的保密。
2) 適用主體。對其重點面向主體進行針對性說明, 包括面向高校(L13)、科研機構(R02)、資助機構(R14)、出版機構(P01)、公共圖書館(L02)、高校圖書館(L16)以及政府數據部門(G01)等。如在英國政府頒布的數據倫理框架中明確規(guī)定了其面向政府和公共部門[40] , 限定了其適用范圍和場景,提升其政策針對性和適用性。
3) 概念定義。闡釋和定義數據倫理相關概念,明確治理的數據內容、數據主體、關鍵措施等。出現(xiàn)頻次最高的概念依次為科學數據(L13)、科研人員(L08)、倫理(L11)、人類主體(R17)、個人數據(T10)與知情同意(R12)。如在高校科學數據政策中限定科學數據的內涵特征, 涉及的敏感數據范圍等[41] , 以便后續(xù)進一步說明數據倫理治理措施。
4) 現(xiàn)有政策。援引現(xiàn)有政策、法律條例以說明與支撐數據隱私、知情同意權、數據版權相關規(guī)定。如引用《一般數據保護條例》(GDPR)、《英國數據保護法》(L13)以及《知識產權法》(L10)等政策中的數據權利保障相關內容。
5) 問題分析。基于治理情境和現(xiàn)狀指出目前存在的數據倫理問題或治理困境, 如數據濫用(T10)、倫理界限模糊(T03)、數據鴻溝(T05)、數據偏見與歧視(G02)、數據交易與流通困難(F07)、多方權益協(xié)調困難(T03)、可用技術有限(T05)等。基于此類問題在政策文件中進一步提出解決措施, 如針對數據濫用問題, 主張設置知情同意程序與使用權限, 針對倫理界限模糊問題, 主張宣傳推廣與教育培訓等[42] 。
3. 2 治理主體
治理主體包含對科學數據倫理治理職責分工與協(xié)同治理的探索。
1) 治理主體界定。針對不同主體作出指導和安排, 劃分主管機構、分管部門與協(xié)作機構。主管機構為科研倫理審查委員會(R01, R15)與資助機構(R05, F10)。分管部門為數據倫理工作小組、數據治理工作小組或數據管理工作小組(R11), 細化到科研項目中分管人為課題負責人(T10)。協(xié)作機構則為數據中心(F18)、檔案館(R15)、圖書館等其他數據利益相關者(T04)。
2) 促進主體協(xié)作。說明主體間協(xié)作的推進方式。包括確定合作機構(L16)、各方達成治理共識(L13)、創(chuàng)建交流渠道(T06)、尋求多種合作方式(T04)、分配數據治理權責(T06)、形成共同標準與規(guī)則(T06)、共同參與數據倫理培訓(R02)等。如帝國理工學院指出在倫理治理中存在學術協(xié)作、商業(yè)合作、慈善饋贈、采購外包等多類合作關系[43] ,強調推進對各類合作關系以推進倫理協(xié)作治理。
3. 3 治理策略
治理策略指圍繞科學數據提出的倫理治理指導與具體措施。
1) 倫理治理指導
包括科學數據倫理治理目標、原則、常見問題以及參考資源。①治理目標指治理期望達成的效果, 包括數據倫理風險最小化(R02)、數據價值最大化及服務于公共利益(F15)。②治理原則引導治理行為, 主要集中于透明性原則(T08)、尊重人類主體(R17)、保密性原則(L13)、包容性原則(R11)、公平性原則(R06)、問責制原則(R18)及CARE 原則(T09)。③常見問題指實施治理面臨的困難及其解決方法, 主要涉及數據匿名化方式(R17)、知情同意表格(R16)、數據保存期限(R17)、數據倫理審查程序(L05)、評估潛在倫理風險的方式(R17)。④參考資源則多見于政策最后的附錄, 內容為參考文獻(R05)、技術工具(L14)、實踐案例(T03)、知情同意表模板(R13)、倫理風險自查清單(T02)及數據服務(L14)。
2) 各階段治理措施
內容包括面向科學數據生命周期提出的具體措施, 分為6 個階段。①準備與計劃階段, 包括提交倫理審查申請(R05)、征求倫理委員會建議(R03)及評估潛在的數據倫理風險(L10)。②數據收集與獲取階段, 常提及簽署知情同意書(D02)、尊重數據所有權(R09)、獲取數據訪問許可(R18)、確定數據權屬(R15)。③合作與分析階段, 規(guī)定數據處理合規(guī)(T12)、避免數據偏見與歧視(G02)、數據匿名化處理(L14)、保障數據完整性(R11)、優(yōu)化數據組織(L15)、尋求專家建議(R14)、完善數據保密(L09)。④管理與保存階段, 強調選擇可信的數據存儲庫(L09)、保障數據存儲安全(L15)、確定數據保存期限(L10)、評估數據管理風險(T07)、評估數據保護效果(L16)、尊重數據刪除權(R19)、建立數據審查與監(jiān)護程序(F08)、設置數據授權機制(D02)、保障數據可移植權(T06)、允許更正個人數據錯誤(T10)、監(jiān)測數據質量(D02)。⑤數據共享與發(fā)布階段, 提出實現(xiàn)負責任的共享(P06)、保護數據隱私(T06)、落實FAIR 原則(L16)、實現(xiàn)合規(guī)的數據開放及獲得數據開放許可(L08)。⑥數據重用與引用階段, 提出規(guī)范數據引用(L04)、獲得數據使用許可(L08)、合規(guī)使用數據(D02)、尊重數據使用撤回權(L15)、保障數據所有權(R15)、標注數據來源(R10)及實施數據使用培訓(T02)。
4 英國科學數據倫理治理特征
通過分析英國科學數據倫理治理網絡揭示其治理特征, 如圖2 所示。方形節(jié)點代表治理主體, 三角形節(jié)點代表政策內容, 連線上及括號內的數字代表編碼參考點數量, 參考點越多表明主體越重視此內容, 如適用領域內容在資助機構政策中具有12個編碼參考點, 治理環(huán)境分析內容在所有政策中具有528 個編碼參考點。
治理主體維度, 科研機構為核心治理主體(參考點為806 個, 占比36%), 其次是第三方機構(參考點為475 個, 占比21%)、資助機構(參考點為339 個, 占比15%)及圖書館(參考點為331 個,占比15%)。治理內容維度, 核心內容為提出各階段治理措施(參考點為919 個, 占比42%)與分析治理環(huán)境(參考點為528 個, 占比24%)。
4. 1 注重定義治理概念與援引相關政策
英國各主體通過定義重要概念與引用相關政策來分析科學數據倫理治理環(huán)境。如圖2 所示, 科研機構與第三方機構政策中更關注定義重要概念(參考點分別為57 個與40 個, 占比分別為41%與29%)。科研機構與圖書館政策中則更多引用現(xiàn)有政策(參考點分別為116 個與43 個, 占比分別為54%與20%)。
1) 定義概念: 界定治理對象、方式及工具
以科研機構與第三方機構為代表的主體注重在政策中定義科學數據倫理治理相關概念, 說明治理的數據內容、治理方式及治理工具相關術語。數據內容相關概念以“科學數據” “倫理” 及“個人數據” 為主, 用于界定治理的數據類型與倫理屬性來闡述相應規(guī)定。治理方式相關高頻概念為“知情同意” “數據信托” 與“數據匿名化”, 用以論述數據倫理治理涉及的典型措施。治理工具概念體現(xiàn)為“算法模型” “數據存儲庫” 及“唯一標識符”, 屬于治理實施相關的工具、設施、平臺等。科研機構政策中尤其重視闡釋和界定“科學數據” 概念, 第三方機構則更注重說明“知情同意” 等治理措施相關概念。
2) 援引政策: 闡釋治理的目標、原則與策略
以科研機構與圖書館為代表的主體注重在政策內容中引證已有政策法令, 解釋說明治理目標、原則及具體策略。治理目標與原則方面, 引用倫理相關經典政策, 如《貝爾蒙報告》等被提及, 闡釋“尊重人、公正、自由、自主、有利、平等” 等治理目標及原則, 凸顯其指南的合法合規(guī)。治理實施策略方面, GDPR 及機構數據權利制度等數據保護相關政策被更多引用, 提出和強調“知情同意” “數據匿名化” 等具體治理措施, 并借此補充政策內容與規(guī)定。
4. 2 明確分配治理主體權責與促進協(xié)作
各主體的政策之中充分界定了治理主體, 注重分配各機構治理權責, 探尋促進治理協(xié)作的方式。在圖2 中, 科研機構與資助機構更注重劃分治理主體, 分配治理權責(政策參考點均為76 個, 占比為42%)。第三方機構更關注促進治理協(xié)作(政策參考點為33 個, 占比為55%)。
1) 明確治理權責
以科研機構與資助機構為代表的主體注重規(guī)定主管機構、分管部門及協(xié)助機構的權責。重點安排主管機構的職責分工, 尤其強調倫理委員會的主導作用, 并規(guī)定其通過制定指南、執(zhí)行倫理審查來履行治理職責。分管部門多是機構下設的數據倫理工作小組或科學數據管理小組, 負責提供數據倫理審查服務。針對協(xié)助機構, 僅提及其作為合作伙伴支持數據倫理規(guī)范與監(jiān)察, 較少對其進行具體權益協(xié)調與職責安排。
2) 促進治理協(xié)作
第三方機構更關注治理協(xié)作, 從跨機構、跨學科與跨部門三方面進行探索。跨機構協(xié)作需實現(xiàn)“共同控制與擁有數據” “達成治理共同規(guī)則與標準” 與“形成數據治理框架”。跨學科協(xié)作強調應“合規(guī)地共享數據以推進多學科與多類項目的協(xié)作”。跨部門協(xié)作強調“促進溝通” “統(tǒng)一各部門數據收集、分析與存檔的標準” 等。
4. 3 全面厘定治理策略與加強風險預防
治理策略厘定是英國科學數據倫理政策中的核心內容, 更多見于科研機構、第三方機構及圖書館為代表的主體治理政策中。治理策略主要包括提供治理指導與各階段治理措施, 其中各階段治理措施更受重視, 總計參考點為919 個, 占比為42%, 如圖2 所示。
1) 提供詳實的治理指南
治理指南中包含治理原則和參考資源, 主要由科研機構與第三方機構制定。治理原則以人權法案、GDPR 等為參考, 包括“公平公正” “知情同意” “CARE 原則” 等。參考資源以文獻、知情同意書模板、倫理評估量表、數據服務申請等為代表,指導解決常見的數據倫理問題, 輔助負責人評估和考量倫理風險, 實現(xiàn)數據采集、處理、共享與使用合規(guī)。
2) 重視預防與規(guī)避倫理風險
在科學數據生命周期中, 準備與計劃階段措施最受重視, 參考點為204 個, 科研機構、第三方機構與圖書館政策規(guī)定“提交倫理審查表” “評估潛在倫理風險” 及“咨詢倫理委員會” 等, 體現(xiàn)其更注重在項目開展前預防與規(guī)避數據倫理風險。其次為共享與發(fā)布階段措施, 參考點為181 個, 科研機構、出版機構與數據庫的政策強調“負責任地共享數據” “貫徹FAIR 原則” 及“保護數據隱私”等。此外, 管理與保存階段措施(參考點為152 個)和收集與獲取階段措施(參考點為118 個)受到一定關注。針對管理與保存, 圖書館、出版機構與數據庫的政策提出“保障數據安全” “評估管理風險”及“設置授權機制” 等。針對收集與獲取, 科研機構政策集中闡釋“獲取知情同意” 與“確定數據版權歸屬”。
5 我國科學數據倫理治理路徑
經筆者調研, 北大法寶數據庫中包含數據治理、數據倫理內容的法律法規(guī)、政策規(guī)章達2 200余條,可見數據治理與倫理已引起我國重視。我國陸續(xù)頒布了科學數據倫理治理相關政策。相關政策內容集中在數據安全、數據權益保障、科技倫理方面。涉及數據安全的法律法規(guī)有130 余條, 如《科學數據管理辦法》中強調科學數據分級管理與安全可控;《數據安全法》中強調數據存儲安全、數據合規(guī)使用、實現(xiàn)數據價值等。涉及數據權益保障的中央法規(guī)有140 條, 如《科學數據管理辦法》中規(guī)定規(guī)范數據收集、使用、管理實踐, 保障各方數據權利;《關于構建數據基礎制度更好發(fā)揮數據要素作用的意見》中強調個人數據保護。涉及科技倫理的法律法規(guī)有40 余條, 如《關于加強科技倫理治理意見》中規(guī)定數據分級分類管理、合規(guī)高效流通、保障數據權益等; 《新一代人工智能倫理規(guī)范》要求公平公正, 保障個人隱私與數據安全; 《科技倫理審查辦法(試行)》強調對涉及數據與算法的科技活動應遵守現(xiàn)有數據安全和個人信息保護規(guī)定。
總體來看, 我國主要通過數據治理、科學數據管理、科技倫理等相關政策推進科學數據倫理治理,暫未出臺專門的數據倫理框架或指導方針。而且目前政策重點在于數據安全、有序管理、數據利用與價值實現(xiàn)等, 倫理規(guī)制內容相對有限[44] 。我國治理政策具有以下特征: ①科學數據倫理內容豐富但分散。科學數據管理、數據治理、科技倫理等相關制度政策內容充足, 但科學數據倫理治理相關規(guī)定分散于其中。②對科學數據倫理理論內涵的界定尚不明晰。雖有涉及倫理的規(guī)章制度, 但尚未細化科學數據倫理理論與內涵。③提出科學數據倫理治理主體, 但其協(xié)同方式尚待探尋。④提供綱領性科學數據倫理治理指導, 但未針對科學數據生命周期各階段細化治理措施與方法。因此, 我國科學數據倫理治理存在專門制度缺失、倫理內涵不明、主體協(xié)同不足及具體方法待探尋的突出問題, 可從以下路徑推進治理實踐。
5. 1 構建倫理治理體系: 形成科學數據倫理治理專門政策
應整合科學數據倫理在數據安全、數據權益、科技倫理、科學數據管理等方面的制度內容, 并出臺科學數據倫理專門政策, 形成完善的治理體系。當前我國科學數據倫理內容分散于各類政策中, 不利于進行全面的倫理規(guī)制指導和規(guī)制。可參考英國各類機構出臺的《研究倫理倫理指導》《倫理準則》類指南, 出臺專門數據倫理治理框架, 并在其中引用現(xiàn)有法律法規(guī)、政策文件, 從而將《數據安全法》《新一代人工智能倫理規(guī)范》《科學數據管理辦法》等相關制度中的數據安全、數據權益、數據隱私、科技倫理等內容關聯(lián)整合, 推動形成完善的科學數據倫理治理專門政策。
5. 2 達成倫理治理共識: 統(tǒng)一規(guī)范科學數據倫理理論內涵
應推動科學數據倫理治理中的各類型主體在治理理論內涵上達成共識。政府主體應出臺綱領性的數據倫理框架或指南以推動各類機構關注和認同數據倫理問題和理論概念, 從而推進科學數據倫理治理實踐。目前我國科學數據倫理規(guī)定分散于各類制度中, 各類主體對科學數據倫理理論概念尚未形成共識, 不利于規(guī)范科學數據治理實踐。應出臺如英國的《數據倫理框架》類的綱領性的數據倫理指導文件, 從數據倫理層面落實和規(guī)范科學數據倫理的內涵與定義, 促使各方在治理中形成共同理解。此外, 在各類主體或機構內部也應出臺指導文件, 參照英國各主體在其倫理政策中對重要治理概念的規(guī)范, 在機構內科學數據管理政策或項目審查規(guī)定中闡明本機構或本學科內的“科學數據” “數據倫理”“個人數據” “敏感數據” “知情同意” 等重要概念內涵和治理規(guī)定, 為數據倫理治理提供參考。
5. 3 共治共享科學數據: 明確各責任主體的權責與促進協(xié)作
應通過政策法律界定和劃分各主體的職責與權利, 并探索實現(xiàn)協(xié)同治理。我國當前政策雖界定了高校、科研機構、醫(yī)療衛(wèi)生機構、企業(yè)等科技倫理審查管理的責任主體, 但并未對其職責進一步細分,對其協(xié)作方式尚待探索, 可參考英國政策中對主管機構、分管部門與協(xié)作機構的細化權責劃分。我國在《科技倫理審查辦法(試行)》《科學數據管理辦法》等相關政策中也可將中央科技部、科技倫理審查委員會等作為統(tǒng)籌主體, 完善現(xiàn)有科學數據倫理審查標準, 指導并安排中科院、社科院、高校研究所等各機構的辦事處的科學數據倫理審查工作, 科研人員也應自覺根據機構政策規(guī)章上報項目倫理審查, 推動形成更完善的科學數據倫理治理協(xié)作網絡。同時, 各責任主體如高校、科研機構、企業(yè)等內部應專設數據倫理小組, 輔助數據倫理審查業(yè)務, 推動各類角色在數據倫理治理中各司其職, 共同開展合法合規(guī)的科學數據管理實踐, 推動實現(xiàn)科學數據的使用合規(guī)化和價值最大化。
5. 4 細化倫理治理措施: 尤其注重事前評估與審查風險
應針對科學數據生命周期各階段厘定可操作的科學數據倫理治理措施, 尤其應將治理重心放在科研項目的準備與計劃階段, 加強事前審查, 防控潛在的科學數據倫理風險。當前我國可參照英國政策細化各生命周期階段的科學數據治理措施。英國政策中尤其強調“項目開展前提交倫理審查申請” “征求倫理委員會建議” 及“評估潛在的數據倫理風險”。在準備與計劃階段, 我國應充分建立起科研項目的數據倫理審查與監(jiān)護程序, 在《科技倫理審查辦法》《數據倫理框架》等制度中明確倫理審查申請要求, 并通過倫理委員會、數據倫理小組等機構實施事前報備、評估與審核, 事中監(jiān)測風險以及事后總結經驗, 指導各個科研項目團體及個人合規(guī)開展科研活動, 及時防控風險。在數據收集與獲取、合作與分析、管理與保存、共享與發(fā)布、重用與引用階段也可融入數據分級分類管理、數據訪問授權、保障個人隱私、劃定數據產權等現(xiàn)有措施加以規(guī)范,形成更穩(wěn)固和完善的科學數據倫理治理流程。
6 結 語
數據密集型科研中的數據倫理問題日漸受到重視, 數據隱私、數據保護、數據安全及算法歧視等問題亟待解決, 對科學數據治理提出更高要求。本文基于扎根理論與社會網絡理論分析英國科學數據倫理政策文本, 總結政策框架, 梳理各方在環(huán)境分析、主體界定及策略厘定方面的治理重點, 揭示其科學數據倫理治理特征, 提出我國科學數據倫理治理路徑。研究發(fā)現(xiàn), 英國科學數據倫理治理注重發(fā)揮科研機構、資助機構及圖書館等重要主體的作用,從環(huán)境、主體與策略三維度構建治理體系。在治理環(huán)境上, 厘清科學研究領域、涉及主體、核心概念、關鍵問題及相關政策。在治理主體上, 重視安排主管機構、分管部門及協(xié)助機構的權利與職責, 促進多主體合作, 并探索協(xié)同治理方式。在治理策略上,闡明治理目標原則, 提供治理參考資源與工具, 構建全面系統(tǒng)指導體系, 落實科學數據全生命周期治理措施, 注重在準備與計劃階段預防與規(guī)避倫理風險與問題。但同時, 英國對于后續(xù)懲戒和救濟規(guī)定也有所缺失。我國可參考其經驗與教訓, 推動形成科學數據倫理治理體系, 各方就科學數據倫理治理理論內涵達成共識, 推進劃定各方倫理治理權責與協(xié)作治理, 細化各階段科學數據倫理治理措施并完善懲戒和救濟措施。本研究從分析深度和粒度上推進了科學數據倫理政策分析研究, 基于此深入剖析數據倫理各類問題, 為多領域主體協(xié)同參與數據倫理治理與確定治理重點提供思路。但也存在部分政策無法訪問或未將所有機構政策納入分析的局限性,未來可全面獲取所有機構的數據文本, 從政策計算的量化角度進行全局分析, 進一步深化政策分析的覆蓋度與深度。
參考文獻
[1] Clark K, Duckham M, Guillemin M, et al. Advancing the Ethi?
cal Use of Digital Data in Human Research: Challenges and Strate?
gies to Promote Ethical Practice [J]. Ethics and Information Tech?
nology, 2019, 21: 59-73.
[2] 胡良霖, 朱艷華, 李坤, 等. 科學數據倫理關鍵問題研究[J].
中國科技資源導刊, 2022, 54 (1): 11-20.
[3] Florid L, Taddeo M. What is Data Ethics? [J]. Philosophical Trans?
actions of the Royal Society a-Mathematical Physical and Engineering
Sciences, 2016, 374 (2083): 1-5.
[4] 牛奔, 耿爽, 王紅. 數據科學導論[ M]. 北京: 中國經濟出
版社, 2022: 213-216.
[5] 陳一. 歐盟大數據倫理治理實踐及對我國的啟示[J]. 圖書情
報工作, 2020, 64 (3): 130-138.
[6] 李卓卓, 張楚輝. 數據倫理框架: 國際對話與中國化的構建路
徑[J]. 情報學報, 2024, 43 (2): 154-166.
[7] ODI. COVID - 19 Identifying and Managing Ethical Data Issues
[R]. London: Open Data Institute, 2020.
[8] 中共中央辦公廳. 國務院辦公廳印發(fā)《關于加強科技倫理治
理的意見》[EB / OL]. https: / / www.gov.cn/ zhengce/2022-03/
20/ content_5680105.htm, 2024-01-29.
[9] Data Ethics Commission. The opinions of the Data Ethics Commis?
sion 2020 [ EB/ OL]. https: / / www. bmj. de/ SharedDocs/ Down?
loads/ DE/ Themen/ Fokusthemen/ Gutachten_DEK_EN_lang.pdf?_
blob=publicationFile&v=3, 2023-08-01.
[10] Gariga-Portola M. Open Data? Yes, But in a Sustainable Way
[J]. Professional de la Information,, 2011, 20 (3): 298-303.
[11] 顧立平, 李海博, 陸彩女. 開放科學的標準規(guī)范研究[J/ OL].
中國圖書館學報: 1-28 [2023-10-12]. http:/ / kns.cnki.net/ kc?
ms/ detail/11.2746.g2.20230330.1250.002.html.
[12] 顧立平. 科研模式變革中的數據管理服務: 實現(xiàn)開放獲取、
開放數據、開放科學的途徑[J]. 中國圖書館學報, 2018, 44
(6): 43-58.
[13] 陳一. 網絡研究中的數據倫理問題研究進展[ J]. 信息資源
管理學報, 2019, 9 (2): 58-65.
[14] 林曦, 郭蘇建. 算法不正義與大數據倫理[ J]. 社會科學,
2020, (8): 3-22.
[15] 劉穎. 智慧圖書館中的數據倫理風險識別及利益協(xié)調策略研
究[J]. 新世紀圖書館, 2021, (12): 11-15, 27.
[16] Martin K D, Murphy P E. The Role of Data Privacy in Marketing
[J]. Journal of the Academy of Marketing Science, 2017, 45 (2):
135-155.
[17] 宋晶晶. 由信息倫理向數據倫理轉型: 溯源、驅動與路徑
[J]. 圖書館學研究, 2020, (3): 35-39, 60.
[18] 蘇令銀. 大數據倫理: 研究現(xiàn)狀、未來議題與政策建議[J]. 新
疆師范大學學報(哲學社會科學版), 2020, 41 (3): 100-110.
[19] Mittelstadt B D, Floridi L. The Ethics of Big Data: Current and
Foreseeable Issues in Biomedical Contexts [J]. Science and Engi?
neering Ethics, 2016, 22 (2): 303-341.
[20] 溫亮明, 張麗麗, 黎建輝. 大數據時代科學數據共享倫理問
題研究[J]. 情報資料工作, 2019, 40 (2): 38-44.
[21] 李建軍, 王添. 科研機構倫理審查機制設置的歷史動因及現(xiàn)實
運行中的問題[J]. 自然辯證法研究, 2022, 38 (3): 51-57.
[22] Peter P, Igor B, Henrike F J, et al. Data Management in Anthro?
pology: The Next Phase in Ethics Governance? [J]. Social Anthro?
pology, 2018, 26 (3): 391-413.
[23] 劉金亞, 顧立平, 張瀟月, 等. 開放科研數據環(huán)境下科研人員
的數據倫理框架研究[ J]. 情報理論與實踐, 2021, 44 (2):
83-89.
[24] Lamas E, Barh A, Brown D, et al. Ethical, Legal and Social
Issues Related to the Health Data-warehouses: Re-using Health
Data in the Research and Public Health Research [ J]. Studies in
Health Technology and Informatics, 2015, 210: 719-723.
[25] Smedley R M, Coulson N S. A Practical Guide to Analyzing Online
Support Forums [ J]. Qualitative Research in Psychology, 2021,
18 (1): 76-103.
[26] Chen W, Haase A Q. Big Data Ethics and Politics: Toward New
Understandings [ J]. Social Science Computer Review, 2020, 38
(1): 3-9.
[27] Spithoff S, Stokdale J, Rowe R, et al. The Commercialization of
Patient Data in Canada: Ethics, Privacy and Policy [ J]. CMAJ,
2022, 194 (3): 95-97.
[28] Saheb T, Carpenter D. Mapping Research Strands of Ethics of Artifi?
cial Intelligence in Healthcare: A Bibliometric and Content Analysis
[J]. Computers in Biology and Medicine, 2021, 135 (3): 1-19.
[29] Masui T. Lecture No 5 Impact of Human Genome Research:
“Policy and Ethics”—Its Meaning in Data Sharing [ J]. Japanese
Journal of Clinical Oncology, 2021, 51 (1): 21-23.
[30] Stewart E, Lyons E. When the Classroom Becomes Datafied: A
Baseline for Building Data Ethics Policy and Data Literacies Across
Higher Education [ J]. Italian Journal of Educational Technology,
2021, 29 (2): 54-68.
[31] 劉金亞, 諶悅, 章成志, 等. 數據倫理政策的量化研究: 基
于天文領域的數據管理辦法[J]. 信息資源管理學報, 2021, 11
(6): 63-75.
[32] 王英. 國外社會科學數據檔案館政策要素及其主體責任[ J].
檔案學研究, 2022, (2): 110-119.
[33] Charmaz K, Thornberg R. The Pursuit of Quality in Grounded
Theory [J]. Qualitative Research in Psychology, 2021, 18 (3):
305-327.
[34] Strauss A, Corbin J. Basics of Qualitative Research: Grounded
Theory Procedures and Techniques [M]. Thousand Oaks: Sage Pub?
lications, 1990.
[35] 張濤, 崔文波, 劉碩, 等. 英國國家數據安全治理: 制度、機
構及啟示[J]. 信息資源管理學報, 2022, 12 (6): 44-57.
[36] The Royal Society. The UK Data Governance Landscape [ EB/
OL]. https: / / royalsociety. org/ -/ media/ policy/ projects/ data - gov?
ernance/ uk-data-governance-explainer.pdf, 2024-02-09.
[37] 中國信息通信研究院. 全球數字治理白皮書(2022) [EB/ OL].
http:/ / www.caict.ac.cn/ kxyj/ qwfb/ bps/202301/ t20230110_413920.
htm, 2024-02-22.
[38] JISC. Research Data Management Toolkit [ EB/ OL]. https: / /
www.jisc.ac.uk/ guides/ rdm-toolkit, 2024-02-23.
[39] 凱西·卡麥茲. 建構扎根理論[M]. 重慶: 重慶大學出版社,
2009: 77-78.
[40] UK Central Digital and Data Office. Data Ethics Framework [EB/
OL]. https: / / www. gov. uk/ government/ publications/ data - ethics -
framework, 2024-02-27.
[41] The University of Edinburgh. Research Ethics and Data Protection
Briefing Note [ EB/ OL]. https: / / www.ed.ac.uk/ files/ atoms/ files/
briefingnote_-_data_protection-research_ethics_chss_11_02_16.pdf,
2024-02-23.
[42] The University of Edinburgh. Research Ethics and Integrity [EB/
OL]. https: / / www.ed.ac.uk/ arts-humanities-soc-sci/ researchke/
res-ethics-policies/ ethics, 2024-02-27.
[43] Imperial College London. An Ethics Code [ EB/ OL]. https: / /
www.imperial.ac.uk/ media/ imperial-college/ research-and-innova?
tion/ public/ research-integrity/ Ethics-Code.pdf, 2024-02-27.
[44] 肖紅軍, 陽鎮(zhèn). 數字科技倫理監(jiān)管的理論框架、國際經驗與
中國借鑒[J]. 東北財經大學學報, 2023, (5): 47-61.
(責任編輯: 楊豐僑)