徐進 汪火明 孫潤康 任宇飛
華中科技大學同濟醫學院附屬同濟醫院 湖北 武漢 430030
隨著2015年8月19日國務院發布了《關于促進大數據發展的行動綱要》[1],宣布國家要實施國家大數據戰略,在綱要中十數次提到“大數據”,大數據作為國家戰略性生產資料,需要使用平臺化工具進行收集、整理、組織和數據利用。醫療衛生屬于該行動綱要的重點領域,建設醫療大數據平臺是國家需求。湖北省委省政府《關于推進疾病預防控制體系改革和公共衛生體系建設的意見》、湖北省政府《湖北省疫后重振補短板強功能“十大工程”三年行動方案(2020-2022年)》中均明確提出要提高信息化服務能力,建設中部地區健康醫療大數據中心,加強重大疫情信息平臺建設。
“十三五”期間,湖北省衛生健康委在遵循國家標準規范的基礎上,結合本省實際進行拓展落地應用,制定實施了《湖北省全民健康信息標準與規范》(鄂衛生計生通〔2017〕39號),為系統融合、數據共享、業務協同等信息化建設和應用提供了統一規范的標準依據。但該套標準目前仍存在標準應用協同不夠,機構、部門之間信息交換不暢通等問題,還缺乏統一權威的數據開放共享管理機制,來保障的數據在開放共享過程中的規范合理[2-3]。
數據開放共享涉及數據提供者、數據管理者和數據使用者。首先管理者對用于交換共享的信息資源進行組織、分類。然后提供者按照規劃,將基礎數據和業務數據注冊到數據開放共享平臺中。管理者對于注冊的數據進行整理形成主題數據,對于主題數據通過管理形成交換數據,將交換數據根據開放共享策略開放給使用者。使用者根據管理者要求,對數據進行各場景的使用。最后對于完成開放共享后的數據及時銷毀。框架如圖1。

圖1 數據開放共享規范框架圖
參與大數據開放共享的角色共分為3類,提供者、管理者和使用者,這3類在數據開放共享過程中分別有不同的責任和義務[4]。
主要負責信息資源開放共享內容與系統的數據注冊等。應當按照“一數一源、最少夠用”的原則提供相關信息,所提供的信息應當符合業務應用和管理要求,保證數據中標識的唯一性、一致性,所提供的信息應當嚴格實行信息復核程序,防止重復注冊、多頭注冊;應當嚴格執行相關標準,做到標準統一、術語規范、內容準確;在數據發生變更時,應當將所管理的信息完整、安全地移交給主管部門管理。
主要負責對用于開放共享的信息資源進行組織與分類,并負責內容更新,對已注冊的數據進行整理清洗,通過數據開放共享平臺對數據執行脫敏操作,對信息資源共享使用設置級別和授權,對數據使用者的數據申請進行審批,審批通過后提供申請相應的數據等。
主要負責大數據中心的數據使用等,應依法依規使用開放共享的數據資源。數據使用者對從數據開放共享平臺獲取的信息,只可按照明確的目的和用途使用,并按照設置的數據使用權限,申請獲取相應的數據,并在授權范圍內按照規定進行使用,并保管好相關數據內容,對開放共享的數據有疑義或者發現錯誤時,應當及時反饋給管理者和提供者。
參與大數據開放共享的管理活動主要分為數據規劃、數據注冊、數據整理、數據管理、數據開放共享和數據銷毀6個環節,各環節的任務不同[5]。
主要指在業務流程梳理基礎上規劃用于開放共享的信息資源,對信息資源進行組織、分類,確定數據開放共享的范圍、模式和實施步驟等。
3.1.1 數據歸集。管理者在歸集數據過程中應采用身份鑒別、數據源認證等安全機制保障開放共享數據來源的真實性。
3.1.2 數據分級。管理者依據科學性、穩定性、實用性、擴展性等原則,根據數據的敏感程度、重要程度以及被泄漏或被非法處理后對國家安全、公共秩序、公共利益、黨政機關及事業單位、法人或其他非政府組織及個人的合法權益的危害程度等的不同,將數據劃分為四個等級,不同級別的保密性要求不同[6]。
3.1.3 數據分類。管理者根據業務領域對數據進行分類,數據按照業務領域分類包括健康類、環境類、資源類、交換類和影像類[7],如圖2。

圖2 數據分類模型
3.1.4 資源目錄管理。數據管理者構建資源目錄發布和審核的機制,并對外提供資源目錄管理服務,供數據提供者調用,并對提供者進行的相關操作進行審核;數據提供者調用資源目錄管理服務,對資源目錄進行管理,并根據數據分類分級規則,定義資源目錄對應的內容和安全等級等。
主要指管理者對可供注冊的數據類型、數據格式等進行維護,并對提供者進行用戶和授權管理。提供者按照類型和格式要求等進行數據注冊。
3.2.1 用戶管理。管理者建立完整的用戶管理機制,支持根據用戶類別對用戶進行管理,并支持用戶全生命周期的管理、監督和分析等。
3.2.2 授權管理。管理者可針對用戶的應用權限、數據權限、管理權限、機構權限等權限類型進行授權管理,支持分級授權,并對于權限的操作進行日志記錄并監管,不允許對權限范圍外的應用或數據進行操作和訪問。
3.2.3 數據導入導出。管理者在數據導入導出過程中應對每次數據導入導出的事務進行唯一標定,在數據導入導出過程中對用戶身份進行鑒別,對導入導出操作有抗抵賴驗證,保證數據在注冊過程中的傳輸安全,并在整個導入導出過程中進行跟蹤和記錄,保證重要數據的可追溯。
3.2.4 數據維護。管理者應建立數據質量控制機制,對數據進行定期維護保證所得到的數據完整準確、及時有效,對敏感數據和重要數據進行加密存儲保護,根據數據安全等級的不同,對數據進行分域分級存儲,并具備數據更新和失效數據重獲取機制,以及故障恢復后數據自動加載能力。
主要指管理者對已注冊的基礎數據和業務數據進行清洗,對敏感數據進行脫敏、匿名化等處理,生成主題數據[8]。
3.3.1 數據脫敏。管理者在數據整理過程中應能夠識別出敏感數據,對敏感數據建立數據脫敏管理策略并進行脫敏,并且在脫敏后,能根據需要保留數據相關信息以進行追溯,同時,所有的數據脫敏操作應有相關日志進行記錄。
3.3.2 數據加密。管理者在數據整理過程對重要數據和敏感數據可采用國密等相關密碼技術,對數據進行加密處理。
主要指管理者對已注冊的基礎數據、業務數據和整理出的主題數據進行分類分級及權限設置等處理,形成交換數據。
3.4.1 權限標記。管理者在數據管理過程中應根據數據的不同密級,標記交換數據的不同使用權限。
3.4.2 安全策略檢查。管理者在數據管理過程中應建立檢查機制,保證開放共享數據安全策略正確配置與實施。
主要指使用者按照管理者設置的數據使用權限,獲取相應數據,并按照規定進行使用[9]。
3.5.1 用戶管理。參考3.2.1。
3.5.2 授權管理。參考3.2.2。
3.5.3 訪問控制。管理者應遵照授權策略對使用者進行訪問控制,并實時檢查使用者的訪問權限和訪問操作,對于不符合授權的訪問嘗試,應提醒并進行相應的記錄。
3.5.4 數據導出使用。參考3.2.3。
3.5.5 數據使用反饋及處理。數據提供者在數據使用過程中對開放共享的數據有疑義或者發現錯誤時,應當及時反饋給管理者,管理者應及時協調提供者,共同校核并予以反饋。
3.5.6 使用監管。管理者應基于國家相關法律法規及標準規范,制定數據使用機制,促使使用者對數據的使用正當合理,同時對數據使用進行監管記錄并分析,對使用者的異常使用進行提醒。
主要指對在數據開放共享平臺中按照數據開放共享規則完成開放共享后的數據,管理者和使用者應及時銷毀數據,且同時應長期保留數據開放共享日志記錄,以備數據溯源。
數據開放共享規范明確了各相關方的職責分工、權利義務和應用規范等內容,確保各個角色在各個活動中對不同數據擁有不同的權限和責任,保障數據使用的規范合理。對于具體的數據開放共享策略未進行制定,未給出對于不同用戶在各個使用場景中對不同數據擁有權限制定詳細的策略方案,需要在具體建設過程中制定具體的數據開放共享方案。并且對于數據分級沒有給出具體的數據分級目錄,需要在數據整理和數據管理過程中,對具體的數據集進行分級,形成數據資源分級目錄。