999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

醫學數字資源長期保存標準體系研究*

2020-06-07 09:35:28楊晨柳胡佳慧
醫學信息學雜志 2020年2期
關鍵詞:標準資源信息

楊晨柳 方 安 胡佳慧 王 茜

(中國醫學科學院/北京協和醫學院醫學信息研究所 北京 100020)

1 引言

步入信息時代,數字資源已成為影響國家安全、長遠發展以及人類文明傳承的重要資源,其長期保存的重要性和緊迫性尤為突出。數字資源長期保存是指對目前社會所擁有和使用的數字形態的資源進行有效保存[1],主要包含兩層含義:一是長期存儲,二是長期可獲取。隨著大數據技術的發展,作為支撐數據密集型科學發現的重要資源,醫學數字資源具有類型復雜、分布廣泛、規模龐大、隱私要求高等特點[2],存在切實的長期保存需求。

在數字資源生命周期的全過程中,標準是保證長期保存各環節互操作的基礎。近年來醫學領域的數字資源數量增長迅速且類型復雜多樣,給存儲標準化帶來巨大挑戰。針對醫學數字資源特點,分析已有的長期保存基礎框架,探索并梳理長期保存過程中涉及到的標準,完善和發展其標準體系框架,對醫學領域資源存儲標準化具有重要意義。為實現醫學數字資源在長期保存過程中的有效組織、管理和檢索服務,本文從研究現狀、數字資源保存標準體系、醫學數字資源保存標準建設3個方面研究并探索醫學數字資源長期保存標準體系框架。基于層次化的分析與設計,重點圍繞醫學數字資源特點開展研究,探索出適用于醫學數字資源長期保存標準體系建設方案,為系統建設提供支持。

2 研究現狀

開放檔案信息系統(Open Archival Information System,OAIS)、保存元數據實施策略(Preservation Metadata Implementation Strategies,PREMIS)、元數據編碼和傳輸標準(Metadata Encoding and Transmission Standard,METS)等國際或行業通用標準為長期保存存檔概念提供指導性框架。其中OAIS是由美國空間數據系統咨詢委員會(Consultative Committee for Space Data System,CCSDS)制定的標準,于2003年被作為ISO標準(ISO 14721)發布[3],為長期保存系統建立基本概念和參考模型且在數據資源長期保存領域具有廣泛的影響力;PREMIS是聯機計算機圖書館中心(Online Computer Library Center,OCLC)和研究圖書館組織(Research Library Group,RLG)在2003年發起的保存元數據實施戰略[4],主要用于描述有關數字資源保存特征信息;METS由數字圖書館聯盟發起,為數字圖書館保存系統提供數字對象和交換元數據的編碼格式,用于元數據編碼、建立關聯和數據遷移。數字資源長期保存標準體系建設方面,郭家義[5]將標準分為系統、業務邏輯和數據層次;劉振[6]將體系框架從流程和層次結構兩個角度進行規劃和管理;王樂春等[7]結合國家圖書館實際情況提出遵循OAIS框架并兼容PREMIS和METS的長期保存數據組織標準。此外國內部分機構針對自身文獻資源存儲類型也制定相應的數字資源長期保存元數據標準,如北京大學圖書館的《中文元數據標準框架》[8-9]、清華大學圖書館的保存元數據方案[10]等。醫學數字資源種類繁多且具有長期保存的切實需求[2]。OAIS等作為長期保存系統的參考標準,在面向具體的數據保存應用場景中應結合實際需求加以利用。為實現醫學文獻資源的長期保存,解放軍醫學圖書館秦將華[11]提出基于OAIS的保存元數據框架。醫學數字資源長期保存系統建設過程中為實現對醫學大數據的長期保存,需滿足系統建設、業務發展和數據保存等各方面需求。因此本文針對醫學數字資源構建長期保存標準體系,為具有長期保存價值的醫學數字資源提供保存標準的建設思路,以期指導后續保存系統的應用實踐。

3 醫學數字資源保存標準體系

3.1 概述

圍繞OAIS框架,基于系統實現角度將醫學數字資源長期保存標準體系框架分為系統標準、業務標準和數據標準3部分,見圖1。

圖1 醫學數字資源保存標準體系

3.2 系統標準

3.2.1 系統參考模型 構建醫學數字資源長期保存系統的關鍵在于遵循統一的數字信息保存標準,從而確保系統中資源和服務的可操作性與共享性。OAIS為長期保存系統創建的數字資源存取基本概念框架,現已成為國際上數字資源長期保存研究與開發項目有限遵循的標準規范。

3.2.2 系統互操作標準 衛生信息領域有常用的系統互操作標準,如醫療數據交換標準HL7[12]和醫療健康信息集成規范(Integrating the Health Enterprise,IHE)[13]。HL7支持使用現行的各種醫學編碼標準,方便各個醫療機構的應用系統間能夠進行醫學資源的互通;IHE通過采用衛生信息標準,促進衛生信息在系統間、機構間實現無縫傳遞,同時基于已有的醫療信息領域規范和標準(如DICOM、HL7、ebXML等)對不同層次醫療服務進行優化,有助于推動各醫療信息系統間實現資源共享。

3.2.3 數字資源生命周期模型 生命周期模型是生命周期管理的基礎,基于不同形式的資源(文本、音頻、視頻、圖像等),采用合適的模型與方案,對被保存的醫學數字資源的生命周期管理有重要意義。英國數字資源管理中心(Digital Curation Center,DCC)[14]于2008年發布數字資源保存生命周期模型,描述數字對象產生、管理、保存的各個環節,強調通過對整個保存生命周期的管理來維護數字對象的可信賴性、可用性、完整性。

3.3 業務標準

3.3.1 數據攝取 主要指從出版商或其他信息提供者收集或接收統一組織格式的提交信息包(Submission Information Package,SIP)并對其進行檢查、轉換、規范和處理等。攝取標準用于規范被接收到的信息內容。目前攝取領域的標準主要是生產檔案標準接口方法(Producer Archive Interface Methodology Abstract Standard,PAIMAS)[15],旨在識別、定義和提供生產者和存檔之間的關系和交互結構。此外攝取過程還涉及安全監測、完整性校驗等方面的標準。安全監測主要對SIP進行病毒、木馬、惡意代碼掃描,消除安全隱患;完整性校驗普遍采用信息加密技術,常用的算法標準有MD5、SHA等。

3.3.2 數據存儲 數據存儲提供對存檔信息包(Archival Information Package,AIP)的存儲、維護和檢索功能與服務,子功能包括從攝取實體接收AIP并將其添加到存儲器、管理存儲體系、更新存儲介質、例行錯誤檢查、災難備份、為檢索模塊提供AIP等。存儲過程中的標準規范主要指導保存的過程、方法、技術等方面的問題,主要包括內容對象標準、數據編碼標注、數字遷移標準、存儲介質和方式標準等[5]。

3.3.3 數據管理 主要提供填充、維護和存取用于標識記錄庫存資源的描述性信息與管理文檔的管理型數據。數據管理標準用于管理數據庫(維護數據庫模式、視圖及系統完整性等)、執行數據庫更新(加載的描述信息或檔案管理數據)、提供數據查詢、產生結果等。

3.3.4 保存規劃 側重于OAIS環境的監測服務,確保被存儲的信息在很長一段時間后,即使原有保存環境發生變化資源仍然能夠被相應的目標用戶團體所存取。由于醫學數字對象的長期保存主要依賴各類物理存儲設備,如果不能監測并及時處理設備出現的問題,將直接導致資源的損壞乃至丟失。

3.3.5 數據訪問 主要與用戶聯系以接收用戶請求,運用訪問控制標準來限制對某些特別保護信息的訪問,嚴格把控請求的執行以成功完成響應并傳遞信息給用戶。被保存信息的訪問過程主要涉及檢索、訪問控制與授權等方面的標準[6]。

3.3.6 系統管理 在醫學數字資源長期保存過程中存在各類安全隱患,包含物理環境、基礎設施等,直接威脅被保存數字資源的安全。信息安全管理體系標準(ISO 27001)建立科學有效的管理制度來保障數字資源的機密性、完整性和可靠性。同時可信賴倉儲認證對構建醫學數字資源存儲體系也具有重要意義,制定可信任數字倉儲的認證標準是建立可信任倉儲系統的核心內容。

3.4 數據標準

3.4.1 醫學信息表達 目前國際衛生信息領域常用的醫學術語標準主要有《國際疾病分類》(International Classification of Diseases,ICD)[16]、臨床醫學系統術語(Systematized Nomenclature of Medicine-Clinical Terms,SNOMED CT)[17]、Read臨床分類(Read Clinical Classification,RCC)[18]、統一醫學語言系統(Unified Medical Language System,UMLS)[19]等。其中ICD涉及所有疾病和死亡原因,具有權威性、科學性并宏觀反映居民健康情況特征;SNOMED CT形成完整的醫學術語體系,涵蓋大多數方面的臨床信息;RCC覆蓋病歷中的所有術語;UMLS對生物醫學科學領域內已有的多個受控詞表進行匯編,提供詞表之間的映射,因此UMLS也被看作是生物醫學概念所構成的本體和敘詞表。

3.4.2 數字對象封裝 在醫學數字資源長期保存中,信息包的選擇、封裝和存檔是關鍵問題,數字對象封裝標準用于規范信息包的組織和構成。長期保存項目通常采用METS[20]、JATS[21和RDF[22]等方式來實現對信息包的封裝。其中METS在為數字資源長期保存提供封裝模型的同時也為系統的構建提供數據模型;JATS標簽集提供一組定義元素和屬性的XML Schema模型來描述期刊論著及非論著材料并已經在出版商、科技期刊以及圖書館等領域廣泛使用;RDF是W3C推薦使用的描述資源及其之間關系的規范,能夠編碼、交換和重用結構化元數據,其通過支持語義語法和結構的設計提升元數據的互操作性[23]。

3.4.3 文件格式 有效創建、交換和保存數字對象信息的基礎,在醫學數字資源長期保存過程中采用開放標準的格式有利于對資源進行創建和維護,也有利于實現系統之間的互操作。長期保存研究實踐中各類機構或組織根據自身需求和特點,形成較為成熟的格式使用規范,如美國佛羅里達數字檔案項目、美國國會圖書館、英國數據檔案的推薦格式,這些規范從各角度歸納和總結PDF/A、JPEG、Tiff、MPEG等重點格式的發展、特點和應用,經過實踐考驗,值得研究借鑒。

3.4.4 分類編碼 數據編碼主要用于對被保存數字對象的描述與識別。在衛生信息領域已有部分臨床信息系統可采用、能標識各種實驗室檢測項目和臨床觀測指標的編碼標準。世界衛生組織(World Health Organization,WHO)制定國際統一的疾病分類方法ICD;多數西方國家的政府衛生部門和商業性醫療機構認可并采用的觀測指標標記符邏輯命名與編碼系統(Logical Observation Identifiers Names and lode,LOINC)[24];對ICD有更全面的細分,不僅含有診斷編碼,還含有就診原因、治療原因和實驗結果代碼的國際社區醫療分類(International Classification of Primary Care,ICPC)[25]。就我國而言,衛生信息數據集分類與編碼規則(WS/T 306-2009)[26]規定衛生信息數據集分類與編碼需遵循的基本原則、技術方法以及應用規則,適用于醫藥衛生領域各類衛生信息數據集的分類與編碼方案。

3.4.5 數據標識 對長期保存的各類醫學數字對象(如文獻、數據集、醫學影像等)進行唯一標識,可以方便快速地定位和訪問這些數字資源,將資源與其他作者實體、機構、項目或研究團隊相關聯,便于發現和引用同被保存的其他醫學數字資源。傳統出版物如書刊、磁帶、光盤都有國際標準編號(ISBN、ISSN、ISCN)及其條形碼作為出版物的唯一標識;常見的數字對象唯一標識符有DOI、SICI、BICI和PII等[5]。在衛生信息領域中,LOINC為實驗室和臨床檢查提供一套統一的名稱和標識碼,每個概念具有唯一代碼且恒久不變。目前LOINC在國內外得到廣泛認可并在許多衛生醫療機構得到廣泛應用。

3.4.6 元數據 實現和支撐數字資源長期保存過程及相關操作的基礎,也是保證醫學數字資源有效性、可操作性和可理解性的重要信息。元數據對數字對象進行描述,同時在保存過程中對數字資源進行識別并管理,實現數字資源的發現、查找、共享和管理。根據描述對象的差別元數據可被分為技術、描述、保存和管理元數據等。在醫學數字資源長期保存過程中元數據方案的開發應用涉及的問題主要包括元數據的應用領域和目標、內容結構、編碼語言、互操作和檢索體系以及長期保存等。

4 醫學數字資源保存標準建設

4.1 系統標準

4.1.1 基于OAIS的系統架構 醫學數字資源長期保存系統框架沿用OAIS參考模型。該模型作為致力于維護信息系統中數字信息的長期保護和存取的參考模型和基本概念框架,現已成為國際上數字資源長期保存研究與開發項目有限遵循的標準規范,被應用于DSEP、Cedars、DIAS、CDS、DAITSS等具有代表性的數字資源長期保存項目中[27]。因此在OAIS基礎框架下開發醫學數字資源長期保存系統能夠更好地實現醫學領域間的資源共享和系統間的交互。

4.1.2 基于保存生命周期的業務流標準 基于數字資源生命周期全過程設計標準體系框架。由于醫學數字資源長期保存涉及數字資源生命周期的全過程,其中各流程都需要標準的支持,因此系統地研究醫學數字資源長期保存過程中的相關標準對于系統的設計和實現是十分必要的。

4.1.3 基于醫療衛生通用互操作標準 系統互操作協議在通用標準和長期保存業界專有標準的基礎上采用IHE作為系統互操作設計基礎,同時借鑒HL7進行交互方案的設計。其中HL7在醫院信息系統(Hospital Information System,HIS)接口基礎上定義了接口標準格式且支持使用現行的各種編碼標準,如ICD-9/10、SNOMED CT等。IHE可有效推動不同醫療信息系統間實現信息共享。

4.2 業務標準

4.2.1 基于OAIS的功能模型 各子模塊創建業務標準體系。在系統建設方面,OAIS功能模型將數字資源長期保存系統劃分為攝取、存儲、數據管理、保存規劃、訪問、系統管理6個部分,各部分都需要對應的指導與實踐標準。采用標準化的協議和規范,可以為醫學數字資源長期保存系統建設提供科學依據和指導,從而確保系統各功能模塊的實現。

4.2.2 細化業務標準 業務標準包含數據和系統管理標準。由于數據和系統管理都與管理相關,因此在已有的一些數字資源長期保存標準體系中將數據管理和系統管理合并為管理標準。事實上在OAIS功能模型中,數據管理與系統管理被分為兩個獨立模塊。其中數據管理模塊包含便于發現和存取被保存資源的描述元數據和管理元數據;系統管理模塊用于系統的日常檢查、運維和訪問等操作。比較發現兩者功能及側重點并不完全一致,因此將二者分別列出并加以說明。

4.2.3 增加保存規劃標準 保存規劃提供的服務和功能是檢測OAIS的環境,保證資源的長期可存取。由于醫學數字資源的長期保存主要依賴各類物理存儲設備,如果不能監測并及時處理設備出現的問題將直接導致被存儲資源的損壞乃至丟失,因此將保存規劃標準列入業務標準中,用于維護系統整體保存環境。保存規劃標準主要包含存檔硬件安全管理和機房環境監控兩部分內容。

4.3 數據標準

4.3.1 增加醫學信息表達標準 相較于文獻數字資源,醫學數字資源具有層次性和專業性強、隱私性要求高等特點,因此在開展醫學科學數據的長期保存活動時需在遵從醫學信息表達相關標準規范的前提下進行。目前國際衛生信息領域常用的醫學信息表達標準主要有ICD、SNOMED CT、UMLS、RCC等,可依據具體存儲及檢索需求對上述醫學信息表達標準進行選擇及復用。

4.3.2 選用RDF描述框架 作為被保存醫學數字資源的封裝標準。在醫學數字資源長期保存過程中對數字對象進行封裝可以有效解決信息包內各類信息的構成和組織問題,使數字資源被更好地保存。醫學數字資源長期保存系統采用Fedora 4.0版本作為底層倉儲以RDF存儲數字資源,可以形成語義數據,方便進行語義挖掘、推理,構建關聯數據平臺。RDF描述框架逐步在國際上得到廣泛認可與應用。

4.3.3 增加醫學影像類型 在文件格式標準中添加醫學影像類型及推薦格式DICOM。在長期保存實踐中各類機構或組織根據自身需求和特點,各自形成一套較為成熟的格式使用規范。相比較而言,醫學數字資源類型豐富、格式多樣,除文本、圖表、壓縮文件外還包括事實數據集(庫)和實驗數據集(庫)以及醫學檢查所產生的醫學影像文件。DICOM的應用范圍包括CT、MRI、DSA、SPECT、超聲、數字化X線影像(CR、DR、FPD)以及內窺鏡、病理學、耳科、皮膚和中醫舌苔圖像等,因此在文件格式標準中加入DICOM可以更全面地實現被保存資源的轉換和存儲。

4.3.4 增加醫學數據編碼標準 由于醫學信息資源的專業性,在原有文獻數字資源編碼基礎上添加醫學數據編碼標準。在衛生信息領域中已有部分可以作為所有臨床信息系統可采用、能夠標識各種實驗室檢測項目和臨床觀測指標的編碼標準,如前文提到的ICD、LOINC、ICPC及WS/T 306-2009衛生信息數據集分類與編碼標準。

4.3.5 構建元數據框架 構建包含技術、保存、描述、管理元數據4部分內容的元數據。基于OAIS參考模型的信息模型可以抽象出一個3層架構的元數據框架,第1層是關于內容數據呈現的元數據,即表現信息部分,對應描述元數據;第2層是保存描述信息部分,可記錄長期保存過程中醫學數字資源所處的環境信息,對應技術元數據和保存元數據;第3層是系統管理層面的元數據內容,實現對數字資源加工過程的管理等,對應管理元數據。

5 結語

通過對數字資源長期保存標準體系和科學數據平臺元數據標準研究現狀的分析,結合醫學數字資源自身特點和長期保存需求,本文提出醫學數字資源長期保存標準體系。基于數字資源長期保存已有的標準體系,將醫學數字資源特有內容進行擴展和延伸,設計涵蓋系統、業務、數據標準的體系框架。在該宏觀標準體系的指導下,結合Fedora 4.0底層倉儲結構,目前醫學數字資源長期保存系統MedPRES已完成由攝取到管理的業務流程功能建設。同時針對系統建設中的實際問題及時調整對應標準和建設方案,以指導MedPRES的后續完善,從而適應實際保存需求,為實現醫學數字資源長期保存系統中保存對象的長期可用奠定基礎。

猜你喜歡
標準資源信息
2022 年3 月實施的工程建設標準
基礎教育資源展示
一樣的資源,不一樣的收獲
忠誠的標準
當代陜西(2019年8期)2019-05-09 02:22:48
美還是丑?
資源回收
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
一家之言:新標準將解決快遞業“成長中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 99精品视频九九精品| 色欲色欲久久综合网| 午夜一区二区三区| 在线观看无码av免费不卡网站| 日韩中文精品亚洲第三区| 欧美精品xx| 国产乱肥老妇精品视频| 国产成人精品亚洲日本对白优播| 色欲色欲久久综合网| 91丨九色丨首页在线播放| 国产手机在线ΑⅤ片无码观看| 综合人妻久久一区二区精品| 国产精品亚洲专区一区| 婷五月综合| 国产毛片不卡| 激情综合网址| 新SSS无码手机在线观看| 在线无码私拍| 成人在线亚洲| 亚洲水蜜桃久久综合网站 | 一区二区三区国产| 国产jizzjizz视频| 五月婷婷综合在线视频| 色老头综合网| 亚洲人精品亚洲人成在线| 玩两个丰满老熟女久久网| 日韩一级毛一欧美一国产| 国产一级视频久久| 又粗又大又爽又紧免费视频| 国产三级毛片| 中文字幕66页| 成人av专区精品无码国产| h网站在线播放| 欧美视频免费一区二区三区| 亚洲无码91视频| 91在线高清视频| 亚洲av日韩av制服丝袜| 五月婷婷亚洲综合| 国产又爽又黄无遮挡免费观看| 精品国产一区二区三区在线观看 | 国产精品亚洲精品爽爽| 成人av手机在线观看| 国产无遮挡猛进猛出免费软件| 亚洲AV成人一区二区三区AV| 日韩毛片免费| 中文国产成人精品久久| 国产一级片网址| 亚洲国产系列| 亚洲三级片在线看| 欧美另类视频一区二区三区| 视频一区视频二区中文精品| 亚洲精品波多野结衣| 亚洲天堂网视频| 婷婷亚洲视频| 国内精品伊人久久久久7777人| 国产高清免费午夜在线视频| 欧美福利在线播放| 久久毛片基地| 91精品日韩人妻无码久久| 亚洲国产看片基地久久1024 | 国产成人综合日韩精品无码首页 | 97超碰精品成人国产| 日韩专区欧美| 国产香蕉在线视频| 亚洲系列中文字幕一区二区| 欧美国产日韩在线播放| 久久久久免费看成人影片| 国产人妖视频一区在线观看| 中文字幕无码电影| 国产9191精品免费观看| 精品久久久久久久久久久| 国内精品小视频在线| 亚洲综合激情另类专区| 人妻21p大胆| 高清色本在线www| 久久99国产综合精品女同| 日韩第一页在线| 中文字幕日韩丝袜一区| 欧美五月婷婷| 欧美色综合久久| 国产精品丝袜在线| 亚洲嫩模喷白浆|