李贊梅 孫海霞
(中國醫學科學院醫學信息研究所/國家人口與健康科學數據共享平臺工程技術中心 北京 100020)
?
?醫學信息組織與利用?
國家人口與健康科學數據共享平臺資源建設模式分析*
李贊梅 孫海霞
(中國醫學科學院醫學信息研究所/國家人口與健康科學數據共享平臺工程技術中心 北京 100020)
總結國家人口與健康科學數據共享平臺資源建設模式特點,分析平臺資源建設在管理、標準化、規范化方面存在的主要問題,在此基礎上提出思考和建議,指出平臺應加快形成完善的資源評價與準入機制,積極推進標準化工作進程,增強科學數據開放共享意識。
國家人口與健康科學數據共享平臺;資源建設模式;科學數據
國家人口與健康科學數據共享工程是科技部國家科技基礎條件平臺科學數據共享工程重要試點項目之一,由國家衛生和計劃生育委員會、解放軍總后衛生部、國家中醫藥管理局和國家食品藥品監督管理總局4個主管部門聯合推薦,中國醫學科學院、中國疾病預防控制中心、解放軍總醫院、中國中醫科學院、國家食品藥品監督管理總局信息中心和軍事醫學科學院6家國家級科研院所聯合申報創建[1]。項目總體目標是按照統一標準規范、統一資源規劃和統一技術架構,建立一個“邏輯上高度統一,開放共享;物理上合理分布,分工合作”的國家人口與健康科學數據管理與共享服務系統[2],服務于科技創新、政府管理決策與醫療衛生事業發展,為創新型醫學人才培養和健康產業發展提供科學數據共享服務,從而提高我國醫療衛生服務整體水平和國際競爭力。
國家人口與健康科學數據共享工程承擔著國家科技重大專項、科技計劃、重大公益專項等人口健康領域科學數據匯總、數據加工、數據存儲、數據挖掘和共享服務的任務。自2004年正式啟動后,經過10余年的發展,國家人口與健康科學數據共享工程建設成果突出,已通過國家人口與健康科學數據共享平臺(以下簡稱人口健康平臺)[3]為全社會提供人口健康科學數據共享與支撐服務。科學數據資源建設是人口健康平臺資源共享與服務的基礎,是平臺建設的重要內容。本文對人口健康平臺聯合共建共享資源建設模式特點做了簡要總結,同時指出平臺資源建設面臨的主要問題,提出幾點建議,旨在為國家人口與健康科學數據共享發展提供參考。
2.1 概述
人口健康科學數據資源分布在行業內業務、科研、生產、管理等多個環節,數據類型復雜多樣、學科差異性大且持續發展變化。任何一家單位都很難滿足所有類型的資源建設與共享服務需求,必須通過各個層次、各種形式的分工協作,聯合人口健康領域內各科學數據資源優勢單位共同參與,才能有效地推動與實現人口健康平臺資源建設工作進展與目標。因此,聯合多家單位共建優質資源實現科學數據共享是人口健康平臺資源建設與共享的必然選擇。
2.2 全面覆蓋,重點突出
人口健康平臺資源建設堅持“預防與治療結合、基礎與臨床結合、中西醫結合、軍隊與地方結合”的布局方針[4],旨在構建全面覆蓋基礎、臨
床、藥物、公共衛生、疾病防控、人口、計劃生育、生殖健康等各類資源的人口與健康科學數據管理與共享服務體系,將國家或地方科技計劃項目所產生的科學數據、國家長期布局的科學數據以及權威機構或科學家個人所擁有的科學數據作為先行建設重點資源。據調查,僅1978-2009年間,人口健康領域各類科技成果、科研項目累計已超7萬余項[5]。面對如此龐大的資源建設前景與需求,人口健康平臺資源建設經驗與力量相對有限,必須抓重點、分批次、講實效,逐步推動平臺資源建設。為此,依據國家人口健康行業發展趨勢,同時充分考慮用戶需求,平臺優先確立了6大資源建設重點領域:(1)以健康與疾病為主題的基礎醫學領域。(2)以臨床流行病學調查、臨床科學研究及臨床實踐活動為主旨的臨床醫學領域。(3)以全國傳染性疾病及防治為主旨的公共衛生領域。(4)為實現食品藥品科學監管及醫藥行業健康發展提供信息服務的藥學領域。(5)中醫藥學領域。(6)人口與生殖健康領域。
2.3 協同共建,優勢互補
人口健康平臺依據6大資源建設重點領域設立了相應的科學數據中心,見圖1。各中心均依托領域內權威的職能部門或資源優勢單位,在平臺統一協調組織下,由各中心負責各重點領域科學數據資源建設與管理任務。這種聯合各領域優勢力量共建國家人口與健康科學數據共享資源體系的模式,既較好地解決了資源隸屬與共享之間的矛盾,拓寬了資源渠道,而且還能有效避免資源重復建設造成的各種浪費。除了重點領域間的協同共建外,重點領域內資源建設也存在著聯合共建。如藥學數據中心選擇了國家食品藥品監督管理總局信息中心及中國醫學科學院藥物所兩家單位共同承擔資源建設任務,以充分發揮兩家單位在藥物管理、藥品研發領域優勢,保證藥學領域資源建設的完整性。

圖1 人口健康平臺重點領域資源聯合共建共享體系
2.4 統一標準,有效共享
聯合行業內優勢力量共建國家人口與健康科學數據資源共享與保障體系模式的成功建立,既依賴于各資源建設參與方的積極聯合,同時還需有效地標準化以保證各類資源建設的規范性,最大限度實現資源共享。平臺資源主要來源于國家及地方科研項目產出的科學數據,最初主要是為項目本身服務,標準化程度普遍較低。為此,平臺特設專門的標準化工作小組,經過多年的不斷探索與長期實踐,形成了較為全面、完善的資源建設標準規范體系,制定數據類、管理類、服務類、質量控制、安全類等資源建設有關標準10余項。其中,《醫藥衛生科學數據共享網數據元標準化原則與方法》、《醫藥衛生科學數據共享網數據集分類與編碼原則與方法》、《醫藥衛生科學數據共享網數據集元數據標準》及《醫藥衛生科學數據共享網數據模式描述規則與方法》4項標準已經推廣為衛生行業標準[6]。
3.1 概述
截至2014年底,平臺6個重點領域已建設可共享數據集728個,數據量超30 TB。資源覆蓋領域全面,其中人口統計類資源數據最多,預防醫學與衛生學、內科學、中國醫學、藥學等領域資源數量也頗具規模,各類資源基本覆蓋中圖法醫學學科分類[7]的所有2級類目(表1),形成了較為完備的國家人口與健康科學數據共享資源體系。但隨著工程的持續推進,資源越來越豐富,用戶需求日益多樣化,平臺資源建設存在的問題也顯露出來。

表1 人口健康平臺資源分布情況
3.2 資源建設管理工作有待加強
人口健康平臺是基于項目協作的跨部門、跨機構科學數據聯合共建共享工程[8],涉及面廣、參與單位眾多。為保證項目的科學管理和有效運行,平臺成立理事會及平臺管理中心,全面統籌平臺發展戰略及運行管理等各項工作,在總平臺及分中心設置專門的資源建設小組,負責各項資源建設與管理工作。平臺雖已具備較好的資源建設組織體系及人才隊伍,但迄今尚未形成上下配套的資源建設管理機制,以下幾點表現尤為突出:(1)資源評價體系缺失。平臺現有資源質量層次不齊,急需科學合理的資源評價體系指引資源質量的改進。(2)新資源發現、遴選與準入機制不明晰。平臺資源與服務面臨的需求隨人口健康行業及社會經濟發展而不斷變化,只有對此做出及時響應,具備準確、及時發現、篩選、建設熱點資源的機制與能力,才能不斷提高平臺的社會影響力。(3)資源更新維護不及時。平臺現有資源中,有明確更新維護方案的資源僅200余個,尚不足總資源數的1/3,這可能會對平臺資源共享與服務長期可持續發展造成不利影響。
3.3 資源建設標準化、規范化程度有待進一步提高
與我國邊實施科學數據共享工程邊開展有關政策研制情況相似,人口健康平臺各項標準規范也是從無到有、隨資源建設而逐步制定實施與完善的。資源建設標準化工作長期以來一直受到平臺各級的高度重視。除平臺標準化工作小組發布的人口健康領域通用標準規范外,各重點領域也紛紛研制本領域專用標準規范。盡管如此,平臺資源建設標準化工作仍存在一些不盡人意之處:(1)部分標準的可用性差。如資源核心元數據標準,長期以來都只能用于描述資源集本身,而不適用于對資源具體數據內容的揭示與描述。(2)相關標準的缺失。平臺已為國家及地方眾多科研項目提供數據支持,但如何對引用的資源進行標識尚缺乏統一的規范。(3)標準宣傳推廣力度不足。2014年底,平臺工程技術中心聯合平臺管理中心對各資源建設單位標準化工作有關情況進行調查,發現部分單位很少甚至從未參加過標準化相關知識的培訓[9]。
4.1 加強監管,加快制定切實可行的資源評價與準入機制
權威、主動的組織與管理是人口健康平臺各項活動有序開展的重要保障,是平臺資源共建共享健康發展的基礎。平臺需加強建立健全科學化、規范化、制度化的資源建設監督與管理機制,加強資源形成、成長、成熟、衰亡過程的全鏈條式管理,形成上下配套的資源管理辦法。當前,可以現有資源質量改進及新增資源質量把關兩個維度為切入點:一方面加快資源評價與考核機制的制定,以此為基礎對現有資源進行全面客觀評定,對評價出的優質資源進行適度表彰與推廣,對評價結果較差的資源提出有效的整改方案;另一方面要將新資源遴選與準入辦法制度化、條例化,從源頭上保證資源質量。
4.2 全面動員,積極推動平臺資源建設有關標準的研制、修訂和貫徹
面對平臺標準化工作存在的問題,可以采取針對性措施:一是重點標準修訂先行,加緊資源核心元數據、元數據注冊與管理、科學數據資源分類與編碼等資源內容與管理類標準的修訂,可通過選取試點數據集運行修訂標準,試運行過程中不斷對修訂標準進行驗證,提高修訂標準的適用性,完善后繼而推廣到平臺所有資源中去;二是加快有關標準的制定,如科學數據資源引用增加和數據推廣服務需求提出,使得“資源唯一標識符”規則的制定變得更為迫切;三是加強標準的宣傳、培訓與推廣,避免走入“為了標準而做標準”的誤區,可從修訂標準試運行過程中探索適合平臺的標準宣貫路徑,確保各項標準的有效落實。但同時也要注意到,標準化是一項長期工作,標準化雖能促進平臺資源建設有關問題的解決但并非提供全部解決方案,需與管理、技術等措施有效配合,才能充分發揮其在推動平臺資源建設與服務中的作用。
4.3 開放思想,增強科學數據資源共享意識
人口健康平臺資源建設中存在著重視共建、輕視共享的思想,資源開放共享意識還較為薄弱,導致部分耗資巨大建設的資源只能“孤芳自賞”而不能有效共享,這在一定程度上對平臺可持續發展產生不良影響。在大多數人的觀念里,開放共享就意味著免費,實則不然。科學數據開放共享可以存在著公益性運行模式、商業性運行模式亦或二者兼而有之[10]。平臺各參與方應當擯棄在單位內做資源的辦法,采取積極措施,主動應對資源開放共享環境,在資源開放共享有關政策、技術、經濟、組織等保障下,尋找自身資源共享的最佳運行模式,共同培養可持續發展的國家人口與健康科學數據共享文化。
國家人口與健康科學數據共享工程是多部門聯合的跨機構、跨學科國家級大型工程建設項目,目的是整合國家人口健康領域優質可共享資源,最終建成覆蓋全國、聯接世界的人口健康科學數據資源中心與共享服務平臺。國家人口與健康科學數據共享平臺經過長期實踐和不斷調整,在資源建設方面已取得了突出的成效。面對資源建設過程中存在的質量層次不齊、新資源發現不及時、資源評價考核機制不明確等問題,平臺應從加緊形成完善的資源建設管理機制,積極推進標準化工作進程,加強各方的配合,增強科學數據開放共享意識,使資源建設與共享服務協調發展,將平臺資源建設工作提到一個新的高度,充分發揮國家人口與健康科學數據資源在促進社會發展與進步中的價值。
1 劉德培,尹嶺.醫藥衛生科學數據共享[J].中國基礎科學,2007,9(1):26-28.
2 趙紅,尹嶺,王建國,等.國家醫藥衛生領域科學數據共享網建設目的與現狀[J].中國中醫藥現代遠程教育,2008,6(6):570-572.
3 國家人口與健康科學數據共享平臺 [EB/OL]. [2014-12-16].http://www.ncmi.RRRcn/1.
4 胡凱,王建國,尹嶺,等.淺談醫藥衛生科學數據共享網工程建設[J].中國科技資源導刊,2008,40(1):56-59.
5 國家人口與健康科學數據資源手冊[EB/OL].[2015-03-15].http://www.RRRncmi.RRRcn/UploadFile/a/c/d1ebfd56307203297a02bb52cb647eca.RRRpdf
6 已經推廣為衛生行業標準的共享數據類標準[EB/OL]. [2015-04-06].http://www.RRRncmi.RRRcn/info/108/1046.
7 林美蘭. 中國圖書館分類法專業分類表系列·醫學專業分類表[M].北京:北京圖書館出版社,1999.
8 科學數據共建共享模式探討[J].安徽農業科學,2009,37(29):14496-14498,14501.
9 國家人口健康數據共享平臺資源建設與標準規范工作研討會[EB/OL]. [2015-04-26].http://www.RRRncmi.RRRcn/info/50/3550.
10 王晴.論科學數據開放共享的運行模式、保障機制及優化策略[J].國家圖書館學刊,2014,(1):3-9
Analysis of the Resources Construction Mode of the National Scientific Data Sharing Platform for Population and Health
LIZan-mei,SUNHai-xia,
InstituteofMedicalInformation,ChineseAcademyofMedicalSciences/EngineeringCenterofNationalScientificDataSharingPlatformforPopulationandHealthPlatform,Beijing100020,China
The paper summarizes features of the resources construction mode of the national scientific data sharing platform for population and health and analyzes main problems existing in the management, standardization and normalization of platform resources construction. On this basis, it proposes thinking and suggestion, and points out that a complete mechanism for resources assessment and access should be formed as soon as possible for the platform, the work progress of standardization should be promoted positively and the awareness of opening and sharing scientific data should be strengthened.
National scientific data sharing platform for population and health; Resources construction model; Scientific data
2015-07-06
李贊梅,實習研究員,發表論文數篇。
“國家人口與健康科學數據共享平臺標準規范制定”研究成果之一。
R-056
A 〔DOI〕10.3969/j.issn.1673-6036.2015.10.016