湯學軍 朱巖 夏天 張誠 許錦 張倩 楊振宇 趙文華
現代大范圍的兒童營養與健康基礎資源調查,涉及面廣、調查人數多,而且涉及兒童營養、膳食、認知、心理行為、健康等多方面業務內容,實現調查數據采集內容、格式、代碼,包括信息系統的統一標準化,是確保調查工作順利實施。從調查起始就注重數據標準化,形成我國兒童營養與健康的橫斷面調查數據資源。橫向上,調查數據可以用于與其他課題、其他項目的共享,也可以用于與被調查兒童的電子健康檔案共享??v向上,調查數據可以與后續的標準化調查數據進行前后比較研究。標準化使兒童營養與健康調查數據成為無論橫向還是縱向都可以進行比較、追蹤、研究、服務、健康管理所利用的信息資源。根據我國兒童營養信息化發展需求,在充分調研國內外兒童營養與健康調查評價業務開展情況、信息化技術體系與標準化體系現狀及發展趨勢基礎上,構建我國兒童營養與健康信息標準化框架,研究制訂兒童營養與健康調查基本數據集標準。通過數據標準化,使調查數據橫向可以用于與其他課題、其他項目的共享,為開展兒童的健康管理服務奠定基礎,縱向可以與后續的標準化調查數據進行前后比較研究,使調查數據成為可利用的有效信息資源[1]。
經過充分論證,國家衛健建委統計信息中心上報了《兒童營養與健康調查基本數據集標準》制定項目申請,獲得立項批準,標準項目編號20210105(0~35個月)、20210106(36~71個月)、20210107(6~17歲)。
通過查閱文獻、現況調查和多次專題調研,對兒童營養與健康調查工作進行了深入細致的業務需求分析。通過對業務目標、數據內容、工作表單等開展專題調研,收集、梳理了包括0~23月齡兒童營養與健康狀況問卷、0~23月齡兒童醫學體檢表、0~5歲兒童膳食稱重記錄表、2~5歲兒童營養與健康狀況問卷、2~5歲兒童醫學體檢表、6~18歲兒童醫學體檢表、6~18歲身體活動問卷、6~18歲膳食調查問卷等相關業務表單,整理、歸納和確定了兒童營養與健康調查數據集的核心內容。
根據確定的業務核心內容,遵循《GB/T 1.1-2020 標準化工作導則 第1部分:標準化文件的結構和起草規則》[2]《WS 370-2012 衛生信息基本數據集編制規范》[3]等標準規范,規范編制數據集標準;為了保持標準一致性,按照國家標準—行業標準—地方標準的序列,引用已有的數據元標準和值域代碼[4-5],依次采納和編制了兒童營養與健康調查數據集,數據集標準分為3部分,包括《兒童營養與健康調查基本數據集標準 第1部分:0-23月》(數據元123個、值域代碼9個)、《兒童營養與健康調查基本數據集標準 第2部分:2-5歲》(數據元139個、值域代碼25個)、《兒童營養與健康調查基本數據集標準 第3部分:6-18歲》(數據元155個、值域代碼36個),實現從標準層面規約數據采集、規范代碼體系,確保了標準的成熟性、拓展性、實用性和安全性[3]。
為使標準更切合我國兒童營養與健康調查信息化建設的實際情況及發展要求,符合國家既定規范要求,具備普遍適用性、操作實用性,在全國范圍廣泛開展征求意見,征求相關標準使用各級各類應用單位、IT企業及相關專家等各方面意見,并組織部分標準應用單位、IT 企業應用本標準,總體反饋良好,標準具備普遍適用性。對反饋意見進行歸納整理、分析研究,修訂完善標準。
本標準規定了兒童營養與健康調查基本數據集標準的數據集元數據屬性和數據元屬性。適用于兒童營養與健康調查相關醫療機構及衛生行政部門進行相關業務數據采集、傳輸、儲存等工作。
引用了《GB/T 3304 民族代碼》[6]《GB/T 4658 學歷代碼》[7]《GB/T 4761 家庭關系代碼》[8]《GB/T 6565 職業分類與代碼》[9]《WS 364.4 衛生信息數據元值域代碼 第4部分:健康史》[10《]WS 370 衛生信息基本數據集編制規范》[3]等標準規范。
兒童營養與健康調查基本數據集元數據采用表1的格式進行描述。

表1 兒童營養與健康調查基本數據集屬性描述
2.4.1 數據元屬性設置 數據元屬性設置分為兩類:數據元公用屬性和數據元專用屬性。數據元公用屬性7項,數據元專用屬性7項。
2.4.2 數據元公用屬性 在同一個數據集中,版本、注冊機構、相關環境等7個數據元屬性的值若完全相同(可稱為數據元公用屬性),則采用集中描述,在數據元摘要式目錄中可不再分述。
2.4.3 數據元專用屬性 在同一個數據集中,數據元屬性的值不相同(可稱為數據元專用屬性),采用表2的描述格式進行描述[11-12]。

表2 數據元專用屬性描述格式(舉例)
2.4.3.1 內部標識符 內部標識符格式為:數據集標識符+“.”+在數據集中的序號。例如,“孩子姓名”在為HDSB01.06.001,表明當前數據集標識符為HDSB01.06,“孩子姓名”在數據集內部序號為001。
2.4.3.2 數據元標識符 如數據元是引用國家標準、行業標準、地方標準的,數據元標識符直接引用相關標準中的數據元標識符;自研的數據元,數據元標識符則空著。
2.4.3.3 數據元名稱 數據元“中文名稱”是唯一的,以字母、漢字、數字式的字符串形式表示。例如:
有代碼表的,數據元名稱:××代碼,例如:性別代碼。
選項是與否的,數據元名稱:××標志,例如:戶籍標志。
表示日期(年月日),數據元名稱: ××日期,例如:出生日期。
表示日期和時間,數據元名稱: ××日期時間,例如:死亡日期時間。
2.4.3.4 定義 本文件中數據元定義以字母、漢字、數字式的字符串形式表示。
2.4.3.5 數據元值的數據類型 數據元值的數據類型有字符型(S)、布爾型(L)、數值型(N)、日期型(D)、日期時間型(DT)和時間型(T)。
字符型(S)通過字符形式表達的值的類型,可包含字母字符、數字字符等,字符型(S)分為S1、S2、S3三種形式,S1表示描述類的內容;S2表示選項3個或以下的,可在“數據元允許值”中直接描述;S3表示選項3個以上的,在后面列出代碼表。
布爾型(L)又稱邏輯型,采用False或True形式表示。
數值型(N)是數字形式表示的值的類型。
日期型(D)、日期時間型(DT)、時間型(T)釆用GB/T 7408中規定的格式表示的值的類型。
2.4.3.6 表示格式 數據元值的表示格式中字符含義描述規則如下。
AN18:表示固定長度為18個字符(字母或/和數字)長度的字符。
A..100:表示可變長度,最大為100個字符(字母)長度的字符。
N2:表示固定長度為2位數字。
N2..4:表示最小長度為2位,最大長度為4位數字。
N5..7,1:表示最小長度為5位,最大長度為7位的十進制小數格式(包括小數點)。
D8:表示年、月、日。
T6:表示小時、分鐘、秒。
DT15:表示年、月、日、小時、分鐘、秒。
2.4.3.7 數據元允許值 數據元有選項的均已代碼表形式列舉。其中:選項3個或以下的,直接在“數據元允許值”中列舉;選項3個以上,在“數據元允許值”中寫出代碼表名稱,在后面列出代碼表。代碼中有其他選項,均以9或者99表示。代碼表采用表3的格式進行描述。

表3 代碼表描述格式
《 兒童營養與健康調查基本數據集標準》規定了我國兒童營養與健康調查必須收集記錄的兒童營養與健康狀況、醫學體檢記錄等信息的采集范圍,通過標準應用,實現兒童營養與健康調查信息規范采集、交換、統計和共享,使轄區內醫療機構、衛生行政部門和廣大市民能有效共享、利用相關信息。本標準在制定過程中,充分考慮當前工作的實際水平和業務發展趨勢,兼顧先進性和可行性,有利于標準的應用和推廣,從而切實發揮標準的作用[13]。在標準實施過程中因涉及面廣,技術性強,各地現況有參差等問題,各方面建設和完善工作須進一步加強。現提出如下貫徹實施建議。
《兒童營養與健康調查基本數據集標準》是兒童營養與健康調查信息化建設工作的基礎,對于各地規劃、設計和建設兒童營養與健康調查信息管理系統具有重要的、直接的指導作用,對兒童營養與健康調查工作的發展起到積極的促進作用。
各地規劃、建設主管部門要牢固樹立標準意識,使該標準真正成為兒童營養與健康調查信息化建設的指南。兒童營養與健康調查信息化新建、改建、擴建項目,應以按標準設定的數據元構成和值域范圍為基準,確定兒童營養與健康調查衛生服務的核心數據要求,滿足兒童營養與健康調查信息化建設需求。
統一的數據標準是信息化應用的基礎和前提,在此基礎上,規范基于計算機邏輯架構的技術標準和共享文檔將更有利于異構系統間的數據共享、互聯互通,對于各地應用本標準進行規劃和建設具有更直接的促進作用。因此,各地在實踐過程中,要及時總結、反饋應用成果,為標準的不斷完善提供實踐經驗,促進相關的技術標準和共享文檔的出臺,進一步加強兒童營養與健康調查信息化建設。