楊威 劉艷如 孟穎 喬政
術語[1],是在特定學科領域用來表示概念的稱謂的集合,在我國又稱為名詞或科技名詞(不同于語法學中的名詞)。醫學術語的規范和統一是醫學科技發展、學術交流、醫學教育和醫學科普的基礎;標志著一個國家醫學科技發展的水平。在醫學領域和臨床實踐中,醫學術語的標準化和規范化對提高醫療水平和改善醫療質量有著非常的重要作用,但實際應用中同義詞、多義詞眾多,部分醫學術語間存在著相互矛盾,以及同一概念的表達形式不規范、不統一,同一個術語多種表達方式,影響了臨床診療效率和質量,并在一定程度上阻礙醫學信息的互通共享[2]。建立中文臨床醫學術語體系對支撐我國醫學學科發展具有不可替代的特殊價值和意義。
國外醫學術語標準化發展迅速,各標準化組織間具有良好的協調、溝通及合作關系,建立的諸多術語標準和術語集在基礎、臨床、預防等醫學科學研究及應用領域被廣泛承認和應用。特別是在國外術語標準的研制、發布、推廣、應用[3]等整個流程具有整體規劃,政府及相關部門對標準的研究和推廣予以高度重視并投入大量資金支持,由此促使國外醫學術語標準化成果豐富。國外臨床醫學術語標準化研究已出臺《醫學術語系統命名-臨床術語》(SNOMED-CT)[4]《國際疾病分類與代碼》(ICD-10)[5]《觀測指標標識符邏輯命名與編碼系統》(LOINC)[6]《醫學主題詞表》(MeSH)[7]等術語標準[2]。這些術語體系促進了醫學文獻標引、檢索、聚類與分析。在各類衛生信息系統的衛生信息組織、描述、揭示與整合等方面發揮著重要作用[8]。
我國臨床醫學術語標準化的探索起步較晚,目前還處在研究或初級開發階段。但從政策引導和新興 HIT 企業的發展方向來看,整個醫療領域的各個行業層面都對專業的標準化醫學術語有巨大需求。
盡管我國擁有龐大的醫療數據資源,但由于在積累階段缺少對醫學術語規范標準的約束[9-10],臨床醫生在同一癥狀中可能使用了不同的臨床醫學術語[11],導致數據信息的偏離,為醫療大數據的整合帶來了障礙[12]。目前我國的臨床醫學術語標準不足以適應醫療人工智能的應用需求及融合,醫療人工智能迫切需要臨床醫學術語的規范化、標準化、統一化[13]。
雖然國家衛生健康委員會已發布包括《衛生信息數據元目錄》等一系列衛生信息標準。這些標準借鑒采用了國外成熟的通用架構,并在滿足中國衛生信息共享實際需求前提下,以數據元和數據集來規范約束衛生信息共享文檔中的數據元素,以模板庫約束為手段來規范性描述衛生信息共享文檔的具體業務內容,以值域代碼為標準來規范性記載衛生信息共享文檔的編碼型數據元素;但其實質是為了便于統計。
我國科研人員已開展了多方面的研究,如方法學研究、SNOMED CT的具體內容、中醫術語體系的構建等。盡管國外醫學術語對中文醫學術語資源的整合有著極大的借鑒意義,但中文臨床醫學術語體系的構建,并不能簡單走英文醫學術語資源的翻譯之路,翻譯的術語同樣也不一定能有效覆蓋我國醫學領域使用中的術語[14-15]。
臨床醫學術語的規范化,有助于實現病歷文本的語義標識和結構化處理,為醫療大數據挖掘提供知識工具,有利于整合龐大、分散、非結構化的醫療數據。臨床診療規范化,有利于規范醫生的診療行為,幫助醫生進行臨床決策,提高診療效率和質量,避免發生醫患矛盾。臨床醫學術語的標準化和規范化也為精準醫學的實現奠定了基礎,在加速推進醫療與人工智能跨界融合,實現跨系統之間數據有效整合起到關鍵性作用。
從戰略層面制定我國衛生領域整體術語標準化的建設規劃。借鑒國外經驗,把握國際醫學術語標準化發展趨勢,積極促進成熟標準的引進和本土化應用,充分結合我國發展的特定需要并有所創新,建設有中國特色符合國情需求的醫學術語標準、術語集及相關技術工具。積極開展信息技術的研究,明確標準研究和發展的重點任務和工作計劃,使術語標準建設有次序、有重點、分階段、分層次實施,并逐漸形成標準研發、運維和管理、審查、推廣的規范。
構建任何一個術語體系,都應首先明確目標,確定相應的專業領域,面向特定的用戶需求,解決實際應用中的問題[16]。臨床醫學術語系統分類框架的設計應遵循科學性原則。設計應突出概念體系的合理性與層次性[17]。術語中的名稱應優先選用名詞委審定公布的規范名詞,盡量保證用詞規范性、權威性,借鑒參考現行的國家相關法律法規。
首先,需要整理大量的臨床醫學概念名詞和概念描述整理工作量巨大,這不僅包括醫學本體名詞,還包括一些連接詞、修飾語等,如單側、雙側,還有一些分級、分期等名詞概念。其次,前期要對國內首選同義術語、普通同義術語等進行整理工作,后期還要將同義術語與國際標準等進行交叉映射。目前國內醫學術語的應用不規范,各個地區甚至各家醫療機構都有自己的命名與習慣叫法,這無疑增大了同義術語整理的難度和工作量。
臨床的復雜性致使這項工作的繁瑣性增加。其中包括醫學用于語義關系涉及到的臨床本身的醫學邏輯,這需要根據臨床路徑、診療指南、國際權威醫學循證專論、醫療操作規范、專家共識等進一步整理出每一條術語概念的域和值,即每一條概念在定義時允許的屬性和對應的取值。這是概念的進一步關系描述,需要將兩者很好的緊密結合起來。
首先,臨床醫學術語結構化的表達,是其標準化的體現之一,想要其既符合人類語言表達習慣,又便于計算機進行處理。必須制定出清晰的概念組配語法規則,同時也要求計算機進行深度學習;其次,由于臨床醫學術語存在大量的同義術語,為了方便用戶在檢索使用時準確、快速地找到想要的術語名詞,就要求計算機要有很好的語義分析、自動抽取等處理技術。
充足的資金保障是醫學術語標準研究、制定、應用、推廣工作得到不斷推動的重要動力和基礎。因此建議政府和行業要努力創建良好環境,增加對醫學術語標準研究、制定及推廣的資金投入,并鼓勵和推動術語標準和術語集在更大范圍的有效應用,使醫療機構、團體認識到開展標準化工作、使用術語標準能夠提高醫療服務的水平和質量,降低差錯,提高效率。
只有統一規劃,形成合力才能更好、更順利地構建醫療術語標準化體系,因此要加強有關單位、協會之間的合作,避免重復研究。有效進行資金、人力、精力的投入,建設行業內、國內有效可行,國際上有影響力的臨床術語標準化體系。
結合國內外現狀,深入研究存在的主要問題,初步提出構建我國臨床醫學術語標準化管理體系的總體框架,主要分為四個層面:素材研究層面、標準建設層面、發布層面和應用層面。
整理中文臨床醫學術語素材庫,組織醫學專業人士進行素材遴選標準并進行研究,通過素材標準研究,遴選出國際主流臨床醫學標準術語作為本研究的素材庫,如《醫學術語系統命名—臨床術語》《國際疾病分類與代碼》醫學主題詞表、藥物標準術語表、中文版醫學主題詞表(CMeSH),還有其他如《全球醫療設備命名》《藥典》《醫學一體化詞表》等;并結合中國國情對國家衛生健康委員會已經發布的各類衛生標準、各全國性學會公布的指南、規范、共識等進行系統整理和研究。
組織醫學專業人士進行醫學知識表示模型的研究,首先是概念模型,包括概念、描述、同義術語之間的映射、編碼、概念的“域”和“范圍”(domain and ranges)等;其次是邏輯模型,包括術語的基本組成單元、術語的關系等;最后是表達模型,即術語的結構化表達,需要制定清晰的概念組配語法規則,既符合人類語言表達習慣,又便于計算機進行處理。組織IT專業人士進行人機協同關鍵技術研究,進行中文臨床醫學術語平臺的開發。
對臨床醫學術語體系進行標準化,使概念規范、語義關系規范、術語歸并、統一編碼,主要包括:(1)術語名集標準化(術語詞匯表/分類表):疾病名稱、手術操作、癥狀體征、身體部位、藥物名稱、檢查設備等。(2)術語關系體系(敘詞表/語義網絡等):語義關聯組類(術語概念表達及概念之間各種關系的揭示)。(3)一體化語言系統:各個醫學術語標準之間的映射和關系的揭示。
建設專門的中文臨床醫學術語發布平臺,包括術語檢索、術語導航、可視化、數據下載、開放接口、培訓教程等。最大幅度地提高臨床醫學術語的利用度,并可在一定程度產生收益。
中文臨床醫學術語體系的建設,以電子病例規范化、臨床診療輔助決策、知識庫建設、數據挖掘、收費系統等為基點,服務于醫生、科研人員、醫院、保險、決策管理等,同時獲取收益分配。尤其在當前大數據和人工智能快速發展的環境下,標準化的臨床醫學術語可作為數據標準化和數據挖掘與推理的支撐,輔助臨床診療決策[18]。
規范化的臨床醫學術語可以消除臨床概念的不確定性,為我國臨床工作的標準化提供參考依據,醫療數據的精確度記錄和分析,促進了數據共享與利用,提高了醫療大數據的共建共享意識,為臨床工作的標準化提供參考依據;臨床醫學術語標準化對醫學發展能起到關鍵性的促進作用,對臨床醫學的發展有重大意義;同時要加強與國際標準化機構、組織間的交流合作,積極學習借鑒國際各組織的術語標準及術語集建設經驗,廣泛參與國際合作,將我國術語標準化研究和建設提升到一個新的層次。