成福春 張平 劉華 房敏



摘要:本文討論了編碼之中常用到的按位累加取模、多項式乘法累加取模等校驗位算法的優缺點,尤其是對系統化醫學術語集(SNOMED)編碼采用二面體群D5校驗位算法作了較深入的討論。二面體群D5算法不僅可以校驗出所有一位錯誤及相鄰位置換位錯誤,而且不需要增加字母x,是一種非常理想的校驗位算法。國內目前尚無一套既具有信息技術特征,又具有中醫學科本身特征的編碼化的術語集,SNOMED編碼采用二面體群D5校驗位算法,對于中醫術語編碼具有重要的借鑒意義。
關鍵詞:中醫術語;術語編碼;系統化醫學術語集;校驗位算法;二面體群D5
醫學術語及其編碼化,對于規范臨床數據采集,數據檢索分析利用、提升醫療質量以及研究的深度,具有重要意義。系統化醫學術語集臨床術語(systematized nomenclature of medicine clinical terms,SNOMED CT)通過編碼進行世界范圍內的統一術語交流,即代碼唯一,或稱概念唯一。但是代碼所代表的內容其形式可以多樣,如英文形式、中文形式或者各國語言形式。通過定義代碼與代碼之間的關系,來體現學科本身的邏輯與語義。
1.系統化醫學術語集一臨床術語編碼簡介
在SNOMED CT術語體系中,賦予每一個特定術語一個代碼,即擴展版的SNOMED CT概念標識符(SCTID字段)。代碼本身不要求有特別的含義,只是代表這個術語本身,利于計算機處理。
在代碼結構中,具有相關的屬性信息,如extension item identifier(擴展項目標識符),共8位,代表具體的項目編碼;namespace identifier(名稱空間標識符),共7位,代表維護代碼的機構;partition identifier(部分標識符),2位,10代替概念,20代表描述,30代表關系;最后一位是check-digit(校驗位),便于計算機自動糾錯。SNOMED通過3張表來體現,即概念表、定義表、關系表。SCTID是概念表中的最重要的字段。目前擴展版的SCTID字段結構如圖1。