湯智,黨璽蕓,袁秦,何曉帆,柯軍,馮珊
廣東省醫療器械質量監督檢驗所,廣東 廣州 510663
目前,醫療器械的檢測報告和原始記錄編輯是檢驗機構工作的重要一環。現行的《醫療器械分類目錄》[1]包括206 個一級產品類別和1157 個二級產品類別,含6609 個典型產品名稱,種類繁多。醫療器械作為跨學科的行業,產品的技術要求[2]性能指標不勝枚舉。原始記錄及報告的編輯難以有固定的模板,文字編輯核對工作繁重以及文字類報告文本差錯率高,一直是檢測人員的工作痛點。
現有市場上的實驗室信息化管理系統均未有針對醫療器械行業的非固定模板專業報告生成工具,其原因在于軟件程序工程師不具備專業檢測背景,即使與檢測人員合作開發也存在必然的理解差異。因此,開展由醫療器械檢驗人員主導的報告/原始記錄智能生成系統研究勢在必行。本文旨在介紹一種由檢測人員自行設計開發的基于Python 的醫療器械檢驗檢測報告/原始記錄智能自動生成編輯器,以提高工作效率,降低報告文本差錯率,為醫療器械產業提速增效。
目前,國內醫療機構的檢驗報告/原始記錄應按照《醫療器械產品技術要求編寫指導原則》[3]編寫,如表1所示。醫療器械的技術要求是根據指導原則編寫,內容一般包括產品名稱,型號、規格及其劃分說明(必要時),性能指標,檢驗方法,術語(如適用)及附錄(如適用),其中性能指標為報告/原始記錄編輯的目標內容。需對完整技術要求進行解析并獲取目標內容,進行拆分轉換填充至報告/原始記錄。

表1 檢驗報告表格及預填充結果結論示例
針對不同檢驗項目的特點歸納整合,預填充原始記錄/報告中的“檢驗結果”“單項結論”,包括單位,固定的結論格式如表1 所示。
針對技術要求引用國家/行業標準條款內容的情形,須使對應條款或整份標準智能嵌入“標準要求”。
需將技術要求、送檢樣品信息例如名稱、編號、型號規格、委托單位信、批號/生產日期、檢驗項目、依據、樣品照片一一對應,批量生成相應檢驗編號的原始記錄/報告Word 文檔。
本研究設計的編輯器是基于Python[4]的報告自動生成系統,以Pycharm[5]為開發平臺將實際檢驗的專業需求以程序方式實現。Python 語言對客戶端軟硬件要求較低,一般Windows 操作系統即可,簡單易學、功能廣泛、使用方便、操作可行性強。通過Python 下的win32com 模塊、shutil 模塊、Python-docx 庫、openpyxl 庫等的綜合使用,實現上述所列的需求,將任務信息數據庫、標準數據庫、技術要求Word 文檔分別進行信息鏈接和提取,生成原始記錄文檔和報告文檔。編輯器系統框架如圖1所示。

圖1 編輯器系統結構框架
以SL00001 為例,定位SL00001 技術要求文檔,識別任務編號SL00001 并鏈接送檢信息數據庫與原始記錄模板文檔,將任務編號SL00001 的送檢信息插入原始記錄模板,完成SL00001 原始記錄首頁信息填充。
解析產品技術要求獲取目標內容,按標準條款、標準項目、標準要求格式分別插入對應任務編號的原始記錄中。
遍歷原始記錄表格中的要求內容,遍歷國家/行業標準數據庫文檔,并進行互相比對。智能判定并抓取對應國家/行業標準整體或部分條款內容在原始記錄對應位置嵌套插入。
遍歷記錄表格中的要求內容,檢索結論格式數據庫(由檢驗員更新維護),進行對應結論格式比對匹配,智能填充結論格式至原始記錄的實測結果列。以上流程主要代碼如圖2 所示。

圖2 主要功能代碼結構示例
以上程序流程完成后,生成“SL00001 原始記錄”文檔,原始記錄編輯器整體流程如圖3 所示。

圖3 原始記錄編輯器流程圖
定位SL00001 技術要求文檔,識別任務編號SL00001 并鏈接送檢信息數據庫與報告模板文檔,將任務編號SL00001 的送檢信息插入報告模板,完成SL00001 報告首頁信息填充。
打開任務編號SL00001 的原始記錄文檔,并定位到含技術要求內容的表格正文部分,遍歷表格,將原始記錄中的條款、項目、要求內容對應插入到報告模板中。
程序遍歷當前文件夾,檢索SL00001 樣品照片,若有,則將樣品照片插入報告;若插入失敗,則于提示后繼續后續步驟。
遍歷報告表格中的要求內容,檢索結論格式數據庫(由檢驗員更新維護),進行對應結論格式比對匹配,智能填充報告表格中的結論列。
以上程序流程完成后,生成“SL00001 報告”文檔,報告編輯器整體流程如圖4 所示。

圖4 報告編輯器流程圖
預置報告模板、原始記錄模板、SL00001 技術要求,SL00001 照片等文檔以及標準數據庫、送檢信息庫。編輯器運行準備界面如圖5 所示,運行程序,將技術要求(圖6)生成原始記錄(圖7)與報告(圖8)。

圖5 編輯器運行準備界面

圖6 SL0001技術要求中性能指標內容示例

圖8 生成報告的首頁部分(a)與正文部分(b)示例
編輯器經過調試后,于2022 年5 月底正式在醫療器械檢測機構上線。通過對45 名檢測人員(35 名資深檢驗員、10 名初級檢驗員)使用編輯器前后進行跟蹤采樣分析,以外周中心靜脈導管套包產品為例,技術要求標準條款46 項,引用2 項國家標準、3 項行業標準[6-10],對比其出具報告的時間差異;同時,選擇某一無源檢驗室,比較其2022 年各季度的報告檢驗周期,以此評估編輯器的使用對于改善報告出具工作成效的效果。選擇SPSS 25.0 軟件對數據進行分析,計量資料以±s的形式表示,行t檢驗,以P<0.05 為差異有統計學意義。
相較于傳統手工錄入出具報告,資深檢驗員使用編輯器耗時平均縮短80.6%,初級檢驗員耗時平均縮短76.3%,效率有大幅度提升,且差異均存在統計學意義(P<0.001),如表2 所示。使用編輯器后,資深檢驗員與初級檢驗員耗時差距縮小,為初級檢驗員提供了更優勢的便利。
表2 傳統人工錄入與編輯器耗時比較(±s,min)

表2 傳統人工錄入與編輯器耗時比較(±s,min)
注:資深檢驗員為檢驗工作3 年以上,對報告出具流程非常熟悉;初級檢驗員的檢驗相關工作少于1 年。
初級檢驗員(n=10)傳統人工錄入方式67.9±24.8155.5±17.7編輯器方式13.2±2.936.9±8.6 t值24.319.1 P值<0.001<0.001組別資深檢驗員(n=35)
以某無源檢驗室為例,2022 年第四季度比第一季度報告檢驗周期平均縮短63.8%,報告文本差錯率平均降低80.0%,見圖9~10。

圖9 2022年報告的出具工作日

圖10 2022年報告的文本差錯率
在編輯器設計過程中,參考了以往的相關研究。許于春等[11]設計的醫療器械報告程序,需要對技術要求進行二次修改格式,手工重新錄入程序界面;林晉立[12]基于VB 的生成系統,實現了送檢和樣品信息的報告自動生成,但檢驗項目固定,適用于項目單一且少,自行設計固定模板的檢測;高蓓[13]建立的框架類似于醫療器械Lims 管理系統,基于Python 鏈接數據庫生成模板,適用于圖表處理;魏泰等[14]實現了報告模板的生成和批量編碼打印,但僅限于固定的檢測項目;齊敬佩[15]建立的檢測報告和企業報表自動生成系統從檢驗機構的實際出發,但對配置者有計算機學科的門檻要求,依賴于模板,首次制作模板仍需耗費不少工作。魯俊等[16]的檢測報告自動生成算法是在專業領域的系統框架下的運行,適用于檢測依據是固定的國家或行業標準。
相較于以上研究,鑒于醫療器械領域涉及醫藥、機械、電子、塑料等多行業,且為多學科交叉,本研究解決了兩大難題:① 醫療器械產品性能指標無固定模板;② 生產企業在對功能性和安全性自行制定產品技術要求時,引用了諸多的行業/國家標準等指引綱領性的文件。
編輯器的落地實施改變了以往檢測人員編輯技術要求和引用文件耗時耗力的情況:① 一體化智能識別技術要求,對檢測內容進行全局解析及段落/字符的智能編輯,自動生成原始記錄/報告,最大化忽略格式的影響,無須進行特定格式轉化或二次人力加工;② 操作過程簡單、易掌握、無門檻,僅需將技術要求文檔重命名(格式:任務編號+技術要求),再運行編輯器;③ 實現原始記錄/報告的批量生成,僅需將若干個技術要求文檔預置于同一文件夾;④ 通過與任務信息數據庫鏈接,無須重復對報告的樣品信息、檢測信息等進行核對校準;⑤ 通過對技術要求在標準數據庫中的關鍵字模糊或精確檢索,實現技術要求引用對應條款國家/行業標準內容的智能嵌入;⑥ 實現對任務信息數據庫、標準數據庫、報告/原始記錄模板的源頭統一整合性管理,避免文字和格式編輯性錯誤;⑦ 實現條款對應的結論格式預填充,減少后續的文字輸入。
但目前,編輯器還存在很大發展空間:針對醫療器械檢測規格型號復雜的問題,探索解決差異性覆蓋的報告/原始記錄編輯情況;針對監督抽驗,探索利用生成的報告自動形成表單,對檢測項目/檢測結果進行自動化的匯總與歸納分析,出具更詳盡的專項質量分析報告[17],實現多個檢測數據庫的標準化采集、整合與共享,進一步提高醫療器械檢測能力與水平。
綜上所述,通過設計基于Python 的醫療器械報告/原始記錄自動生成編輯器,并將其推廣應用在醫療器械檢測機構中,利用信息化的手段梳理了報告出具的流程,可以提高工作效率,降低報告文本差錯率,為醫療器械產業提速增效。本研究設計的編輯器對醫療器械檢測機構的實驗室信息化管理系統[18]編制有很好的補充作用,具備在各個機構移植與落地的可行性。同時通過檢驗人員學習編程,設計與實際的檢測經驗結合最為緊密,將報告自動化編輯的專業需求以程序語言表達,并付諸實踐,對相關領域的實驗室信息化管理系統編制有很好的啟發作用,能讓信息化工作更貼近專業需求與難點的解決。