郭宇峰,毛一薦,馬成群,周晟汀,韓錦川,王子洪,郭海濤
陸軍軍醫大學第一附屬醫院 醫學工程科,重慶 400038
自新型冠狀病毒肺炎暴發以來,患病人數不斷增多,醫護工作量不斷增大[1-2]。而與患病人數激增的嚴峻形勢相比,卻是醫護資源比較匱乏的現狀,醫護資源的配置不足嚴重影響著病人的基礎生命支持[3]。在患者護理和診療工作中,監護儀又作為實時監測病人生命體征的重要醫療設備,對診斷和治療疾病有著極其重要的意義[4-6],被廣泛應用于監護病房和急救轉運車內。然而,在當前監護系統的操控方式下,采集測量患者生命體征數據時,需要醫護人員采用手工操作方式實現數據采集的啟動和關閉、報警設置等;但醫護人員在日常工作中眼睛和手常被其它操作占用,再去操控監護儀有諸多不便,不僅耗費時間,而且存在接觸感染的風險,特別是在傳染病隔離病房和轉運車內。為充分合理的發揮醫護資源效用,避免接觸感染、保障醫護工作者健康安全,有必要利用智能化技術來優化監護儀操控方式,盡量減輕醫務人員在監護工作中用于參數采集的工作量,將釋放出的工作量投入其他的醫療服務中。
語音識別控制技術作為智能控制研究領域的一個重要分支,能夠為智能醫療儀器提供了更為直接、方便的人機接口[7]。基于語音控制技術的醫療設備,通過非接觸式語音操控方式,具有便利性、實用性和人性化的特點,存在廣闊的應用價值[8-10]。本研究結合語音控制技術的優點以及當前臨床監護系統人機交互存在的問題,將該技術應用于臨床監護控制中,作為醫護人員“手”的擴展,具有以下優點:① 非接觸式操控監護儀,醫護人員無需手工操作機器,在特殊環境下盡可能避免接觸感染;② 操控方式更加便捷、高效,醫護工作者僅需說出語音命令即可完成參數采集與設置工作,而不必放下當前手中工作去監護儀旁操控機器。
智能語音控制系統作為醫護人員“手”的擴展,它需具備語音識別與操作控制功能。文中設計的語音控制系統總體結構框圖(圖1),主要由語音輸入模塊、識別模塊、主控制器模塊和控制模塊幾部分組成。

圖1 語音控制系統結構框圖
在系統工作時,醫護人員說出監護儀語音操控指令,并由語音輸入模塊采集該操控語音將其傳給語音識別模塊;語音識別模塊對采集信息進行分析識別,并將識別結果傳給主控模塊;此時主控模塊通過分析識別結果后,利用控制模塊控制監護系統執行相關操作。其中上位機可通過主控制器對識別模塊內的關鍵詞列表進行更新維護,將醫護人員習慣用語添加到識別模塊內部。
1.2.1 識別模塊
語音識別模塊是本系統的核心模塊,為了使系統能夠識別醫護人員發出的語音控制指令,本文選用ICRoute公司設計生產的語音識別專用芯片LD3320進行語音識別。該芯片集成了語音識別處理器和一些外部電路,包括AD/DA轉換器、語音輸入輸出接口等,能夠方便進行應用開發[11-12]。系統電路參考ICRoute發布的LD3320數據手冊和開發手冊,采用并行方式與外部主控制器連接通訊,包含八根數據線(P0-P7)、四個控制信號以及一個中斷返回信號INTB;并通過語音輸入接口(MICN-P引腳)與麥克風電路連接獲取外界語音控制指令;同時為滿足3.3 V供電需求,采用AMS1117穩壓器將5 V電源轉換為3.3 V電壓為其供電(圖2)。

圖2 識別模塊外圍電路
1.2.2 主控制器模塊
主控制器電路能夠實現與上位機以及語音芯片的交互通訊,并通過接收分析語音識別模塊傳輸過來的識別結果,將與識別結果相對應的控制指令發送給控制模塊,操控控制模塊動作。文中選用STC10L08XE單片機作為系統主控制器,供電電壓同樣為3.3 V,內部Flash程序存儲器為8 k,SRAM為512 k,與傳統51單片機相比,運行速度快,抗干擾能力強,功能較全面[13]。系統晶振選用22.1184 MHz,工作時主控芯片STC10L08XE通過并行總線(P0.1~0.7)對語音芯片讀寫操作,獲取識別結果并通過P1.0~P1.3引腳驅動控制模塊運作。
1.2.3 控制模塊
控制模塊接收主控制器發來的控制指令,控制對應繼電器的開、關,實現對監護儀不同的操作控制。模塊選用常見的SRD-05VDC-SL-C繼電器,并通過USB接口為其提供5 V驅動電壓,工作時利用主控制器發出的控制信號與開關三極管SS8050對繼電器兩端電壓進行控制,實現繼電器通斷功能,電路原理圖見圖3。本文系統選用四路相同的繼電器控制電路,實現監護儀不同操作的控制。

圖3 控制模塊電路
1.2.4 語音輸入模塊
該模塊主要用于采集醫護人員發出的操作指令,并傳遞給語音識別模塊。文中采用駐極體麥克風(咪頭)完成語音信息采集,其具有體積小、結構簡單,價格低、電聲性能好等優勢,應用時只需添加部分外圍電路即可實現語音輸入。
文中設計的監護儀語音控制系統,主要實現語音信號的自動識別以及智能控制功能,系統軟件整體工作框圖如圖4所示,其中語音識別程序和繼電器驅動程序為軟件核心內容。工作時系統通過并行接口初始化語音識別芯片LD3320,使語音識別芯片進入循環識別模式,系統處理器反復啟動語音識別程序,持續監測語音信號;當麥克風監測到語音信號且被判斷為有效識別結果時,即為正確語音操控指令時,則調用與識別結果對應的繼電器驅動程序,發出控制信號驅動不同控制電路操控監護儀工作;若為無效識別結果,即語音信號不屬于有效操作指令時,則進入下一次識別過程;在每一次語音識別控制流程結束后,系統將自動進入下一次識別過程。

圖4 系統軟件工作框圖
1.3.1 語音識別功能設計
系統為實現對多條不同語音操控指令進行正確識別,首先需運行語音芯片初始化程序,調用關鍵詞列表更新函數,并將應用中實際所需多條關鍵詞語存到LD3320芯片中,此時芯片啟動一次內部ASR(Automatic Speech Recognition)語音識別流程;ASR流程啟動成功后,持續等待中斷響應。一旦檢測到外界語音信號時,進入中斷處理函數,并讀取BA寄存器的值分析識別情況,產生對應的識別狀態(成功/失敗)返給主程序,完成一次識別,后續由主控制程序根據識別狀態作出不同處理,見圖5。其中LD3320芯片可支持自由編輯50條關鍵詞條,在同一時刻,最多在50條關鍵詞語中進行識別[14]。另外,考慮到系統復雜的運行環境,為兼顧啟動識別靈敏度和對遠處干擾語音不能太敏感,在醫院人員嘈雜的情況下麥克風增益寄存器(0X55)設定值為43H[15]。

圖5 語音識別程序工作流程
1.3.2 繼電器驅動功能設計
為實現智能控制功能,驅動不同繼電器根據醫護人員的不同操控指令動作,主程序在獲取到語音識別成功的狀態后,立即從C5寄存器內提取識別結果;同時根據識別結果選擇對應的控制引腳進行高低電平控制,實現多路繼電器的操控。其中,考慮到監護儀按鍵多為點觸控制,在對控制引腳電平控制時,一般會設置0.5 s的延時,即將控制引腳先設置為高電平,延時0.5 s后再重置為低電平,而對于關機操作延時會設置為5 s。
在系統軟硬件基礎上搭建監護儀語音交互控制系統,系統實物圖如圖6a所示。應用時,通過上位機將系統程序下載完成,并將控制模塊的四路繼電器分別與監護儀按鍵并聯;連接線路后,給系統上電,在系統初始化完畢后即可用于語音控制,如圖6b所示,此時醫護人員若說出“測血壓”語音指令,監護儀則會執行對應操作,測出相應的血壓值。

圖6 監護儀語音控制系統實物圖
但是,由于系統是基于非特定語音識別技術,即對任何人的聲音都可以進行識別和判斷,其匹配原理以無聲調的拼音進行匹配識別。在實際應用中發現如下問題:有時在無語音操控時,該模塊響應了;并非有效語音操作時,即發出并非指定的控制語音,該模塊響應了。為提高語音模塊識別效果和用戶體驗感,系統采取如下方法:① 語音識別中采用口令模式,即我們給模塊定義一個觸發口令,每次只有先喊出觸發口令后才能進行和它對話,對于觸發口令可選擇一些日常不常聽到的詞語,例如本系統中將“監護助手”作為觸發口令;② 增添“垃圾關鍵詞語”,即添加一些其他的任意詞匯到識別列表,用來吸收錯誤識別,從而降低誤識別率。這些垃圾關鍵詞可以說一些應用場景中常見的詞匯,特別是一些與應用所需關鍵詞語音相似的詞匯。系統對這些詞語識別后不做任何操作,這樣當它識別后不起任何作用,可用來避免錯誤識別。
為了測試語音控制系統的功能,本文設計了相應的語音控制實驗。實驗中,選取了4名受試者(其中3名男性、1名女性)分別使用本系統完成監護儀的語音控制。同時,考慮到系統的軟硬件條件以及醫護人員對監護儀的常用操作內容,本文選用如下語音命令來操控監護儀,包括開機、測血壓、關閉報警、打印記錄、關機共5種命令。實驗時,4名受試者分別對上述5種命令各進行50次實驗,語音命令為普通話,受試者與監護儀間隔3 m左右,記錄每人每種語音控制的成功次數,并計算成功率,實驗結果如表1所示。

表1 語音控制實驗數據
實驗結果表明,對于所有受試者的5種語音命令,其語音識別控制平均成功率為92.4%,其中最低識別控制成功率也有86%;受試者2的普遍成功率要低些,可能與該受試者方言口音較重有關。通過該實驗,發現受試者通過該系統語音操控監護儀有較高的成功率,可見該系統用于醫護人員語音操控監護儀是可行的。
在傳統監護儀操控模式下,醫護人員需要放下手中工作再去操控床旁監護儀,如開關機、報警設置、測量血壓等,一般至少需要花費20 s以上時間,倘若還需要手消毒后再去操控機器,可能需要幾分鐘;并且因操控監護儀而中斷手中工作,不可避免的會對工作進度有影響。而在語音操控方式下,測試發現完成上述五種監護儀操控,平均每種操控所花時間不會超過8 s,并且通過語音操控方式醫護人員不必去中斷現有工作即可完成監護儀操作,且不存在接觸感染的風險。由此可見,通過該系統能夠為醫護人員提供一種更加便捷、高效的監護儀操控方式,并避免接觸感染。
當前,智能語音識別技術發展突飛猛進,智能語音識別技術與醫療場景的結合應用在提升臨床工作降本增效能力等方面表現出巨大的潛力;但是大多集中在語音電子病歷錄入、語音問診機器人等方面[16-17],例如云知聲提出的語音電子病歷,科大訊飛開發的智能問診系統等。在醫療設備的語音交互控制方面的應用研究并不多見,少數在康復訓練系統[18]、假肢運動[19]等方面開展了相關的研究,而在臨床監護儀操控方面的應用研究寥寥無幾。本文根據臨床監護儀操控的實際需求,創新性的將語音識別技術應用在監護儀操控方面,設計了監護儀智能語音操控系統。測試結果也表明將語音識別技術應用于監護儀操控方面是可行的,本技術在優化監護儀日常操控方式上有積極意義,能夠一定程度上提高醫護操控效率和避免接觸感染。
本文針對當前監護儀日常操作中遇到的一些問題,提出并設計了一種基于語音控制技術的監護儀操控系統。通過該系統,醫護人員可以方便的通過語音指令方式控制監護儀按期望方式運作。較傳統監護儀操控方式相比,不僅能夠有效提高操控效率,節約時間;同時醫護人員也不必去經常接觸監護儀,能夠較好地避免接觸感染,特別是傳染隔離區內有較大應用價值。本文對語音控制技術在監護儀中應用進行了初步研究,驗證了該技術的可行性,但是仍然存在一些不足之處,之后會在下面幾個方面開展進一步的工作:① 結合醫院和急救車的特殊外界聲音環境,在當前基礎上優化語音識別的算法,進一步提高識別準確率;② 開展基于特定語音識別的研究,讓系統僅能識別指定用戶的聲音,避免其他非相關人員的誤操作;③ 豐富語音控制功能范圍,使得醫護人員可通過語音模塊直接對監護儀參數進行設置、調用生命體征數據趨勢圖等。