李 叢, 李 藝, 王晶晶, 俞 清,3, 周保松, 胡 兵, 黃備建,3*, 王文平,3*
1. 復旦大學附屬中山醫院超聲科,上海 200032 2. 上海交通大學附屬第六人民醫院超聲科,上海 200233 3. 上海市超聲質量控制中心,上海 200032 4. 復旦大學大數據學院,上海 200433
隨著我國群眾對健康重視程度不斷提高,體檢廣泛開展,超聲以其無創、便捷、性價比高的特點成為醫院應用最多的影像設備。但是目前國內醫院80%的超聲設備是進口機型[1]。
近年來隨著國產影像設備行業的發展,國產超聲設備圖像質量不斷提高[2],市場占有率逐步提高。國產自主知識產權的診療設備市場占有率大幅提升,并降低核心技術的對外依賴,達到國際領先水平之一,為國家規劃目標之一。因此應對國產超聲設備的圖像質量進行詳細評價,并與進口設備比較,尋找差距,以提高國產超聲設備認同度及競爭力。目前對國產超聲設備圖像質量的評價很少[3],評價標準不夠詳細,更缺乏針對腹部超聲圖像質量的大樣本多中心系統評價。
本研究通過制定詳細的評價規范,對不同醫院用11個國內外超聲高端設備采集的腹部圖像數據進行量化評價,以期提高國產超聲設備的醫療領域認可度,并不斷提高國產設備水平。
1.1 一般資料 選取2018年6月1日至2020年5月31日國內18家醫院955例受試者的腹部超聲圖像資料。其中13家為三級醫院、5家為二級醫院,納入5個國產品牌的5個高端機型(Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ)和5個進口品牌的6個高端機型(A、B、C、D、E、F)進行評價。高端機型由廠家及超聲專家綜合定義。
955例受試者中,男性480例,女性475例,年齡18~80(39.64±15.73)歲,體質量指數(body mass index,BMI)為17.10~37.69 (23.67±3.72) kg/m2。受試者納入采用方便抽樣,納入標準:常規體檢人員或無重大疾病者。排除標準:有需要評價的器官缺失;餐后;不能配合檢查;腹腔脹氣明顯。同一例受試者由一位醫師使用國產及進口設備進行超聲檢查,前后順序隨機。對每位受試者用某一國產及某一進口設備各采集腹部標準圖像26張。超聲設備探頭頻率為2~5 MHz,采用內置腹部掃查條件,醫師可調節增益、動態范圍使圖像盡量清晰,聚焦在觀察目標下方;同一例受試者盡量保持圖像條件相同,使其具有可比性。
1.2 評價標準 組織超聲專家、超聲診斷質量控制中心專家團隊,對《上海市超聲診斷質控手冊》和國外相關文獻[4-15]進行研究,參考國內較權威的超聲儀器基本性能檢測規范,并結合我國臨床需求,共同制定腹部超聲圖像質量評價標準與研究方案。采取單盲法對腹部超聲圖像進行量化,將2名副高級職稱以上專家評分的均值作為最終評分。評分采用李克特量表:5分為圖像質量優秀,可用于診斷,非常滿意;4分為圖像質量良好,可用于診斷,滿意;3分為圖像質量有瑕疵,不影響診斷,一般;2分為圖像質量欠佳,影響診斷,欠滿意;1分為圖像質量差,不能診斷,不滿意;0分則為圖像采集錯誤(不計入統計)[16]。對參評專家進行圖像評價培訓,使其評價能力不斷完善。
1.3 統計學處理 在Rstudio的編程環境中采用R語言(R 2.6.2)處理數據,調用dplyr、ggplot 2、gridExtra、RColor、tidyselect、tidyr和knitr等統計算法包。符合偏態分布的計量資料以M(P25,P75)表示,進行Kruskal-Wallis秩和檢驗,運用經Bonferroni法調整的Wilcoxon檢驗進行兩兩比較。可視化展示的圖形包括帶散點分布的箱式圖和瓦片圖。檢驗水準(α)為0.05。
2.1 腹部超聲圖像質量評價標準與研究方案 共采集腹部超聲圖像49 660張。標價標準見表1。

表1 腹部超聲圖像評價標準
2.2 超聲設備年限比較 腹部超聲圖像評分在不同年限分組之間差異有統計學意義(KW=23.83,P<0.001)。經兩兩比較,設備年限<3年與3~6年的圖像差異無統計學意義,但均高于6年及以上設備的圖像質量(P<0.001)。由于6年及以上的設備均為進口設備(21例),故后續分析中只納入年限<6年的設備。
2.3 超聲設備整體評分比較 結果(圖1,表2)表示:國產(n=955)和進口超聲設備高端機型(n=934)腹部圖像評分差異無統計學意義[117.0(103.0, 125.0)分vs116.0(102.0, 125.0)分, KW=0.10,P=0.750]。
2.4 超聲設備不同型號比較 結果(圖1、表2)顯示:不同型號間腹部超聲圖像評分差異有統計學意義(KW=177.27,P<0.001);兩兩比較(表3)顯示:國產型號Ⅰ、Ⅳ與進口型號B、D表現相對較好。

圖1 腹部超聲圖像總分情況

表2 腹部超聲圖像總分
2.5 超聲設備一級指標評分 結果(表4)顯示:國產與進口超聲設備之間腹部圖像灰階評分差異無統計學意義(KW=0.01,P=0.915),彩色多普勒血流成像評分差異無統計學意義(KW=0.95,P=0.329),時間流速曲線評分差異無統計學意義(KW=1.01,P=0.315)。
兩兩比較(圖2)顯示:不同型號超聲設備間腹部超聲圖像灰階評分差異有統計學意義(KW=161.62,P<0.001),國產Ⅰ表現較好、Ⅱ及Ⅲ表現較弱,進口B表現最好、E表現相對較弱;不同型號間彩色多普勒血流成像評分差異有統計學意義(KW=185.77,P<0.001),國產Ⅳ表現較好、Ⅲ表現較弱,進口D表現最好、E表現較弱;時間流速曲線評分差異有統計學意義(KW=140.59,P<0.001),國產Ⅰ表現較好,進口D表現較好、E表現較弱。

表3 腹部超聲圖像評分兩兩對比情況

表4 國產與進口超聲設備腹部圖像一級指標評分比較
2.6 超聲設備三級指標評分 結果(圖3)顯示:國產超聲設備反映灰階細節分辨力的切面(1.2.2、1.5.1、1.5.2)、彩色多普勒血流成像血流充盈度及平滑度的切面(1.1.8、1.1.9)、時間流速曲線中低速血流敏感度的切面(1.4.7)的能力有待提高。

圖2 腹部圖像質量一級指標評分情況

圖3 腹部圖像質量三級指標評分情況
醫用超聲設備是醫院應用最廣泛的影像設備,可為醫師日常診療及時提供信息,方便快捷。國內醫院超聲科大多采用進口設備是由于醫院對國產超聲設備認識不足。目前國家提倡國內企業自主研發、提高創新能力。在政策不斷支持下,國產影像設備圖像質量不斷提高[16]。國產超聲品牌數量增多,市場占有率逐步提高,逐漸達國際領先水平。以往對國產超聲圖像質量的研究很少[3],且缺乏詳細深入的系統評價。本研究是國內首次對國產及進口超聲設備高端機型腹部圖像質量進行大樣本多中心系統性評價。組織國內專家制定的針對腹部超聲圖像評價標準具有先進性、權威性,是目前最詳細的標準,可為超聲醫師腹部超聲檢查提供指導。
本研究中國產和進口超聲設備高端機型腹部圖像整體評分之間差異無統計學意義,分值均較高。國產與進口不同型號圖像評分總分之間差異有統計學意義,兩兩比較顯示,國產型號Ⅰ、Ⅳ表現相對較好,與評分高的進口機型之間無差異,Ⅱ及Ⅲ表現較弱,但與進口機型分值差別不大。超聲圖像質量的評價有3個重要的一級指標,即灰階、彩色多普勒血流成像、時間流速曲線,國產與進口超聲設備腹部圖像總體一級指標評分之間無統計學差異,但不同型號一級指標評分之間有統計學差異。灰階為國產Ⅰ表現好,Ⅱ及Ⅲ表現較弱;彩色多普勒血流成像為國產Ⅳ表現較好,Ⅲ表現較弱;時間流速曲線為國產Ⅰ表現較好,Ⅲ表現較弱。部分國產設備與進口設備仍有差距,有待進一步提高,差距主要體現在灰階細節分辨力、彩色多普勒血流成像充盈度與平滑度,時間流速曲線中低速血流敏感度。本研究肯定了國產超聲設備腹部圖像質量,發現了部分超聲設備的不足之處,能指導國產超聲設備進行針對性改進。
本研究尚有不足之處:雖然統計時選取了使用年限在6年以內的超聲機型,但國產設備的使用年限多較進口設備短;而且國產超聲設備檢查模式更適應國內超聲醫師的視覺需求。這些均可能對圖像的評價產生影響。
綜上所述,國產超聲設備高端機型腹部圖像質量較好,總體與進口設備高端機型之間無差異,雖然某些機型評分低于進口設備,但評分差值不大。國產超聲設備高端機型腹部圖像質量得到超聲評價專家的普遍認可。