朱會明 趙銳 高悅



摘要 立足于“目為肝之竅”的中醫望診理論,針對傳統醫學中肝病目診缺少客觀化及量化指標的問題,研發一種可穿戴的中醫肝病智能目診系統(設備)。本系統主要是由眼部圖片自動采集、圖譜智能生成設備及數字化診斷系統兩部分構成。利用仿生模式識別理論的同源連續性算法構建眼部特征發現模塊,利用仿生模式識別的高維目標識別算法實現眼部肝病圖譜生成模塊。通過這2個模塊,根據中醫目診理論,對照片及識別結果進行分層次結構化的存儲,建立有中醫內涵的健康人及肝病患者人眼庫,為提高中醫數字化、可視化診斷水平提供方法與手段。
關鍵詞 目診;目診設備;仿生模式識別;同源連續性算法
Abstract Based on the theory of “ liver opening into eye” and aiming at the lack of objectivity and quantitative indicators of eye inspection in traditional Chinese medicine, a wearable intelligent eye inspection system (equipment) for liver diseases in traditional Chinese medicine was developed. This system is mainly composed of two parts: automatic eye image acquisition, intelligent atlas generation equipment and digital diagnosis system. The bionic pattern recognition theory homology continuity algorithm was used to construct the eye feature discovery module, and the bionic pattern recognition high-dimensional target recognition algorithm was used to realize the ocular liver disease map generation module. Through these two modules, according to the eye inspection theory, the photos and recognition results were stored in a hierarchical structure, the health and liver disease patients eye banks were established to provide methods and means for improving the level of digitalization and visual diagnosis of TCM.
Keywords Eye inspection; Eye-inspection equipment; Bionic pattern recognition; Homology continuity algorithm
目診是通過觀察眼睛變化來診斷全身疾病的方法,是中醫望診中特色診法之一。“目為肝之竅”“心之使”“為腎精之所藏”“為血之宗”“五臟六腑之精氣皆上注于目”。在生理上,目與五臟六腑聯系密切。在病理上,察目亦可反映臟腑精氣的盛衰。《重訂通俗傷寒論》:“凡病至危,必察兩目,視其目色,以知病之存亡也,故觀目為診法之首要”[1]。瑤醫目診是具有民族特色診法之一,其內容包括白睛診法、黑睛診法、眼球經區診法以及天、人、地三部形色目診等,其診斷符合率頗高,且一直應用于臨床。近來隨著計算機科學與醫學的交互應用與發展,為目診的現代化、客觀化的研究提供了技術支撐。
眼部識別是最自然的一種識別方式,人們甚至可以依據文字描述來區別不同人的眼睛。人類諸多疾病亦可反應于眼,眼瞼、鞏膜、虹膜等部位上的每個特異性表現都可能是某種疾病生物特征在眼部反射。雖然人的眼睛會隨著年齡增長發生變化,但眼表血管分布的幾何關系與虹膜邊沿紋理在人的一生中都非常穩定,因此可以反映軀體的不同狀態。基于此,本項目以肝病為切入點,運用仿生模式識別及計算機圖像處理技術,通過對患者眼睛各部位形態、色澤、紋理、斑點及位置結構的動態變化與分析,來判斷軀體內在器官病變及功能紊亂。即設計可通過自動采集與分析眼睛的物理、生物和行為等特征來識別人體疾病的中醫肝病智能目診儀(全息仿生智能診斷設備),其前端眼睛圖片采集設備見圖1。
1 基于中醫目診理論的數據采集與分析
以中醫目診理論為指導,基于圖像處理技術,研發目診圖像采集功能模塊和圖像采集設備,形成可穿戴中醫肝病目診儀圖像采集樣機。眼瞼及眼前血管紋理等在可見光波長照明下即可采集,鞏膜與虹膜圖片也可采用大景深鏡頭高清晰采集。通過采集被試人員(健康人及肝病患者)眼部(眼瞼及眼球)彩色及紅外線照片,建立不同疾病眼部圖片庫,并基于圖像處理技術進行眼部特征提取及關聯分析,以獲得不同年齡段的健康人及不同疾病的眼部特異性特征。
1.1 眼部圖片采集
運用目診儀采集被測試者眼部高清彩色照片,通過無線傳輸模塊將圖像傳至計算機,人工標注年齡,性別,職業等一般資料,形成眼部多粒度信息采集。
1.1.1 采集人群 肝病患者主要來自于上海中醫藥大學附屬曙光醫院肝硬化科住院及門診的肝硬化患者。健康志愿者來源于曙光醫院體檢中心,其中性別、年齡與患者相匹配。為了便于機器學習尋找特征,需采集盡量多的不同年齡段的眼睛圖片,現階段完成并用于分析的樣本數為200例。
1.1.2 采集方法 運用目診儀采集全部入組人員眼部照片,采集時矚受試者盡量睜大眼睛,并保持1 s直視前方,軟件自動采集眼部圖片5張,并根據虹膜內徑邊沿紋理清晰程度,選取其中3張進行圖片識別。見圖2。同時以眼科裂隙燈拍攝照片做對照。
1.2 眼部特征分類 根據中醫理論將眼部特征劃分為神態及形色兩部分,神態指眼球動態變化的特征,以神、態為主要元素進行人工標注,如眼瞼,目珠、瞳孔等。形色指眼球中基本固定不變的特征,以色澤、形狀為主要元素進行人工標注,如眼前血管,虹膜邊沿鋸齒分布,以及各部位的顏色等。基于圖像處理技術對眼部圖像進行七區定位,將眼部視覺信息轉換為相應部位的數值化信息。
2 眼部圖像特征(肝病)區域劃分與生成
本研究選用針對眼睛眼表特征識別以進行疾病(以肝病為切入點)診斷的研究,目前,利用自制目診儀既可在可見光也可以紅外光下采集眼部照片,且所采集照片已達到虹膜識別的準確度。見圖3。
2.1 眼部圖片識別及匹配算法 鞏膜位于眼球外圍,是由不透明白色膠原和彈力纖維組成,虹膜是鞏膜與瞳孔之間的環形區域。鞏膜本身無血管組成,其上面的血管是球結膜血管覆蓋鞏膜的表面所致,雖然眼前血管結構具有個體差異性,但是病理反射區域相對固定,這使得基于眼前血管紋理、鞏膜色彩、虹膜肌肉紋理及板塊變化能夠用于進行醫學輔助診斷。本研究算法基于快速魯棒特征的方法、微小偵測法以及直接關聯注冊與匹配的方法作為特征生成函數[2]。
2.2 眼部圖片處理與匹配 基于眼部圖像識別技術對采集圖片進行處理。首先,基于中醫“五輪學說”對所采集眼部圖片進行截取,分別截取出眼瞼、鞏膜、虹膜、瞳仁、內眥5個部分;其次,利用特征增強算法濾除血管紋理之外的背景;再次,設定眼表血管紋理描述符,從已經濾除背景的圖片中分別提取各圖片的特征形成描述符集合,即眼部特征;最后,對眼部特征進行比對以實現生物識別。
以鞏膜特征提取為例,首先截取眼部圖像的鞏膜部分。因所截取圖像存在自身比較度偏低的局限,難以直接提取眼前血管及肌肉紋理特征。因此,首先,需要采用多方向的Gabor濾波器來增強眼前血管紋理特征,即利用多尺度區域增長的方法過濾圖片背景來增強眼前血管分布形態及血管顏色特征。其次,基于類似RANSAC算法進行眼部圖片的注冊,通過注冊參數估算兩鞏膜模板之間最佳注冊參數組以實現圖片注冊。最后,通過比較各測試模板中的曲線段與目標模板中的線段以完成匹配[2]。
3 眼部圖像特征識別與提取
3.1 肝病圖像特征識別
3.1.1 仿生模式識別理論 傳統模式識別基本數學模型是從特征空間中不同類樣本的劃分出發,然而本研究需要劃分的是2個“同源”(同類)而不完全相等的事物(如人類同年齡同性別群體,但存在不同疾病的眼睛特征)。自然界任何欲被認識的同源的2種事物間的差別若是可以漸變的(如眼部圖像由正常到疾病狀態),那它們之間必然存在一個漸變過程(連續性)。故本研究采用同源連續性原理(PHC,Principle of Homology-Continuity)的仿生模式識別方法尋找特征空間中同類樣本全體的連續性規律。在仿生模式識別中,連續性規律也被用來作為樣本點分布的“先驗知識”,以此來提高對事物的認識能力[3]。
3.1.2 高維復雜幾何形體覆蓋方法識別 仿生模式識別的要點為特征空間中同類樣本全體的連續性規律。如特征空間中任何一類事物A類(如肝病患者眼前血管紋理)全體在空間中連續映射的“像”所形成的點集都是一個封閉子空間,即集合A(肝病眼前血管紋理特征)。在仿生模式識別中,采用軟件或硬件的方法來判斷是否屬于集合A。在特征空間中構筑一個能覆蓋集合A的n維空間幾何形體,根據連續性的維數推測原理,若把n維空間分成2部分,其界面必須是一個n-1維的超平面或超曲面。而人工神經網絡的一個神經元正是在n維空間中作一個n-1維的超平面或超曲面,或者為復雜的封閉超曲面[3]。因而,人工神經網絡是十分合適的實現仿生模式識別手段。而同族事物對應點分布的規律性,為研究用高維復雜幾何形體對同族事物進行覆蓋的最佳化點覆蓋識別提供了基礎。
建立高維仿生人眼特征坐標系:以一個標準人眼為原點,將采集到的健康及所要判識疾病患者圖片表示到N維坐標系,建立疾病的M維超曲面。識別時導入N維個體眼部特征超曲面,當M維與N維超曲面平行時,表示被測試對象健康,反證為某種疾病,此時M維與N維相交的點即為病患的幾何空間分布特性,映射到坐標軸即為具體的病患[4]。根據仿生模式識別同源連續性原理,人體病變是同源連續的過程,因此針對某種疾病應該存在一個由健康到病變的連續變化的N維曲面,該曲面表征了各種病變間的高維度連續變化關系或聯系的集合。見圖4、圖5。
3.1.3 眼部模式空間的構造與識別 本研究采用文獻[5]提出的構建封閉區域法。首先確定表征某一類樣本的特征空間走向,然后確定在該走向上封閉區域向四外的伸延。利用已知樣本構造出代表該類樣本的高維空間的封閉區域的支撐“骨架”來描述該封閉區域的走向。最后,在該“骨架”的基礎上按照一定策略向四外伸延,“生長”出高維空間封閉區域。
在滿足同類樣本全體的連續性原則的基礎上,將已有樣本看成是特征空間中分布的一個點集。將每個樣本看成一個節點,兩節點相連就認為在這兩點之間有一個連接。根據同類樣本全體連續性原則,每一個樣本都和其他任何樣本相連,由此可得到一個無向全連通圖,即“骨架”,骨架的形狀和走向對于要構造的封閉區域影響重大。為了最大程度降低“骨架”的不確定性,故常將生成骨架的問題轉成在一個無向全連通圖上找一個最小生成樹的問題。在仿生模式識別理論中,封閉空間的構造通常以“骨架”上的每個點為中心做超球,求所有超球的并集就構成了高維空間封閉區域。該算法的關鍵是確定每個超球的半徑,根據一個樣本與其他類別樣本的關聯程度,自適應地確定其小球半徑。見圖6。
綜上所述,骨架是由同類樣本之間的關系確定的,而如何在骨架的基礎上生長出封閉區域就是由不同樣本之間的關聯性確定的。基于此,我們利用已知的樣本構造出代表該類樣本的高維空間的封閉區域,以后每學習一種新的類型,就根據這個方法構造出代表該類樣本的高維空間的封閉區域,然后調節原有各個類別封閉區域占據的空間。
基于上述方法,本研究根據現有樣本所設計的仿生肝病圖像特征識別分類器,智能地分類已采集50例肝硬化患者及200例健康人,實驗結果顯示:在訓練集和測試集數據2∶1情況下,測試集上分類錯誤率為8.333%。
3.2 基于局部二值模式特征法提取眼部特征 局部二值模式(Local Binary Patterns)特征又稱“LBP特征”。它主要用于提取圖像局部的紋理特征描述算子。它的優點在于具有較強的分類能力、較高的計算效率及較好的灰度不變性。本研究首先將眼部彩色圖像灰度化,其次將LBP圖像劃分為均勻子塊圖像,成為一個組合單元,接著在每個柄中定義像素3×3鄰域內,將圖像閾值化處理,即周圍像素小于中心像素值,則該像素點的位置被標記為0,否則為1。可以形成一個二進制的LBP值[6]。見圖7。將所采集的40例健康人及40例肝病(肝硬化)患者的圖像資料進行LBP法分析,分別計算每個組合單元中矩陣(圖7),按順序串聯子塊圖像,最后形成相應的共生矩陣,從而實現眼部圖像LBP特征提取。
本研究通過LBP特征將彩色圖像灰度化以排出顏色因素干擾,最后生成眼部圖像相應的共生矩陣。依據8位二進制數值范圍在1~255之間,故每張圖像LBP特征頻數面積共255層。計算每層LBP頻數面積百分比以量化眼部圖像紋理特征,得到肝病患者與健康人LBP特征頻數圓環圖。經統計學分析,發現兩者間差異有統計學意義。見圖8。此外,通過計算圖像LBP值頻數面積百分比,并結合方差分析、秩和檢驗等統計學方法對相關指標進行篩選,可以找出二者間具體的差異性特征。
4 小結
生物識別是利用物理、生物和行為等特征來自動識別目標特征的技術。依據生物全息理論,人類的許多特征都可以用作疾病診斷,如脈診,舌診,面診等。但各種診法都各有其優勢與不足。因此,生物信息學研究正在尋找新的識別技術以為人類診斷疾病提供更多的選擇。
本研究基于中醫目診理論,探索并研發了一種適用于中醫肝病臨床診斷的可穿戴式目診設備及其智能診斷系統。首先,通過鏡頭、芯片及相應電子元器件等圖像采集功能模塊設計制備移動終端設備,形成中醫肝病目診儀圖像采集樣機。其次,通過移動終端實現對眼表圖像的自動采集,清楚、精確呈現眼前血管形態、色澤,虹膜紋理等解剖結構,并實現結構化存儲,建立目標人群眼庫。最終,利用仿生模式識別技術對所采集的大樣本被試人員(健康人及患者)眼部(眼瞼及眼球)彩色照片,進行眼部特征提取及關聯分析,實現基于眼部特征的疾病診斷,同時,通過提取LBP特征法等圖像處理技術,提取眼部特征并最后找出具體可描述的差異性特征。推動中醫數字化、客觀化、可視化診斷技術的進步與發展。
參考文獻
[1]吳銳,謝建祥,趙鳳達,等.望白睛赤絡理論與臨床[J].新中醫,2007,39(2):3-5.
[2]藺勇.基于GPU的并行鞏膜識別與LDPC譯碼研究[D].西安:西安電子科技大學,2014.
[3]王守覺.仿生模式識別(拓撲模式識別)——一種模式識別新模型的理論與應用[J].電子學報,2002,30(10):1417-1420.
[4]王俊勇.ICA/PCA虹膜識別方法中預處理與分類的改進方法研究[D].長春:吉林大學,2011.
[5]肖瀟.高維仿生信息幾何學研究及其在模式識別中的應用[D].杭州:浙江工業大學,2012.
[6]王凱.基于圖像紋理特征提取算法的研究及應用[D].成都:西南交通大學,2013.