王澤宇,陳露,祁鳴
(浙江大學醫學院,浙江 杭州 310000)
人面部識別(human face recognition)技術是生物識別技術的一種,主要通過計算機與光學、聲學、生物傳感器和生物統計學原理等高科技密切結合,利用人體固有的臉形、虹膜、視網膜、色斑、痣疣以及指紋、靜脈紋等生物特征,和頭部動態、眨眼睛頻率、聲音、筆跡、步態等行為特征,采用不同特征表示方法分析人面部圖像,提取有效信息進行研究。科學研究發現,疾病不僅會造成人體內在結構、生理功能的異常,還可能會導致人面部特征、運動形態改變或畸形,尤其先天性遺傳疾病會造成面部特殊特征。基于此,近年來,人臉面部識別技術已逐漸進入醫學診斷領域,通過分析患者面部的視覺特征信息研究疾病引起的特殊面容,采集患者面部特征標志點數據,構建患者面部模式與疾病數據庫,最終通過計算機機器診斷來確定患者的疾病類型[1-2]。本文簡要概述了人面部識別技術的發展歷史與基本原理,以及其在醫學遺傳領域上的發展歷史、應用與現狀,為醫學領域的遺傳學研究提供遺傳診斷的依據[3]。
18世紀,1篇基于人面部特征信息進行身份鑒別的文章發表于《Nature》[2]上,開啟了近代人面部識別技術應用的序幕。
目前,遺傳病診斷包括常規診斷和特殊診斷。常規診斷指與一般疾病相同的診斷方法;特殊診斷是指采用遺傳學方法,包括染色體檢查、家系分析等,是遺傳病確診的關鍵。前者耗時短但誤診率高,后者準確性高卻需耗費大量的人力、物力、財力,非普通家庭所能承擔。而面部識別技術可用技術模型協助人力,以數據庫補充遺傳學分析,將線下會診轉化為線上詢診,在降低誤診率的同時提高診斷效率。據統計,遺傳綜合癥中已明確約有3 500 種遺傳綜合征具有明顯的面部病理特征。面部識別診斷技術是由成熟的面部識別技術與醫學領域診斷技術相結合,通過計算機機器輔助醫生進行疾病的準確診斷。面部識別診斷技術的基本步驟包括受試者圖像預處理、人面部檢測、面部特征信息提取和疾病數據庫對比并分類。具體步驟如下:①獲得受試者(患者)面部圖像。圖像可通過攝像頭、相機等獲得,圖像需保證清晰度、像素、人臉完整程度、背景光線顏色和被拍攝者的方向與形態,建立圖像的預處理標準,有助于批量處理圖像。②檢測預處理圖像。按照面部形態以及比例特征進行面部點位標記,點位標記精細程度越高,產生數據量也就越大,識別準確率也就越高。③圖像特征點信息提取。采用Gabor 小波變換(Gabor wavelet transform)、局部二值模式(local binary pattern)等方法對幾何特征、質地和相關度等特征點進行處理與數據提取[1]。④完成數據提取后,將受試者樣本面部特征數據與機器后端中疾病數據庫進行比對,篩選出與樣本特征相似的疾病模型且歸類,從而對該受試者得出具體診斷結果,其中可用到的診斷分類、歸類方法包括留一交叉驗證法及訓練法等[4]。
面部識別技術及成果已初步應用于醫學領域,在具有明顯面部病理特征的疾病中,人面部識別技術可對其進行精確識別與分類,且具有診斷的潛在應用價值,如先天遺傳性疾病、內分泌疾病、慢性疲勞綜合征和CFS 缺乏等疾病[5]。2003年,人面部識別技術第1次被成功地應用于遺傳綜合征的面部識別,證明計算機機器通過識別算法識別遺傳綜合征的可行性較高。該實驗選取55 例患有5 類不同遺傳綜合征的測試者,包括脆性X綜合征(窄長臉、面中部發育差、前額突出、下頜前突、耳部特殊改變,如大耳、耳外翻、招風耳、單耳輪等)、德朗熱綜合征(小頭、弓形眉、連體眉、短鼻、鼻孔前傾、長人中、上唇薄、嘴角上翹和顎/頜小)、黏多糖貯積癥3型(頭大、舟型頭、前額突出、眉毛濃密、眼睛突出、眼瞼腫脹、鼻梁低平、鼻孔上翻和嘴唇大而厚)、Prader-Willi綜合征(窄臉、前額窄凸、長顱、單眼皮、杏仁眼、斜視、窄鼻梁、薄上唇、嘴角下垂、小嘴、小下頜)和Williams-Beuren綜合征(小頭、眉間潮紅、眼裂小、斜視和低鼻梁)。試驗采用人工設置32 個面部標記點并使用Gabor小波變換進行數據處理,結果采用留一法將單個樣本進行對比與分類,試驗結果最終顯示診斷準確率達到76%,而試驗中的臨床遺傳學專家對同樣的圖片進行判斷,其準確率僅為62%,低于計算機的識別正確率。計算機能更好的、更精準的識別受試者患有的潛在疾病。
2.1 唐氏綜合征 唐氏綜合征是最常見的因染色體異常導致的遺傳綜合征。唐氏綜合征患者具有的特殊面容特征包括眼距寬、眼裂小、眼外側上斜、有內眥贅皮,鼻根低平,外耳小,舌胖、常伸出口外,流涎多,身材矮小,頭圍低于正常人、頭前后徑短、枕部平呈扁頭,頸短,皮膚寬松等特殊的面容特征,可被計算機捕捉且識別檢測率較高[6-7]。2014年,研究者采用多個不同的分類器(包括支持向量機、k-近鄰、隨機森林和線性鑒別分析)識別唐氏綜合征患者和正常人群,正確率最高為96.7%。實驗中識別技術采用獨立分量分析(independent component analysis),同時,改進了標志點的檢測,用該技術分析出的代表性面部特征非常符合臨床的觀察。另外,實驗還測試該技術分辨唐氏綜合征和其他遺傳綜合征,到97%的正確率。有研究者認為,該技術可有效地用于唐氏綜合征的檢測,并可推廣至其他遺傳綜合征的識別[8]。
2.2 德朗熱綜合征 2014 年,一種新型技術面部畸形新分析(facial dysmorphology novel analysis,FDNA)技術被用于識別CdLS患者的面部圖像。研究者選取34例CdLS患者的照片作為陽性樣本,97例非CdLS的其他綜合征患者作為陰性樣本,對FDNA系統進行訓練,訓練完畢的系統識別31例NIPB,或 SMC1A 基因突變的 CdLS 患者和非 CdLS 受試者(分別為16、6、9例),其識別正確率為87%,而醫學專家對相同樣本的識別正確率為77%。可見FDNA技術對CdLS患者和非CdLS受試者的辨識能力較強,臨床前景較好[4]。
2.3 努南綜合征 Noonan綜合征(努南綜合征),1963年由Noonan 和Ehmke 首次認定的一種疾病,患者伴有特殊面容和多發畸形,包括先天性心臟病。Noonan 綜合征的發病率為1:2 500~1:1 000,目前明確發病相關基因為PTPN11、SOS1、RAF1、RIT1、KRAS、BRAF、SHOC2等,與絲裂原活化蛋白酶(RAS-MAPK)信號通路異常有關[9-10]。Noonan 綜合征的主要特征包括特殊面容(即眼距增寬、瞼裂下斜、蹼頸)、先天性心臟病、身材矮小和胸部畸形。約25%的患者有精神發育遲滯,50%患者有出血傾向。骨骼系統、神經系統、泌尿生殖系統、淋巴系統、眼睛和皮膚可不同程度地受累[11-14]。2004 年,Hammond 等[15]使用 11 個遺傳綜合征的醫學診斷相關特征點,包括內外眼角、上嘴唇中點、左右嘴角、鼻根、鼻尖、人中、下巴等,同時采用密度表面模型(dense surface model,DSM)和3D人臉模型分析的方法進行Noonan綜合征面部特征的建模和分析。實驗中采用5 種分類器包括近鄰均值、C5.0 決策樹、神經網絡、邏輯回歸和支持向量機識別Noonan患者和健康人群。實驗結果表現敏感性和特異性的最高水平達到94%和88%。2017 年3 月,Paul Kruszka 等[16]選取非洲、亞洲和拉丁美洲等地共20 多個國家的罕見病患者樣本,運用人面部特征識別技術進行試驗比對,其中患者平均年齡8 歲。總樣本量為322 例,標注樣本量為125 例Noonan患者,其中女性占比46%。實驗結果顯示,敏感性為94%,特異性為90%。
2.4 其他遺傳疾病 除上述遺傳疾病種類以外,仍有多種遺傳疾病具有明顯的面部患病特征可通過人工智能面部識別進行診斷,包括克氏綜合征(Klinefelter syndrome,KS)、X染色體易裂癥等遺傳疾病[17]。針對表現出特殊面部特征的疾病,面部識別技術均能較準確的識別并進行診斷[18-19],如內分泌代謝性疾病庫欣綜合征[20-22]、肢端肥大癥[23-24]等。2011年,實驗室研究人員選取57 例肢端肥大癥患者面部圖片樣本進行試驗,加入60張正常人面部圖像,使用面部圖像輔助診斷(facial image diagnostic aid,FIDA)人臉分類軟件對患者及正常人群進行識別。建立Gabor 小波變換與留一交叉驗證方法對實驗圖像進行分析處理,實驗結果顯示,患者識別正確率為71.9%,對照組圖像識別正確率為91.5%,略高于醫學專家的63.2%和80.8%[25]。
2.5 遺傳疾病常規診斷現狀與技術對比 遺傳疾病常規診斷依賴于傳統醫生的個人經驗與診斷技術,個體差異較大,而人面部識別技術可依據數據庫識別成功率較高,且已在遺傳綜合征、肢端肥大癥等疾病領域取得了良好效果。同時,人面部識別技術也可用于其他具有特殊特征的疾病類型,如慢性疲勞綜合征和內分泌疾病等有面部特征改變的疾病。人面部識別診斷技術作為遺傳疾病診斷輔助手段或遺傳疾病篩查手段具有高效、簡單、便宜、非侵入性和易推廣等優點。
但人面部識別診斷尚需實現以下幾方面工作:①識別診斷成功率受到樣本數據量的限制。數據量積累越多,所獲得的檢測結果往往越精確。②受地域限制。不同地域不同人種的面部特征及數據往往不同,需在計算機內建立多套樣本模型以保證識別檢測的成功率。③需建立年齡、BMI和家庭基礎信息匹配的人面部識別數據庫,盡量完善統計數據信息與種類,從而保證計算機識別的準確性。
經過人面部識別技術的不斷發展與完善,越來越多的遺傳綜合征將被計算機記錄,應用開發機器算法,有望覆蓋遺傳綜合征檢測篩查。在國內遺傳咨詢臨床醫生嚴重缺乏、國內醫療資源分布不均的環境下,傳統疾病檢測診斷的高昂費用將推進人面部識別技術這種人力資源消耗少、費用低廉的新型醫療檢測方式的普及與應用[26]。雖然面部識別技術應用前景可觀,但在醫學遺傳領域,對其技術穩定性的評估和臨床應用的普適性還需要實踐探索,尤其是相似面部病理特征的區分與歸類,仍有待醫學與計算機領域研究者共同推進。