孟田華,盧玉和*,任建光,劉紅梅,黃 榮,王浩航
(1.山西大同大學物理與電子科學學院,山西 大同 037009;2.云岡研究院,山西 大同 037004)
在石質文物病害的諸多類型中,空鼓病害是非常典型的病害之一(圖1)。主要表現為石層中間出現空氣層,導致一完整的石壁變成了由前壁石層(露天)—空氣層(空鼓)—背底巖石三者構成的空鼓病害結構。當空鼓厚度達到一定的程度,在溫度變化較大或者受力不均勻時,前壁石層很容易產生裂縫而自然脫落,危害性極強。因此,對空鼓病害的情況進行及時評估,防止進一步劣化是非常重要的。[1,2]文物不可再生的特性,決定了其保護修復前對病害探查分析技術必須是無損的。文物領域的無損檢測有其特定的含義,泛指一切不給所測文物帶來任何宏觀物理變化和潛在危害的分析檢測技術。文物保護科學家根據電磁波譜各個頻段的優勢和檢測需求幾乎應用了所有頻段,例如,利用超聲波對文物淺層病害的無損檢測[3];利用微波段的探地雷達探尋地下文物或遺跡[4];利用傅里葉紅外光譜儀對可以微量采樣文物物質的識別[5];基于光化學反應原理使用紫外光對有機染料和油漆進行檢測[5];X射線熒光光譜儀和X射線衍射方法對礦物顏料元素的分析[6]。盡管整個電磁波譜中被稱為亞毫米波和遠紅外射線的太赫茲(THz)波,在文物檢測方面還未得到充分利用,但高分辨率、強穩定性、強穿透力和強抗干擾的THz技術已被認可作為一種新的無損檢測方法來填補這一空白,THz技術在諸多無損檢測方法中脫穎而出,其潛在的高效檢測手段和更加細致可靠的評價方法為文物檢測領域注入了新的活力。[7]
THz技術進入文物保護領域最早可以追溯到1998年,Koch等人首次提出根據材料性質的不同,對THz射線所產生的時間延遲、吸收強度等光學參數的差異,將THz成像方法用在樹木的斷代研究中。[8]之后的近十年,相對于超聲波、紅外和微波等技術所取得的大量成果,THz技術在文物檢測方面的研究成果和數據非常少,主要受限于有效THz源和靈敏探測器,當時的THz系統復雜且昂貴,還未出現使用便捷的THz系統,無法滿足對那些易碎、精致、及體積大難以移動類文物的檢測,所以,形成了一個“THz波段檢測間隙”。隨著超快光電子技術與低尺度半導體技術的飛速發展,為THz波段提供了合適的寬帶穩定光源和高靈敏度探測器,很快讓THz技術成為了一種準常規技術,并在國際范圍內掀起一股THz研究熱潮。自2006年開始,THz技術登上了文物無損檢測的舞臺,早期Jackson,Abrsham,Adam等研究者將THz光譜技術應用到各種繪畫類文物檢測研究中,如壁畫不同顏料和粘合劑的THz光譜識別[9]、隱藏于繪畫作品下層圖畫的THz圖像顯現[10]、油畫隱藏層分析、架上繪畫隱藏肖像等的重現。[11]特別是日本的Fukunaga研究小組,利用THz光譜技術分別對中世紀后期蛋彩畫、版畫、壁畫的常見病害及繪畫層、古花瓶等做了大量極具參考價值的研究工作。[12-14]近年來,此技術逐漸擴展到繪畫以外的古代木構建筑、石雕等研究中,例如德國Krügener小組利用THz技術對漢諾威的下薩克森州國家博物館一個石質圓形浮雕內部裂隙進行了探測,通過THz時間延遲差精確測量了5 mm-7 mm的隱藏裂隙,并利用成像方法對特里爾大教堂一個破裂窗臺的修復狀況進行了評估,[15]還有效檢測了16世紀釉面陶土層下的缺陷。[16]Skryl利用類似的方法對一幅19世紀的俄羅斯木質圣像畫隱藏缺陷進行了檢測。[17]?hrstr?m則對留存的木乃伊進行THz成像,結果顯示骨頭和周圍的其它物質有明顯的區別。[18]THz系統的發展為這個領域開辟了一個令人興奮的可能性檢測波段,盡管仍處于探索階段,但已經可以對體積大、精致、易碎等無法移動的藝術品和文物進行現場檢測了。例如對3500年前密封的埃及陶罐內部物質的檢測[19]、教堂壁畫隱藏于石膏層下藝術品的探測,[20]富有挑戰性的是對壁畫所包含的支撐結構、地仗層、顏料層等多層不平整結構下古繪畫的研究。[21]國內THz技術在文物方面的研究較少,代表性研究團隊有首都師范大學張振偉組對故宮博物院收藏的現代油畫、古代礦物顏料,藝術品等進行了THz層析成像及顏料的成分分析研究。[22,23]陜西省文物保護研究院周萍組在2013年至2016年間主要針對壁畫類文物開展了THz無損檢測及成像研究。[24]華中科技大學王可嘉組分別對平面油畫作品的內部破損和底層素描信息,及卷軸型字畫類藝術品進行了THz圖像研究。[25]山西大同大學盧玉和組自2009年起,開展THz技術在石質文物風化病害檢測方面的相關研究,先后對云岡石窟風化物的THz光譜、風化等級測定、空鼓病害檢測等進行了系統研究。[26]
總之,從具體方法看,THz成像法主要用于對各種文物內部特征及形貌的直觀研究,而THz光譜法則多用于文物材料成分識別及缺陷/病害的量化表征;從研究對象看,絕大多數研究對象為各種繪畫類文物,而對石質類文物鮮有報道。盡管基于THz技術的文物無損檢測在近年來已經成為一個新的研究熱點,但是,THz石質文物檢測中對于空鼓病害的檢測仍然是一項艱巨的挑戰,可以歸因于以下原因:(1)石質文物在THz波段沒有指紋譜,石質空鼓病害也就不能直接用THz特征譜技術直接表征。(2)缺乏普適性的理論模型,這極大地限制了THz技術在多種文化遺產病害檢測領域的廣泛應用。因此,需要推廣THz檢測技術,采用更具普適性的理論模型,將其應用范圍擴展到所有的石質文物,而不是只適用于一種或幾種有限的理論模型。但是,由于被測樣品的數量有限(文物必須要求無損檢測),在一般情況下,很難進行多點或線測試,所以由少量的實驗樣本和數據推導出普遍性理論模型需要機器學習的幫助來驗證其正確性和普適性。與其他類型的機器學習相比,支持向量機(SVM)具有處理小樣本、非線性和處理高維問題的優點,克服了神經網絡的局部極小問題。更重要的是,據報道,基于Vapnike Chervonenkis(VC)維數理論和統計學習理論[27]的最小化結構風險原理,建立的SVM空鼓病害預測模型能有效提高THz檢測的通用性。利用病害的THz光譜數據作為SVM預測模型的訓練和測試樣本,所建立的SVM病害預測模型具有良好魯棒性是迫切需要解決的問題。所以,對于石質文物的病害檢測,有必要尋求新的思路和方法,特別是需要進一步通過機器學習的理論來構建具有普適性的石質文物THz檢測理論。希望在檢測砂巖石文物空鼓病害時,無論何種樣品,無論其形狀如何,無論它們來自物體的哪個部分,僅通過測量其THz反射光譜信息就可以預測其劣化程度。此外,THz檢測技術借助于SVM病害預測模型,可以在文物病害的實際檢測中更加快速、高效、節約成本。
本研究對典型露天石質文物云岡石窟的砂巖空鼓病害進行了實驗和理論研究。根據空鼓樣品中三個THz反射脈沖的相對時間延遲與樣本空鼓厚度的關系,[28-31]利用最小二乘支持向量機(Least Squares Support Vector Machine,LS-SVM)建立基于SVM的石質文物空鼓病害預測模型(SVM-HDPM)。利用該模型,將空鼓病害的THz數據輸入SVM-HDPM,可以準確預測石質文物的空鼓病害狀況,實驗結果證明該模型具有較高的準確性和有效性。
云岡石窟大多空鼓病害的前壁石層厚度在2 mm左右,因此我們把從云岡石窟景區采集到的砂巖切割為2 mm厚度(d_1)的平行石片,為了盡可能模擬真實空鼓病害,避免其他因素的干擾,同時制備了厚度(d_3)為6 mm的背地巖石后壁,這兩個石片的中間空氣層厚度即為空鼓厚度(d_2),不同的d_2值對應不同劣化程度的空鼓病害樣品,空鼓樣品示意圖及實驗模型實物圖,如圖1所示。補充一點說明,雖然空鼓樣品的粗糙表面會引起THz波的散射和漫反射,能量被周圍介質吸收或直接耗散到空氣中,但這種耗散的效果對所有空鼓樣品是相同的。因此,表面粗糙度不會影響THz波時間延遲值與空鼓厚度(d_2)間的變化規律。此外,本研究采用的是單點檢測法,THz波的束腰直徑為2 mm,也表明樣品的表面粗糙度影響可以忽略不計。

圖1 空鼓病害示意圖和實驗模型實物圖
利用太赫茲時域光譜系統(THz-TDS 1008)對40個空鼓厚度d_2介于0.1-4 mm,間隔為0.1 mm的空鼓樣品進行THz無損檢測。THz-TDS系統[32]相關參數為:激光中心波長800 nm,脈沖時間100 fs,THz光譜掃描范圍340-420 ps,步長0.02 ps。為了盡可能模擬云岡石窟景區實際環境,設置檢測環境為溫度293 K,相對濕度30%。
為了深入了解砂巖在THz波段的光學特征,首先利用透射式THz-TDS對厚度分別為1.5 mm和2.0 mm的兩片砂巖進行檢測。圖2a和b分別為THz參考光譜和透過片狀砂巖的THz脈沖光譜。THz脈沖通過砂巖片時,由于材料對THz光的吸收和散射引起時域光譜的延遲及強度降低,對應頻域譜中的衰減和振幅降低。接著通過兩片砂巖的THz透射率譜研究其穿透性,如圖2c所示,結果表明:在保持較高信噪比(S/N)的情況下,當厚度從1.5 mm增加到2.0 mm時,THz光仍能有效穿過巖片,表明利用THz信號檢測空鼓樣品的可行性,即THz光穿過空鼓的前壁石層,通過空氣層到達空鼓的背底巖石后,THz信號被反射回來。50%的THz信號透射率保證了THz-TDS系統的正常運行,并保持其自身的高信噪比檢測性能。此外,值得注意的是,砂巖片的折射率在THz波段非常穩定,如圖2d所示。因此,在后續的分析中,根據其穩定的折射率和互相平行的前后表面,可以近似地將砂巖片視為各向同性介質。利用T.D.Dorney[33]提出的太赫茲時域光譜法提取材料光學常數的模型對數據進行處理:

圖2 空鼓樣品片狀石材在太赫茲波段的光學性能

其中n(ω)為樣品在一定頻率下的折射率,φ(ω)為THz光通過樣品的相位延遲,d為樣品厚度。
其中10個空鼓樣品的THz時域信號如圖3所示。圖3右側THz時域信號的時間間隔為370-400 ps。同時由圖1a可以看到,在空鼓樣品中有三個明顯的THz反射脈沖信號(除了當d_2=0 mm時,即沒有空鼓病害)。第一個脈沖信號是由于THz脈沖從空鼓樣品前壁石片的前表面反射而產生的,同樣,空鼓樣品的前壁石片后表面和后壁石層前表面分別產生第二次和第三次反射脈沖信號。由于所有檢測的空鼓樣品的d_1保持不變,使得第一和第二個反射脈沖信號出現的峰值位置是一樣的,而d_2的不同會導致第二和第三個反射脈沖信號之間的時間延遲隨d_2的增大而逐漸增加。此外,據相關文獻介紹,[28,31,34]在時域光譜中,由于樣品和光學元件的標準具效應引起光譜中出現振蕩,導致了樣品的位移峰和在主THz峰后存在子峰。
對應的空鼓樣品參數為:d_1=2 mm,d_2=0~4 mm,d_3=6 mm.
通過以上分析,THz信號可以作為指紋識別技術來識別空鼓樣品,我們的目標是建立一個關于空鼓厚度(d_2)和第三個THz反射脈沖信號時間延遲位置相關的函數關系。然而,樣品的THz時域信號會受到背景噪聲、系統噪聲、樣品散射以及THz脈沖的色散拉伸等因素的影響,導致THz信號包含相位脈沖的部分重疊和移位。這些因素顯著阻礙了正確結論的確定,因此在檢測到的THz信號中,需要采用傳統的反褶積去噪方法來消除噪聲干擾的影響并將其分離出來。[34,35]首先,用空鼓樣品的THz時域信號數據減去參考THz時域信號數據(當d_2=0 mm時),即可以消除第一反射脈沖和環境因素的影響。然而,這種數據處理方法可能不適用于d_2較小的情況,因為它很難區分緊密分布的THz脈沖第二和第三個脈沖信號,如圖3所示。其次,利用第一步的結果數據減去20個d_2在2.1~4.0 mm之間的空鼓樣品信號中第二個THz脈沖數據的平均值。然后得到只有第三個THz反射脈沖的空鼓樣品的THz時域信號數據。對只包含第三個脈沖信息的THz時域信號進行常規去噪處理,得到第三個脈沖信號隨空鼓厚度變化而出時間延遲現象,如圖4所示。

圖3 空鼓樣品的THz時域信號

圖4 只包含樣品的第三個脈沖信息的空鼓樣品的THz時域信號
LS-SVM使用最小二乘線性系統代替傳統支持向量機的二次規劃方法作為損失函數,因此比傳統SVM更簡單。損失函數[27]可以用拉格朗日法求解,得到的分類判別函數為:

其中ai為拉格朗日系數,b為分類閾值,為核函數。核函數的構造是支持向量機的關鍵步驟。線性核,多項式核,徑向基函數核是常見的核函數。因此,分別利用上述三個核函數可以建立三種SVM空鼓病害預測模型。通過留一交叉驗證(LOOCV)方法確定最優模型參數,獲得最優預測結果。最優模型參數包括控制經驗風險的懲罰系數(c),控制誤差邊界的不敏感參數(ε),以及控制支持向量機對輸入變量變化的敏感性的徑向基系數(γ)。[36]
從圖3和圖4可以看出,空鼓樣品第三個THz反射脈沖信號的位置與d_2厚度近似呈線性相關關系。因此,可以將空鼓樣品時域信號中第三個反射脈沖的延遲時間和d_2設置為SVM預測模型分析的向量。為了建立具有任意d_2厚度的SVM空鼓病害預測模型,選取了同一d_1厚度下40個不同d_2厚度的空鼓樣品的THz時域信號。從空鼓樣品時域信號中提取反射波波谷的時間位置,與d_2構成特征向量,然后將特征向量轉換為SVMlight樣本格式。[36]接著從總數據集中隨機選取30組特征向量數據作為訓練樣本,剩下的10組數據作為檢驗樣本,采用LOOCV找出SVM空鼓病害預測模型的最佳參數。LOOCV的過程是這樣的:從這30個數據集中選取29個作為訓練集,剩下的1個作為測試集,然后循環選取下一個數據作為測試集,剩下的29個數據作為訓練集,以此類推直至每個數據都作為測試集,這樣就可以利用LSSVM不斷優化SVM-HDPM的參數。剩下的10組檢驗樣本用于驗證所構建SVM-HDPM的可靠性。
為了定量比較三種預測模型的差異,選擇了主要的建模和評價參數,包括c,ε,γ和均方誤差(MSE)。三種預測模型的相關參數如表1所示。由表1可見,使用線性核函數的SVM-HDPM的MSE最低,僅為3.303 E-4,這表明在三種模型中,SVMHDPM的預測精度最高,優于馮等[37]報道的MSE為0.998的傳統曲線擬合方法。因此,具有線性核函數的SVM-HDPM在預測空鼓厚度方面是最準確的。RBF核函數的SVM-HDPM的預測精度排名第二,多項式核函數的SVM-HDPM的預測精度最低。因此,可以認為線性核函數建立的模型是最適合開發空鼓病害預測模型的方法。在實際應用中,向SVMHDPM輸入時間參數可以預測d_2值,時間參數是空鼓樣本的THz時域信號中第三個脈沖信息的數據。顯然,SVM-HDPM能為文物的及時修復和維護提供有效的參考數據。

表1 不同核函數的三種SVM模型相關參數
實際上,砂巖文物空鼓病害的前壁石層厚度很少是精確等于2 mm。因此,為了滿足現場測試的需求,進行數據預處理是保證數據質量和適用范圍的必要步驟。以厚度為1.5 mm的前壁石層為例。在我們的回歸預測模型(SVM-HDPM)中,第二個反射脈沖是由空鼓樣品前壁石層的后表面產生,即第二個反射脈沖的時間延遲可以表征前壁石層的厚度(d_1)。因此,前壁石層的厚度變化是兩個空鼓樣品THz信號中第二個反射脈沖的時間差(Δt)函數。如圖5所示,插圖中的光譜是主圖像中所選THz光譜對應的范圍,并利用loess(局部加權回歸)方法對其進行了去噪和平滑處理,可以清楚地看到Δt是厚度分別為2 mm和1.5 mm兩個前壁石層的時間延遲差值。因而,將前壁石層厚度為1.5 mm空鼓樣品第三個反射脈沖的時間延遲值加Δt后的數值即可應用已建立好的前壁石層厚度為2 mm空鼓樣品SVM-HDPM進行病害預測。所以,我們將處理后的THz數據轉換為SVMlight樣本格式數據輸入到SVM-HDPM中,通過SVMHDPM的輸出值便可以得到空鼓病害厚度的預測值了,具體流程示意圖如圖6所示。對將前壁石層厚度(d_1)為1.5 mm的5個不同d_2空鼓樣品進行了THz-TDS檢測,并利用SVM-HDPM預測獲得的d_2值與實際值吻合較好,其MSE值為4.46 E-4,這表明SVM_HDPM在空鼓前壁石層厚度較復雜的情況下仍具有良好的適用性和較高預測精度。所以,SVMHDPM可以廣泛應用于石質文物空鼓病害的檢測工程中。

圖5 空鼓樣品中前壁厚度(d_1)分別在1.5 mm和2 mm下的太赫茲時域信號

圖6 SVM-HDPM在空鼓檢測應用中的流程示意圖
選取合適的核函數后,以從石質文物空鼓病害的THz光譜中提取出的特征值作為模型樣本數據,通過LOOCV確定最優參數的LS-SVM回歸算法,在此基礎上,建立了最優的空鼓病害回歸預測模型(SVM-HDPM)。我們所建立的回歸預測模型僅需輸入THz無損檢測所獲得的特征光譜數據,就能準確地預測該處空鼓病害劣化情況。與其他傳統的接觸和侵入式檢測方法相比,基于THz的無損檢測具有非接觸、無損、結構簡單、操作快速、穩定性高、可重復性好等優點。具有預測功能的空鼓病害太赫茲無損檢測技術不僅為石質文物的無損檢測提供了一種新的方法,而且具有良好的實際應用前景和發展前景。