楊德宸,吳 偉,鄔冠華,陳 曦
(南昌航空大學(xué) 無損檢測技術(shù)教育部重點實驗室,江西 南昌 330063)
TC6鈦合金是一種綜合性能良好的馬氏體型αβ兩相鈦合金,在航空航天領(lǐng)域應(yīng)用廣泛。在大型鍛件生產(chǎn)過程中,不同位置材料溫度不均勻,冷卻較慢的內(nèi)部區(qū)域會因材料凝固收縮而產(chǎn)生縮孔、縮松等空洞型微小缺陷。在鍛造變形過程中,由于表面摩擦力大,內(nèi)部變形不均勻性明顯以及內(nèi)外溫差大等,容易在鍛件內(nèi)部產(chǎn)生剪切帶(應(yīng)變線),嚴(yán)重時導(dǎo)致開裂形成微小裂紋缺陷。這些缺陷當(dāng)量尺寸在1 mm左右,屬于微小缺陷,對零件的疲勞強(qiáng)度等力學(xué)性能造成直接影響,是無損檢測的重點。
GJB 2218A—2018《航空用鈦及鈦合金棒材和鍛坯規(guī)范》規(guī)定存在單個平底孔當(dāng)量1.2 mm的缺陷即不符合要求[1]。AMS2631E-2017(R)《Ultrasonic Inspection Titanium and Titanium Alloy Bar,Billet and Plate》中規(guī)定,對于棒材及板材的初級產(chǎn)品,存在當(dāng)量尺寸大于2 mm缺陷即不符合要求;對于管材驗收要求不存在當(dāng)量尺寸大于0.51 mm缺陷[2]。
目前,對鈦合金鍛件常用的無損檢測方法是超聲脈沖反射法。TC6屬典型的粗晶材料,晶粒不均勻帶來的噪聲和結(jié)構(gòu)散射信號非常大,微小缺陷回波幅度較小,難以直接從回波信號中識別微小缺陷的回波[3]。國內(nèi)外學(xué)者從信號提取方面做了大量工作,Rose對超聲信號在金屬內(nèi)的傳播及散射做了詳細(xì)推導(dǎo)[4],Praveen采用改進(jìn)的小波原理對超聲信號去噪[5],句海洋等對變分模態(tài)算法進(jìn)行改進(jìn)優(yōu)化管道損傷信號的提取和濾波效果[6],這些方法可以解決一些缺陷波相對比較明顯的信號,但在處理被淹沒的微小信號處理方面尚顯不足。因此,如何利用超聲信號分析方法發(fā)現(xiàn)工件中是否存在微小缺陷,是產(chǎn)品質(zhì)量檢測中亟需解決的問題。
近年來,基于機(jī)器學(xué)習(xí)的分類方法在超聲檢測信號分析中成為研究熱點,唐國維等將模糊神經(jīng)網(wǎng)絡(luò)與焊縫超聲缺陷信號識別相結(jié)合[7],敬人可等采用聚類分析的方法對未知類型的缺陷信號進(jìn)行分類[8],胡宏偉等使用基于LDP-KPCA特征提取的方法對焊縫超聲信號進(jìn)行缺陷分類[9],這些智能算法從信號本身出發(fā),用信號特征來描述缺陷類別。這些研究成果表明,針對超聲檢測信號,用單分類器可以判別缺陷,但如何提高單分類器的識別精度并作出結(jié)果驗證又是一個值得研究的問題。
本文針對TC6鍛件超聲檢測中微小缺陷回波信號容易完全淹沒在背散射信號中的現(xiàn)象,提出基于KPCA-集成學(xué)習(xí)方法來判別信號中是否存在微小缺陷回波。以背散射信號的高維時頻表征參數(shù)集的核主成分降維結(jié)果作為分類模型輸入,建立BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹和概率神經(jīng)網(wǎng)絡(luò)的單分類模型,以成對差異性度量值為判據(jù),通過加權(quán)投票機(jī)制確定權(quán)值,將單分類器結(jié)果與權(quán)值相結(jié)合構(gòu)建融合決策算法,優(yōu)化判別效果,進(jìn)而有效識別TC6鍛件中是否存在微小缺陷。
超聲探頭發(fā)射聲波入射到材料內(nèi)部中后,當(dāng)聲波在傳播中遇到如組織不均勻、內(nèi)部缺陷及晶粒尺寸方向不同時,當(dāng)兩種差異界面線度與聲波波長相似或更小時會發(fā)生繞射和反射,反射波轉(zhuǎn)化成不同方向散射的波,其中一部分會射向發(fā)射探頭,即背向散射(back scatter,BS)信號,典型的背散射信號如圖1所示。
圖1 超聲背散射信號示意圖
由于背散射信號中的微小缺陷信息會被組織結(jié)構(gòu)噪聲所淹沒,而經(jīng)過濾波后會損失一部分有用信息,不利于微小缺陷的識別和一些后續(xù)的研究,因此需要保證波形完整性,對原始背散射信號在時頻域上進(jìn)行處理,提取相應(yīng)的特征參數(shù)如表1和表2所示。
表1 超聲背散射信號頻域特征參數(shù)集
表2 超聲背散射信號時域特征參數(shù)集
協(xié)方差功率譜密度估計(power of covariance,Pcov)通過協(xié)方差法計算信號序列的功率譜,獲得背散射信號各個頻率成分和頻率分布范圍,能反映背散射信號整體的波動情況;多信號分類法(power of multiple signal classification,Pmusic)根據(jù)信號子空間與噪聲子空間的正交性,構(gòu)造空間譜函數(shù),通過譜峰搜索估計信號頻率分布,對于微小缺陷的突變有很高的分辨率。通過對兩種不同的頻譜分析能夠獲得微小缺陷信號和無缺陷信號的細(xì)微差異。
T1~T9為有量綱特征參數(shù),代表了完整信號的某一指標(biāo)。T10~T13為無量綱特征參數(shù)。其中,峰值因子代表峰值在波形中的極端程度,能夠表現(xiàn)微小缺陷回波與噪聲之間的差異。峭度因子和脈沖因子與峰值因子的物理意義相似,用來檢測信號中有無突出波形,表達(dá)式有較大差異。裕度因子能夠反映微小缺陷回波與噪聲回波的幅值分布情況。
從背散射信號中提取的特征參數(shù)都包含了不同的信息,在缺陷識別時單一特征值具有局限性,而特征參數(shù)集維數(shù)過多又會包含重疊的信息,使模型復(fù)雜化,需要在保留主要信息的同時有效降低輸入?yún)?shù)的維度。
核主成分分析法(kernel principal components analysis,KPCA)是一種非線性推廣的主成分分析。主要思路為:對于輸入空間中的矩陣,先通過非線性映射將全部樣本映射至一個高維特征空間,將其線性可分,之后在這個高維空間實現(xiàn)PCA降維[10]。
為了將樣本x∈Rd轉(zhuǎn)換到維度更高的k維子空間,定義如下非線性映射函數(shù) ?:
其中 ? (x)為高維數(shù)據(jù)矩陣,使用矩陣符號表示協(xié)方差矩陣:
特征向量記為:
由于 Σv=Σλ,兩邊同時除以 ? (X)得:
κ為相似(核)矩陣,使用核函數(shù) κ能避免使用?來精確計算樣本集合X中樣本對之間的點積,這樣則不需對特征向量進(jìn)行精確計算:
使用高斯核函數(shù):
將特征值對應(yīng)的特征向量按降序排列,按照所需選取前p個特征值所對應(yīng)的特征向量,即降維后的數(shù)據(jù)。
由于原始特征參數(shù)集的各個評價指標(biāo)的性質(zhì)不同,其量綱與數(shù)量級也各不相同,數(shù)值較高的參數(shù)會相對削弱數(shù)值較低的參數(shù)。因此,需要使用minmax方法對特征參數(shù)集作標(biāo)準(zhǔn)化,設(shè)x1,x2,···,xn為原始特征參數(shù),則:
新序列y1,y2,···,yn∈[0,1]且無量綱。
微小缺陷超聲信號判別屬于二分類問題,并且訓(xùn)練樣本是已知標(biāo)簽的,同時考慮輸入?yún)?shù)的多維度及模型運行速度,使用穩(wěn)定快速且適合二分類問題的單分類器模型。
1.3.1 支持向量機(jī)
支持向量機(jī)(support vector machine,SVM)是一種二分類模型,基本模型為在特征空間上的間隔最大的線性分類器,學(xué)習(xí)策略為間隔最大化[11]。由于要將低維數(shù)據(jù)映射到高維,在約束問題中內(nèi)積運算十分困難,因此引入核函數(shù)以避免精確計算樣本集合中樣本對之間的點積。
多項式核函數(shù)是一種全局核函數(shù),允許相距很遠(yuǎn)的數(shù)據(jù)點對核函數(shù)的值有影響。d越大,映射的維度越高。
高斯核函數(shù)是一種局部性強(qiáng)的核函數(shù),對數(shù)據(jù)中存在的噪聲有較好的抗干擾能力,應(yīng)用最為廣泛。
1.3.2 BP 神經(jīng)網(wǎng)絡(luò)
BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),其包括輸入層、輸出層和隱含層[12]。將網(wǎng)絡(luò)誤差平方作為目標(biāo)函數(shù),使得網(wǎng)絡(luò)的實際輸出值與期望輸出值的誤差均方差最小,通過反向傳播誤差修正各層單元權(quán)值,不斷調(diào)整至完成訓(xùn)練。
1.3.3 概率神經(jīng)網(wǎng)絡(luò)
概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural network,PNN)是徑向基網(wǎng)絡(luò)的一個分支,屬于前饋神經(jīng)網(wǎng)絡(luò),基于貝葉斯最小風(fēng)險準(zhǔn)則,在多維輸入空間內(nèi)分離決策空間,適用于模式分類[13]。
1.3.4 決策樹
決策樹(decision tree,DT)是一種常用的分類和回歸方法,通常包括:特征選擇、決策樹生成、決策樹修剪三個步驟[14]。根節(jié)點中包括全部數(shù)據(jù)集,在數(shù)據(jù)集中找到一個最優(yōu)特征,根據(jù)最優(yōu)劃分屬性,把數(shù)據(jù)集分成若干子集,劃分到子節(jié)點中,依次遞歸。
為了使融合后的模型對于單分類器的優(yōu)化效果較好,單分類器的判別結(jié)果不能一致或相似,一些分類器能夠?qū)ζ渌诸惼髋袛噱e誤的樣本做出正確的決策。所以需要對單分類器進(jìn)行成對差異性度量。
假設(shè)Da、Db分別為兩種不同的單分類器,其對缺陷信號的判別結(jié)果見表3。
表3 2種單分類器判別結(jié)果
其中,樣本總數(shù)N=N11+N01+N10+N00
根據(jù)Q統(tǒng)計方法的定義,兩個分類器Da和Db的差異性為
Qa,b的值在[–1,1]之間變化,如果這兩個分類器相互獨立,則它們的Q統(tǒng)計量的值為0;Qa,b的絕對值越大,則兩個分類器對同樣樣本的判斷越接近,差異性就越小。
集成學(xué)習(xí)的主要思想是將多種單分類器融合,根據(jù)單分類器不同的特點和其判定結(jié)果,通過一定方法融合形成最后的分類判別結(jié)果。針對學(xué)習(xí)過程分為:存在強(qiáng)依賴關(guān)系,必須串行生成的序列化方法;不存在強(qiáng)依賴關(guān)系,能夠同時生成的并行化方法。選取使用決策層作為輸出的融合模型。常用的多分類器融合方法有平均法、投票法、學(xué)習(xí)法。典型的集成學(xué)習(xí)結(jié)構(gòu)見圖2。
圖2 典型集成學(xué)習(xí)結(jié)構(gòu)
加權(quán)投票法根據(jù)各個單分類器不同的特點和效果,給定不同權(quán)值,結(jié)合權(quán)重和投票得到最終結(jié)果。
根據(jù)單分類器判別結(jié)果的準(zhǔn)確率,給予它們相應(yīng)的權(quán)值系數(shù),通過加權(quán)投票得到最終的融合模型。
具體流程如下:
1)使用訓(xùn)練集對各個單分類器進(jìn)行測試,得到其判別準(zhǔn)確率分別為P1,P2,···,Pi。
2)根據(jù)單分類器的準(zhǔn)確率計算權(quán)重系數(shù):
其權(quán)重系數(shù)之和為1。
3)根據(jù)式(13)計算出的權(quán)重系數(shù),與單分類器相結(jié)合,得到最終融合模型判別公式為:
選取 TC6 鍛棒,切割成尺寸為 25 mm×19 mm×15 mm的長方體試塊,采用人工構(gòu)造缺陷,在試樣中心位置打孔,孔深 12 mm,直徑分別為0.6 mm、0.8 mm、1.0 mm。共制備無缺陷試樣 20 塊,不同當(dāng)量缺陷試樣各10塊,共計50塊,試樣見圖3。
圖3 TC6鍛件試樣圖
采用水浸超聲掃查方式,主要裝置有OLYMPUS公司的5077PR脈沖信號發(fā)生器,PicoScope3204D超聲采集卡,使用OlympusA112s水浸聚焦探頭,激發(fā)頻率為 10 MHz,晶片尺寸 0.25 in(1 in=2.54 cm)。采用激勵觸發(fā)方式,采樣頻率 500 MHz,增益 59 dB。檢測示意圖見圖4。
圖4 檢測示意圖
分別對有缺陷與無缺陷試樣不同區(qū)域位置采集信號,其檢測信號如圖5和圖6所示。
圖5 無微小缺陷超聲信號
圖6 含微小缺陷超聲信號
在探頭有效面積下分別對有缺陷與無缺陷試樣進(jìn)行重復(fù)采樣,得到超聲信號3000個,其中有微小缺陷和無缺陷信號各1500個,其中各取900個為訓(xùn)練集樣本,600個作為檢驗集樣本。訓(xùn)練集共計1800個樣本,檢驗集共計1200個樣本。對其進(jìn)行時頻域處理后提取特征參數(shù)見表4。
表4 原始特征參數(shù)集
從表4可以看出,各個特征參數(shù)之間具有不同的數(shù)量級,對數(shù)據(jù)分析不利。需要對其標(biāo)準(zhǔn)化后進(jìn)行KPCA處理,得到其主成分與貢獻(xiàn)率見表5。
表5 各個主成分貢獻(xiàn)率
主成分的貢獻(xiàn)率是指某個主成分的方差在總方差中所占的比例,反映了主成分綜合原始變量信息的能力,主成分的貢獻(xiàn)率越高,其中包含的原始數(shù)據(jù)的信息越多。選取累計貢獻(xiàn)率達(dá)到91.1%的前3個主成分,其降維結(jié)果見圖7。
圖7 KPCA降維圖
圖7中三軸坐標(biāo)分別代表3個主成分的得分,藍(lán)色箭頭代表每一個原始特征參量對主成分的載荷,能夠反映兩者的關(guān)聯(lián)程度。從圖中可以看出原始特征在不同方向均有適當(dāng)?shù)妮d荷,說明降維后很好地保留了其原有的信息,可以將3個主成分作為新的輸入特征參數(shù)。
選擇6種單分類器進(jìn)行測試,其中BP_1隱含層數(shù)量為10,采用梯度下降法進(jìn)行訓(xùn)練;BP_2隱含層數(shù)量為15,采用Powell-Beale共軛梯度法進(jìn)行訓(xùn)練。SVM_1使用高斯核函數(shù);SVM_2使用多項式核函數(shù)。概率神經(jīng)網(wǎng)絡(luò)訓(xùn)練的擴(kuò)展速度設(shè)為0.3。決策樹算法通過迭代確定最小葉子節(jié)點數(shù)為13,以此進(jìn)行剪枝。
假設(shè)有缺陷信號判別正確的樣本為M1,無缺陷信號判別為有缺陷的樣本為M2,無缺陷信號判別正確的樣本為M3,有缺陷信號判別為無缺陷的樣本為M4。則敏感度表示正確識別有缺陷信號的能力:
特異性表示正確判別無缺陷信號的能力,為:
準(zhǔn)確率表示對兩種信號正確判別的能力,為:
訓(xùn)練集判別準(zhǔn)確率及特異性、敏感度見表6。
表6 訓(xùn)練集單分類器模型判別結(jié)果
通過訓(xùn)練集結(jié)果,根據(jù)式(11)求得各個單分類器的成對差異性度量值見表7。
表7 各單分類器差異性度量值
由表7可知,BP_2和SVM_2的判別結(jié)果基本相同,不具有一定的差異性,但BP_2與PNN、決策樹、SVM_1都具有較好的差異性,BP_1雖然與決策樹、SVM_2具有較好的差異性,但與 PNN、SVM_1判別結(jié)果類似。經(jīng)比較分析,最后采用SVM_1、BP_2、決策樹、PNN這4種單分類器模型,相互之間具有較好的差異性,且建模集、檢驗集準(zhǔn)確率均較高。
根據(jù)單分類準(zhǔn)確率按式(13)計算出4種單分類器的權(quán)重分別為 0.2451、0.2542、0.2485、0.2522,通過此權(quán)值系數(shù)與單分類器的判別結(jié)果,可得到融合后的最終模型的判別公式為:
使用訓(xùn)練集數(shù)據(jù)對融合模型進(jìn)行測試,其結(jié)果的混淆矩陣見圖8。
圖8 訓(xùn)練集融合模型結(jié)果
從圖8可以看出,融合模型的準(zhǔn)確率為95.8%,根據(jù)式(15)、(16)計算敏感度為97.4%,特異性為94.5%。對于有缺陷信號和無缺陷信號的判別效果好,相對于單分類器有較大提高。
檢驗集是指沒有參與過模型訓(xùn)練的集合,可能用來檢驗?zāi)P妥R別能力,從前述1200個檢驗集中每次隨機(jī)抽取600個不同的樣本作為測試集,對融合模型和4種單分類器測試10次,取其結(jié)果平均值見表8。
表8 10次測試集判別結(jié)果均值
由表8可以看出,單個分類器中的最高準(zhǔn)確率為88.8%,經(jīng)過融合后的分類模型檢驗集準(zhǔn)確率為95.6%,通過融合后的模型判別準(zhǔn)確率提高了6.8%,說明經(jīng)過融合后的判別模型能夠集成原始單分類器的信息和結(jié)果,提高了對實際檢測信號缺陷分類判別的準(zhǔn)確性。
對于融合后的分類模型,不止要求對單次分類的準(zhǔn)確率提高,并且應(yīng)該考慮模型的泛化問題,即對于新增樣本的適應(yīng)能力。模型的穩(wěn)定性,即對于多次新輸入數(shù)據(jù)的判別準(zhǔn)確性也是評價模型效果的一個重要指標(biāo)。4種單分類模型和融合模型對10次不同測試集進(jìn)行缺陷信號判別的結(jié)果見圖9。
圖9 各分類模型測試準(zhǔn)確率
從圖9中可以看出,融合模型對新的測試集均能夠有效進(jìn)行判別,泛化能力較好。在10組檢驗集測試中,融合模型的準(zhǔn)確率均最高。各單分類器和融合模型的標(biāo)準(zhǔn)差、離散系數(shù)見表9。
表9 5種模型準(zhǔn)確率的標(biāo)準(zhǔn)差及離散系數(shù)
由表9可以看出,經(jīng)過融合后的判別模型準(zhǔn)確率的標(biāo)準(zhǔn)差和離散系數(shù)均最低,說明經(jīng)過融合后的模型判別穩(wěn)定性也比單個分類器要好。
本文針對TC6鍛件超聲背散射信號中微小缺陷回波信號被噪聲淹沒而無法判別是否存在微小缺陷,提出基于KPCA-集成學(xué)習(xí)的超聲背散射信號判別TC6鍛件是否存在微小缺陷的方法,通過實驗研究得出以下結(jié)論:
1)通過KPCA對原始背散射信號高維時頻域參量進(jìn)行降維處理,在保證原有信息完整性的前提下能夠有效簡化模型的輸入?yún)?shù)。
2)根據(jù)集成學(xué)習(xí)的思想,通過加權(quán)投票機(jī)制由單個分類器的準(zhǔn)確率確定其權(quán)值系數(shù),將4種具有一定差異性的單分類模型進(jìn)行融合得到新的模型,通過選取和構(gòu)建不同的測試集對單分類模型及融合模型進(jìn)行判別測試,融合模型的準(zhǔn)確率達(dá)到95.8%,有了較大提高。
3)針對新的數(shù)據(jù),融合模型泛化能力較好,能夠使各個單分類器之間的性能互補,提高了融合模型的穩(wěn)定性。經(jīng)過多分類器融合后的模型判別TC6鍛件微小缺陷信號是可行的,比單分類器有優(yōu)勢,能夠有效判別出試樣是否存在0.6~1.0 mm的微小缺陷,達(dá)到更高的標(biāo)準(zhǔn)要求,為鈦合金材料微小缺陷的判別提供了一種更為客觀有效的方法。