李 偉,楊向東,陳 懇
(清華大學(xué) 機(jī)械工程系,北京 100084)
心音由心臟發(fā)出,包含其活動(dòng)的豐富信息,因此對(duì)心臟疾病的診斷具有重要指示作用,通常被醫(yī)生作為初步診斷的主要依據(jù)。然而目前心音診斷通常只能在醫(yī)院由經(jīng)驗(yàn)豐富的醫(yī)生進(jìn)行,這些限制不利于人們及時(shí)發(fā)現(xiàn)心臟異常并進(jìn)行有效的預(yù)防和治療。隨著大數(shù)據(jù)和機(jī)器學(xué)習(xí)的發(fā)展,自動(dòng)的心音診斷逐漸成為研究熱點(diǎn),研究者們嘗試使用人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、k近鄰、決策樹(shù)[1,2]等對(duì)心音進(jìn)行自動(dòng)分類(lèi),使人們可以更方便的進(jìn)行心音聽(tīng)診,從而幫助發(fā)現(xiàn)心臟疾病并進(jìn)行提前預(yù)防。目前心音自動(dòng)分類(lèi)的方法可分為兩類(lèi),一類(lèi)是兩階段方法,它們首先對(duì)心音數(shù)據(jù)進(jìn)行分割然后將各段的特征送入分類(lèi)器進(jìn)行判斷。這些方法使用的心音分割方法各不相同,比如有人使用k近鄰和濾波的方法來(lái)分割心音,而Kay等[3]使用基于隱馬爾科夫模型的方法,分割心音后研究者們?nèi)鏜ichael等[4]進(jìn)一步提取各階段的梅爾倒譜系數(shù)和小波系數(shù)等作為特征,構(gòu)造合理的分類(lèi)器并訓(xùn)練,最后得到一個(gè)自動(dòng)分類(lèi)心音的模型。還有研究者在心音分割后使用簡(jiǎn)單的CNN或RNN提取特征,結(jié)合其它網(wǎng)絡(luò)和規(guī)則器共同分類(lèi),達(dá)到了目前效果最好的86.0%的分類(lèi)準(zhǔn)確率[5]。另一類(lèi)是單階段方法,這類(lèi)方法直接對(duì)完整心音數(shù)據(jù)提取特征然后進(jìn)行分類(lèi)[6,7],這類(lèi)方法中最好的結(jié)果是85.2%[7]。由于單階段的方法不存在心音分割過(guò)程,卷積結(jié)構(gòu)可以更好提取全局特征,因此也有研究者使用CNN直接處理心音數(shù)據(jù)變換得到的聲譜圖,利用卷積結(jié)構(gòu)對(duì)圖像特征的強(qiáng)大提取能力,即使沒(méi)有特別的選擇特征,這些方法的平均準(zhǔn)確率也可達(dá)到80%[8-10]。整體來(lái)講,單階段方法流程簡(jiǎn)單,與心音分割方法解耦,然而目前效果略差于兩階段方法,考慮到未經(jīng)分割的心音數(shù)據(jù)保留了更多的全局信息,若可以充分挖掘其中的信息,可能會(huì)對(duì)分類(lèi)產(chǎn)生較大幫助。因此為進(jìn)一步提升分類(lèi)準(zhǔn)確率,本文專(zhuān)注于未經(jīng)分割的心音數(shù)據(jù),構(gòu)造一個(gè)同時(shí)包含CNN和RNN的新型網(wǎng)絡(luò),直接對(duì)完整心音數(shù)據(jù)提取特征并做分類(lèi),達(dá)到了目前單階段方法中的最好效果。
為從完整心音中提取更多的有效信息來(lái)做分類(lèi),同時(shí)簡(jiǎn)化心音分類(lèi)的整體流程,本文提出一種基于CNN和RNN聯(lián)合網(wǎng)絡(luò)的單階段自動(dòng)分類(lèi)方法。目前的兩類(lèi)方法中,兩階段方法過(guò)于復(fù)雜,分類(lèi)之前需要額外的心音分割過(guò)程,這里心音分割是指將一個(gè)完整的心音周期根據(jù)不同特性劃分為4個(gè)時(shí)期,分別是第一心音期、收縮期、第二心音期和舒張期。分割后從各個(gè)時(shí)期提取特征再做分類(lèi),這與醫(yī)生聽(tīng)診的過(guò)程更加相似,因此準(zhǔn)確率相對(duì)較高。單階段方法直接對(duì)未分割的心音做分類(lèi),雖然減少了各時(shí)期的監(jiān)督信息,但完整的心音又增添了全局的特征,如果能使用有效的特征提取手段利用這些信息,必將得到更好的分類(lèi)結(jié)果。目前單階段方法中提取特征的過(guò)程比較簡(jiǎn)單,直接導(dǎo)致分類(lèi)結(jié)果較差。因此本文構(gòu)造具備強(qiáng)大能力的網(wǎng)絡(luò)進(jìn)行特征提取并分類(lèi)。
隨著深度學(xué)習(xí)和大數(shù)據(jù)的發(fā)展,CNN和RNN在圖像及語(yǔ)音方面發(fā)揮著越來(lái)越重要的作用,依托于強(qiáng)大的特征提取能力,它們能夠自動(dòng)學(xué)習(xí)到有效特征,從而使研究者擺脫手動(dòng)構(gòu)造特征的繁瑣過(guò)程。一般來(lái)講,CNN使用堆疊的卷積核逐層的提取特征,每個(gè)卷積核只專(zhuān)注于一種特征,它們?cè)趫D像各處共享權(quán)值,相較于全連接的神經(jīng)網(wǎng)絡(luò),CNN提高了特征提取效率并極大減少了計(jì)算量,能夠高效處理網(wǎng)格化的數(shù)據(jù);而RNN采用循環(huán)單元作為結(jié)構(gòu)的核心,每個(gè)單元都接收當(dāng)前時(shí)間步的輸入和上個(gè)時(shí)間步處理后的狀態(tài)作為輸入,由于增加了各個(gè)時(shí)間步之間的關(guān)聯(lián),RNN可較好處理具有時(shí)序關(guān)系的序列。它們已經(jīng)成功的應(yīng)用到諸多領(lǐng)域,比如目標(biāo)檢測(cè),語(yǔ)音識(shí)別和機(jī)器翻譯等。然而目前利用深度學(xué)習(xí)進(jìn)行心音自動(dòng)分類(lèi)的方法只是單獨(dú)使用最樸素的CNN或者RNN,并沒(méi)有充分發(fā)揮這些網(wǎng)絡(luò)的優(yōu)勢(shì)。另外,從之前的研究來(lái)看,無(wú)論是單階段還是兩階段方法,一般效果較好的模型都是同時(shí)利用時(shí)域和頻域特征,因此本文充分利用CNN和RNN的特性,提出使用CNN提取頻域特征,使用RNN提取時(shí)域特征,然后將兩組特征融合后再做分類(lèi)的方法,為了減輕模型的過(guò)擬合現(xiàn)象,本文還特別地使用了音頻增強(qiáng)的方法,使得模型更加魯棒。總體來(lái)講,本文提出了一個(gè)單階段心音分類(lèi)方法,利用精調(diào)參數(shù)的CNN和RNN分別來(lái)提取時(shí)頻特征并輔以音頻增強(qiáng)的方法進(jìn)行訓(xùn)練,相對(duì)于單獨(dú)使用CNN或RNN的模型,平均分類(lèi)準(zhǔn)確率有較大的提升。這里的平均分類(lèi)準(zhǔn)確率作為評(píng)價(jià)指標(biāo)指的是分類(lèi)器對(duì)正常和異常樣本預(yù)測(cè)準(zhǔn)確率的平均值,相對(duì)于總的準(zhǔn)確率,該指標(biāo)對(duì)于不平衡的樣本分布有更好的指示作用。
本文提出的單階段心音分類(lèi)方法,構(gòu)建了同時(shí)包含CNN和RNN的新型分類(lèi)網(wǎng)絡(luò),精細(xì)的調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),并在訓(xùn)練時(shí)輔以音頻數(shù)據(jù)增強(qiáng),避免模型出現(xiàn)過(guò)擬合現(xiàn)象。基于以上創(chuàng)新點(diǎn),本文最終得到了目前單階段方法中分類(lèi)效果最好的模型。文中使用的數(shù)據(jù)來(lái)源于PhysioNet Challenge 2016的數(shù)據(jù)集,其專(zhuān)門(mén)為研究者提供各種現(xiàn)實(shí)場(chǎng)景下的心音數(shù)據(jù),主要包括異常、正常兩大類(lèi),同時(shí)還包含少量的不確定樣本,目前被研究者廣泛使用。上述文獻(xiàn)的諸多方法也都使用了該數(shù)據(jù)集,這使得各實(shí)驗(yàn)結(jié)果具有可比性。這部分本文將從數(shù)據(jù)預(yù)處理、分類(lèi)網(wǎng)絡(luò)構(gòu)建、數(shù)據(jù)增強(qiáng)訓(xùn)練及樣本預(yù)測(cè)4個(gè)方面來(lái)詳細(xì)介紹提出的心音自動(dòng)分類(lèi)方法。
從PhysioNet中獲取的數(shù)據(jù)包含一些長(zhǎng)度不等的心音片段和相應(yīng)的類(lèi)別標(biāo)簽,其中心音數(shù)據(jù)的采樣頻率是2000 Hz,長(zhǎng)度為20 s到60 s不等。為了保證輸入網(wǎng)絡(luò)的數(shù)據(jù)維度固定,本文將一段心音數(shù)據(jù)以5 s為間隔進(jìn)行劃分,根據(jù)醫(yī)學(xué)專(zhuān)家的經(jīng)驗(yàn),5 s的時(shí)間至少包含了一個(gè)完整的心音周期,因此該劃分不會(huì)破壞心音的全局信息,依舊保持單階段方法的特性。另外,原始心音數(shù)據(jù)的振幅分布在-5000到5000之間,為使后續(xù)網(wǎng)絡(luò)訓(xùn)練快速收斂,需要用下式將它歸一化到標(biāo)準(zhǔn)的(0,1)分布
(1)
其中,μ代表均值,σ代表方差。最后將數(shù)據(jù)變換為CNN和RNN要求的輸入形式,對(duì)于RNN的輸入,本文將5 s的心音數(shù)據(jù)劃分為20個(gè)時(shí)間步(圖1)。對(duì)于CNN的輸入,本文采用短時(shí)傅里葉變換(STFT)將其轉(zhuǎn)化為聲譜圖(圖2),具體計(jì)算方法如下

(2)
其中,w代表窗函數(shù),一般選擇矩形窗,m和k分別代表時(shí)間和頻率。變換后的數(shù)據(jù)粗略包含了心音在各時(shí)刻的頻率信息,而它所具備的網(wǎng)格化形式恰好是CNN最擅長(zhǎng)處理的。

圖1 RNN輸入

圖2 CNN輸入
此處建立的分類(lèi)模型是本文的一個(gè)重要?jiǎng)?chuàng)新點(diǎn),利用CNN和RNN強(qiáng)大的特征提取能力,直接從原始數(shù)據(jù)出發(fā)做心音正常和異常的分類(lèi),省略了復(fù)雜的心音分割和特征提取步驟,充分利用心音數(shù)據(jù)的全局特性并同時(shí)提取頻域和時(shí)域信息,最終得到了單階段心音分類(lèi)方法中的最好效果。具體來(lái)講,本文的分類(lèi)模型可以被劃分為3個(gè)模塊,分別是CNN頻域特征提取模塊、RNN時(shí)域特征提取模塊和全連接分類(lèi)模塊,在訓(xùn)練的過(guò)程中這3個(gè)模塊可以同時(shí)更新參數(shù),協(xié)同做好心音自動(dòng)分類(lèi)任務(wù),其整體結(jié)構(gòu)如圖3所示。接下來(lái)分別介紹3個(gè)模塊。

圖3 方法整體結(jié)構(gòu)
1.2.1 CNN頻域特征提取模塊
此模塊的輸入是聲譜圖,主要用來(lái)提取心音的頻率信息,其結(jié)構(gòu)見(jiàn)表1,其中s,c分別代表卷積的步幅和輸出通道數(shù),數(shù)據(jù)維度中的4個(gè)量分別代表樣本數(shù)量、圖像寬、高以及輸出通道數(shù)。卷積操作中除了第一層采用了5×5的卷積核,大多采用的是3×3的卷積核。考慮到聲譜圖特殊的紋理結(jié)構(gòu),這里還特別的添加了1×3和3×1的卷積核,這樣既減少了參數(shù)量和計(jì)算量,又使得網(wǎng)絡(luò)加深,增強(qiáng)網(wǎng)絡(luò)的非線性和擬合能力,后續(xù)實(shí)驗(yàn)也說(shuō)明這樣的網(wǎng)絡(luò)結(jié)構(gòu)確實(shí)對(duì)分類(lèi)有幫助。除此之外,在最后的全連接層,本文還添加了dropout結(jié)構(gòu),以避免網(wǎng)絡(luò)出現(xiàn)過(guò)擬合現(xiàn)象。最終網(wǎng)絡(luò)通過(guò)一系列操作輸出維度為8的頻域特征向量。

表1 CNN模塊結(jié)構(gòu)說(shuō)明
1.2.2 RNN時(shí)域特征提取模塊
此模塊的輸入是經(jīng)過(guò)處理的振動(dòng)波形,主要用來(lái)提取心音的時(shí)域信息,其結(jié)構(gòu)見(jiàn)表2,其中sequence用來(lái)標(biāo)識(shí)循環(huán)單元對(duì)每個(gè)時(shí)間步是否都有輸出,數(shù)據(jù)維度的3個(gè)量分別代表樣本數(shù)量、時(shí)間步數(shù)和特征維度。本文采用具有長(zhǎng)短期記憶的循環(huán)單元(LSTM)作為該模塊的基本結(jié)構(gòu),它是RNN的改進(jìn)版本。相比之下,LSTM添加了門(mén)控單元調(diào)整信息流的傳遞過(guò)程,解決了RNN固有的梯度消失和梯度爆炸的問(wèn)題,從而保證信息可在多個(gè)時(shí)間步共享,效果更好。這里采用兩層堆疊的LSTM,為了保證網(wǎng)絡(luò)能快速收斂且具有更強(qiáng)的泛化能力,還特別添加了batch norm,同時(shí)在LSTM內(nèi)部也增加了dropout以緩解過(guò)擬合現(xiàn)象。最終網(wǎng)絡(luò)輸出的是維度為8的時(shí)域特征向量。

表2 RNN模塊結(jié)構(gòu)說(shuō)明
1.2.3 全連接分類(lèi)模塊
此分類(lèi)模塊相當(dāng)于多層感知機(jī),輸入是上述兩模塊產(chǎn)生的特征向量拼接后的特征,經(jīng)過(guò)由8個(gè)神經(jīng)元組成的隱藏層,最終輸出該樣本屬于正常的概率,模型結(jié)構(gòu)如圖4所示。

圖4 全連接網(wǎng)絡(luò)
通過(guò)建立以上3個(gè)模塊,即可得到本文的分類(lèi)模型。其數(shù)學(xué)模型可簡(jiǎn)單表示如下
feat1=H1(stft(data))
feat2=H2(split(data))
pre=H3(feat1,feat2)
(3)
其中,H1,H2,H3分別是CNN模塊,RNN模塊以及全連接分類(lèi)模塊代表的變換函數(shù);stft和split代表將原始數(shù)據(jù)變換成網(wǎng)絡(luò)輸入的操作,即短時(shí)傅里葉變換和波形分割操作。模型訓(xùn)練是通過(guò)梯度下降法更新3個(gè)模塊的參數(shù),使式(4)代表的損失函數(shù)降到最低
(4)
經(jīng)過(guò)預(yù)處理得到的數(shù)據(jù)集,正負(fù)樣本的比例大概在 4∶1,屬于不平衡樣本的情況,訓(xùn)練時(shí)使用過(guò)采樣方法使得每批正負(fù)樣本大致保持在1∶1,這樣可以有效提高分類(lèi)器對(duì)于負(fù)樣本的判斷能力。另外,考慮到原始數(shù)據(jù)樣本有限,本文采用了類(lèi)似在圖像分類(lèi)時(shí)使用的數(shù)據(jù)增強(qiáng)方法,對(duì)原有的心音數(shù)據(jù)進(jìn)行擴(kuò)充,以進(jìn)一步減輕網(wǎng)絡(luò)的過(guò)擬合現(xiàn)象。為了不改變心音數(shù)據(jù)的原有標(biāo)簽,本文使用3種方法進(jìn)行音頻數(shù)據(jù)增強(qiáng)。第一,添加微弱白噪聲,如式(5)所示,此操作有利于減輕模型的過(guò)擬合,同時(shí)可以模擬心音數(shù)據(jù)質(zhì)量稍差的情形
xp=x+white_noise
(5)
其次是將心音數(shù)據(jù)左移或右移,類(lèi)似數(shù)據(jù)的位移操作,但需要將數(shù)據(jù)溢出邊界的部分補(bǔ)充到數(shù)據(jù)的另一端。除此之外還可在音頻首端或尾端添加一段0振幅數(shù)據(jù),以模擬某些時(shí)刻心音數(shù)據(jù)只是大部分完整,而首端或尾端沒(méi)有記錄的情況。考慮實(shí)際的效率和效果,本文將前兩個(gè)增強(qiáng)操作作用在分割為5 s片段前,最后一個(gè)作用在分割為5 s片段后。
訓(xùn)練好的模型具備對(duì)一段固定長(zhǎng)度為5 s的心音數(shù)據(jù)進(jìn)行分類(lèi)的能力。當(dāng)對(duì)一個(gè)完整心音樣本進(jìn)行分類(lèi),首先要按照上述的數(shù)據(jù)預(yù)處理方法得到多個(gè)心音片段,接著利用訓(xùn)練好的模型對(duì)各個(gè)片段進(jìn)行預(yù)測(cè),最后根據(jù)設(shè)定的規(guī)則將這些結(jié)果轉(zhuǎn)化為最后對(duì)樣本的判斷結(jié)果。此處的規(guī)則可以有多種設(shè)定方式,可以采用投票機(jī)制,即選擇這些片段的多數(shù)類(lèi)別作為最終的樣本類(lèi)別,也可采用平均各片段分類(lèi)概率的方法,把平均后的結(jié)果當(dāng)作這個(gè)樣本屬于正常的概率,然后根據(jù)分類(lèi)閾值確定樣本的最終類(lèi)別結(jié)果。獲取一個(gè)樣本類(lèi)別結(jié)果的規(guī)則一般都是人為設(shè)定,上述兩個(gè)規(guī)則各有利弊,對(duì)最終的結(jié)果影響不大,本文選擇平均各段的結(jié)果得到樣本的類(lèi)別概率。后續(xù)如果研究者找到更合理的規(guī)則設(shè)定,更改此處預(yù)測(cè)樣本類(lèi)別的規(guī)則將有利于提升整體的分類(lèi)準(zhǔn)確率。
本文首先將PhysioNet 2016上的所有心音數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集和測(cè)試集分別占比為90%和10%。其中,測(cè)試集用于最終測(cè)試模型的性能,為確保結(jié)果的合理性,須嚴(yán)格保證訓(xùn)練時(shí)不可見(jiàn)。接著將用于訓(xùn)練的各心音分割為長(zhǎng)度為5 s的片段,把所有的片段再劃分為訓(xùn)練集和驗(yàn)證集,兩者分別占比為80%和20%,這里額外構(gòu)造驗(yàn)證集是為了避免模型出現(xiàn)過(guò)擬合,同時(shí)可以挑選更優(yōu)的模型超參數(shù)。這部分通過(guò)展示一些實(shí)驗(yàn)結(jié)果,驗(yàn)證本文采用的網(wǎng)絡(luò)結(jié)構(gòu)確實(shí)具有優(yōu)越性。
針對(duì)CNN模型的結(jié)構(gòu),考慮到長(zhǎng)條形的卷積更符合聲譜圖帶狀的特點(diǎn),其提取特征的效果可能更好,因此本文比較了3×3和1×3,3×1的卷積的效果,為了實(shí)驗(yàn)簡(jiǎn)單快速,此處只利用CNN特征進(jìn)行分類(lèi),在計(jì)算量和參數(shù)量幾乎相同的情況下,模型訓(xùn)練5輪,兩者的比較結(jié)果見(jiàn)表3,對(duì)照組采用3×3的卷積直接輸出64通道的特征圖,實(shí)驗(yàn)組采用先使用3×3的卷積輸出32通道的特征圖,然后再經(jīng)過(guò)3×1和1×3的長(zhǎng)條形卷積輸出64通道的特征圖。由于每個(gè)心音樣本的預(yù)測(cè)準(zhǔn)確率直接依賴于分割后各心音片段的預(yù)測(cè)準(zhǔn)確率,因此這里的評(píng)價(jià)標(biāo)準(zhǔn)直接使用模型在驗(yàn)證集的判斷準(zhǔn)確率(下同)。通過(guò)比較準(zhǔn)確率可知,添加長(zhǎng)條形的卷積在心音的聲譜圖上確實(shí)有更好的表現(xiàn)。

表3 CNN結(jié)構(gòu)比較
通常研究者在使用RNN時(shí)很少添加額外的結(jié)構(gòu),本文嘗試在RNN模塊中添加一些常見(jiàn)的有效單元,并驗(yàn)證它們是否可以提升模型的效果。本文主要比較了添加batch norm、dropout以及不添加的兩種結(jié)構(gòu),batch norm有利于模型各層之間的解耦,加速訓(xùn)練過(guò)程并提升分類(lèi)準(zhǔn)確率;而dropout單元在訓(xùn)練時(shí)可隨機(jī)屏蔽一些神經(jīng)元,起到正則化的作用從而避免模型過(guò)擬合。它們?cè)谌B接網(wǎng)絡(luò)中作用顯著,但在RNN上的效果學(xué)界還未有定論。從表4的結(jié)果可以看出,在添加較少計(jì)算量的情況下,這些結(jié)構(gòu)確實(shí)可在本文的RNN模塊上起作用,它們減弱了模型的過(guò)擬合,同時(shí)提高了模型準(zhǔn)確率。關(guān)于這些結(jié)構(gòu)是否對(duì)于其它的RNN模型都起作用,值得研究者們繼續(xù)探討研究。

表4 RNN結(jié)構(gòu)比較
音頻數(shù)據(jù)增強(qiáng)是本文的另一個(gè)重要?jiǎng)?chuàng)新點(diǎn),雖然從表5得知它并沒(méi)有大幅提高分類(lèi)準(zhǔn)確率,但它可以使得模型學(xué)習(xí)到更多的合理數(shù)據(jù)從而減輕過(guò)擬合現(xiàn)象,隨著更大的模型在音頻數(shù)據(jù)上使用,音頻數(shù)據(jù)增強(qiáng)必定是一個(gè)重要的研究方向,本文采用的音頻增強(qiáng)操作比較簡(jiǎn)單,希望可以為研究者們提供一些方向和思路。
在本次實(shí)驗(yàn)中,本文從已有的心音樣本中隨機(jī)選擇10%當(dāng)作測(cè)試樣本,這部分不參與訓(xùn)練。訓(xùn)練好模型后,采用對(duì)完整心音樣本進(jìn)行預(yù)測(cè)的方法對(duì)心音進(jìn)行分類(lèi),最終得到平均分類(lèi)準(zhǔn)確率為85.7%,達(dá)到了目前單階段心音分類(lèi)方法的最好效果,并且與最好的兩階段分類(lèi)方法也非常接近,表5比較了多個(gè)單階段心音自動(dòng)分類(lèi)方法的性能。

表5 各方法性能比較
總結(jié)來(lái)說(shuō),本文提出的直接從心音數(shù)據(jù)出發(fā)的自動(dòng)分類(lèi)方法,不依賴于心音分割,同時(shí)使用CNN和RNN提取頻域和時(shí)域特征,并且更加精細(xì)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)和超參數(shù),如使用長(zhǎng)條形的卷積、設(shè)置dropout和batch normalization結(jié)構(gòu)等,并輔以音頻數(shù)據(jù)增強(qiáng)進(jìn)行訓(xùn)練,使網(wǎng)絡(luò)充分學(xué)習(xí)了數(shù)據(jù)與標(biāo)簽的潛在函數(shù)關(guān)系,達(dá)到了目前單階段分類(lèi)方法中的最好效果。本文提出的方法,將有助于打破心音聽(tīng)診只能在醫(yī)院進(jìn)行的限制,但要使心音自動(dòng)聽(tīng)診真正走進(jìn)家庭,研究者們還需進(jìn)一步提升心音分類(lèi)的準(zhǔn)確率。
隨著生活水平的提高,人們對(duì)自身健康越來(lái)越關(guān)注,心音診斷作為監(jiān)測(cè)心臟相關(guān)疾病的重要手段自然也引起人們的廣泛關(guān)注。通常的心音診斷活動(dòng)只能在醫(yī)院由經(jīng)驗(yàn)豐富的醫(yī)生進(jìn)行,而心音自動(dòng)診斷能夠幫助人們?cè)诟鱾€(gè)場(chǎng)所方便的進(jìn)行心音異常檢測(cè),從而更加有效地保障人們的心臟健康。借助于深度學(xué)習(xí)和大數(shù)據(jù)的發(fā)展,本文在之前方法的基礎(chǔ)上,提出了一種不依賴于分割的自動(dòng)心音判斷方法,充分利用心音的全局信息,使用CNN和RNN自動(dòng)提取的時(shí)頻特征并輔以數(shù)據(jù)增強(qiáng)的方法進(jìn)行訓(xùn)練,最后得到了較高的分類(lèi)準(zhǔn)確率。這對(duì)心音輔助聽(tīng)診會(huì)有不小的幫助,有利于人們及時(shí)準(zhǔn)確的發(fā)現(xiàn)心臟異常并提早預(yù)防。在本文研究的基礎(chǔ)上,研究者可進(jìn)一步開(kāi)發(fā)利用CNN或者RNN的結(jié)構(gòu),采用更加合理有效的模塊和超參數(shù)或者更多的音頻數(shù)據(jù)增強(qiáng)操作來(lái)提升分類(lèi)準(zhǔn)確率,另外,如果對(duì)心音聽(tīng)診有更好的理解,還可以通過(guò)設(shè)置更加合理的心音片段判斷結(jié)果到心音樣本判斷結(jié)果的轉(zhuǎn)換規(guī)則來(lái)提升模型的分類(lèi)效果。總體來(lái)講,本文認(rèn)為利用深度學(xué)習(xí)的視角和思路來(lái)研究心音異常判斷方法將會(huì)是一個(gè)非常有潛力的方向。