唐鳳仙 羅富貴 張綠云
河池學(xué)院 廣西 河池 546300
最近這些年伴隨著科技的進(jìn)步以及社會(huì)的不斷發(fā)展,深度學(xué)習(xí)成為人工智能研究的重要形式,并且是當(dāng)前社會(huì)熱門(mén)研究的重點(diǎn)之一,對(duì)深度學(xué)習(xí)的研究發(fā)展,無(wú)論是對(duì)計(jì)算機(jī)視覺(jué)領(lǐng)域,或是機(jī)器學(xué)習(xí)領(lǐng)域分析,都具有重要的影響。如今,深度學(xué)習(xí)技術(shù)正在不斷完善,其在方方面面對(duì)大眾的生活產(chǎn)生了影響,本文將通過(guò)探究深度學(xué)習(xí)在圖像識(shí)別方面的應(yīng)用,探索其發(fā)展的內(nèi)涵。
深度學(xué)習(xí)是Hinton等[1]人于2006年提出的,這是一種機(jī)器學(xué)習(xí)的方式,起源于人們深入研究人工神經(jīng)智能網(wǎng)絡(luò)的探索。傳統(tǒng)圖像識(shí)別方法,例如支持向量機(jī)[2]、小波變換[3]等識(shí)別方法的泛化能力不強(qiáng),圖像識(shí)別精度不高。深度學(xué)習(xí)以數(shù)據(jù)驅(qū)動(dòng)方式結(jié)合非線性變換,從大量的原始數(shù)據(jù)中自動(dòng)提取到高層、抽象、特定語(yǔ)義的特征,并完成分類任務(wù)。另外,深度學(xué)習(xí)本身也是一種對(duì)數(shù)據(jù)表象的學(xué)習(xí)方法,其具體學(xué)習(xí)過(guò)程可以理解為:學(xué)習(xí)訓(xùn)練的目的是計(jì)算機(jī)通過(guò)對(duì)網(wǎng)絡(luò)層級(jí)間的參數(shù)迭代更新進(jìn)行深度學(xué)習(xí),并使其訓(xùn)練的結(jié)果無(wú)限接近真實(shí)值。訓(xùn)練過(guò)程中,學(xué)習(xí)路徑通過(guò)梯度的不斷下降,并運(yùn)用統(tǒng)計(jì)學(xué)方法進(jìn)行有效優(yōu)化。目前在社會(huì)發(fā)展歷程中,深度學(xué)習(xí)已經(jīng)在計(jì)算機(jī)視覺(jué)、自動(dòng)控制和自動(dòng)駕駛等方面得到了充分運(yùn)用,推動(dòng)了圖像識(shí)別技術(shù)的發(fā)展。
機(jī)器學(xué)習(xí)的發(fā)展歷程中,基于人工神經(jīng)網(wǎng)絡(luò)算法的模型可以分為兩部分:第一個(gè)是淺層學(xué)習(xí),第二個(gè)是深度學(xué)習(xí)。因?yàn)闇\層學(xué)習(xí)時(shí)期,人工神經(jīng)網(wǎng)絡(luò)算法雖然也被稱為多層感知機(jī),但由于多層網(wǎng)絡(luò)訓(xùn)練困難,通常都是只有一層隱含層的淺層模型。不能有效解決結(jié)構(gòu)抽象與不能形式化描述等問(wèn)題,所以推進(jìn)了人們對(duì)于深度學(xué)習(xí)算法的進(jìn)一步研究。深度學(xué)習(xí)的快速發(fā)展,為多數(shù)領(lǐng)域帶來(lái)正面影響,采用卷積神經(jīng)網(wǎng)絡(luò)[4]可以對(duì)于圖像識(shí)別未來(lái)發(fā)展起到良好的推動(dòng)作用。類似于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的卷積神經(jīng)網(wǎng)絡(luò)可以看成是人腦神經(jīng)結(jié)構(gòu)的簡(jiǎn)單仿真,每層主要由大量的神經(jīng)元組成。整體可以分為三部分,分別是輸入層、卷積層和池化層的組合以及多層感知機(jī)分類器。在大數(shù)據(jù)背景下,深度學(xué)習(xí)發(fā)揮了其強(qiáng)大的功能,也還有許多的深度網(wǎng)絡(luò)模型以及多融合的神經(jīng)網(wǎng)絡(luò)發(fā)揮作用。深度學(xué)習(xí)在應(yīng)用過(guò)程中可以有效提升語(yǔ)音識(shí)別的精確度,通過(guò)交通標(biāo)志的識(shí)別,可以在車(chē)輛檢測(cè)時(shí)取得理想效果。
在進(jìn)修醫(yī)師剛?cè)肟茖?duì)功能神經(jīng)外科疾病尚不熟悉的情況下,安排書(shū)寫(xiě)病歷是快速進(jìn)入狀態(tài)的好途徑。對(duì)常見(jiàn)的十幾種疾病都做好文本模板,特別是首次病程記錄,做到寧繁勿簡(jiǎn)。在現(xiàn)病史中對(duì)癥狀的描述盡可能詳盡,歸納可能的合并癥狀,提供必要的陰性癥狀,完善的既往治療措施;查體需包括可能的陽(yáng)性體征和必要的陰性體征;診斷依據(jù)條理性強(qiáng),有分析過(guò)程,同時(shí)提供3~4條鑒別診斷;診療措施規(guī)范合理;術(shù)前小結(jié)模板對(duì)手術(shù)適應(yīng)癥、可能的合并癥及術(shù)后注意事項(xiàng)記錄清楚。在進(jìn)修醫(yī)師病歷書(shū)寫(xiě)過(guò)程中,通過(guò)對(duì)詳盡的模板進(jìn)行改動(dòng),增加患者個(gè)體化信息的過(guò)程中也獲得了對(duì)疾病認(rèn)識(shí)的提高。
目前,深度學(xué)習(xí)快速發(fā)展的同時(shí)在各大行業(yè)或領(lǐng)域也得到了廣泛應(yīng)用。但是,相關(guān)研究人員對(duì)深度學(xué)習(xí)的探索與研究還處在發(fā)展時(shí)期,還有很多問(wèn)題需要人們深入解決。例如,在模型結(jié)構(gòu)方面,人的大腦結(jié)構(gòu)是立體的,并且兼顧了平面層分布于縱向排列,但現(xiàn)階段人類使用的網(wǎng)絡(luò)結(jié)構(gòu)僅僅是平面結(jié)構(gòu)。所以,為了深入探索深度學(xué)習(xí),相關(guān)研究人員希望可以在提高訓(xùn)練基礎(chǔ)上保持速度,但是深度學(xué)習(xí)結(jié)構(gòu)網(wǎng)絡(luò)較為復(fù)雜,由于其層次多并且有數(shù)據(jù)的影響,訓(xùn)練時(shí)速度也會(huì)受其影響而被制約,所以如何在確保訓(xùn)練精準(zhǔn)度的情況下依舊可以提升速度,還需要相關(guān)研究人員進(jìn)行深入探討與研究。
深度學(xué)習(xí)概念源自于人工智能神經(jīng)網(wǎng)絡(luò)的研究,其在圖像識(shí)別系統(tǒng)運(yùn)用較廣,屬于多層次感知結(jié)構(gòu)體系,這也是其最大的優(yōu)點(diǎn),有關(guān)研究證實(shí),如果針對(duì)某項(xiàng)特定任務(wù)模型其深度不足,那么則會(huì)增加一些計(jì)算元素,也就需要多參數(shù)以及訓(xùn)練樣本來(lái)同時(shí)深度學(xué)習(xí),所以深度學(xué)習(xí)是基于大數(shù)據(jù)自主學(xué)習(xí)過(guò)程,并非通過(guò)手工設(shè)計(jì)來(lái)獲取有關(guān)數(shù)據(jù),而是通過(guò)組合層獲得直觀表達(dá)方式,實(shí)現(xiàn)機(jī)器替代人類學(xué)習(xí)。這一系列操作的目的在于機(jī)器模擬人腦來(lái)完成學(xué)習(xí)的動(dòng)態(tài)過(guò)程,相當(dāng)于是需要機(jī)器來(lái)模仿人類的學(xué)習(xí)行為以及活動(dòng),深度學(xué)習(xí)在大數(shù)據(jù)自主學(xué)習(xí)基礎(chǔ)上可以獲得更好的基礎(chǔ)保障,所以能有效提升圖像識(shí)別的效用。
遙控控制原理圖見(jiàn)圖4,遙控控制模塊在采集車(chē)鐘電流、控制指令(正倒車(chē)啟動(dòng)、停車(chē)等)、安保輸出和主機(jī)轉(zhuǎn)速等信號(hào)之后,首先根據(jù)主機(jī)的運(yùn)行狀態(tài)進(jìn)行內(nèi)部控制邏輯處理,然后向電噴控制系統(tǒng)中的LCU和DCU發(fā)送指令,最后由DCU通過(guò)各缸的CCU驅(qū)動(dòng)各電磁閥件完成對(duì)主機(jī)的控制。
遙感圖像包含了非常多的數(shù)據(jù)信息,這些具有價(jià)值的數(shù)據(jù)被運(yùn)用于各行業(yè)。通常而言,遙感圖像數(shù)據(jù)具有兩個(gè)特點(diǎn),第一,因?yàn)檫^(guò)大的圖像數(shù)據(jù)造成信息的冗余,第二由于較低的分辨率造成不同信息間的相互結(jié)合影響。所以對(duì)于遙感圖像分類是比較難的一項(xiàng)工作。傳統(tǒng)分類方法無(wú)法把有價(jià)值的信息與無(wú)價(jià)值的信息準(zhǔn)確分開(kāi),如果融入深度學(xué)習(xí)技術(shù),將其運(yùn)用到遙感圖像分類過(guò)程中,構(gòu)建合適的學(xué)習(xí)模型,結(jié)合特定優(yōu)化計(jì)算方式,可以取得良好的分類效果。該項(xiàng)技術(shù)的使用為遙感圖像分類技術(shù)提供了方便。
(3)重介質(zhì)洗選系統(tǒng)及介質(zhì)回收系統(tǒng)的相關(guān)設(shè)備應(yīng)鋪設(shè)襯板。目前普遍采用磁鐵礦粉與水配制的懸浮液作選煤或選矸用重介質(zhì),由于這種懸浮液密度大、顆粒硬度高,所以在重介質(zhì)洗選系統(tǒng)和介質(zhì)回收系統(tǒng)中的儲(chǔ)罐(桶)、漏斗、溜槽、管道應(yīng)全部或局部鋪設(shè)襯板。
老年人在生活中跌倒的事件是屢見(jiàn)不鮮的事,如何在跌到事件發(fā)生后得到快速反饋和救助,以有效降低死亡和留下長(zhǎng)時(shí)間治療及后遺癥的風(fēng)險(xiǎn),對(duì)老年人跌到事件進(jìn)行自動(dòng)檢測(cè)的智能系統(tǒng)具有重要的現(xiàn)實(shí)意義。部分研究人員提出了采用深度學(xué)習(xí)方法對(duì)智能家居環(huán)境下的計(jì)算機(jī)視覺(jué)跌倒檢測(cè)系統(tǒng),主要方法是采用背景減法提取人體前景輸入到分類器中,對(duì)于是否發(fā)生跌到的最終決定,依賴分類器輸出與特定的判別規(guī)則。這種使用深度學(xué)習(xí)方法檢測(cè)人體跌到的方法,主要通過(guò)智能獲取雷達(dá)回波的復(fù)雜性,結(jié)合距離信息,頻率、時(shí)間信息等減少不正確的預(yù)警。另外還有一些研究人員通過(guò)融合的方法,比如結(jié)合彩色與深度圖像,通過(guò)特征學(xué)習(xí)方法和目標(biāo)區(qū)域的定位,提出使用深度信息為目標(biāo)定位決策,使用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)生成特征來(lái)檢測(cè)人員是否發(fā)生跌倒。與RGB圖像進(jìn)行比較,優(yōu)點(diǎn)是場(chǎng)景信息準(zhǔn)確、干擾的聲音小等特征,算法結(jié)合設(shè)備與人體的距離信息,計(jì)算人體的高度和寬度,并通過(guò)像素轉(zhuǎn)化實(shí)現(xiàn)目標(biāo)定們來(lái)優(yōu)化圖像。把圖像高度和寬度作為輸入層圖像的大小,采用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)深層特征檢測(cè),自動(dòng)獲取300個(gè)的特征作為分類。深度學(xué)習(xí)在跌到檢測(cè)識(shí)別中的應(yīng)用推動(dòng)了人工智能背景下智慧醫(yī)療的發(fā)展。
深度學(xué)習(xí)在圖像識(shí)別中應(yīng)用最多的就是人臉識(shí)別,而人臉識(shí)別最大的問(wèn)題在于如何把多個(gè)元素引發(fā)變化進(jìn)行有效區(qū)別。引發(fā)圖像識(shí)別變化因素非常多,例如表情、身份、光線等等這些因素的變化,分布性質(zhì)屬于非線性的,而且這些變化有著非常復(fù)雜的內(nèi)在特點(diǎn),因此很多時(shí)候借用傳統(tǒng)模型無(wú)法區(qū)分。深度學(xué)習(xí)之所以會(huì)被運(yùn)用到人臉識(shí)別過(guò)程中,其目的就在于實(shí)行了多層非線性變化,所以通過(guò)這種變化我們可以汲取新的特征,從而有效區(qū)分有不同元素所引發(fā)的變化。常用的人臉識(shí)別數(shù)據(jù)庫(kù)主要有WebFace、CelebFaces、LFW標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)等。
早些年,一些計(jì)算機(jī)視覺(jué)研究人員將深度學(xué)習(xí)模型視為黑盒子,這一觀點(diǎn)并不全面,因此相關(guān)研究人員就提出了聯(lián)合深度學(xué)習(xí)的方法。第一,傳統(tǒng)計(jì)算機(jī)視覺(jué)系統(tǒng)與深度學(xué)習(xí)模型間存在一定的關(guān)聯(lián),所以在相關(guān)的研究運(yùn)用中兩者關(guān)聯(lián)起來(lái)可以構(gòu)建出新的模型,而且這模型具有一定深度。第二,深度學(xué)習(xí)模型各個(gè)層次以及視覺(jué)系統(tǒng)若干模塊是可以一一對(duì)應(yīng)的,如果現(xiàn)有模型和視覺(jué)系統(tǒng)間這種對(duì)應(yīng)關(guān)系消失了,那么有關(guān)研究人員也可以在此啟發(fā)之下重新組建了新的模型。
深度學(xué)習(xí)在各大行業(yè)或領(lǐng)域中運(yùn)用越來(lái)越廣,尤其是在圖像識(shí)別中的運(yùn)用較多并推動(dòng)著圖像識(shí)別的發(fā)展。基于深度學(xué)習(xí)的圖像識(shí)別方法在大規(guī)模圖像分類中降低了錯(cuò)誤率,例如,在2014年谷歌提出的GooleNet,錯(cuò)誤識(shí)別率為6.7%,微軟研究團(tuán)隊(duì)提出的PReLU-Nets,錯(cuò)誤率為 4.94%。深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)于手寫(xiě)數(shù)字以及人臉識(shí)別等具有明顯的提升效果;在人臉識(shí)別、跌到檢測(cè)等方面也提高了圖像識(shí)別的準(zhǔn)確率和識(shí)別速度。
隨著經(jīng)濟(jì)社會(huì)的快速發(fā)展,交通圖像識(shí)別技術(shù)主要用于車(chē)道偏離、車(chē)牌識(shí)別、交通標(biāo)識(shí)等各個(gè)方面,其為人們的日常出行提供了方便,有關(guān)研究者嘗試把深度學(xué)習(xí)技術(shù)運(yùn)用到更深入的交通圖像識(shí)別領(lǐng)域,例如把深度卷積神經(jīng)網(wǎng)絡(luò)運(yùn)用于交通標(biāo)志檢測(cè)中,可以實(shí)現(xiàn)高精度以及時(shí)效性強(qiáng)的檢測(cè)工作。基于深度學(xué)習(xí)下的交通圖像識(shí)別技術(shù),可以為圖像識(shí)別領(lǐng)域創(chuàng)新提供新思路以及方法。
基于深度學(xué)習(xí)的字符圖像識(shí)別運(yùn)用于電子簽名,郵政信件等眾多領(lǐng)域,同時(shí)取得了一定的成績(jī),但是早些年字符圖像識(shí)別技術(shù)存在一些問(wèn)題,過(guò)于依賴人工對(duì)于字符的預(yù)先處理。很明顯這種識(shí)別的識(shí)別效率以及可靠性均不高。當(dāng)深度學(xué)習(xí)技術(shù)流行之后,部分研究者開(kāi)始運(yùn)用該項(xiàng)技術(shù)研究字符的圖像識(shí)別工作。在MNIST數(shù)據(jù)集上取得了一定成績(jī),明顯減少了識(shí)別的錯(cuò)誤率,這確保了機(jī)器和人類觀察者間的差距不斷減少。
光陰似箭,一晃就是一年。春天,楊家莊村邊的小樹(shù)林里空氣清新,野花遍地。這天,楊力生與李秀花依舊在這里約會(huì)。二人擁抱親吻完畢,楊力生說(shuō):“秀花,我要和楊秋香離婚,離婚后咱倆結(jié)婚,好嗎?”
當(dāng)前,雖然深度學(xué)習(xí)已經(jīng)被廣泛應(yīng)用于各行各業(yè),也取得了令人矚目的成績(jī)和效果,并顯著應(yīng)用在圖像識(shí)別領(lǐng)域中。但是深度學(xué)習(xí)依賴于大量的數(shù)據(jù)訓(xùn)練,才能表現(xiàn)出強(qiáng)大的特征提取能力,現(xiàn)實(shí)生活中,采集多樣性的大量數(shù)據(jù)費(fèi)力又費(fèi)時(shí),于是限制了學(xué)習(xí)模型的泛化能力;另外,現(xiàn)實(shí)中的場(chǎng)景有時(shí)不可控也不可重復(fù),組成因素多樣化,影響視覺(jué)算法的設(shè)計(jì),再加上人為標(biāo)注的數(shù)據(jù)也存在誤差,因此融合多種感知信息進(jìn)行深度學(xué)習(xí)構(gòu)架是我們今后研究的主要方向。
