999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于雙重深度遷移學(xué)習(xí)的機(jī)械領(lǐng)域命名實(shí)體識(shí)別

2022-10-10 09:25:40臧凌玉張應(yīng)中羅曉芳
關(guān)鍵詞:深度模型

臧凌玉 張應(yīng)中 羅曉芳

(大連理工大學(xué)機(jī)械工程學(xué)院 遼寧 大連 116024)

0 引 言

在機(jī)械工程領(lǐng)域存在大量的非結(jié)構(gòu)化或半結(jié)構(gòu)化的知識(shí)文本,如專利、說明書、期刊和書籍等,這些文本包含豐富的領(lǐng)域?qū)<抑R(shí)和專業(yè)技術(shù)知識(shí)。自然語言處理能夠通過理解和挖掘文本知識(shí)從而獲取專業(yè)知識(shí)。命名實(shí)體識(shí)別是指識(shí)別文本中具有特定含義的實(shí)體(例如人名、地名、機(jī)構(gòu)名和專有名詞等),是自然語言處理基礎(chǔ)性工作,是正確理解文本的基礎(chǔ)[1]。它是信息抽取、文本分類、關(guān)系抽取、知識(shí)圖譜、搜索引擎、機(jī)器翻譯和自動(dòng)問答等應(yīng)用領(lǐng)域的基礎(chǔ)性工作[2-7]。

機(jī)械工程領(lǐng)域包括機(jī)械設(shè)計(jì)、制造和工程材料等多個(gè)學(xué)科,涉及大量的概念、術(shù)語和專有名詞,這些名詞以自然語言方式表示在文本中。特別是機(jī)械專利文本,其包含了新的技術(shù)和原理,體現(xiàn)了領(lǐng)域的最新信息。對(duì)機(jī)械專利文本進(jìn)行命名實(shí)體識(shí)別,及時(shí)發(fā)現(xiàn)最新的技術(shù)和應(yīng)用,將有利于確定技術(shù)發(fā)展趨勢(shì)。例如,劉宇飛等[8]應(yīng)用命名實(shí)體識(shí)別技術(shù)識(shí)別數(shù)控系統(tǒng)新興技術(shù),陳秋瑗等[9]利用其實(shí)現(xiàn)機(jī)械設(shè)計(jì)領(lǐng)域新詞發(fā)現(xiàn)等。

目前,命名實(shí)體識(shí)別常用的方法有基于規(guī)則和詞典的方法、基于傳統(tǒng)統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法等[10-13]。其中,由于深度學(xué)習(xí)能夠從原始數(shù)據(jù)中自動(dòng)獲取特征,提升數(shù)據(jù)的處理能力和識(shí)別的準(zhǔn)確性,因而被廣泛應(yīng)用于命名實(shí)體識(shí)別中[14-18]。由于深度學(xué)習(xí)方法需要大量的樣本數(shù)據(jù),基于深度學(xué)習(xí)的命名實(shí)體識(shí)別研究主要集中于具有成熟數(shù)據(jù)集的通用領(lǐng)域和生物醫(yī)學(xué)等幾個(gè)特定領(lǐng)域,而機(jī)械工程領(lǐng)域涉及范圍寬,且目前沒有成熟的標(biāo)注數(shù)據(jù)集,因此極大地限制了命名實(shí)體識(shí)別方法在機(jī)械工程領(lǐng)域中的應(yīng)用。

遷移學(xué)習(xí)能夠利用已獲取的源域知識(shí)改善目標(biāo)任務(wù),所以將遷移學(xué)習(xí)引入命名實(shí)體識(shí)別中,可以有效地解決模型由于數(shù)據(jù)集少而導(dǎo)致的識(shí)別能力不足的問題[19]。Devlin等[20]提出了基于遷移學(xué)習(xí)的BERT(Bidirectional Encoder Representations from Transformers)模型,刷新了包括命名實(shí)體識(shí)別在內(nèi)的11種NLP測(cè)試成績(jī)。楊飄等[21]將BERT作為預(yù)訓(xùn)練語言模型,并將其與BiLSTM-CRF模型相結(jié)合解決中文命名實(shí)體識(shí)別問題,結(jié)果表明在命名實(shí)體識(shí)別任務(wù)中,結(jié)合后的模型性能有較大提升。由此可知,BERT遷移學(xué)習(xí)模型作為預(yù)訓(xùn)練語言模型遷移,能夠提高模型識(shí)別的準(zhǔn)確性。

本文針對(duì)機(jī)械工程領(lǐng)域命名實(shí)體識(shí)別中成熟標(biāo)注數(shù)據(jù)集少的問題,以及更好地提高識(shí)別精度,提出一種基于雙重深度遷移學(xué)習(xí)的中文命名實(shí)體識(shí)別方法。該方法應(yīng)用BERT模型對(duì)文本語義進(jìn)行遷移的基礎(chǔ)上,進(jìn)一步利用模型遷移的方法對(duì)命名實(shí)體識(shí)別模型的預(yù)訓(xùn)練參數(shù)實(shí)施整體遷移,建立了雙重深度遷移學(xué)習(xí)模型—DT-BLC模型,從而更好地實(shí)現(xiàn)命名實(shí)體識(shí)別具體任務(wù)知識(shí)的遷移,提升了機(jī)械工程領(lǐng)域命名實(shí)體識(shí)別的準(zhǔn)確性,有效地解決了深度學(xué)習(xí)在機(jī)械工程領(lǐng)域中由于數(shù)據(jù)量少而導(dǎo)致的學(xué)習(xí)能力不足的問題。然后以齒輪專利為例,運(yùn)用雙重遷移學(xué)習(xí)模型分別對(duì)每一年的齒輪發(fā)明專利文獻(xiàn)進(jìn)行命名實(shí)體,運(yùn)用統(tǒng)計(jì)學(xué)的方法分析齒輪的研究重點(diǎn)和最新發(fā)展趨勢(shì)。

1 雙重遷移學(xué)習(xí)模型

雙重遷移學(xué)習(xí)模型框架如圖1所示,由兩部分組成:基于BERT的單重深度遷移學(xué)習(xí)和基于整體模型的遷移學(xué)習(xí)。先將源域數(shù)據(jù)集輸入到BERT+BiLSTM-CRF模型中獲得預(yù)訓(xùn)練參數(shù),之后將預(yù)訓(xùn)練參數(shù)輸入到訓(xùn)練模型中,并對(duì)訓(xùn)練模型進(jìn)行參數(shù)凍結(jié)建立凍結(jié)的訓(xùn)練模型,接下來將目標(biāo)域數(shù)據(jù)集輸入到凍結(jié)的訓(xùn)練模型進(jìn)行訓(xùn)練,訓(xùn)練好的模型便成為命名實(shí)體識(shí)別器,最后輸入目標(biāo)域測(cè)試數(shù)據(jù)集就能獲得識(shí)別結(jié)果。

圖1 雙重遷移學(xué)習(xí)模型框架

1.1 基于BERT的第一次遷移學(xué)習(xí)

基于BERT的遷移學(xué)習(xí)由BERT預(yù)訓(xùn)練語言模型、BiLSTM-CRF模型組成。在模型中利用BERT預(yù)訓(xùn)練的模型參數(shù)進(jìn)行模型遷移,將維基百科語料的語義關(guān)系遷移到機(jī)械工程領(lǐng)域,實(shí)現(xiàn)了模型的第一次遷移學(xué)習(xí)。

BERT的一個(gè)重要的應(yīng)用就是作為預(yù)訓(xùn)練語言模型,與其他語言表示模型相比,BERT預(yù)訓(xùn)練模型可以將經(jīng)過大規(guī)模語料所學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)為目標(biāo)學(xué)習(xí)任務(wù)提供豐富的先驗(yàn)知識(shí),并將語義知識(shí)遷移到具體的模型訓(xùn)練當(dāng)中,進(jìn)而能夠提高模型的泛化能力和魯棒性,同時(shí)可以減少大量的人工標(biāo)注工作,尤其適用于處理數(shù)據(jù)量比較少的自然語言任務(wù)。

條件隨機(jī)場(chǎng)(CRF)是一種概率無向圖模型,它通過計(jì)算某個(gè)序列中的聯(lián)合優(yōu)化概率,進(jìn)而優(yōu)化整個(gè)序列的標(biāo)簽序列。CRF概率計(jì)算式為:

(1)

在這一部分中,模型先將輸入文本通過BERT預(yù)訓(xùn)練語言模型獲得語義表示,得到句子中的每個(gè)字的向量表示后,再將字向量輸入到BiLSTM中進(jìn)行序列特征的自動(dòng)提取,最后通過CRF層輸出概率最大的標(biāo)簽序列。

1.2 基于整體模型的第二次遷移學(xué)習(xí)

基于整體模型的遷移學(xué)習(xí)是建立在模型遷移方法的基礎(chǔ)上,并在目標(biāo)數(shù)據(jù)進(jìn)行訓(xùn)練時(shí)對(duì)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的幾層權(quán)重因子進(jìn)行了凍結(jié),實(shí)現(xiàn)了模型的第二次遷移學(xué)習(xí)。

模型遷移方法建立在成熟的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,首先利用大量高質(zhì)量的源數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行相關(guān)訓(xùn)練,并通過調(diào)參后得到可靠的模型。然后用此模型對(duì)目標(biāo)數(shù)據(jù)集進(jìn)行訓(xùn)練,訓(xùn)練時(shí)可以選擇遷移部分或全部參數(shù)。最后通過深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的自適應(yīng)性對(duì)模型進(jìn)行微調(diào)。由于模型的可靠性已經(jīng)得到了檢驗(yàn),提前得到了底層的模型結(jié)構(gòu)和參數(shù),為目標(biāo)領(lǐng)域的訓(xùn)練提供了很好的初始化,節(jié)省了目標(biāo)領(lǐng)域的訓(xùn)練時(shí)間,降低了調(diào)參難度,同時(shí)也提升了目標(biāo)領(lǐng)域的建模效果。

在模型中,假設(shè)所有權(quán)重因子為vars,則權(quán)重因子可以分為兩部分:

vars=vars0+v

(2)

式中:vars0代表源域和目標(biāo)域共享部分;v代表對(duì)目標(biāo)域的特定處理。在模型訓(xùn)練時(shí),將所有需要更新計(jì)算的權(quán)重因子v相應(yīng)名稱加入庫中,vars0從預(yù)訓(xùn)練模塊中繼承參數(shù),實(shí)現(xiàn)參數(shù)共享。更新時(shí),僅訓(xùn)練更新庫中的權(quán)重因子v,沒有加入庫中的權(quán)重因子vars0在訓(xùn)練過程中只進(jìn)行調(diào)用,不進(jìn)行更新,將vars0權(quán)重因子進(jìn)行凍結(jié)。將模型的部分權(quán)重因子進(jìn)行凍結(jié)能夠充分利用預(yù)訓(xùn)練模型的先驗(yàn)知識(shí),且模型的訓(xùn)練更新參數(shù)減少將大大縮短模型每一步的訓(xùn)練時(shí)間。

在這一部分中,模型首先將源數(shù)據(jù)(MSRA數(shù)據(jù)集)輸入到預(yù)訓(xùn)練模塊中進(jìn)行預(yù)訓(xùn)練,在預(yù)訓(xùn)練過程中不斷用Adam優(yōu)化器對(duì)參數(shù)進(jìn)行優(yōu)化,直至達(dá)到Pre_epoch參數(shù)值;接下來將預(yù)訓(xùn)練模塊計(jì)算出的全部參數(shù)(即預(yù)訓(xùn)練參數(shù))輸入到訓(xùn)練模塊中,對(duì)訓(xùn)練模塊的參數(shù)進(jìn)行初始化;然后對(duì)訓(xùn)練模塊的權(quán)重因子vars0進(jìn)行凍結(jié),建立凍結(jié)的訓(xùn)練模塊,之后將目標(biāo)訓(xùn)練數(shù)據(jù)(機(jī)械工程領(lǐng)域數(shù)據(jù)集)輸入到凍結(jié)的訓(xùn)練模塊中進(jìn)行訓(xùn)練;最終得到機(jī)械工程領(lǐng)域的命名實(shí)體識(shí)別器。將需要進(jìn)行命名實(shí)體識(shí)別的目標(biāo)域測(cè)試數(shù)據(jù)輸入到命名實(shí)體識(shí)別器中,即可得到命名實(shí)體識(shí)別結(jié)果。

2 識(shí)別實(shí)驗(yàn)

2.1 實(shí)驗(yàn)數(shù)據(jù)集

由于機(jī)械工程領(lǐng)域沒有成熟的標(biāo)注數(shù)據(jù)集,目標(biāo)域數(shù)據(jù)集采用手工標(biāo)注的機(jī)械工程領(lǐng)域相關(guān)文本,數(shù)據(jù)集采用BIO標(biāo)注,類別分別為材料、熱處理和零件名稱。目標(biāo)域訓(xùn)練集有938個(gè)標(biāo)記語句,目標(biāo)域測(cè)試集有163個(gè)句子。

源數(shù)據(jù)集(即預(yù)訓(xùn)練數(shù)據(jù)集)為微軟亞洲研究院的MSRA部分?jǐn)?shù)據(jù)集,數(shù)據(jù)集采用BIO標(biāo)注,實(shí)體類別分別為:人名、地名和組織機(jī)構(gòu)名。源數(shù)據(jù)集有19 717個(gè)標(biāo)記語句。

2.2 評(píng)價(jià)指標(biāo)

在測(cè)試時(shí),只有當(dāng)識(shí)別的實(shí)體邊界和實(shí)體的類型完全準(zhǔn)確時(shí),實(shí)體才算識(shí)別正確。命名實(shí)體識(shí)別的常用的評(píng)估指標(biāo)有精確率(P)、召回率(R)和F1值。因此本文用這三個(gè)指標(biāo)來判斷命名實(shí)體識(shí)別系統(tǒng)的識(shí)別效果,指標(biāo)的計(jì)算方法為:

(3)

式中:TP表示模型識(shí)別正確的個(gè)數(shù);FP表示模型識(shí)別錯(cuò)誤的實(shí)體個(gè)數(shù);FN表示文本中實(shí)體未識(shí)別到的個(gè)數(shù)。

2.3 模型比較

實(shí)驗(yàn)首先對(duì)雙重深度遷移學(xué)習(xí)模型DT-BLC與常用模型BERT+BI-LSTM-CRF在相同參數(shù)條件下的F1值、運(yùn)算速度進(jìn)行比較,研究雙重遷移學(xué)習(xí)對(duì)模型的改進(jìn)效果,然后改變模型DT-BLC中對(duì)源域的預(yù)訓(xùn)練epoch(Per_epoch)參數(shù),探究Per_epoch參數(shù)對(duì)雙重深度遷移學(xué)習(xí)模型的影響。

模型BERT+BiLSTM-CRF和模型DT-BLC進(jìn)行比較,參數(shù)設(shè)置如表1所示。

表1 模型的比較參數(shù)

對(duì)于模型DT-BLC,Pre_epoch參數(shù)分別設(shè)置為0.1、0.15、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5。

最后為了驗(yàn)證實(shí)驗(yàn)的有效性,將模型與BiLSTM-CRF模型和Lattice-LSTM-CRF模型的識(shí)別結(jié)果進(jìn)行比較。

3 實(shí)驗(yàn)與結(jié)果分析

3.1 雙重遷移學(xué)習(xí)模型識(shí)別效果

命名實(shí)體識(shí)別系統(tǒng)常用的評(píng)估指標(biāo)有精確率、召回率和F1值,NER是復(fù)雜的任務(wù)單靠一個(gè)指標(biāo)很難做評(píng)判,因此采用綜合指標(biāo)F1對(duì)識(shí)別效果做判斷。

DT-BLC模型和BERT+BiLSTM-CRF模型的F1值隨迭代epoch的變化如圖2所示。可以看出,在訓(xùn)練過程中,與BERT+BiLSTM-CRF模型相比,應(yīng)用了雙重遷移學(xué)習(xí)方法的DT-BLC模型的F1值更高,且DT-BLC模型在訓(xùn)練到17個(gè)epoch時(shí),其訓(xùn)練F1已達(dá)到90%,BERT+BiLSTM-CRF模型在訓(xùn)練到40個(gè)epoch才達(dá)到90%,能夠在更短的時(shí)間達(dá)到比較高的F1值。所以基于整體模型的遷移學(xué)習(xí)能達(dá)到提升模型的識(shí)別效果和縮短訓(xùn)練時(shí)間的效果。

圖2 DT-BLC模型和BERT+BiLSTM-CRF模型的F1值隨迭代epoch的變化

3.2 雙重深度遷移學(xué)習(xí)模型訓(xùn)練速度分析

雙重深度遷移學(xué)習(xí)模型DT-BLC在訓(xùn)練目標(biāo)數(shù)據(jù)時(shí),對(duì)一部分深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)權(quán)值因子進(jìn)行了凍結(jié),使模型訓(xùn)練過程中更新的參數(shù)更少。對(duì)DT-BLC模型和BERT+BiLSTM-CRF模型訓(xùn)練時(shí)間進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如圖3所示。

(a) DT-BLC模型和BERT+BiLSTM-CRF模型運(yùn)行時(shí)間隨迭代epoch的變化

(b) DT-BLC模型和BERT+BiLSTM-CRF模型訓(xùn)練速度隨迭代epoch的變化圖3 模型的訓(xùn)練速度分析

可以看出,與模型BERT+BiLSTM-CRF相比,運(yùn)算相同迭代epoch時(shí),模型DT-BLC所需時(shí)間明顯減少,運(yùn)算速度加快。表明雙重遷移學(xué)習(xí)模型在模型遷移的基礎(chǔ)上對(duì)訓(xùn)練模型的部分權(quán)重因子進(jìn)行的凍結(jié),能夠在保證識(shí)別效果的同時(shí),使每次的epoch所需要的時(shí)間更短,大大縮短了訓(xùn)練時(shí)間,提升了模型訓(xùn)練效率。

3.3 預(yù)處理對(duì)遷移學(xué)習(xí)模型的影響

Pre_epoch參數(shù)指的是在基于整體模型的遷移學(xué)習(xí)中,預(yù)訓(xùn)練模型對(duì)源數(shù)據(jù)集訓(xùn)練的epoch,Pre_epoch的值越大代表對(duì)源數(shù)據(jù)集訓(xùn)練的迭代步數(shù)和訓(xùn)練時(shí)間越久。通過DT-BLC模型的精確率、召回率和F1隨Pre_epoch參數(shù)的變化來研究基于整體模型的遷移學(xué)習(xí)對(duì)DT-BLC模型識(shí)別效果的影響,如圖4所示。

圖4 DT-BLC模型的精確率、召回率、F1值隨Pre_epoch的變化

可以看出,當(dāng)Pre_epoch為0.1(即Pre_epoch非常小)時(shí),基于整體模型的遷移學(xué)習(xí)對(duì)模型起到抑制的作用,DT-BLC模型的精確率、召回率、F1值均為0;隨著Pre_epoch的增加,DT-BLC模型的精確率、召回率、F1值迅速增加,當(dāng)Pre_epoch為0.3時(shí),DT-BLC模型的識(shí)別效果達(dá)到一個(gè)比較大的值;而后隨著Pre_epoch的增加,DT-BLC模型精確率、召回率、F1值在一個(gè)較小的范圍內(nèi)波動(dòng)。由此可知,Pre_epoch參數(shù)在值比較小時(shí),其值變化對(duì)DT-BLC模型的識(shí)別影響比較大,在Pre_epoch參數(shù)值超過0.15后,其值的增加對(duì)模型識(shí)別影響較小,且很小的Pre_epoch參數(shù)就能對(duì)模型產(chǎn)生遷移優(yōu)化的效果。

3.4 不同的模型識(shí)別效果對(duì)比

與BiLSTM-CRF模型和Lattice-LSTM-CRF模型識(shí)別效果的比較結(jié)果如表2所示。

表2 不同模型識(shí)別效果比較(%)

將DT-BLC模型與BiLSTM-CRF模型、Lattice-LSTM-CRF模型和BERT+BiLSTM-CRF模型進(jìn)行對(duì)比,發(fā)現(xiàn)DT-BLC模型的精確率、召回率和F1值均高于其他三個(gè)模型,且基于雙重深度遷移學(xué)習(xí)的DT-BLC模型,與BERT+BiLSTM-CRF模型相比,精確率高出5.01百分點(diǎn),召回率高出4.84百分點(diǎn),F(xiàn)1值高出4.93百分點(diǎn)。由此證明基于雙重深度遷移學(xué)習(xí)的DT-BLC模型能夠通過兩次遷移的方法,利用通用領(lǐng)域命名實(shí)體識(shí)別任務(wù)的參數(shù)提供先驗(yàn)知識(shí),進(jìn)而提升機(jī)械工程領(lǐng)域的命名實(shí)體識(shí)別效果。

4 DT-BLC模型應(yīng)用于齒輪專利分析

齒輪是機(jī)械領(lǐng)域重要的基礎(chǔ)性零件,其每年都有大量的專利申請(qǐng)受理,其對(duì)加工技術(shù)和加工機(jī)床的要求也不斷提高。因此,本文以分析齒輪專利文獻(xiàn)為例,分別獲取2010年至2018年的齒輪相關(guān)發(fā)明專利數(shù)據(jù)的摘要,組建面向機(jī)械領(lǐng)域的齒輪專利實(shí)驗(yàn)數(shù)據(jù)文本(數(shù)據(jù)文本中有權(quán)發(fā)明專利摘要共計(jì)28 707條),然后運(yùn)用DT-BLC模型對(duì)專利文本進(jìn)行實(shí)體識(shí)別,通過識(shí)別結(jié)果對(duì)齒輪專利開展如下兩個(gè)方面的分析。

4.1 齒輪實(shí)體類別比例分析

運(yùn)用DT-BLC模型分別對(duì)每一年的齒輪發(fā)明專利文獻(xiàn)進(jìn)行命名實(shí)體識(shí)別,然后分別針對(duì)識(shí)別到的齒輪材料、加工工藝和零部件三類實(shí)體類別,統(tǒng)計(jì)其在每年齒輪發(fā)明專利中所占的比例,以分析齒輪技術(shù)類別的發(fā)展趨勢(shì)。

齒輪發(fā)明專利各個(gè)實(shí)體類別比例隨著年份的變化趨勢(shì)如圖5所示。可以看出,每年齒輪發(fā)明專利文獻(xiàn)識(shí)別到的三個(gè)技術(shù)類別實(shí)體在實(shí)體總數(shù)中的比例基本不變,且零部件實(shí)體遠(yuǎn)遠(yuǎn)高于材料實(shí)體和加工工藝實(shí)體,其所占比例大約在97.5%。這是因?yàn)樵趯?shí)體識(shí)別的過程中,將機(jī)械產(chǎn)品、裝置名稱、零件和部件名稱均歸類為零部件類別,且齒輪是零件,專利研究多集中于將其與其他零件相結(jié)合組成部件或機(jī)械產(chǎn)品中。

圖5 實(shí)體比率隨年份變化

由此可得,齒輪的發(fā)明專利集中于將零件運(yùn)用到機(jī)械產(chǎn)品,對(duì)其新材料在齒輪中的應(yīng)用以及新的加工方法在齒輪中的應(yīng)用相對(duì)較少,不過近年來材料實(shí)體的比例有所提升。

4.2 齒輪材料實(shí)體類別發(fā)展分析

隨著新材料的不斷發(fā)現(xiàn),齒輪制造過程中越來越注重材料的選擇,使其具有更長(zhǎng)的工作壽命和能夠應(yīng)用于更復(fù)雜的工況條件。因此,本文運(yùn)用統(tǒng)計(jì)學(xué)方法對(duì)DT-BLC模型識(shí)別到的齒輪材料實(shí)體進(jìn)行數(shù)據(jù)挖掘,分析齒輪材料應(yīng)用的研究方向和發(fā)展趨勢(shì)。

如圖6所示,對(duì)齒輪專利文獻(xiàn)進(jìn)行命名實(shí)體識(shí)別后,識(shí)別到的材料實(shí)體最多是金屬和塑料,然后是齒輪油。由此說明在齒輪材料的研究中還是以金屬為主,而塑料也是研究重點(diǎn),而齒輪油作為齒輪潤(rùn)滑必不可少的材料也引起了相關(guān)學(xué)者的重點(diǎn)關(guān)注。對(duì)兩種重要的金屬材料不銹鋼和鋁合金進(jìn)行對(duì)比發(fā)現(xiàn),不銹鋼作為齒輪材料應(yīng)用更加廣泛。同時(shí)運(yùn)用新詞發(fā)現(xiàn)來探究齒輪材料新的發(fā)展方向。在DT-BLC模型識(shí)別到的材料實(shí)體中,2017年發(fā)現(xiàn)的在2010年至2016年未出現(xiàn)的材料實(shí)體可以分為三類。一類是應(yīng)用于齒輪的新材料:耐磨自潤(rùn)滑尼龍、碳纖維復(fù)合材料、玻纖增強(qiáng)尼龍、燒結(jié)鐵合金、鎳包碳化鎢;一類是齒輪材料應(yīng)用于新材料制備,即齒輪的新應(yīng)用,包括PET塑料、芳綸Ⅲ樹脂、聚丙烯酰胺;一類是應(yīng)用于齒輪潤(rùn)滑的齒輪油新材料,如:全合成超載荷抗磨極壓工業(yè)齒輪油、無硫磷有機(jī)鉬減摩劑、聚α烯烴基油。這些識(shí)別到的新詞反映了齒輪新的研究方向,對(duì)其進(jìn)行發(fā)現(xiàn)能夠把握齒輪發(fā)展的趨勢(shì),使企業(yè)及時(shí)跟進(jìn)最新發(fā)展動(dòng)態(tài)。

圖6 材料實(shí)體隨年份變化趨勢(shì)

5 結(jié) 語

本文針對(duì)機(jī)械工程領(lǐng)域,提出一種基于雙重遷移學(xué)習(xí)的中文命名實(shí)體識(shí)別方法,建立了DT-BLC模型,并對(duì)其性能進(jìn)行了分析。同時(shí),將DT-BLC模型應(yīng)用于齒輪專利的研究與發(fā)展趨勢(shì)分析。研究結(jié)果表明:

(1) 與其他模型相比,雙重深度遷移學(xué)習(xí)模型DT-BLC的精確率、召回率和F1值均得到提升。

(2) 隨著Pre_epoch參數(shù)的增加,雙重深度遷移學(xué)習(xí)模型DT-BLC的識(shí)別效果迅速提升,并且穩(wěn)定在一定范圍內(nèi)。

(3) 通過對(duì)DT-BLC模型識(shí)別后的齒輪專利實(shí)體進(jìn)行分析,得出齒輪發(fā)明專利多集中于將零件運(yùn)用到機(jī)械產(chǎn)品,同時(shí)齒輪材料依然以金屬為主,不過近年來新材料的研發(fā)也得到較多關(guān)注。

猜你喜歡
深度模型
一半模型
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
深度觀察
深度觀察
深度觀察
深度觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 国产不卡国语在线| 亚洲三级电影在线播放| 成人在线欧美| 欧美日韩免费在线视频| 欧美日韩激情在线| 99热精品久久| 日本高清免费不卡视频| 国产精品黄色片| 亚洲视频一区在线| 成年人久久黄色网站| 秋霞午夜国产精品成人片| 久久精品免费国产大片| 亚洲国产日韩一区| 免费国产在线精品一区| 国产精品主播| 午夜免费小视频| 91视频区| 国产成人免费视频精品一区二区| 精品国产自| 免费看的一级毛片| 99视频全部免费| 91精选国产大片| 久久成人国产精品免费软件| 亚洲人成在线精品| 亚洲Av综合日韩精品久久久| 日本在线欧美在线| 最近最新中文字幕免费的一页| 久久亚洲综合伊人| 午夜视频免费一区二区在线看| 午夜国产精品视频黄| 欧美在线综合视频| 国产精品3p视频| 国产人人射| 亚洲中文字幕日产无码2021| 在线高清亚洲精品二区| 久久午夜夜伦鲁鲁片无码免费| 日本人真淫视频一区二区三区| 国产人在线成免费视频| 伊人成人在线视频| 美女无遮挡拍拍拍免费视频| 国产成人综合日韩精品无码首页| 韩日午夜在线资源一区二区| 97在线碰| 日韩福利在线视频| 日韩精品一区二区深田咏美| 国产在线观看第二页| 在线欧美a| 国产96在线 | 手机在线免费不卡一区二| 亚洲精品无码专区在线观看| 91精品国产自产在线观看| 亚洲综合二区| 91啪在线| 欧美国产综合色视频| 亚洲精品无码不卡在线播放| 毛片网站在线看| 国产网站在线看| www成人国产在线观看网站| 人妻免费无码不卡视频| 噜噜噜久久| 日韩不卡高清视频| 国产成人乱码一区二区三区在线| 欧美h在线观看| 美女国内精品自产拍在线播放| 人妻21p大胆| 在线欧美一区| 国产精品亚欧美一区二区| 亚洲福利一区二区三区| 中文字幕有乳无码| 97视频免费在线观看| 福利片91| 91小视频在线| 国产欧美日韩91| 国产精品一区二区无码免费看片| 欧美亚洲综合免费精品高清在线观看| 日本午夜影院| 亚洲第一视频免费在线| 小说 亚洲 无码 精品| 欧美亚洲日韩不卡在线在线观看| 手机精品视频在线观看免费| 丰满少妇αⅴ无码区| 日本a∨在线观看|