999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于深度學習的PDM文檔自動審核算法

2018-06-14 11:52:24寧凌
計算機與網絡 2018年10期
關鍵詞:深度模型

寧凌

(中國電子科技集團公司第五十四研究所,河北石家莊050081)

0 引言

PDM是一種幫助工程師管理產品數據和產品研發過程的工具,作用是確保跟蹤設計、制造所需的大量數據和信息的正確性,并由此支持和維護產品。針對不同階段的工程設計需求,設計人員需按照標準模板輸出文檔并上傳至PDM系統[1],通過相關管理人員的審核之后進行發布,作為產品設計及研發的依據。在操作過程中,技術文檔和設計文檔需要相關管理人員進行審核,大量的審核工作給審核人員帶來了巨大的工作壓力,降低了審核效率與準確率。隨著人工智能技術的發展,可以利用深度學習[1]的方法,將文檔審核人員的各類操作轉化為知識,由機器自動對文檔進行審核評判,降低審核人員的工作強度。

深度學習是指通過多層神經網絡擬合訓練樣本分布[2]的一種機器學習算法,與傳統神經網絡算法相比,克服了多層神經網絡中出現的局部最優問題,并且其訓練過程不依賴于樣本標簽信息,可以實現特征的自主學習,這一特性為許多問題提供了新的解決思路和途徑。2000年,Hilton等人提出了適合訓練的馬爾可夫隨機場模型的對比散度新算法,為深度學習的誕生奠定了基礎。2006年,Hinton等人提出深度信念網絡[3],并利用對比散度算法對模型進行訓練,迎來了深度學習的發展浪潮,深度信念網絡也成為深度學習的主流框架之一。

1 PDM文檔自動審核算法框架

整個框架包括訓練和審核2個部分:①訓練部分:深度學習模塊根據專家產生的訓練集對文檔識別參數進行訓練,形成能夠識別各類文檔錯誤的模型參數;②審核階段:文檔審查模塊根據產生的參數對新文檔進行審查,提示用戶文檔中存在的各類錯誤。PDM文檔自動審核算法框架如圖1所示。

圖1 PDM文檔自動審核算法框架

從現有PDM文檔系統中選取不同類別、不同質量的PDM文檔,構成PDM文檔集,組織多位專業審核人員對PDM文檔集進行評審,主要對文檔標題、字詞級錯誤和語法級錯誤進行標注,并將相關句子記錄形成標注信息文檔,并分為訓練集和測試集。利用相關技術對標注信息文檔進行預處理,實現標注語句的分詞;利用Skip-gram模型進行詞向量[4]訓練得到分詞結果的詞向量表示;利用深度學習方法實現語句的表示,實現標注語句特征的自學習;利用Softmax回歸設計多分類器,對語句進行分類;利用測試集對模型進行測試,并根據測試結果對模型進行優化,當模型效果達到預期時,則可以發布并進行使用。

當有新文檔上傳至PDM系統時,對新文檔進行語句分割后則可以接入PDM自動審核模型,對文檔中的語句類型進行標注,實現PDM文檔的自動審核,以上過程需要解決PDM文檔分詞和語句表示等處理算法。

2 PDM文檔分詞及語句表示

2.1 PDM文檔分詞

PDM文檔分詞模型如圖2所示,主要包括初步分詞、去除停用詞、領域專用詞篩選及詞典庫構建等過程,最終實現PDM文檔的分詞結果,主要過程如下:

① 采用國內比較成熟、用戶較多的NLPIR[5]漢語分詞系統對PDM文檔進行分詞;

圖2 PDM文檔分詞模型

②根據停用詞表去除停用詞,由于各類PDM文檔都具有較規范的格式,可將文檔中常出現的對文檔評分無用的詞添加到停用詞表;

③由于NLPIR系統是一個普適性的分詞工具,PDM文檔包含多個領域的專業詞語,識別可能不精確,可由相關領域專家根據停用詞刪除后的分詞結果篩選各領域的專用詞,構成領域的詞典庫,加入到分詞系統;

④重復步驟②和步驟③,完成各類PDM文檔分詞模型的構建。

2.2 基于深度學習的語句表示及分類

通常使用向量空間模型對語句進行表示,但是向量空間模型忽略了語句中詞與詞之間的順序,假設語句中的詞與詞之間是相互獨立的,忽略了詞與詞之間的依賴關系,并且存在維度災難和稀疏表示的問題。

為實現對語句的表示,實現PDM文檔的自動審核,本文首先利用Word2vector中的Skip-gram模型訓練得到詞向量,再利用RNN中的長短記憶模型(LSTM)[6]對輸入進行逐級抽象表示,得到語句的高層次抽象表示,其原理如圖3所示。

圖3 基于深度學習的PDM文檔表示及審核模型

將經過深度學習網絡獲取的語句高層次抽象表示輸入到基于Softmax的多類分類器中,最終獲取對當前語句是否為標題以及是否存在相關錯誤進行標注,完成PDM文檔的自動審核,PDM文檔評審人員可根據標注信息實現對文檔質量的評價。

3 PDM文檔自動審核算法的優勢

與傳統方式相比,算法主要的優勢有:① 客觀性:采用機器學習方法對文檔質量進行初步評價很客觀,因為它的評價標準地定義清楚,避免了人工審核中因疲勞、經驗等主觀因素的影響;② 經濟實用性:設計人員提交文檔眾多,在對文檔進行審核的過程中需要耗費大量的人力、財力和物力,采用自動評分不僅可以降低工作的強度,而且可以提高工作的效率;③即時性:在未來的PDM系統中,自動審核以網絡為媒介,實現信息的實時傳遞,可以在提交文檔后短的時間內獲得審核結果及相應的回饋信息。

4 結束語

PDM系統是一項不斷發展的綜合技術,特定內涵和外延在不斷發展變化。本文提出了一種基于深度學習的PDM文檔自動審核算法,可以實現文檔質量的初步評價,為審核人員提供輔助支撐,在客觀性、經濟實用性和即時性等方面都優于傳統人工審核,為海量PDM文檔的審核管理提供了一種解決途徑,為以后PDM文檔的智能化處理奠定了基礎。

[1]房曉楠.深度學習進化編年史:一路走來,幾十年的風風雨雨[J].機器人產業,2017(4):102-110.

[2]韓偉,張雄偉,張煒,等.深度學習中的經典網絡模型及訓練方法[J].軍事通信技術,2016,37(1):90-97.

[3]喬林,張雄偉,史海寧,等.深度學習應用中的常見模型[J].軍事通信技術,2016,37(1):98-104.

[4]王耀華,李舟軍,何躍鷹,等.基于文本語義離散度的自動作文評分關鍵技術研究[J].中文信息學報,2016,30(6):173-181.

[5]李良杰.基于統計和語義信息的中文分詞算法研究[D].青島:青島科技大學,2016.

[6]謝逸,饒文碧,段鵬飛,等.基于CNN和LSTM混合模型的中文詞性標注[J].武漢大學學報(理學版),2017,63(3):246-250.

猜你喜歡
深度模型
一半模型
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
深度觀察
深度觀察
深度觀察
深度觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 天天婬欲婬香婬色婬视频播放| 国产内射在线观看| 亚洲乱码在线视频| 欧美性猛交一区二区三区 | 美女无遮挡拍拍拍免费视频| 国产剧情伊人| 国产成人超碰无码| 久久久黄色片| 操美女免费网站| 国产精品白浆无码流出在线看| 超清人妻系列无码专区| 欧美日韩国产精品va| 97视频精品全国在线观看| www.youjizz.com久久| 四虎AV麻豆| 久久精品日日躁夜夜躁欧美| 国产熟女一级毛片| 国产成人在线无码免费视频| 国产成人久视频免费| 亚洲欧美不卡视频| 免费无码AV片在线观看国产| 精品国产女同疯狂摩擦2| 在线国产毛片手机小视频| 久久精品66| 国产成人精品2021欧美日韩 | 欧美无专区| 欧美一区精品| 亚洲三级影院| 日本高清有码人妻| 国产女人综合久久精品视| 婷婷中文在线| 一级毛片视频免费| 乱色熟女综合一区二区| 色噜噜综合网| 深夜福利视频一区二区| 国禁国产you女视频网站| 国产夜色视频| 欧美日韩理论| 在线亚洲小视频| 婷婷激情五月网| 亚洲一区波多野结衣二区三区| 国产丝袜无码精品| 毛片网站免费在线观看| 综合久久久久久久综合网| 色婷婷综合激情视频免费看| 乱人伦视频中文字幕在线| 日本精品αv中文字幕| 亚洲第一天堂无码专区| 欧美精品黑人粗大| 午夜限制老子影院888| 99精品福利视频| 毛片在线播放a| 激情综合网激情综合| 欧美一级高清片欧美国产欧美| 国产毛片基地| 天天做天天爱夜夜爽毛片毛片| 欧美激情首页| 日韩人妻精品一区| 91热爆在线| 激情成人综合网| 国产精品女熟高潮视频| 国产欧美日韩91| 99视频在线观看免费| 97在线免费| 国产成在线观看免费视频| 国产精品无码AⅤ在线观看播放| a级毛片在线免费观看| 国产av色站网站| 国产主播在线一区| jizz国产视频| 久久一本精品久久久ー99| 91久久夜色精品国产网站| 综合色区亚洲熟妇在线| 又爽又黄又无遮挡网站| 国产成人综合网| 亚洲精品日产精品乱码不卡| 国产成人h在线观看网站站| 91精品情国产情侣高潮对白蜜| 国内a级毛片| 99精品影院| 国产成人精品18| 日韩精品成人在线|