李明超,田 丹,沈 揚(yáng),Jonathan Shi,韓 帥
(1.水利工程仿真與安全國家重點(diǎn)實(shí)驗(yàn)室 天津大學(xué),天津 300350;2.中國長江三峽集團(tuán)有限公司,北京 100038;3.College of Engineering,Louisiana State University,Baton Rouge,LA 70803,USA)
在水利水電工程建設(shè)過程中,產(chǎn)生了大量對(duì)水利水電工程施工過程反饋、管理評(píng)估、質(zhì)量驗(yàn)證等具有重要作用的文本,增加了文本管理與分析的難度[1-2]。在文本管理與分析中,自然語言處理(Natural Language Processing,NLP)技術(shù)具有較高的應(yīng)用率與可靠性,能夠?qū)崿F(xiàn)海量文本數(shù)據(jù)的系統(tǒng)管理。雖然NLP技術(shù)在文本分析中取得較大發(fā)展,但現(xiàn)有的NLP術(shù)語研究主要針對(duì)日常生活用語,較少涉及具體專業(yè)領(lǐng)域。基于此,不同領(lǐng)域的學(xué)者目前都針對(duì)自己的領(lǐng)域發(fā)展專業(yè)性較強(qiáng)的NLP技術(shù),增強(qiáng)NLP技術(shù)在專業(yè)領(lǐng)域的應(yīng)用能力[3]。然而,針對(duì)水利水電工程專業(yè)的NLP技術(shù)尚處于起步階段,未形成具體的專業(yè)文本識(shí)別提取與分析體系。
采用NLP技術(shù)分析水利水電工程專業(yè)文本最關(guān)鍵的環(huán)節(jié)之一是專業(yè)詞識(shí)別,在海量的多源文本中準(zhǔn)確提取專業(yè)詞,有利于提高專業(yè)文本信息分析的準(zhǔn)確率。現(xiàn)有NLP技術(shù)缺乏完善的水利水電工程專業(yè)詞識(shí)別方法,難以直接用于水利水電工程專業(yè)詞提取,同時(shí)已有水利水電工程專業(yè)詞典無法囊括所有專業(yè)詞,隨著施工技術(shù)的進(jìn)步,大量的水利水電工程新工藝、新技術(shù)被開發(fā),同時(shí)產(chǎn)生許多新的專業(yè)詞[4]。水利水電工程專業(yè)詞智能識(shí)別能有效提高水利水電工程管理信息的理解與分析效率,便于在工程各階段快速查找與反饋工程內(nèi)容,完成海量工程信息檢索,增強(qiáng)工程管理效率,提高對(duì)施工現(xiàn)場(chǎng)的管理效果,對(duì)于水利水電工程質(zhì)量、進(jìn)度、成本、安全等管理與評(píng)價(jià)具有重要意義。……