章喻龍
(中國(guó)電力工程顧問(wèn)集團(tuán)中南電力設(shè)計(jì)院有限公司,湖北 武漢 430070)
研究顯示,新的工程圖紙中有超過(guò)80%的設(shè)計(jì)可以通過(guò)重用或者修改過(guò)去的設(shè)計(jì)來(lái)實(shí)現(xiàn)[1]。然而事實(shí)上,作為企業(yè)知識(shí)財(cái)富核心的圖紙卻只會(huì)有極少部分被再次利用。其主要原因在于設(shè)計(jì)人員通常只能通過(guò)同事間的口耳相傳以及在檔案館對(duì)圖紙逐一查詢(xún)的方式來(lái)獲取圖紙信息,在短時(shí)間內(nèi)獲取所需圖紙的可能性較低。因而如何提升成品圖紙的利用率進(jìn)而提升設(shè)計(jì)企業(yè)生產(chǎn)效率成為一個(gè)亟待解決的關(guān)鍵問(wèn)題。文章提出可以通過(guò)分三步走的方式來(lái)提升圖紙利用效率。首先搭建多維度的圖紙搜索平臺(tái);然后使用機(jī)器學(xué)習(xí)算法將圖紙中非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),用于提升圖紙搜索質(zhì)量;最后搭建圖紙輔助和自動(dòng)化設(shè)計(jì)平臺(tái)變被動(dòng)搜索為主動(dòng)推薦,進(jìn)一步提升繪圖效率和質(zhì)量。
根據(jù)公司信息化建設(shè)水平,設(shè)計(jì)企業(yè)可以依次搭建數(shù)字檔案館、項(xiàng)目門(mén)戶(hù)和電子成品檔案借閱3個(gè)模塊,從多個(gè)維度對(duì)圖紙進(jìn)行展示和利用。
數(shù)字檔案館模塊通過(guò)結(jié)構(gòu)化數(shù)據(jù)的形式記錄所有歸檔圖紙的整編信息,例如歸檔時(shí)間、所屬項(xiàng)目、繪制專(zhuān)業(yè)和設(shè)計(jì)人等,進(jìn)而提供對(duì)已歸檔圖紙基于項(xiàng)目基礎(chǔ)信息的檢索和借閱功能。
項(xiàng)目門(mén)戶(hù)模塊如圖1所示,以項(xiàng)目地圖的形式對(duì)項(xiàng)目進(jìn)行展示。通過(guò)選擇項(xiàng)目是屬于境內(nèi)還是境外、其所屬省份、工程類(lèi)別(如火電、新能源、電網(wǎng))以及項(xiàng)目類(lèi)型(如總承包、設(shè)計(jì)、勘測(cè))等信息,設(shè)計(jì)人員可以找到需要的項(xiàng)目的名稱(chēng)和其詳細(xì)信息,點(diǎn)擊項(xiàng)目詳情還可以進(jìn)一步的關(guān)聯(lián)到項(xiàng)目的流程、參與人員名單、涉及專(zhuān)業(yè)、差錯(cuò)統(tǒng)計(jì)情況以及校審意見(jiàn)等信息,并從上述維度查詢(xún)到對(duì)應(yīng)圖紙。

圖1 項(xiàng)目地圖
項(xiàng)目門(mén)戶(hù)模塊的數(shù)據(jù)主要來(lái)源于項(xiàng)目從登記開(kāi)始到立項(xiàng)、啟動(dòng)、WBS分解、卷冊(cè)任務(wù)書(shū)下達(dá)、成品校審、成品出版最后到歸檔的全套流程,是對(duì)數(shù)字檔案館模塊的補(bǔ)充。
電子成品檔案借閱模塊[2]如圖2所示,是一個(gè)基于Lucene索引技術(shù)的圖紙搜索引擎。該模塊提供了圖紙全文檢索和標(biāo)簽檢索的功能,方便設(shè)計(jì)人員對(duì)圖紙進(jìn)行借閱和查詢(xún)。

圖2 電子成品檔案借閱界面圖
圖紙的全文檢索功能通過(guò)三個(gè)步驟實(shí)現(xiàn):首先通過(guò)一個(gè)在A(yíng)utoCAD上二次開(kāi)發(fā)的文字提取軟件提取DWG上的所有文字信息;然后利用爬蟲(chóng)軟件搜集這些信息并發(fā)送到索引服務(wù)器;最后索引服務(wù)器利用分詞工具包對(duì)文字進(jìn)行分詞并制作索引。
標(biāo)簽式檢索功能則是首先從流程中獲取圖紙的設(shè)計(jì)階段、所屬專(zhuān)業(yè)以及工程類(lèi)別等信息;然后通過(guò)索引服務(wù)器把相關(guān)信息制作為圖紙標(biāo)簽;最后通過(guò)流程引擎的標(biāo)簽選擇界面實(shí)現(xiàn)圖紙按照標(biāo)簽進(jìn)行查詢(xún)的能力。
提升圖紙搜索能力,首先需要挖掘圖紙中的潛在信息。近年來(lái)人工智能技術(shù)高速發(fā)展,利用深度學(xué)習(xí)算法實(shí)現(xiàn)的文字和圖像識(shí)別算法可以有效的提取圖紙信息,提升搜索質(zhì)量。
2.1.1 文字識(shí)別
文字識(shí)別是指對(duì)包含文字的圖像文件進(jìn)行分析處理從而獲取文本的過(guò)程。該過(guò)程一般包括圖像輸入,圖像預(yù)處理、文字檢測(cè)和文本識(shí)別四個(gè)步驟[3-4]。
基于開(kāi)源的通用文本識(shí)別工具對(duì)于機(jī)打、位置相對(duì)固定的文字的識(shí)別率很高,然而卻存在不善于處理特殊字符識(shí)以及不定方向文字的問(wèn)題[3],因而無(wú)法直接應(yīng)用于實(shí)際的生產(chǎn)環(huán)境。因此需要首先利用包含標(biāo)注了定位信息的圖紙對(duì)文字檢測(cè)程序進(jìn)行訓(xùn)練,提升文字檢測(cè)程序的準(zhǔn)確度和識(shí)別效率;然后再將定位的文本進(jìn)行分割后發(fā)送給文本識(shí)別算法進(jìn)行轉(zhuǎn)換,從而實(shí)現(xiàn)對(duì)圖紙中文字的識(shí)別功能。
文字識(shí)別算法可以用于識(shí)別圖簽關(guān)鍵信息、圖紙標(biāo)注以及對(duì)全部文字進(jìn)行識(shí)別。其中圖簽關(guān)鍵信息包括圖簽中填寫(xiě)的項(xiàng)目名稱(chēng)、項(xiàng)目編號(hào)、卷冊(cè)編號(hào)、圖紙名稱(chēng)、圖紙編號(hào)、設(shè)計(jì)時(shí)間、比例、版本、設(shè)計(jì)人員姓名、校審人員姓名等信息。圖紙標(biāo)注信息包括圖元的標(biāo)注信息(如門(mén)窗的大小、型號(hào)等)以及其他圖紙內(nèi)容的說(shuō)明。全文字識(shí)別是指對(duì)圖紙當(dāng)中所有文本進(jìn)行識(shí)別的技術(shù),識(shí)別后信息通常用于PDF圖紙的全文檢索。
2.1.2 圖像識(shí)別
較為常見(jiàn)的圖像識(shí)別技術(shù)有圖像分類(lèi)、目標(biāo)檢測(cè)和實(shí)例分割等。近年來(lái),開(kāi)源的基于深度學(xué)習(xí)的圖像識(shí)別算法例如VGG16、Faster RCNN,YOLO等,因?yàn)槠湟椎眯浴⒏哒_率和近乎實(shí)時(shí)的識(shí)別效率而被較為廣泛的應(yīng)用在各個(gè)生產(chǎn)系統(tǒng)當(dāng)中[5-6]。
深度學(xué)習(xí)的算法實(shí)現(xiàn)的圖像識(shí)別功能的主要難點(diǎn)在于需要大量被標(biāo)記的圖紙。獲取被標(biāo)記的圖紙可以通過(guò)利用圖紙和項(xiàng)目信息中的結(jié)構(gòu)化數(shù)據(jù)的關(guān)聯(lián)關(guān)系,使用計(jì)算機(jī)程序自動(dòng)化標(biāo)注的方法實(shí)現(xiàn)。例如可以通過(guò)數(shù)據(jù)庫(kù)中圖紙和設(shè)計(jì)人員關(guān)聯(lián),設(shè)計(jì)人員又和其所屬專(zhuān)業(yè)關(guān)聯(lián)的特性,將圖紙和其專(zhuān)業(yè)進(jìn)行關(guān)聯(lián),從而實(shí)現(xiàn)對(duì)圖紙所屬專(zhuān)業(yè)的自動(dòng)化標(biāo)注工作。還有部分訓(xùn)練數(shù)據(jù)可以通過(guò)開(kāi)源項(xiàng)目獲得,例如DICE項(xiàng)目[7]就提供了2000個(gè)CAD圖元的3D和2D模型,可以用于對(duì)圖紙中圖元的識(shí)別。
圖像識(shí)別算法可以被應(yīng)用在圖紙分類(lèi)、圖標(biāo)識(shí)別以及圖元識(shí)別等方面。其中圖紙分類(lèi)是指對(duì)圖紙按照其所屬專(zhuān)業(yè)、大小、繪制內(nèi)容進(jìn)行分類(lèi)。圖標(biāo)識(shí)別是指識(shí)別圖紙當(dāng)中參與單位標(biāo)識(shí)等特殊標(biāo)識(shí)。圖元識(shí)別是指識(shí)別圖像當(dāng)中有意義的圖紙?jiān)兀鐗Α⒋啊⒘骸⒅翘荨⒈芾揍樀取?/p>
在圖紙經(jīng)過(guò)了文字和圖像的識(shí)別以后,會(huì)挖掘出一系列結(jié)構(gòu)化信息,這些信息將被用來(lái)補(bǔ)全缺省以及促進(jìn)圖紙搜索質(zhì)量的改進(jìn)。
2.2.1 補(bǔ)全缺省信息
前文提到數(shù)字檔案館模塊由于開(kāi)發(fā)時(shí)間早,其中有大量圖紙只存在紙質(zhì)版本,現(xiàn)在需要工作人員對(duì)這些圖紙進(jìn)行掃描,實(shí)現(xiàn)其電子版本的二次歸檔。然而二次歸檔,不僅需要掃描圖紙電子版本,還要人工將紙質(zhì)版本和其電子版本進(jìn)行關(guān)聯(lián)。整個(gè)過(guò)程費(fèi)時(shí)費(fèi)力還容易出錯(cuò)。文字識(shí)別,作為檔案工作中的關(guān)鍵技術(shù),可以被用來(lái)開(kāi)發(fā)“掃描即歸檔”的功能從而解決這個(gè)問(wèn)題。
實(shí)現(xiàn)方法一是批量的對(duì)圖紙進(jìn)行掃描,將其轉(zhuǎn)化為PDF和JPG格式的文件;二是提交JPG格式的文件,利用訓(xùn)練好的文字識(shí)別工具識(shí)別出圖紙當(dāng)中的項(xiàng)目名稱(chēng)、圖紙名稱(chēng)、卷冊(cè)編號(hào)、設(shè)校審批人姓名等基本信息填寫(xiě)入待歸檔的清單;三是根據(jù)卷冊(cè)編號(hào)和項(xiàng)目名稱(chēng)反向查詢(xún)出數(shù)字檔案中原始文件的歸檔編號(hào)、存放位置等歸檔信息填入清單;四是根據(jù)JPG和PDF的對(duì)應(yīng)關(guān)系把PDF文件歸檔到所屬目錄。
2.2.2 提升搜索質(zhì)量
前文提到過(guò)電子成品檔案借閱模塊提供了對(duì)所有圖紙的全文檢索功能,但它存在以下幾點(diǎn)不足:一是對(duì)于PDF格式圖紙的全文檢索能力缺失;二是圖紙標(biāo)簽式檢索的維度過(guò)少;三是搜索停留在字面檢索的范疇,造成當(dāng)搜索目標(biāo)模糊時(shí),無(wú)法提供一個(gè)較為有效的搜索結(jié)果。
PDF格式圖紙不能全文檢索是指部分老圖紙只有PDF格式,無(wú)法通過(guò)搜索引擎進(jìn)行索引和查詢(xún)。解決該問(wèn)題,需要四個(gè)步驟:將PDF文件轉(zhuǎn)換為JPG格式,以方便后續(xù)處理;通過(guò)文字識(shí)別功能讀取圖紙中所有文字信息;通過(guò)爬蟲(chóng)技術(shù)將讀取的文字發(fā)送給搜索引擎建立索引。最后搜索引擎使用關(guān)鍵詞抽取技術(shù)[8-9]進(jìn)行分析并建立索引。標(biāo)簽式檢索維度少的問(wèn)題是指搜索引擎目前只能按照專(zhuān)業(yè)、階段、工程類(lèi)別三個(gè)維度進(jìn)行查詢(xún)。這樣查找到的圖紙范圍太廣,往往還需要針對(duì)關(guān)鍵字進(jìn)行二次查找。解決該問(wèn)題,一方面要整合補(bǔ)全缺省信息后的數(shù)字檔案館模塊和項(xiàng)目門(mén)戶(hù)模塊中的圖紙標(biāo)簽,將它們和圖紙通過(guò)搜索引擎進(jìn)行關(guān)聯(lián),補(bǔ)充到標(biāo)簽維度當(dāng)中;另一方面也可利用已經(jīng)訓(xùn)練好的文字和圖像識(shí)別功能對(duì)圖紙進(jìn)行數(shù)據(jù)挖掘,進(jìn)一步提取隱含信息作為關(guān)鍵字,進(jìn)而提升搜索效率。提取隱含信息的方式如下:①利用文字識(shí)別功能識(shí)別圖紙標(biāo)注,建立圖紙尺寸大小標(biāo)簽;②通過(guò)圖像識(shí)別功能對(duì)圖紙圖元進(jìn)行識(shí)別分類(lèi),建立圖紙繪制內(nèi)容標(biāo)簽;③通過(guò)圖標(biāo)識(shí)別功能識(shí)別設(shè)計(jì)單位和圖集標(biāo)識(shí)信息,建立設(shè)計(jì)單位和圖集標(biāo)識(shí)標(biāo)簽。
針對(duì)搜索目標(biāo)模糊的情況,一方面需要提供更多的搜索標(biāo)簽,以便于縮小搜索范圍;另一方面需要利用深度學(xué)習(xí)和圖紙數(shù)據(jù)庫(kù)建立圖紙推薦算法從而實(shí)現(xiàn)以圖搜圖。圖紙推薦算法包含特征提取、特征索引、特征分析和特征比對(duì)[10-11]四個(gè)步驟。其中特征提取是神經(jīng)網(wǎng)絡(luò)對(duì)所有圖紙?zhí)崛√卣鲾?shù)據(jù)的過(guò)程。特征數(shù)據(jù)可以是結(jié)構(gòu)化的,如工程名稱(chēng)或者設(shè)計(jì)單位;也可以是非結(jié)構(gòu)化的,如一個(gè)卷積網(wǎng)絡(luò)提取出來(lái)的表示圖紙?zhí)卣鞯亩嗑S張量。特征索引是將圖紙?zhí)卣鬟M(jìn)行存儲(chǔ)的過(guò)程。特征分析是對(duì)輸入圖紙進(jìn)行分析,提取搜索要素的過(guò)程。搜索要素一般會(huì)包含如圖紙名稱(chēng)這樣的圖紙基礎(chǔ)信息,也會(huì)包含如卷積特征張量這樣的隱藏信息。有時(shí)候,搜索要素還會(huì)包含搜索人的專(zhuān)業(yè)或者搜索歷史記錄這樣的極具個(gè)人特色的數(shù)據(jù)。特征比對(duì)是指通過(guò)最近鄰算法或?qū)嵗评韀12]等手段,將特征分析結(jié)果和數(shù)據(jù)庫(kù)中圖紙的特征信息進(jìn)行比對(duì)的過(guò)程。特征比對(duì)時(shí)通常會(huì)首先使用文字比對(duì),縮小搜索范圍;然后再通過(guò)比對(duì)圖紙細(xì)節(jié)特征,鎖定要搜索的圖紙內(nèi)容。
在補(bǔ)全缺損信息及完成圖紙推薦算法后,可以實(shí)現(xiàn)輔助設(shè)計(jì)和自動(dòng)化設(shè)計(jì)的功能,進(jìn)一步的提升設(shè)計(jì)企業(yè)的生產(chǎn)效率。
輔助設(shè)計(jì)功能是指在繪制圖紙的過(guò)程中,根據(jù)圖紙正在繪制的內(nèi)容,實(shí)時(shí)進(jìn)行提示的功能。提示信息可以包含設(shè)計(jì)的各個(gè)方面,如對(duì)當(dāng)前繪制圖元自動(dòng)的補(bǔ)全;對(duì)當(dāng)前卷冊(cè)提供相關(guān)專(zhuān)業(yè)類(lèi)似設(shè)計(jì)圖紙參考;對(duì)設(shè)計(jì)中存在錯(cuò)誤的分析等。這些功能實(shí)際上雖然只是對(duì)圖紙信息和相關(guān)應(yīng)用的整合,但對(duì)算法的實(shí)時(shí)性和準(zhǔn)確性提出了更高的要求。
自動(dòng)化設(shè)計(jì)是指在需求較為明確的情況下,軟件自動(dòng)實(shí)現(xiàn)對(duì)圖紙的設(shè)計(jì)和繪制的過(guò)程。自動(dòng)化設(shè)計(jì)功能目前主要應(yīng)用在建筑的功能性設(shè)計(jì)[13]領(lǐng)域,實(shí)現(xiàn)了在提供房間圖紙的情況下自動(dòng)化擺放家具到合理位置的功能。其實(shí)現(xiàn)方法主要還是通過(guò)深度學(xué)習(xí)算法:首先將設(shè)計(jì)好的圖紙使用矩形框標(biāo)注出房間功能以及家具的位置和類(lèi)型;然后把房間以及房間的門(mén)和窗的位置作為輸入,功能性家具的位置和種類(lèi)作為輸出對(duì)圖形分割算法的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練;最后利用訓(xùn)練好的算法對(duì)初始房間圖形進(jìn)行布置。
雖然目前自動(dòng)化設(shè)計(jì)功能的應(yīng)用領(lǐng)域尚較為狹窄,然而因其響應(yīng)速度快,人工消耗少,智能程度高的特點(diǎn),將越來(lái)越多的被應(yīng)用在投標(biāo)招標(biāo)及工程實(shí)施階的各個(gè)階段。
本文以本院為例,對(duì)圖紙利用方法進(jìn)行了研究,提出了首先直接利用已有數(shù)據(jù)幫助設(shè)計(jì)人員在更大范圍、更多維度查找圖紙內(nèi)容,促進(jìn)圖紙的再利用;然后利用深度學(xué)習(xí)算法挖掘圖紙潛在價(jià)值,補(bǔ)全缺省信息,提升搜索質(zhì)量;最后綜合所有數(shù)據(jù)和應(yīng)用實(shí)現(xiàn)輔助化和自動(dòng)化的設(shè)計(jì)策略。該策略可以顯著提升設(shè)計(jì)企業(yè)生產(chǎn)效率,在行業(yè)內(nèi)極具推廣價(jià)值。