文|高天
隨著鋼結構制造企業的發展和數字化轉型的不斷深入,大量的圖紙和工程文檔成為企業管理中不可或缺的一部分。然而,傳統的工程圖紙管理和識別過程通常需要耗費大量的人力和時間,且容易出現錯誤。因此本文基于OCR識別技術將工程圖紙等工程文檔轉化為可編輯文本,提供了一種處理大量圖紙的自動化技術方式,從而實現企業精細化管理,提高管理和工作效率。
鋼結構制造企業在設計階段涉及大量的信息處理,這些信息涵蓋了從項目規劃到產品制造的各個方面,其中國內鋼結構制造企業對于信息處理仍大量采用人工處理方式,尤其在鋼結構定額信息化管理方面的研究仍處于起步階段。通過調研發現現有鋼結構定額過程中,材料表的提取是定額計算的基礎,目前主要采用人工統計完成,存在效率慢、易出錯的特點。
雖然諸多學者都對表單的快速提取做了大量研究,但仍有許多關鍵問題亟須解決,如多張材料單的匯總、材料單的正確率提高、材料單解析并發量的滿足、文檔解析可視化等問題。南開大學的尚子峰提出利用OCR技術實現基于模板的通用表單處理系統,該系統模板以XML文檔形式存放。首先該模型不滿足Excel文檔格式的存儲;其次該模型提取表單的正確率較低,約為88%,且不能實現解析結果的可視化。國防科技大學任通、程江華等人提出基于OCR技術的電子掃描表格圖像的自動識別算法,提高了識別的準確率,但是該方法僅停留在試驗環境,沒有并發量的考慮。
目前鋼結構市場面臨極大的競爭,精益化管理成了行業共同關注的主題,如何快速精準提取大量工程圖紙中的材料表,提高板材的利用率,提高計算效率和降低生產成本,是迫切需要解決的問題。
OCR技術是一種將圖像中的文字轉換為可編輯、可搜索的電子文本形式的技術。該技術在銀行、保險業和人工智能領域中得到了廣泛應用。銀行和保險公司利用OCR技術對用戶的身份證、銀行卡等證件進行識別并完成相關操作,提高了業務辦理效率和準確率。在人工智能領域中,OCR技術能夠提高數據的準確性和處理效率,為機器學習和人工智能提供有力支持。因此利用OCR機器識別技術在鋼結構制造企業也完全可行,利用OCR機器學習技術、計算機視覺技術搭建數據解析模型,實現非結構化數據到結構化功能關系的建立,完成從數據的識別、解析、抽取、校驗、管理等基礎功能組建的材料表智能提取系統。
通過采用智能解析算法,運用OCR機器學習技術、機器視覺技術實現PDF文件、圖片、掃描件等非結構化數據的批量解析和提取,實現表單解析可視化,實現解析結果的可追溯性。主要研究方法如下:
圖像處理和分割:對于圖紙中的材料表,首先需要對圖紙進行圖像處理和分割,將材料表從圖紙中提取出來。
區域檢測和定位:一旦材料表被提取出來,需要確定表格在圖像中的位置和邊界。
文字識別:可以使用OCR技術,將表格中的文字內容轉化為可編輯的電子文本。表格中可能有不同的字體、符號、大小和顏色,需要考慮多樣性。
模型訓練與優化:基于機器學習的方法,可以構建模型來識別和提取材料表信息。使用標注好的數據來訓練模型,不斷優化模型的性能。
規則引擎:在一些情況下,可以基于規則引擎來設計規則,例如識別特定格式的單元格,以支持特定類型的材料信息提取。
驗證與評估:在開發好的方法和模型中,使用一些真實的圖紙數據,評估方法的準確性和效率。
該系統主要由非結構化數據(PDF文件、圖片)、提取信息系統編程接口、智能解析算法、可視化界面,應用功能服務幾個部分構成,如圖1所示。

圖1 智能提取材料清單系統構成
針對存在的多種非結構化數據例如自PDF文件、圖片、掃描件等,運用OCR機器學習技術、智能解析算法實現非結構化數據的批量解析和提取,提取形式見表1。

表1 非結構化數據的抽取形式
本文旨在提高使用OCR技術識別鋼板材料表計算效率和準確率,實現鋼結構的成本精細化管理。基于深度學習的OCR算法,實現材料表自動提取的同時,要根據材料表文件的不同清晰度,實現不同范圍的識別準確度,確保準確率,但是考慮到不同設計圖的命名規范問題,不能將主要特征作為判定的唯一條件。
鋼結構制造企業數據主要來自PDF/JPG等不同格式材料文件,這些設計文檔還包括大量其他信息,其中所需要定額的材料表,一般都存在設計圖紙中,提供的形式通常為兩種形式:PDF或者紙質藍圖。其中PDF根據清晰度可以分為三類:AutoCAD直接打印的PDF文件、根據紙質藍圖掃描成的PDF文件和圖片。
為了滿足生產需求,根據所提供的設計文檔,需要提取的圖表主要為材料表,材料表的主要特征為:一是材料表的表格名稱(以下簡稱表名)主要特征:“XXX材料表”“XXX數量表”等關鍵字;二是表格的列字段(以下稱為表頭)包含編號、規格、單重、數量等字段。
因此,材料表需要提取的內容有表格名稱、表格內容、規格列中特殊符號對應的鋼材類型、頁碼、梁段名稱等。還要根據材料表中的小計、合計、總重等字段,結合合并行單元格的特性來判定匯總數據所在的行數,便于進行快速核對。
目前鋼結構制造企業提取制造數據從工程圖紙定位所需要的材料,整理多種轉化后的工程圖紙數字樣式和不同規格列表格式,因此每次核對文件通常要上傳成百上千張圖紙。該系統以項目為基礎,不同工程圖紙按照項目整合,進行OCR集中識別。系統呈現界面顯示從源文檔中切割的圖片和識別后結果的界面,通過鼠標懸浮在指定區域,進行高亮處理,幫助工作人員進行線上差錯處理,節約核對時間。識別結果均為可編輯文檔,包括在線編輯和下載后編輯,經測試該系統識別準確率高達95%以上。圖紙識別后界面如圖2所示。

圖2 圖紙識別后界面
不同的材料表按照識別出頁碼在平臺內進行展示,便于工作人員的核對、計算、統計等后續工作。不同工程圖紙分別保存在各個項目菜單中,材料信息保存到數據庫,按照索引方式進行收集,方便員工查閱和追溯。隨著系統數據的大量積累,為后續數據分析提供有力支撐,為公司精細化管理提供路徑。
基于OCR的工程圖紙識別定額系統主要通過工作人員進行線上數據統計,包括材料表提取、核對和導出,顯著提升了管理水平,主要體現在以下方面:①在自動化圖紙處理方面,系統可以自動完成很多繁瑣的識別和錄入工作,提高圖紙處理的自動化水平,節約時間和人力資源;②在圖紙版本控制方面,對圖紙上的版本號、日期等信息進行自動識別,確保使用最新的圖紙版本,避免錯誤和混淆;③在快速搜索與檢索方面,將識別后的圖紙信息存儲到數據庫中,可以實現快速的文本搜索和檢索功能,使管理團隊能夠迅速找到需要的圖紙和信息。
通過進一步對OCR技術進行剖析,發現企業精細化管理可更進一步。在數字化檔案管理方面,通過OCR技術,圖紙可以從紙質文檔轉換為電子文本,并且可編輯、可搜索。在減少錯誤和質量控制方面,可減少手工輸入錯誤,提高圖紙處理的準確性和質量控制水平,有助于預防錯誤和避免潛在風險。通過將圖紙信息數字化,可以更好地進行知識管理和傳承,新加入項目員工可以更容易地訪問和理解過去的項目信息,快速融入項目團隊。
隨著人工智能和計算機視覺技術的不斷發展,未來的OCR技術可以拓展到更多應用場景,制造企業可以積極探索和應用OCR技術在不同領域的潛力。OCR技術可以提供更高的集成性,能夠無縫連接到企業的信息系統和生產系統中,這將有助于實現信息的實時共享和協作,推動企業數字化轉型和智能化發展。OCR技術作用于數據分析與決策支持層面,通過線上收集這些數據可以用于進行數據分析和挖掘,為決策提供科學依據。制造企業通常有自己獨特的業務需求,可考慮開發定制化OCR應用,以滿足特定場景的生產和管理需求。