文/福建省泉州市城鄉(xiāng)規(guī)劃信息中心 吳新蓉
城市規(guī)劃屬于一項(xiàng)重點(diǎn)工作,而其中的檔案管理與工程質(zhì)量息息相關(guān)。城市規(guī)劃?rùn)n案屬于各個(gè)部門展開規(guī)劃管理、規(guī)劃審批的主要依據(jù),同時(shí)能夠?qū)こ藤|(zhì)量進(jìn)行評(píng)估,看其是否符合相關(guān)的建設(shè)標(biāo)準(zhǔn)。而信息技術(shù)的快速發(fā)展,讓以往的城市規(guī)劃?rùn)n案數(shù)據(jù)處理以及檢索逐漸被淘汰,無(wú)法滿足大家的應(yīng)用需求。而將AI文字識(shí)別技術(shù)應(yīng)用到城市規(guī)劃?rùn)n案工作中,可以彌補(bǔ)傳統(tǒng)工作中的不足,使檔案工作的效率與質(zhì)量顯著提升,最終讓城市規(guī)劃?rùn)n案顯現(xiàn)出巨大的價(jià)值。
自2015年以來(lái),我國(guó)各個(gè)地區(qū)逐步開啟了城市規(guī)劃?rùn)n案數(shù)字化工作,到2018年,部分重點(diǎn)區(qū)域已經(jīng)形成了規(guī)范化的數(shù)字檔案,并且能夠?qū)崿F(xiàn)統(tǒng)一的管理。用戶能夠根據(jù)自己的權(quán)限,調(diào)取系統(tǒng)中的部分內(nèi)容;而有關(guān)的工作人員還能夠達(dá)成在線移交、在線調(diào)取等,這些工作的實(shí)現(xiàn)都為后續(xù)的檔案數(shù)據(jù)挖掘打下良好基礎(chǔ)。
在這一過(guò)程中,逐漸顯露出一些問(wèn)題,雖然檔案數(shù)字化投入了大量的人力、物力以及財(cái)力,數(shù)字化建設(shè)團(tuán)隊(duì)越來(lái)越多,但是由于城市規(guī)劃?rùn)n案數(shù)據(jù)較為繁雜且種類繁多,致使部分歷史檔案有所缺失,無(wú)法保障檔案的完整性。
在收集城市規(guī)劃?rùn)n案時(shí),工作人員在整理、鑒定數(shù)據(jù)的有效性等方面會(huì)耗費(fèi)大量的時(shí)間與精力,同時(shí)還要與規(guī)劃部門進(jìn)行協(xié)調(diào)。前期的數(shù)據(jù)鑒定工作基本上是人工進(jìn)行操作,審查時(shí)間長(zhǎng)、處理效率低。現(xiàn)階段的城市規(guī)劃?rùn)n案主要分為三方面,分別為規(guī)劃編制類、規(guī)劃管理類與規(guī)劃監(jiān)管類,在每一個(gè)類型下還會(huì)細(xì)分出眾多的子項(xiàng)目,檔案數(shù)量多,類型雜,并且檔案中還存在著一些敏感信息,在移交檔案時(shí),可能出現(xiàn)數(shù)據(jù)重復(fù)與分類錯(cuò)誤等問(wèn)題,這會(huì)對(duì)后續(xù)的工作造成一定的不利影響,同時(shí)會(huì)對(duì)檔案的數(shù)字化建設(shè)與價(jià)值挖掘造成阻礙,進(jìn)一步增加了檔案處理的復(fù)雜度。
在城市規(guī)劃?rùn)n案數(shù)字化中應(yīng)用AI文字識(shí)別技術(shù),可以從根本上降低工作量,并且保障檔案文字錄入失誤大幅度減少,從而使得檔案錄入質(zhì)量顯著提升。同時(shí),當(dāng)進(jìn)行歷史檔案補(bǔ)錄工作時(shí),AI文字識(shí)別技術(shù)的應(yīng)用,可以起到技術(shù)上的支持,使得檔案數(shù)據(jù)更加完整、可靠。具體應(yīng)用優(yōu)勢(shì)如以下:
(一)具有較強(qiáng)的精準(zhǔn)性。現(xiàn)如今,市場(chǎng)上普遍運(yùn)用的AI文字識(shí)別技術(shù)一般都基于深度學(xué)習(xí)能力,能夠?yàn)槭褂萌后w提供包括圖片在內(nèi)的多種文字識(shí)別檢測(cè)服務(wù),在速度上以及操作上具有明顯的優(yōu)勢(shì)。并且,在我國(guó)部分地區(qū)的城市規(guī)劃?rùn)n案數(shù)字化工作當(dāng)中,AI文字識(shí)別技術(shù)的應(yīng)用,與手寫識(shí)別相對(duì)比,其準(zhǔn)確率可以達(dá)到70%,而對(duì)于一些印刷的文字,在識(shí)別上準(zhǔn)確率能夠達(dá)到90%。
(二)具有高效率。目前所存在的AI文字識(shí)別技術(shù),每一字符識(shí)別時(shí)間平均為2ms,而且可以在連續(xù)的更新與優(yōu)化中始終保持著穩(wěn)定。在部分城市規(guī)劃?rùn)n案處理實(shí)例中,每完成一件檔案,時(shí)間約為3分鐘,這包括了格式轉(zhuǎn)換時(shí)間、網(wǎng)絡(luò)傳輸時(shí)間、文字識(shí)別時(shí)間以及人工校對(duì)時(shí)間。如果將AI文字識(shí)別技術(shù)應(yīng)用到城市規(guī)劃?rùn)n案工作中,其文檔提取時(shí)間相較于傳統(tǒng)的文字識(shí)別方法能夠縮短1分鐘。
(三)具有較高的穩(wěn)定性。AI文字識(shí)別技術(shù),可以完成對(duì)多種格式的圖像以及文字的編碼轉(zhuǎn)換,并且在表格處理工作時(shí),還能夠判斷出圖像表格的準(zhǔn)確數(shù)量,完成動(dòng)態(tài)化的切割操作,讓經(jīng)過(guò)切割之后的圖像仍然可以保存原有的表格塊。除了這些,AI文字識(shí)別技術(shù)本身具備著文字糾錯(cuò)功能,具有較高的穩(wěn)定性能。
(四)具有針對(duì)性。在實(shí)際的城市規(guī)劃?rùn)n案數(shù)字化工作當(dāng)中,將AI文字識(shí)別技術(shù)應(yīng)用到其中,能夠?qū)崿F(xiàn)自主模版配置功能,并結(jié)合實(shí)際的檔案樣式完成相應(yīng)的配置,讓其可以達(dá)成城市規(guī)劃?rùn)n案提取以及補(bǔ)錄的具體要求。
(五)具有友好性。現(xiàn)如今,已經(jīng)存在的AI文字識(shí)別技術(shù)逐步擁有了文字批量識(shí)別、單文件識(shí)別、項(xiàng)目識(shí)別等功能,使用群體只需要把檔案上傳到系統(tǒng)中,就可以達(dá)成全文數(shù)字化的檢測(cè),并對(duì)檢測(cè)完的成果進(jìn)行驗(yàn)證,如果驗(yàn)證通過(guò)了,那么會(huì)和原有設(shè)定模板進(jìn)行匹配,如果識(shí)別失敗,會(huì)快速反饋,并提示出錯(cuò)誤的原因,最終讓所識(shí)別的檔案信息完成自動(dòng)化的分表顯示以及分組顯示。
(一)實(shí)現(xiàn)技術(shù)上的創(chuàng)新。首先,應(yīng)完成圖像去噪這一工作。對(duì)于城市規(guī)劃?rùn)n案而言,其中所涉及的大部分文件屬于老舊的紙質(zhì)文件,而這些文件上多多少少會(huì)存在著染色、字跡模糊等情況,這時(shí)便要完成圖像去噪,讓文字識(shí)別的精準(zhǔn)度顯著提升。其次,要進(jìn)行表格提取這一工作。城市規(guī)劃?rùn)n案里面的絕大部分內(nèi)容都會(huì)以表格的形式存在,因?yàn)楸砀窬€的影響,若采取傳統(tǒng)的文字識(shí)別技術(shù),會(huì)降低識(shí)別的效果。而應(yīng)用AI文字識(shí)別技術(shù)中的表格提取算法,可以把所有的表格提煉出來(lái),并完成對(duì)各個(gè)類別數(shù)據(jù)的整合,確保文字識(shí)別的精準(zhǔn)度。此外,應(yīng)優(yōu)化識(shí)別的結(jié)果。要結(jié)合檔案信息的實(shí)際需求,對(duì)所得出的識(shí)別結(jié)果進(jìn)行轉(zhuǎn)換,讓其成為預(yù)期格式,比如電話格式、時(shí)間類型等,不但提升了工作質(zhì)量,還會(huì)提升數(shù)據(jù)的精準(zhǔn)性。最后,要完成項(xiàng)目識(shí)別的排序分組。開展大規(guī)模的項(xiàng)目識(shí)別工作時(shí),許多檔案編號(hào)在排列上具有規(guī)律性。對(duì)此,要按照檔案編號(hào)的實(shí)際特點(diǎn),專門打造出一種分組排序算法,讓所有的檔案都能夠精準(zhǔn)完成算法排序工作,讓大規(guī)模的檔案實(shí)現(xiàn)數(shù)字化識(shí)別。
(二)把控根本質(zhì)量。AI文字識(shí)別技術(shù)與傳統(tǒng)的手寫文字識(shí)別方式進(jìn)行對(duì)比,在識(shí)別的精準(zhǔn)性上不是很高。對(duì)此,需要對(duì)識(shí)別結(jié)果進(jìn)行檢查。第一,完整性檢查,按照檔案的著錄字段以及城市規(guī)劃數(shù)據(jù)的根本要求,查看基于AI文字識(shí)別之下的結(jié)果是否完整,對(duì)于一些應(yīng)該錄入而未錄入的字段進(jìn)行重點(diǎn)檢測(cè)。第二,精準(zhǔn)性檢查,根據(jù)比例進(jìn)行抽查工作,看識(shí)別結(jié)果中是否存在文字上以及內(nèi)容上的錯(cuò)誤。第三,有效性檢查,對(duì)電話號(hào)碼、檢查日期及其編號(hào)等內(nèi)容,查看其格式轉(zhuǎn)換是否正確,以此保障著錄數(shù)據(jù)在實(shí)際應(yīng)用時(shí)的可行性。質(zhì)量檢測(cè)時(shí),可以采取人工檢測(cè)或者是機(jī)器檢測(cè)的方法,打造AI文字識(shí)別系統(tǒng)時(shí),要對(duì)嵌入機(jī)器的檢測(cè)步驟進(jìn)行綜合考慮,從而使機(jī)器檢測(cè)結(jié)果體現(xiàn)在人工復(fù)檢中,讓檢測(cè)質(zhì)量達(dá)成雙重的把控。
(三)優(yōu)化數(shù)字化加工流程。在開展城市規(guī)劃?rùn)n案數(shù)字化工作時(shí),應(yīng)巧妙應(yīng)用AI文字識(shí)別技術(shù),并讓所有的數(shù)字化加工流程得以確認(rèn)。首先,在圖像掃描階段,應(yīng)提前完成電子文件格式的轉(zhuǎn)換。其次,原有人工錄入階段,可以用AI自動(dòng)識(shí)別技術(shù)進(jìn)行取代,但是最后還需要采取人工校對(duì)的方法,提升檔案數(shù)字化工作效率。此外,要完成檔案系統(tǒng)和AI文字識(shí)別技術(shù)間的有效銜接,利用減少步驟環(huán)節(jié)、變化時(shí)序等形式,讓AI技術(shù)可以更好地應(yīng)用到檔案數(shù)字化工作中,使各個(gè)操作流程變得簡(jiǎn)單,達(dá)成降低成本的目標(biāo)。需要注意一點(diǎn),優(yōu)化流程并不是短時(shí)間內(nèi)就可以達(dá)成的,而是需要根據(jù)時(shí)間的推移不斷完善技術(shù)。
(四)做到安全管控。首先,應(yīng)當(dāng)使用可靠、穩(wěn)定的AI文字識(shí)別技術(shù)系統(tǒng),系統(tǒng)屬于技術(shù)應(yīng)用的主要載體。而在城市規(guī)劃?rùn)n案數(shù)字化工作之中,早期工作一般會(huì)應(yīng)用現(xiàn)有的第三方平臺(tái)。在進(jìn)行平臺(tái)選擇時(shí),應(yīng)先完成多方內(nèi)容的比對(duì),檢測(cè)好主流AI文字識(shí)別平臺(tái)是否穩(wěn)定、安全,以此避免由于系統(tǒng)存在漏洞而造成檔案的外泄以及遺失。其次,完善現(xiàn)場(chǎng)安全管理機(jī)制。應(yīng)根據(jù)新時(shí)期的發(fā)展特點(diǎn),對(duì)各項(xiàng)任務(wù)進(jìn)行有效分配,制訂相關(guān)的安全管理機(jī)制。比如,在設(shè)備安全檢查、網(wǎng)絡(luò)線路上制訂出應(yīng)急制度,以此保障問(wèn)題解決得及時(shí)性,讓安全管理的水平顯著提升。最后,強(qiáng)化數(shù)據(jù)安全管理。根據(jù)數(shù)據(jù)的具體使用方向以及實(shí)際工作與使用情境,創(chuàng)設(shè)AI文字識(shí)別系統(tǒng)與數(shù)據(jù)庫(kù),城鄉(xiāng)規(guī)劃?rùn)n案在進(jìn)行數(shù)字化建設(shè)之前,首先要對(duì)數(shù)據(jù)檔案的保密性進(jìn)行分級(jí)。在數(shù)據(jù)安全管理中,對(duì)于密級(jí)數(shù)據(jù)檔案與非密級(jí)數(shù)據(jù)檔案,在數(shù)字化構(gòu)建與數(shù)字化管理中的方式存在著較大的差異性,其中的各項(xiàng)要求也不同。在完成數(shù)字化構(gòu)建之后,要進(jìn)行數(shù)字化成果核驗(yàn),挑選出不適合對(duì)外公布的數(shù)據(jù)信息,并集中進(jìn)行刪除。在AI文字識(shí)別平臺(tái)與檔案管理系統(tǒng)中,要針對(duì)不同用戶的訪問(wèn)權(quán)限進(jìn)行分類管理,成果數(shù)據(jù)只能在指定的操作范圍內(nèi)進(jìn)行使用。
總而言之,除了上述內(nèi)容,若想讓AI文字識(shí)別技術(shù)的應(yīng)用更加有效,應(yīng)加強(qiáng)對(duì)于數(shù)據(jù)的安全管理,根據(jù)實(shí)際的城市規(guī)劃?rùn)n案工作情況,構(gòu)建出高質(zhì)量的AI文字識(shí)別憑條,讓檔案更具安全性。此外,對(duì)于一些數(shù)字化成果,還要進(jìn)行保密檢查,將一些不適合對(duì)外公開的內(nèi)容進(jìn)行剔除,使得城市規(guī)劃?rùn)n案所公開的內(nèi)容更加規(guī)范、合理,提升檔案管理的有效性,為城市規(guī)劃后續(xù)工作的實(shí)施打下良好基礎(chǔ)。