劉 瞻,付 饒,魯俊杰,鄧惠芬,楊曄軒
(1. 武漢市自然資源和規(guī)劃信息中心,湖北 武漢 430014;2. 湖北省空間規(guī)劃研究院,湖北 武漢 430071)
國(guó)土空間用途管制是指以總體規(guī)劃、詳細(xì)規(guī)劃為依據(jù),對(duì)陸海所有國(guó)土空間的保護(hù)、開(kāi)發(fā)和利用活動(dòng),按照規(guī)劃確定的區(qū)域、邊界、用途和使用條件等,核實(shí)行政許可、進(jìn)行行政審批等。2021年自然資源部辦公廳發(fā)布的《國(guó)土空間用途管制數(shù)據(jù)規(guī)范(試行)》提出,構(gòu)建“全域、全要素、全流程、全生命周期”的用途管制數(shù)據(jù)體系。近年來(lái),武漢市自然資源和規(guī)劃局通過(guò)開(kāi)展審批服務(wù)“一條龍”、“大集中”改革,在探索用途管制全周期管理等方面取得了一定成效,但仍存在用途管制各環(huán)節(jié)難以高效、精準(zhǔn)關(guān)聯(lián),許可審批與規(guī)劃編制、事中事后監(jiān)管全鏈統(tǒng)籌管理缺乏有效技術(shù)手段等問(wèn)題。隨著改革與應(yīng)用的不斷深入,以關(guān)系型數(shù)據(jù)為基礎(chǔ)的鏈?zhǔn)焦芾砗鸵詷?shù)形結(jié)構(gòu)管理項(xiàng)目的模式已無(wú)法滿足最新要求。圖譜在建立復(fù)雜數(shù)據(jù)實(shí)體映射關(guān)系、挖掘?qū)嶓w之間隱藏關(guān)聯(lián)等方面具有一定優(yōu)勢(shì),逐步成為數(shù)據(jù)挖掘、知識(shí)計(jì)量的新技術(shù)手段。本文通過(guò)引入知識(shí)圖譜技術(shù)鏈接空間單元和各管理環(huán)節(jié)信息,提出了國(guó)土空間用途管制時(shí)序圖譜的構(gòu)建方法,探索了國(guó)土空間用途管制時(shí)序圖譜在信息融合、知識(shí)推理和時(shí)空分析等方面的應(yīng)用,取得了良好效果。
原始數(shù)據(jù)通常需經(jīng)過(guò)數(shù)據(jù)整合、知識(shí)抽取(實(shí)體抽取、關(guān)系抽取)、知識(shí)融合(實(shí)體對(duì)齊)、數(shù)據(jù)模型構(gòu)建、質(zhì)量評(píng)估等步驟,最終形成基于實(shí)體、客體和關(guān)系的靜態(tài)三元組(s,r,o)的知識(shí)表示。國(guó)土空間用途管制全周期管理具有很強(qiáng)的時(shí)空特征,各階段具有明確的空間位置,且許可行為和監(jiān)管與時(shí)序高度相關(guān),因此將時(shí)間信息嵌入到傳統(tǒng)知識(shí)圖譜的靜態(tài)三元組中,以四元組(s,r,o,t)表達(dá)國(guó)土空間用途管制各階段信息及其關(guān)聯(lián)關(guān)系,有助于蘊(yùn)涵其實(shí)體、空間隨時(shí)間變化的復(fù)雜邏輯關(guān)系信息。不同于通用領(lǐng)域圖譜基于泛在文本的NLP提取構(gòu)建方法,本文以武漢市已良好組織的許可結(jié)構(gòu)化數(shù)據(jù)為基礎(chǔ)構(gòu)建用途管制實(shí)體和關(guān)系;以項(xiàng)目審批為主線、行政許可為內(nèi)核、空間為載體、時(shí)序?yàn)閰⒖迹瑒澐挚茖W(xué)可行的知識(shí)粒度,采用空間分析和語(yǔ)義匹配方法形成用途管制各階段、各節(jié)點(diǎn)及其相關(guān)管理環(huán)節(jié)的多鏈路圖譜,服務(wù)于國(guó)土空間用途管制全周期管理。
國(guó)土空間用途管制實(shí)體的分類和定義確定了知識(shí)圖譜的管理范圍和粒度。通過(guò)綜合分析國(guó)土空間用途管制在審批服務(wù)、全周期監(jiān)管、信息共享共用等場(chǎng)景下的應(yīng)用要求與特點(diǎn),本文將用途管制知識(shí)實(shí)體分為4 大類32小類(表1)。基于上述實(shí)體定義,通過(guò)命名實(shí)體識(shí)別(NER)任務(wù)加人工輔助的方式,從自然資源和規(guī)劃行政審批、規(guī)劃編制、行政辦公以及各類專題數(shù)據(jù)中識(shí)別、提取和構(gòu)建實(shí)體。根據(jù)自然資源部《國(guó)土空間用途管制數(shù)據(jù)規(guī)范(試行)》和武漢市現(xiàn)階段數(shù)據(jù)基礎(chǔ),明確了各實(shí)體類型共1 100余項(xiàng)的屬性,按照?qǐng)D(空間信息)、文(文檔資料)、數(shù)(核心數(shù)據(jù))3種形式收錄并與實(shí)體進(jìn)行關(guān)聯(lián)。

表1 國(guó)土空間用途管制實(shí)體分類
通用領(lǐng)域知識(shí)圖譜基于機(jī)器學(xué)習(xí)、NLP語(yǔ)義分析的關(guān)系提取方法,難以處理國(guó)土空間用途管制領(lǐng)域?qū)嶓w之間的復(fù)雜時(shí)空關(guān)系,因此本文提出一種雙向時(shí)序空間交會(huì)算法,用以構(gòu)建用途管制實(shí)體間的復(fù)雜網(wǎng)絡(luò)化關(guān)系。算法主要步驟為:①通過(guò)空間關(guān)系和語(yǔ)義關(guān)系構(gòu)建項(xiàng)目備選實(shí)體集、R 樹(shù)空間索引,并按時(shí)間排序;②選取某一實(shí)體作為初始節(jié)點(diǎn),遞歸計(jì)算初始節(jié)點(diǎn)與正向時(shí)序相鄰實(shí)體的空間拓?fù)洹r(shí)序和語(yǔ)義等關(guān)系(表2),關(guān)系成立歸入結(jié)果集;③由結(jié)果集按照反向時(shí)序遞歸計(jì)算關(guān)系,驗(yàn)證并補(bǔ)齊形成最終實(shí)體關(guān)系集。算法一般但不限定選取項(xiàng)目審批的起始許可作為初始節(jié)點(diǎn),起始許可因項(xiàng)目類型不同而有所不同。實(shí)際處理中可選取隨機(jī)實(shí)體作為初始節(jié)點(diǎn)計(jì)算交叉驗(yàn)證實(shí)體關(guān)系,規(guī)避歷史數(shù)據(jù)中因起始許可缺失或時(shí)序錯(cuò)誤帶來(lái)的影響。分析最終結(jié)果集可知,多種類型的實(shí)體與關(guān)系表現(xiàn)出組合特征和內(nèi)聚性,與審批項(xiàng)目分類相對(duì)應(yīng)。

表2 國(guó)土空間用途管制實(shí)體關(guān)系表
時(shí)間元素的引入,不僅擴(kuò)展了用途管制圖譜的知識(shí)表達(dá),而且是分析計(jì)算實(shí)體關(guān)系的重要參考,分解為單向時(shí)序的遞歸運(yùn)算可極大提高海量數(shù)據(jù)的計(jì)算效率,正向時(shí)序交會(huì)快速構(gòu)建實(shí)體關(guān)系的多鏈路結(jié)構(gòu),反向時(shí)序交會(huì)鏈接鏈路形成網(wǎng)絡(luò)結(jié)構(gòu)。雙向時(shí)序空間組合分析主要解決兩方面問(wèn)題:①在空間管理單元(地塊)和審批許可過(guò)程-映射的基礎(chǔ)上,建立實(shí)體間分拆、合并的多元關(guān)系,反映用途管制的實(shí)施路徑;②通過(guò)雙向回溯機(jī)制有效銜接空間準(zhǔn)入、用途轉(zhuǎn)換與規(guī)劃實(shí)施階段,加強(qiáng)不同類型項(xiàng)目之間的聯(lián)系,將單一的實(shí)體關(guān)聯(lián)關(guān)系轉(zhuǎn)換為帶有時(shí)間序列和方向的全流程鏈接信息,實(shí)現(xiàn)國(guó)土和規(guī)劃業(yè)務(wù)的全流程關(guān)聯(lián)。
對(duì)于國(guó)土空間用途管制中技術(shù)服務(wù)、監(jiān)管處罰、行政管理等不具備空間屬性的實(shí)體,通過(guò)神經(jīng)網(wǎng)絡(luò)檢索方法實(shí)現(xiàn)基于機(jī)器學(xué)習(xí)的輔助關(guān)聯(lián)。相較于傳統(tǒng)文本匹配方法,神經(jīng)網(wǎng)絡(luò)檢索將文檔或數(shù)據(jù)集中的信息用神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)和編碼,度量語(yǔ)義相似度來(lái)實(shí)現(xiàn)快速準(zhǔn)確的檢索。實(shí)體關(guān)聯(lián)的主要步驟為實(shí)體的語(yǔ)義特征提取、向量檢索召回和結(jié)果重排。采用基于Bert的雙重交互編碼器,分別嵌入查詢實(shí)體和待匹配實(shí)體的屬性文本,以審批、公文、信訪、批后監(jiān)管、法律規(guī)范等政務(wù)數(shù)據(jù)為樣本語(yǔ)料進(jìn)行領(lǐng)域?qū)W習(xí)和微調(diào),生成富含語(yǔ)義特征和配對(duì)信息的同維度語(yǔ)義空間向量;檢索階段采用面向稠密向量的近似最近鄰算法,從大規(guī)模數(shù)據(jù)中高效召回與給定實(shí)體向量歸一化點(diǎn)乘距離最近的向量集;重排階段采用交叉編碼器對(duì)文本對(duì)進(jìn)行訓(xùn)練編碼,以更細(xì)粒度地捕獲原序列和配對(duì)序列之間的交互信息,從而提高語(yǔ)義匹配的準(zhǔn)確性;最后將關(guān)聯(lián)實(shí)體按時(shí)序嵌入圖譜,實(shí)現(xiàn)機(jī)器輔助的關(guān)聯(lián)實(shí)體自動(dòng)聚合。
國(guó)土空間用途管制時(shí)序圖譜的構(gòu)建流程主要包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、實(shí)體與屬性提取、實(shí)體關(guān)系構(gòu)建、時(shí)序圖譜檢查與更新、時(shí)序圖譜數(shù)據(jù)持久化和時(shí)序圖譜的檢查與更新(圖1)。實(shí)體和關(guān)系的更新采用批處理與流處理相結(jié)合的方式,即采用離線處理方式批量構(gòu)建和整體檢查用途管制時(shí)序圖譜的實(shí)體信息(圖、文、數(shù))和關(guān)聯(lián)關(guān)系,定期排查實(shí)體缺失、錯(cuò)鏈、漏鏈等情況,保證用途管制時(shí)序圖譜的準(zhǔn)確性;在用途管制許可、監(jiān)管等條件觸發(fā)后,在線實(shí)時(shí)生成新增實(shí)體關(guān)系,通過(guò)插入和更新時(shí)序圖譜庫(kù)進(jìn)行檢查。

圖1 武漢市國(guó)土空間用途管制時(shí)序圖譜構(gòu)建流程圖
國(guó)土空間用途管制時(shí)序圖譜匯聚了用途管制中的多源異構(gòu)數(shù)據(jù),將不同尺度的數(shù)據(jù)對(duì)齊,消除沖突和重復(fù),構(gòu)建復(fù)雜關(guān)系知識(shí)網(wǎng)絡(luò),為用途管制全周期信息提供直觀可視化表達(dá)和高效即席查詢,可根據(jù)單個(gè)實(shí)體快速檢索項(xiàng)目全貌信息;基于語(yǔ)義相似度、平移距離模型等算法將用途管制時(shí)序圖譜不同類型和尺度的數(shù)據(jù)對(duì)齊并融合,形成項(xiàng)目資源庫(kù),建立項(xiàng)目資源關(guān)聯(lián)引用關(guān)系,實(shí)現(xiàn)“零資料”辦理模式;基于時(shí)序圖譜探索指標(biāo)智能融合,實(shí)現(xiàn)項(xiàng)目后序?qū)徟?wù)環(huán)節(jié)同類指標(biāo)直接從前序環(huán)節(jié)繼承引用。圍繞項(xiàng)目管理和決策分析的主題和場(chǎng)景,實(shí)現(xiàn)項(xiàng)目分期指標(biāo)的跟蹤、回溯、監(jiān)管和風(fēng)險(xiǎn)預(yù)警,提升核心指標(biāo)信息的精細(xì)化、智能化管理水平。
通過(guò)規(guī)則挖掘?qū)τ猛竟苤茣r(shí)序圖譜進(jìn)行鏈路分析與預(yù)測(cè)、關(guān)聯(lián)關(guān)系推理與沖突檢測(cè),以實(shí)現(xiàn)國(guó)土空間用途管制領(lǐng)域的知識(shí)推理。基于路徑排序等算法的圖結(jié)構(gòu)推理方法,運(yùn)用歷史項(xiàng)目樣本開(kāi)展大量訓(xùn)練,實(shí)現(xiàn)不同類型項(xiàng)目辦理的智能導(dǎo)航和精準(zhǔn)研判。根據(jù)即有實(shí)體關(guān)系推理下一時(shí)序環(huán)節(jié),提醒下游環(huán)節(jié)人員提前介入、主動(dòng)服務(wù),保障重大項(xiàng)目順利落地;基于不完備知識(shí)庫(kù)的關(guān)聯(lián)規(guī)則挖掘等算法的邏輯規(guī)則推理方法預(yù)測(cè)實(shí)體之間潛在關(guān)系,建立項(xiàng)目分期、分批關(guān)系,為項(xiàng)目指標(biāo)“一條龍”監(jiān)測(cè)與管控提供支撐;基于NTN、GNN等模型的神經(jīng)網(wǎng)絡(luò)推理方法,結(jié)合建設(shè)用地全生命周期管制規(guī)則、監(jiān)測(cè)指標(biāo)和評(píng)價(jià)模型,推理得到征供地率、閑置用地處置率、開(kāi)竣工率等情況,實(shí)現(xiàn)建設(shè)用地利用的動(dòng)態(tài)監(jiān)測(cè)、實(shí)時(shí)預(yù)警和精準(zhǔn)處置。
國(guó)土空間用途管制時(shí)序圖譜在時(shí)序、空間上的擴(kuò)展和融合,可反映項(xiàng)目和地塊在時(shí)間和空間維度上的關(guān)聯(lián)演變。基于時(shí)序圖譜的時(shí)空特性,結(jié)合用途管制項(xiàng)目的R樹(shù)空間索引,分析用途管制時(shí)序圖譜的時(shí)空關(guān)聯(lián)規(guī)則以及不同時(shí)間刻度下項(xiàng)目或地塊的時(shí)空切片,輔助構(gòu)建以地塊碼為核心,涵蓋業(yè)務(wù)碼、空間碼和要素碼的“一碼管地”編碼體系,實(shí)現(xiàn)地塊賦碼推進(jìn)全周期管理。基于項(xiàng)目時(shí)序圖譜可動(dòng)態(tài)推演國(guó)土空間用途、用地變化情況和項(xiàng)目的實(shí)施過(guò)程,建立項(xiàng)目地塊的時(shí)空變換過(guò)程,有助于規(guī)劃傳導(dǎo)與審批實(shí)施反饋,為國(guó)土空間規(guī)劃實(shí)施監(jiān)管和城市體檢評(píng)估提供技術(shù)支撐。
本文以武漢市2021—2022年經(jīng)標(biāo)準(zhǔn)化處理的用途管制數(shù)據(jù)為樣本,包含實(shí)體719個(gè)、關(guān)系573個(gè)、實(shí)體集(項(xiàng)目)160個(gè),示例項(xiàng)目圖譜見(jiàn)圖2,按照7∶3的比例劃分訓(xùn)練集和驗(yàn)證集,用以驗(yàn)證時(shí)序圖譜構(gòu)建以及聯(lián)接國(guó)土空間用途管制空間單元和各管理環(huán)節(jié)信息的實(shí)際效果。具體驗(yàn)證結(jié)果見(jiàn)表3。基于關(guān)系型數(shù)據(jù)和知識(shí)圖譜查詢的平均耗時(shí)分別為612.57 ms和48.14 ms。

圖2 實(shí)例項(xiàng)目圖譜

表3 國(guó)土空間用途管制時(shí)序圖譜構(gòu)建和應(yīng)用效果
通過(guò)驗(yàn)證分析可見(jiàn),相較于傳統(tǒng)空間疊加分析方法只能獲取簡(jiǎn)單的實(shí)體集合,該方法在實(shí)體關(guān)系構(gòu)建上具有較高的準(zhǔn)確率,可重建用途管制環(huán)節(jié)對(duì)應(yīng)空間單元上分期、合并、續(xù)辦等更加細(xì)化的有序、有向關(guān)系。錯(cuò)誤實(shí)體關(guān)系主要為同一空間上其他項(xiàng)目空間單元被計(jì)入,未來(lái)可考慮通過(guò)圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)來(lái)提高項(xiàng)目區(qū)分度和實(shí)體識(shí)別率。由于自然資源領(lǐng)域樣本數(shù)據(jù)有限,語(yǔ)義匹配的實(shí)體關(guān)聯(lián)效果未達(dá)到該模型在通用領(lǐng)域的精度效果,下一步可通過(guò)加強(qiáng)機(jī)器訓(xùn)練和模型遷移進(jìn)行改善。
用途管制時(shí)序圖譜的建設(shè)與應(yīng)用,有力支撐了武漢市國(guó)土空間用途管制全周期管理創(chuàng)新;基于此開(kāi)展的審批服務(wù)“大集中”平臺(tái)建設(shè),實(shí)現(xiàn)了項(xiàng)目全過(guò)程“一條龍”審批與服務(wù),即圖形成果“一條龍”監(jiān)測(cè)管理、指標(biāo)數(shù)據(jù)“一條龍”引用和自動(dòng)計(jì)算預(yù)警、成果資料“一條龍”關(guān)聯(lián)共用,推動(dòng)了“五全”審批服務(wù)模式創(chuàng)新,即全業(yè)務(wù)口徑網(wǎng)上辦理,各類事項(xiàng)全市域“同標(biāo)準(zhǔn)、無(wú)差別”實(shí)施,項(xiàng)目全鏈條統(tǒng)一調(diào)度監(jiān)管,項(xiàng)目“圖、文、數(shù)”全電子化、精細(xì)化管理,項(xiàng)目相關(guān)政務(wù)資源全內(nèi)容信息服務(wù)。通過(guò)圖譜的知識(shí)增強(qiáng)型信息服務(wù),建設(shè)流程智能、資源智能、指標(biāo)智能工具,探索“機(jī)器帶(代)人、人人會(huì)審”,建立機(jī)器引導(dǎo)、人機(jī)協(xié)同的智能審批模式,實(shí)現(xiàn)基于政府投資房建項(xiàng)目、社會(huì)投資一般項(xiàng)目、政府投資市政項(xiàng)目、工業(yè)項(xiàng)目和“承諾可開(kāi)工”項(xiàng)目等不同類型項(xiàng)目辦理流程的智能導(dǎo)航和辦理規(guī)則研判。用途管制時(shí)序圖譜對(duì)于推動(dòng)國(guó)土空間用途管制管理數(shù)字化、知識(shí)化、智慧化提升轉(zhuǎn)型具有重要意義。圖譜結(jié)合機(jī)器學(xué)習(xí)方法如何應(yīng)用于用途管制實(shí)施監(jiān)測(cè)、知識(shí)推演等方面,仍需深入探索和研究。