李光恒,萬錦輝,何挺,黃群,蒙立東,董喆
(廣西產研院 人工智能與大數據應用研究所有限公司,廣西 南寧 530000)
黨的十九大以來,我國政府持續推進“互聯網 + 政務服務”建設,依靠新一代信息技術推動政務治理模式創新,在推動“互聯網+政務”的實踐過程中,采取了“重組”的策略進行智慧政務服務的業務再造,但由于管理過程中出現大量的層級協調工作,實質上存在著數字技術工具化,底層仍由科層制驅動的問題[1]。電子政務對政府職能管理體系提出了重構性的訴求和整體性改革的需求,政府職能管理應與電子政務建設銜接起來協調推進[2]。以科技管理部門為例,目前國內科技管理部門多用不同的管理系統實現對各種科技政務和業務的管理,造成政務資源和數據相互阻隔,難以實現政務數據資源有效管理與高效應用。部分科技管理部門建設統一政務數據平臺,只適配已有的科技政務管理,對不斷發展的科技政務數據資源和科技業務管理無法很好地適應和納入統一管理,只能大幅修改已有系統或推翻重建。從技術層面看,主要有以下關鍵問題需要解決。
現有科技政務系統平臺在系統構架擴展性、定制性(彈性)方面存在缺陷,使得系統難以修改和擴展,難以快速響應用戶/業務部門對功能的修改和功能擴展需求,缺少敏捷應對政務業務變化的技術框架模型。
現有科技信息管理系統存在各部門數據共享及業務互通性差的問題,一是系統開發者對科技業務不熟悉,缺乏對各部門業務和數據的統一梳理。二是各系統在數據格式和標準上的不一致,導致互通和共享有困難。三是現有系統在技術構架上沒有一套能適應各種來源數據共享和互通方面的機制,對新的子系統的增加不能很好地融合。
隨著信息技術的發展和人民生活水平的提高,“互聯網+政務服務”要求科技管理政管理由粗放式向精細化轉換,推進數據共享,打通信息孤島成為數據建設的指導思想理念,這對科技政務數據治理的實時性和協同性提出了更高要求。而由于歷史原因,現有的科技政務系統在數據治理、工作協同等方面困難重重,效率低下,久而久之造成數據不準確、不完整、可用性低等問題。由于數據治理欠佳,影響了大數據分析的準確性,從而無法為科技管理改革、政策制定、社會服務提供有力的支撐[3]。
本文提出基于柔性治理和知識圖譜的技術手段,利用柔性治理的理念和先進技術,構架一個既能夠兼容已有政務數據資源和業務管理的體系,又能基于柔性治理容納未來新增的科技政務數據資源和科技業務,同時深入研究知識圖譜模型和大數據分析模型在科技政務數據資源中的應用,真正使科技政務數據為科技管理決策服務。
柔性治理中的“柔性”是對“剛性”而言的,傳統意義上的柔性多用于定義生產制造型企業的生產方式,是以“制造系統響應內外環境變化的能力”建設為核心的生產方式與方法論。隨著市場競爭的日益激烈,生產型企業需要依托低成本快速反應的制造方法滿足市場需求的多樣化和不確定性,柔性的含義主要包含3個層面:能力的柔性、容量的柔性和系統適應內部變化的柔性。
柔性治理的理念從生產制造術語移植到政策話語表達最早出現在2019年的政府工作報告中的“新型城鎮化要處處體現以人為核心,提高柔性化治理、精細化服務水平,讓城市更加宜居,更具包容和人文關懷”??梢?,新時代的柔性治理在保留了原始理念的情況下更多地面向公共服務的應用,圍繞復雜的政府職能體系,從外部環境、公眾需求,內部治理需要、政治要求等角度,開展多元參與、協同共治、快捷反應的機制優化,借助新一代信息技術,進而實現職能之間的協同化和政府治理的整體性。
為了敏捷應對政務業務變化,本文提出采用柔性治理技術框架,采用微服務和松耦合技術,提高系統的定制能力、可擴展性和運行性能,遷移柔性生產的3個層面柔性流程管理、柔性數據管理、柔性功能定制的理念,從科技政務系統的定制化流程、定制化模塊和數據治理3個方面進行柔性治理改造。
一是柔性能力,指生產水平的快速調節能力,或迅速轉移產品生產到另一種產品上的能力。在政務管理中,體現為柔性流程管理,基于知識抽取后的流程模板,對流程管理功能進行快速定制和開發,迅速調整生成各類流程模塊。二是柔性容量,指按需調節生產的產量的能力。在政務管理中,體現為柔性數據管理,通過建立適應各種業務數據的數據結構、數據存儲形態和數據交換標準及接口,實現數據交換和共享的問題,可以按需分配數據資源和使用權限。三是系統適應內部變化的柔性,指系統在遇到擾動的情況下能夠快速恢復運行的能力,在政務管理中,體現為柔性功能定制,基于參數配置與腳本自定義框架,在需要對系統模塊進行調整時,快速實現功能的修改和自定義配置。
實現柔性治理三大內容的核心在于對現有業務流程進行優化與改造,本文設計了一種基于柔性治理的可拓展流程模型(如圖1),該模型以業務流程引擎為中心,主要邏輯包括以下層面:第一,通過對現有的科技政務應用系統進行分析,將流程應用數據接入業務流程引擎,從業務流程引擎中抽象出流程資源模型、流程應用數據和功能配置參數,形成知識積累型的技術引擎,可基于參數配置和腳本自定義框架,快捷配置業務流程的相關業務模板、應用程序及系統環境數據。第二,從業務流程引擎中抽象出組織/角色模型和過程/功能模板,負責管理與配置組織、角色、用戶的權限,滿足流程模塊化定制需求。第三,在數據管理層面,為了提升數據的柔性程度,對業務數據進行解耦分離,形成過程數據和知識數據分離的數據存儲和管理構架,將數據接入知識圖譜引擎中。第四,知識圖譜引擎的工作流由信息抽取、實體關系消歧、知識融合、知識加工等步驟組成,在知識圖譜引擎中,將建設知識倉庫、知識管理及規則管理3個部分。第五,為了解決數據流的問題,在對公用數據和專用數據進行分類的基礎上,建立各種業務數據的數據結構、數據存儲形態和數據交換標準及接口,解決數據交換和共享問題[4]。

圖1 基于柔性治理的可拓展流程模型
由于科技政策文本數量日趨龐大,語義關系日漸繁雜,將知識圖譜技術用于科技政策領域,以實現政策主體、政策屬性與關系的結構化和顯性化越來越重要[5]。本文提出的知識圖譜是適用于科技政務管理領域的政務知識圖譜,其核心是為業務流程的柔性需求提供快捷的知識響應服務,解決數據共享及業務互通性差的問題。本文基于知識圖譜構建了一個面向業務流程的知識管理系統模型,主要由數據資源層、代理層和業務層組成(如圖2)。

圖2 基于知識圖譜的科技政務知識管理系統模型
數據資源層主要擔任知識存儲倉庫的角色,在數據資源層包含了數據解耦模塊,進入數據倉庫的數據在數據資源層已經完成了業務流程數據的一次解耦分離,為知識圖譜的構建提供原始數據來源。
代理層是系統的核心部分,也是系統的功能服務層,代理層通過信息抽取、關系消歧、知識融合與知識加工等步驟,完成了科技知識圖譜的創建。在知識圖譜構建完成后,代理層還承擔了知識管理的任務,為了更好地服務業務流程定義,本模型將知識需求獲取功能單獨提取出來,作為銜接代理層和業務流程層,對接業務流程和知識圖譜的一個接口而存在[6]。
業務流程層是主要用于實現業務流程的柔性開發。為保證知識可以滿足業務流程的需要,系統首先必須能夠識別在業務流程的某一環節需要什么樣的知識,在本模型中,主要包括知識數據、配置參數、知識模型3類知識,分別對應柔性數據管理、柔性功能定制、柔性模塊構建的開發,代理層為業務流程層的知識應用提供了柔性化開發、自動化生成的服務。
至此,本模型主要由5個模塊組成:在數據資源層,包括數據解耦模塊;在代理層,包括知識圖譜構建模塊和知識管理模塊;在業務流程層,包括知識需求獲取模塊,業務流程定義模塊。該模型各模塊之間存在豐富的自主交互,能夠基于知識圖譜,對外界的任務輸入做出一定的判斷和推理,降低了數據協同、系統迭代的難度。
科技大數據分析為科技部門評價與決策提供量化支撐。與傳統的基于專家系統的評價與決策帶有主觀經驗不同,科技大數據分析通過基于數據驅動的機器學習方法來量化評價與決策。如果數據足夠多且質量好,則這種基于數據驅動的機器學習方法量化評價與決策比較客觀。但是,如果數據沒有那么完美,如何結合專家系統與基于數據驅動的機器學習方法是關鍵技術問題。
在知識圖譜構建過程中,信息抽取是最關鍵步驟,信息抽取需要利用大規模數據集對模型進行訓練,而大規模數據集的人工標注成本昂貴,為了解決此問題,可以使用無監督、半監督的抽取方法代替有監督的方法,通過先聚類后標注的方法,降低標注難度,或者構建生成式的模型,構造先驗條件后再訓練模型,減少數據標注成本、降低信息抽取對標注的依賴。
在機器學習算法層面,采用基于機器學習的自然語言處理(NLP)遺忘算法可以實現數據的精準鑒別。遺忘算法是以牛頓冷卻公式模擬遺忘為基礎、用于自然語言處理(NLP)的機器無監督學習算法體系,與主流算法相比,具有占有資源少、性能快的優勢。遺忘算法不僅可廣泛應用于批量文本智能分析領域,而且可以應用于圖片分類識別、圖像識別等領域,遺忘算法的語言無關特性,使得其應用語境理論上無限制,可以支持各種語言,其核心技術主要包括以下幾點:①基于大規模文本的詞庫自動生成技術;②文本結構化處理技術;③分詞權重計算技術;④實時熱詞發現技術。基于強大的自然語義分析處理核心技術,突破 NLP 分析瓶頸的遺忘算法,結合多源非結構化數據對算法進行訓練,然后對科技項目進行精準對比分析,能夠快速地命中并識別出檢測文件與比對源中的相似內容,也不會造成過度檢測,從而在從監測技術的運用和精準度以及多語言支持上都實現了對質量不佳的科技數據的優化。
上文基于可拓展流程和知識管理系統兩個技術模型之間的業務邏輯交互組成了科技政務云數據平臺的平臺服務層,基于機器學習的自然語言處理(NLP)遺忘算法對科技政務數據進行了質量優化,最終要實現的目標是建設高水平科技政務數據治理和應用系統,其技術框架如下。
Iaas層提供充足的計算、存儲和網絡能力。同時依托電子政務內網、外網、互聯網和教育網等已有的資源共享平臺,實現跨區域、跨行業、跨部門、跨層級的數據采集和交換。
Paas 層構建以Hadoop作為基礎支撐的大數據基礎服務(Daas)。集成應用可變流程、知識圖譜、數據融合、機器學習等技術,實現一站式數據資源的采集、存儲、管理、計算、分析、服務等功能,為上層各類業務系統和大數據分析提供高可用性、高體驗度、高安全性的數據服務能力。
Saas 層通過業務融合和互聯互通相結合,對科技系統內部分散、割裂、標準不一的新舊系統和歷史數據庫進行大規模整合、推倒和統一重建,為開展科技數據共享和大數據應用掃清障礙打下牢固基礎。
基于建設高水平科技政務數據治理和應用系統的目標,本文研究科技政務數據治理的關鍵技術,包括柔性治理技術框架、知識圖譜模型及科技數據治理優化方法,在此基礎上設計了基于柔性治理與知識圖譜的科技政務數據治理云平臺,能夠有效整合各個科技業務系統和科技數據,利用柔性治理技術,實現科技業務融合,解決了有一個新業務就要新建一個系統,造成新的數據孤島的根本性問題,同時知識圖譜模型和大數據分析模型在科技領域的應用,能夠利用云平臺聚集的大量科技政務數據資源,完成科技數據可視化和多維科技數據分析,為科技決策提供輔助參考,創造了一個利于協同、方便共享、積極分享、無界交流的科技政務發展環境。