文/潘志方
為什么要構建應用獨立而數據集中的智能填報系統?本質上,智能填報是通過填報過程與填報結果的深度融合,來提高數據的使用價值,從而提升填報過程的服務質量,這呼應了當前“最多跑一次”的改革目標。特別在高等教育領域,高校師生在校期間對填報服務質量的訴求是很尖銳的,填報服務的體驗度是最為核心的指標。
當前,我國高等教育領域用戶側普遍存在以下幾個方面的問題:一是重處室業務管理流程規范性,缺少師生用戶視角的服務設計,90%的線上業務系統只服務于10%的校內管理人員;二是校級流程管控缺失,各處室割離建設造成流程雜亂與重復;三是流程雜亂及數據質量監控缺失造成數據質量低下,數據可用性不高;四是缺乏統一的開放服務支撐平臺和整體解決方案,用戶入口不便捷;五是管理機制落實不到位,責任權限劃分不明,存在職能交叉、條塊分割、多頭管理的現象。
在這樣的背景下,溫州醫科大學希望建立以數據治理為核心的智慧校園,構建智能填報中心。在溫州醫科大學實際的用戶服務過程中,關于師生用戶填表類服務存在如下不合理現象:一是不同部門填寫同樣的表格;二是同一部門每年重復填寫同樣的表格;三是用戶數據缺乏權威認證源和管理機制,多頭管理;四是缺少統一的門戶提供一站式填報類服務,服務分散在各個部門業務系統。面對這樣的用戶服務現狀,具體要怎么做?
從技術的角度來看,教育大數據治理是智能填報中心建設的基礎性工作,校級流程中心是智能填報中心建設的前提性工作,區塊鏈技術則實現了雙向的數據清洗,確保填報數據和數據中心雙向數據的準確。
教育大數據治理通過數據交換、采集、傳輸、加工、存儲、應用、建模、評估、發布和高維度可視化的業務鏈條,搭建數據交換平臺,建立高校數據交換機制和基礎信息庫,歸集各類業務數據,推進教學、科研及辦事流程協同應用。通過對結構化、半結構化和非結構化數據的采集、加工、存儲、流轉及建模,構建了高校數據治理體系架構,為后續數據的展示分析和用戶服務提供奠定了堅實基礎,可以說它是實現智能填報服務的基礎性工作。
校級流程中心能夠快速幫助高校從流程的建模、設計、執行、監控和優化全生命周期的進行業務流程管理,實現有效的集中規劃、整理,解決高校原有建設過程中按業務部門視角進行建設帶來的流程割裂、流程離散的問題。采用統一的流程管理與監控工具,在業務流程執行的時候,能夠積累大量的過程數據,同時對數據進行不同維度的統計與分析,向管理者提供有效的、真實的業務優化數據支持,可以說它是實現智能填報服務的前提性工作。
區 塊 鏈, 簡 稱 BT(Blockchain technology),也被稱之為分布式賬本技術,是一種互聯網數據庫技術,其特點是去中心化、公開透明,讓每個接入用戶平等參與數據庫記錄的管理與保存。區塊鏈技術并不是一個全新的技術,它融合了共識機制、分布式存儲技術、哈希算法、非對稱加密等原有信息技術,使得區塊鏈上的數據具備防篡改性、加密透明性、分布式自治性。
區塊鏈技術在高校大數據交換過程中具有很高的應用價值。
1.跨系統間數據流轉控制。在大數據系統的數據流轉過程中,區塊鏈記錄結構化與非結構化數據的產生、修改、調用以及數據處理的權限定義,使數據可在一個多業務、多系統的環境下進行有效的生命周期管理與信息演化管理。
2.跨系統數據可信存證。區塊鏈數據的分布式高可用與數據不可篡改的特征,保證了上鏈數據在業務系統不完全可靠、審核操作分部門協作體系下,數據歷史真實性和審核責任方的可溯源性質,實現了被調用數據的可信任性。
3.多系統用戶身份統一。區塊鏈的公私鑰管理體系為多業務系統協同提供一種完備的統一身份認證機制。該機制一方面提供了數據中心接入的高擴展性,另一方面保證了業務數據源、數據用戶標識、數據訪問權的高安全保障。
如果把區塊鏈作為一個狀態機,則每次交易就是試圖改變一次狀態,而每次共識生成的區塊,就是參與者對于區塊中所有交易內容導致狀態改變的結果進行確認。通過區塊鏈的這種機制,可以確保每次填報時各類數據的準確,可以說它是實現智能填報服務的關鍵性技術。
隨著高校用戶對服務的需求越來越復雜及多樣化,應用的價值交付不斷增加,單一利用某種技術,很難解決所有問題,所以必須把大數據治理、流程中心和區塊鏈等各種技術結合在一起,從整體上,保障高校用戶填報服務的全過程,包括用戶獲取服務、使用服務、服務關閉和對服務進行評價,通過數據和流程雙引擎,達到數據的一體化和服務的一站式。
1.《高校公共基礎信息數據元規范》
溫醫大制定《高校公共基礎信息數據元規范》。該標準規定了高校公共基礎信息的數據元分類、數據元屬性與數據元目錄,共涉及高等院校教學、科研、辦公活動中的人、財、物等5大數據子集,12個數據類,39個基本數據子類,合計396個數據元,每個數據元設置中文名稱、英文名稱、中文全拼、內部標識符、對象類詞、應用約束、數據類型、數據格式等16個屬性,每個屬性設置取值范圍,全文共六萬六千多字。
2.《高校公共基礎信息數據交換規范》
溫醫大制定《高校公共基礎信息數據交換規范》。該標準適用于溫州市高校之間公共基礎信息交換、共享與管理,標準規定了高校公共基礎信息庫數據交換的模式、技術要求、接口規范、安全規范、接入規范、管理規范。該標準適用于溫州市高校公共基礎信息庫數據交換所有過程。
3.高校大數據治理平臺
將以上兩大技術規范應用到實踐中,溫醫大定制開發了大數據治理平臺。治理平臺集平臺管理、數據交換、數據管理、數據服務、數據監控、運行展示和前置程序7大功能于一體,共10萬多行代碼,該平臺根據《高校公共基礎信息數據元規范》和《高校公共基礎信息數據交換規范》形成了數據字典,將采集到系統里的數據按照數據字典和用戶自定義策略進行標準化處理,對于重復數據、錯誤數據、非標數據將統一提示,進行糾錯,統一保存在該平臺里。根據業務需要,平臺統一對外提供數據接口服務。該平臺所有數據采集、數據交換、數據管理和數據服務都在平臺數據監控下有效運行。
相較于大數據治理建設的目標——數據的匯聚,次級數據中心的建設目標是構建可信歷史精準數據的集合。所有填報數據在經過相關職能部門審核后,存儲于次級數據中心,并同時存儲于區塊鏈系統。溫醫大次級數據中心的構建是基于Token標記的私有區塊鏈體系,所有填報審核過程、填報結果、評審結果的數據指紋均入鏈保存。該數據私有區塊鏈上主要記錄審核數據的指紋、審核歷時、使用歷史以及相關審核人(或部門)。區塊鏈的構建包括數據賬本、多物理記賬節點(DPOS共識)、區塊鏈數據瀏覽器、節點訪問監控系統與可接入服務接口(多語言SDK)等組成部分。區塊鏈系統保障次級數據中心數據的存儲可信性,即保證次級數據中心的數據具備歷史保真性與審核或使用的可追溯性。當用戶使用次級數據中心已有歷史數據時,系統通過鏈上數據的比對,智能分析數據的正確性、有效性與相關性,確保填報數據的完整性、安全性與保真性。擁有數據加密和區塊鏈的次級數據中心為學校唯一權威數據源(如圖1所示)。

圖1 智能填報數據區塊鏈數據流轉過程
通過大數據治理平臺和次級數據中心雙向的數據清洗,確保填報數據和數據中心雙向數據的準確。
從區塊鏈應用上看,對外集成辦事大廳、大數據治理平臺和次級數據中心,擁有校級統一身份認證、消息推送、數據防篡改和數據雙向清洗等特性。
溫醫大網上辦事大廳是師生辦理公共事務、進行工作管理和流程服務的總入口,它是溫醫大所有服務事項的集散中心,也是智能填報中心建設的前提、內核和容器,填報中心的流程流轉、服務管理、任務調度、權限管理和身份認證都依賴于網上辦事大廳的建設。通過網上辦事大廳,一方面,用戶可方便地獲取全校所有的應用服務和相關流程咨詢,了解服務流程說明,進行服務流程辦理。另一方面,管理者通過辦事大廳,能便捷地進行環節審批、數據統計、流程管理和過程監控,從管理端和服務端雙向提升工作效率。
為了解決師生每年重復填表的問題,又根據線上服務事項的難易程度,針對需求復雜、邊界模糊、審批環節繁多、跨業務跨部門的事項,溫醫大定制開發了智能填報中心。該中心的建設目標是按需填表、一次審核、永久有效,保證用戶“最多填一次”。該平臺徹底實現了全過程線上辦理,全環節靈活跳轉,全數據網上填報,全痕跡歷史記錄和全信息可信度校驗的“五全”特性。
針對目標填報服務,填報過程如下:
第一,填報系統從學校數據治理平臺或業務系統數據庫自動抽取標準數據,填入事先設計好的表單字段;
第二,將抽取數據與校次級數據中心區塊鏈上數據指紋做比對,確保數據真實可信;
第三,根據事先定義好的規則庫,對表單數據進行智能篩選,推薦最優填報方案;
第四,用戶根據系統推薦的最優方案,進行簡單二次修正,提交審核;
第五,填報系統并行推送用戶填報數據至二級審核部門,進行審核,二級審核部門根據標簽,只對增量數據進行審核,權威數據無須審核;
第六,二級審核完成后,并行推送到一級審核部門進行終審;
第七,終審數據與次級數據中心區塊鏈上的權威數據指紋進行比對,進行二次清洗;
第八,清洗完成之后的權威數據,回寫到大數據治理平臺和業務系統支撐其他數據應用。
以上的前三個階段均由系統自動產生,無須用戶人工干預。
從服務上看,填報平臺提供填表類服務,縮短“填報-審核-存檔”的時間周期,避免重復填報,一次審核,永久有效,提高服務質量和用戶體驗。
從管理上看,填報平臺提供了對填報過程、用戶及數據的全過程管理,保存了歷史數據,便于進行數據統計,實現了從管理向服務轉型的目標。
智能填報中心的智能體現在以下幾個方面:
1.填報數據的獲取智能:填報系統配備有數據匹配規則,包括填報要求的數據類別(如科研或成果)、數據時效要求(如任職以來)、數據的格式要求(如與源數據格式不同)、數據的屬性要求(如主持或排名前三)等。數據獲取時智能過濾不符合條件的數據。
2.填報數據的排序智能:填報系統具備可配置的量化(或定性)的評分規則,對每條有效數據的各個分量可配置相應分值與權重,系統會根據評分標準向用戶智能推薦數據選取的優先度與排序的合理性。填報系統對于數據優先性具備智能,提升用戶填報的精準度。
3.填報過程的處理智能:填報系統具備可配置的審批流程引擎,用戶提交填報申請后,系統將根據流程引擎將填報數據按對口部門分塊推送,并根據以往的平均審核時長,向審批人定時發送任務審核請求,并根據各部門協同的進度,向用戶顯示業務處理進度。填報系統對于審批優化具備智能性,提升填報人和審核部門的用戶體驗。
4.填報數據的認定智能:填報系統配備次級數據中心與區塊鏈數據認定系統,可根據用戶選?。ɑ蚴謩犹顖螅┑臄祿热荩匪輸祿v史的正確性和完備性,根據鏈上指紋與本次申報數據的匹配程度,智能決定局部數據的可免審性,加快審核的進度,并有效降低審核部門的工作壓力。填報系統對于簡化審批手續具備智能性。
從用戶體驗角度來看,填報中心智能性體現如下:
1.可視化的填報規則庫,管理員無須專業培訓,可自主配置填報規則。
2.靈活拖拽填報數據項,表單字段可靈活拖拽,即使在業務過程中,也能做到隨時添加刪除或修改。
3.自動識別數據格式,用戶二次修正時可做到格式自動識別。
4.審核結果文檔自動標注數字水印,填報文檔加密保存。
5.多維度業務數據抽取,根據權重智能推薦填報內容。根據填寫目標,根據權重自動進行量化打分計算,智能推薦最優業績數據,形成最優的填報方案,大大減少用戶二次修正工作量。
6.增量審核,提升數據審核效率,業務審核員無須全量審核,全校權威數據提供全局可信字段。
7.每次業務周期形成新增權威數據,二次清洗數據回填次級中心,形成智能填報雙向清洗數據環,構成大數據治理增量模型(如圖2所示)。

圖2 智能填報雙向清洗數據環
經費保障方面,學校教育信息化建設的經費來源有四個方面:1.各級政府信息化專項支持經費。由上級政府部門撥款,用于支持學校辦學水平的相關信息化項目建設。2.學校年度信息化專項經費,由學校自籌,主要用于保障全校全年信息化基本運行、學校年度工作重點建設項目等。3.縱向課題經費,由上級科研管理機構撥款,支持教育信息化科學研究,解決學科關鍵難點問題。4.橫向課題經費,由社會機構出資,用于解決教育信息化一般工程類問題。
人才隊伍支撐方面,學校通過多方協作方式來解決人才缺乏和信息化精準度問題。信息技術中心為項目建設的主體,進行頂層設計和項目管理;學校信息與工程學院的專業教師和學生參與具體項目設計實施,需求的采集、系統模型的設計和過程監理;社會團體和軟件公司進行代碼的實現。因此,學校是以信息技術中心為核心,調用整個學校和社會的信息化人才資源,統籌規劃,統一執行。
智能填報中心是全面深化高校“放管服”(簡政放權、放管結合、優化服務的簡稱)改革的有效途徑之一,它充分運用“互聯網+校務服務”,打破信息孤島,實現業務協同,著力簡化了辦事程序、減少了辦事材料、優化了辦事服務,使師生的獲得感明顯增強、學校治理能力有效提升、發展活力不斷提高。