楊學利
遼寧建筑職業學院,遼寧 遼陽 111000
標準無論在生活還是學習中影響是深遠的,如度量的標準、安全的標準等。如果標準不對或沒有可遵循的標準,則容易引起混亂。同樣,對于一個學校來說,采用統一標準的數據格式也是很重要的。
數據標準化[1]可以保證在學校范圍內數據從定義到接口以及后期使用規范等都是統一的標準。對接入的應用系統所需數據起到規范和約束作用,是智慧校園信息化發展的先決條件,是保證一所學校信息化發展到一定高度的基礎。對于學校而言,所謂數據標準就是對數據的性質以及含義、接口類型和出處等做出合理的規范,以此保證現有和后續的業務系統對數據的定義和使用有一個統一理解,使學校基礎數據始終保持一致性,最大限度地實現信息資源的價值[2]。不能因為學校發展和數據量的增多逐年增加投入系統整合的成本,并且始終要保障信息共享和各類分析的準確性。
數據標準建設對于學校來說是數據建設的首要任務。但是學校從零開始建設信息標準是不可行的,我們必須在一個初具規模的基礎之上進行適用學校的校標建設迭代,從而形成我們學校的可執行標準。職業院校一定要基于國家標準、教育部標準、行業標準,這將大大有利于標準的有效性擴展、兼容國家可持續迭代,最大程度對接國家上報數據標準,有利于建成學校自己的一套標準體系。
高職院校數據標準的建設可徹底消除數據在不同系統間互相訪問受限制的問題,始終保持數據從定義到使用規范的高度一致[3],這可以為學校的二級管理部門形成自己數據報表提供依據和數據支撐,能夠準確掌握目前學校現有的應用系統運行和使用情況,加強部分信息資源的使用率,找到問題結點精準施策,提高系統集成度,改善學校數據質量,去除冗余和垃圾數據,為信息化不斷發展中的后續應用系統鋪平道路,減少不必要的人力和物力的支出,保障后續系統能和現有數據實現無縫對接。
同時,數據標準建設也為師生提供相應的支撐。數據標準建設可提升業務規范性,保障人員對數據業務[4]含義理解一致,支撐業務數據分析挖掘以及信息共享。對于管理老師而言,有數據標準作為支撐,可提升系統實施工作效率,保障系統建設符合規范,同時降低出錯率,提升數據質量。對部門領導而言,數據標準建設可提供更加完整、準確的數據,更好地支撐決策、精細化管理。
我們最終是通過統一數據標準的制定結合學校完善的數據標準管理體系,實現數據的標準化管理,保障應用系統數據的完整性、一致性、規范性,為學校將來發展提供數據支撐,為后續的數據管理提供標準依據[5]。
由于我們國家和國外一些發達國家相比,信息化建設起步比較晚,對于高校信息化也是近幾年才逐步開始重視起來,所以許多學校并沒有把學校數據資源當作一種重要資產來對待,也就沒有讓數據融入到學校管理和教務教學中去,或者有些學校融入得并不完全,只是簡單做一個分析,做一下表面文章,并不能從真正意義上解決學校的實際問題,了解學校某一方面的具體情況。
目前多數職業院校應用系統的建設都是二級部門根據自身業務需求而建立,不能從學校發展出發做一個整體的規劃。另外,不同系統的建設廠商為了自身的權益考慮,在建設方式和數據標準上都可能有所不同,所以不同系統之間數據的不一致性難以避免,究其根源就是沒有一套統一的數據標準來進行約束和統一管理。
學校在對數據管理和使用過程中,由于缺乏標準約束和整體規劃設計會出現很多問題,主要有以下幾點:
首先,由于應用系統出處不同,數據存儲結構不一致,當某一應用系統需要調用其他系統的數據時,由于這些數據在原始存儲時候沒有統一的規范標準,所以數據在不同系統中存儲結構不同,這樣就導致數據無法進行直接關聯,所謂的數據共享和數據價值[6]也就無從談起。
其次,系統對數據定義和理解也不一致,不同系統對數據的命名、含義、取值范圍等定義也有所不同,有些時候名字是相同的但是所代表的意義卻是不同的,所以在數據關聯時容易發生混淆,對系統分析處理問題造成很多的影響。
再次,也是數據發生錯誤的最主要的原因,就是數據來源不一致。目前有許多高校由于業務系統沒有進行數據關聯,采集數據時候都是按照自己業務需要進行單方面錄入,這里也不乏個人原因,比如學生在輸入自己個人信息時,入團時間、入黨時間等很可能會出現前后錄入時間不一致,這樣就會對相應的統計結果有一定誤差。
數據標準在特定的環境中存在相應的變化。各校的應用系統和數據形式不一樣,在進行數據管理中要因地制宜。從大的方向數據標準可以分為數據結構[7]、數據來源和技術業務三個標準。
從數據結構角度上分為結構化數據標準和非結構化數據標準。結構化數據標準主要是針對比較統一的數據,通常這類數據主要包括信息項分類、格式、長度和定義等。非結構化數據就是針對一些數據在名稱、格式、分辨率等方面不是很統一的數據。
從數據來源角度上可以分為基礎類數據標準和派生類數據標準。基礎數據就是業務系統直接產生的原始數據和相關代碼數據,這些數據主要是保障業務系統日常運行時的數據的統一性;派生類數據主要是指在業務系統使用過程中,后期加工計算出來的后續數據,比如統計報表數據和實體標簽等。
從技術業務角度看,數據就是指在實際工作中,針對不同的部門的業務系統通過實際業務溝通而制定的數據標準,通常指業務定義命名、管理部門標識和相關業務主題等。技術數據指標就是通過信息技術對相關數據做出統一的規范和定義,通常指類型、字段長度、數據格式等。
隨著信息時代的到來,移動終端的不斷普及,高校從招生宣傳到管理模式也在發生著變化,高校之間競爭也日益激烈。相關教育部門對學校規范要求也是日趨嚴格,各個高校也逐漸意識到時刻掌握自身的優缺點的重要性。通過數據分析解決問題,增強自身的競爭力,是最行之有效的方法。建立符合高校自身的數據標準勢在必行。建立數據標準需要有相應的數據標準管理組織[8],其主要就是負責數據標準的統一管理和實施,承擔基礎數據的制定、維護和后期應用、監督等工作。管理組織一般由數據標準決策層、管理部門和具體工作的實施人員組成。另外,數據標準管理工作要想順利地進行,需要學校管理層制定相應的管理制度,主要是指數據標準管理措施、數據標準規范和數據標準管理操作文件等,只有這樣相關負責部門才能有理有據地開展工作。根據多數學校的情況數據標準建設一般可分為以下幾個階段,具體如下。
由于高校之間情況有所不同,所以要從實際情況出發,結合不同廠家給出的具體方案,根據現行國家標準和行業通用標準以及數據標準化經驗的積累,梳理出一套符合高校數據場景的數據標準,梳理出數據標準建設的具體范圍,定義數據標準體系框架、分類等,制定詳細的實施計劃。根據當前高校數據治理和標準化的數據要求,數據標準通常包括主數據標準和代碼標準。主數據標準主要涵蓋了高校的院系信息、人員信息、人事信息、教務信息、辦公信息、財務信息、學工信息、科研信息、資產信息、組織信息、校友信息、外事信息、衛生信息、統戰信息等主題域的信息數據子集分類標準。其中還包括了信息標準分類規范、信息子集編制規范、數據項元數據定義規范說明等。代碼標準包括全局代碼、院系部門代碼、人事代碼、教務代碼、辦公代碼、財務代碼、學工代碼、科研代碼、資產代碼、組織代碼、校友代碼、外事代碼、衛生代碼、統戰代碼等主題域的代碼標準。
信息化建設辦公室可根據廠商提供的參考標準和學校自身情況,以及學校在未來幾年的整體規劃情況,對企業標準文稿進行合理修改并評審,形成符合學校的數據標準初稿。已形成的校標(學校數據標準)要與相關業務部門進行溝通征求意見,與之相關的部門都要進行實地調研,以免在建立以后出現不必要的麻煩,然后形成校標的草案。如果進行得順利則沒有大的變動,最后就可以形成學校的數據標準的基本準則。
根據數據標準的體系框架[9]和具體分類,先確定好分類數據的標準模板,然后由相關人員依據行業和學校具體需要進行數據標準的編制。數據標準建設工作繁瑣而且工作量比較大,后續管理工作也非常困難。高校可根據自身情況設計一套完善、易用的數據標準管理工具,幫助工作人員完成數據標準的管理工作。上述我們了解高校數據標準落地大致思路是,首先廠商根據參考標準以及實施經驗形成企業標準,然后校方根據學校業務系統具體數據情況和學校信息化建設的規劃對企業標準進行評審修改后經業務專家評審,最終形成校標。因此,數據標準管理工具的設計應該包括高校參考標準管理、業務系統標準管理、企業標準管理、校園標準管理四塊功能。
高校參考標準主要有國家標準、教育部標準和行業標準,參考標準管理其主要功能有標準的增刪改、標準文檔的上傳下載、標準文檔在線查看。
業務系統標準管理是在高校各個已建的業務系統所采用的標準規范,包括各個業務系統的數據模型標準和代碼標準,通過對業務系統標準的管理,主要是實現以目錄的形式展現高校所有業務系統中的數據全景,對了解高校的具體業務起到關鍵輔助作用。加強對高校各個業務系統的管控能力,形成高校所有業務數據的視圖。它是高校執行標準落地的主要參考。數據標準主要是為了使業務系統之間實現數據共享而建立的,業務系統管理主要實現數據模型分類管理、數據模型對象管理、數據模型對象的日常查看、數據模型對象的日常維護、數據模型對象字段的日常維護等功能。
企業標準管理[10]就是借助企業數據標準化管理的經驗,為高校數據治理和標準化解決實際問題。管理工具支持單個數據對象的在線添加及編輯,也要支持批量數據模式的整體導入。其功能主要分為代碼模型和代碼管理,主要是數據模型分類管理和對象管理,數據模型對象的日常查看和維護,數據模型對象字段的日常維護,以及查看、新增、刪除,等等功能。
校園標準管理就是針對學校自身情況而定的,工具主要是單個數據對象的在線添加編輯,批量數據的整體導入。其功能主要分為代碼模型和代碼管理,主要是數據模型分類管理和對象管理,數據模型對象的日常查看和維護,數據模型對象字段的日常維護及查看、新增、刪除等功能。
各學校情況有所不同,數據量和數據類型也有很大的不同,所以不是所有的數據標準都能夠完全落地,實際工作中可能會存在歷史系統無法改造的情況,所以首先確定數據標準落地策略和落地范圍,并制定相應的落地方案,然后推動數據標準落地方案的執行,對標準落地情況進行跟蹤并評估成效。
不是所有的數據都需要建立數據標準,高校中實際數據模型中有上萬個字段,有些模型還會經常變換更新,如果把這些信息全部納入到標準體系中工作量巨大,很難真正實現落地。因此僅需要對核心數據建立標準并落地,既可達到預期效果,同時也提升了工作效率。數據標準范圍圈定建議:共享性高、使用頻率高的字段需入標;監管報送或發文涉及到的業務信息需入標;結合數據使用情況,對于關鍵數據的字段盡量入標;數據應用有使用需求的字段需入標;與系統人員溝通其系統內重要信息來輔助入標判斷。
數據標準落地工作中的困難在所難免,如某些歷史系統無法改造或者改造成本過大,導致無法落標。這就需要結合不同的系統,建立不同的落標策略。對于新建系統,一般采用強制落標的策略,即新建系統必須符合數據標準,在新系統啟用之前對其進行數據標準落地評估,如評估結果不合格,則令其整改。
對于已有的歷史系統,建議采用落標的策略。首先將已有系統的標準問題找出來,然后進行分析和整理,綜合多方面考慮,包括工作量、整改風險、周期、成本等等,最后制定最有效的落標策略,比如等到以后系統升級改造時再落標,通過邏輯轉換方式落標,通過數據倉庫落標。
綜上所述,高校數據標準體系建立需要各個部門通力合作,并非哪一個部門可以完成,在實際建設過程中會面臨很多困難和挑戰,需要在實踐中不斷調整策略和方法,各個部門需要密切溝通,加強業務系統用戶的體驗度,把契合點前置問題后移,最后找到雙贏的點,最終形成一套符合自身的數據標準體系,為學校的發展和競爭力打牢基礎。