郝志杰, 李 莉, 榮 娟
(中國石油大學(華東) 信息化建設處, 山東 青島 266580)
數字校園建設以來,信息化大幅提升了高校管理的精細化水平,在職稱評審、崗位考核、導師遴選、學科建設等重要工作過程中教師需要填寫大量的表格,而且表格之間數據重復項很多,導致教師感覺相同的數據要次次填、年年填,給教師造成了很大的負擔。為解決師生反應強烈的“表格繁多、重復填報”等突出問題,啟動了“一張表”工程。當有數據填報需求時,直接從這“一張表”中自動抽取數據,生成表格,從而達到減少重復填報,節省師生的寶貴時間。實現在辦理業務填寫相關表格時“一次錄入、共享互通、重復使用、自動填充”。
事實上,“一張表”的本質是數據問題。數字校園時期高校信息化建設了大量的MIS系統,教師填表所需要的教學科研數據已經存在于各個業務部門的MIS系統中,但是由于系統孤島、數據煙囪和應用碎片化等問題,導致這些數據難以共享。因此,是否能夠進行有效地數據治理是破解“一張表”難題的關鍵所在。
“治理(Governance)”原意是控制、引導和操縱。全球治理委員會對治理的定義是:治理是各種公共的或私人的個人和機構管理其共同事務的諸多方式的總和,它是使相互沖突的或不同的利益得以調和并采取聯合行動的持續過程[1]。數據治理最早是沃森( Watson)在2004年就企業管理中數據倉庫治理的實踐提出的[2]。美國國際數據管理協會(Data Management Association nternational) 是較早開展數據治理相關研究的學術團體,并將數據治理定義為對數據資產管理和控制的活動集合,包括計劃、監控和執行等[3]。數據治理研究所( The DataGovernance Institute)認為,數據治理是信息相關流程的決策權歸屬和責任擔當框架,即根據商定的模型,確定誰在什么情況下,對什么信息,使用什么方法,能采用什么行動,并按此執行[4]。國內學者則認為數據治理是指與有效運用數據所需的、組織或執行層面的準則、政策、步驟和標準相關的實踐活動,是通過建立數據標準體系提升數據質量,通過數據架構合理組織數據,通過元數據和主數據管理提升關鍵數據的管理水平,通過安全和生命周期管理保證數據的安全性、有效性、時效性等功能的綜合體系[5-6]。綜合已有研究以及數據治理的實踐經驗,認為高校數據治理,是從目標、組織、管理、技術、應用的角度持續提升數據質量的過程;它可以幫助學校清洗數據、使用數據,挖掘數據價值,從而提高學校的科學決策能力、運營效率和管理水平,增強競爭力。數據治理的長期性、往復性是其內在特征。
如圖1所示,為數據治理所涉及的核心領域:
(1) 戰略目標。數據治理最終是要通過提供數據服務,發掘數據潛在價值,進而讓組織能夠創造出比之前更大價值。因此,明確數據治理的戰略目標,并將戰略目標和組織發展戰略目標高度一致,是數據治理的前提和最終意義,確保數據有效治理。

圖1 數據治理框架體系
(2) 組織架構。高校數據治理組織機構是由高校領導牽頭的自上而下的一個完整的組織機構,并明確數據治理組織中相關部門和人員的數據職權和責任。組織機構是數據治理的靈魂[7],高校信息中心雖然是數據治理的發起者和IT技術的掌握者,但信息中心只是數據管理部門不是數據生產部門,所以只能在技術層面支持數據治理,改變不了數據本身的問題。相應的數據產生部門才是數據治理真正的主體。
(3) 數據標準。標準是對重復性事物和概念所做的統一規定。數據標準是為了保證高校內外部數據的使用和交換的數據的一致性和準確性,經協商一致制定并由相關主管部門批準,能夠共同和重復使用的一種規范性文件。數據標準是高校數據治理的基礎,也是數據治理建設中的首要環節[8]。① 數據標準為高校數據中心提供統一的數據定義。② 數據標準是高校數據中心進行數據治理的依據和根本[9]。
(4) 數據集成。數據集成也稱數據整合,把不同的源頭的數據收集、整理、清洗、轉換后加載到一個新的數據源,然后為數據消費者提供統一視圖的數據集成方式[10]。即將高校范圍內各個異構的業務系統的數據按照相應規范和數據標準進行交換和集成,將業務系統中的數據抽取到學校數據中心,并在學校數據中心完成這些數據的統一管理、更新和維護。
(5) 數據質量。數據質量是數據治理過程中非常重要的環節,也是數據治理成果的重要體現之一。“Garbge In,Garbage Out” 是數據質量領域最為經典的一句話,意思是“輸入的是垃圾,輸出的也是垃圾”[11]。如果進行數據分析前,不能保證數據質量符合標準和業務需求,那么使用這些數據分析所得出的結果當然是無效和錯誤的。在“數據—信息—知識—決策”的工作途徑中,如果數據是低質量的,那就不可能做出科學的決策。因此,數據質量管理需要通過建立閉環管理,保證數據一致性、準確性、完整性和及時性。實時監控數據質量,清洗臟數據,反饋數據質量報告,形成良性的數據質量改進閉環,確保數據質量滿足提供方、使用方和管理方等多方的需要。
(6) 數據倉庫。數據倉庫并不是簡單數據庫疊加形成的一個大型的數據庫,而是在數據庫已經大量存在的前提下,為進一步實現數據的分層分級管理[12],挖掘數據資源等需要而產生的,其建設目的是實現數據的集中有序管理,以及為前端大數據量的并發查詢和分析等需求提供穩定高效的數據基礎。
數據治理的難點并不在于IT技術本身,而組織架構的權責分配、協調工作、業務梳理和對接才是關鍵[13]。數據治理的目標必須和組織目標保持一致,必須能夠支持組織目標,推進組織工作。如果數據治理不能做到這一點,是很難真正意義上的推進。在解決學校數據的痛點問題時,應該主動尋找具體工作載體,并做出實際的改善,這樣才能得到相關管理部門的認可和支持,協調推進。
目前,在高校里重復填表問題無疑是大家公認的痛點,幾乎達到了人人共憤的地步,是高校數據治理一個非常好的工作切入點。解決“一張表”問題選取崗位考核為抓手,就明確了本次數據治理的工作目標和工作范圍,并將數據治理的工作目標與業務部門的工作目標一致起來。
數據治理的核心是角色,即數據治理的組織架構。高校數據治理組織架構圖如圖2所示,最上層的是決策層,如果數據治理在組織范圍內沒有領導決策和支持是不可能實行的。第二層為管理層,主要包括信息中心、數據管理職能部處和院領導。第三層包括學院的數據審核員、教師作為數據的錄入員等。

圖2 高校數據治理組織架構圖
要數據治理主體去完成數據的錄入、審核等繁瑣工作,就必須有相應管理手段和有效激勵。否則教師就沒有動力去填寫,更談不上保證數據的準確性。以崗位考核、職稱評審等工作為抓手收集數據,這些數據的準確性就與每位教師的切身利益息息相關,這樣教師和相關部門的配合程度就可以得到充分的保證。
“一張表”選擇崗位考核為抓手,治理和教工相關的數據,就自然形成了數據治理的組織機構。同時以崗位考核為抓手還具有以下三大優勢,① 涉及的教工數據字段最全。崗位考核涉及教工個人基本信息教學科研等方面的數據,是涉及數據字段非常全的一個應用,這保證了數據的廣度。② 時間跨度長。崗位考核的周期為4年,也就意味著借助這個抓手可收集到和教工相關的4年數據,保證了數據的深度足夠。③ 涉及教工范圍廣。職稱評審、導師遴選等應用都是涉及到一部分老師,而崗位考核是全校教工均需參加,方便學校收集每位教工的數據。
在高校,系統建設都是為了滿足部門業務需求,沒有考慮到其他系統數據重復使用的問題。因為缺乏這種對數據的整體設計考慮,造成了多種數據問題,如數據共享困難,統計口徑不一,業務溝通困難易發生歧義等,只有建立數據標準才能解決這一問題。
(1) 權威數據源。建立數據標準的基礎是在高校范圍內確定數據的權威數據源,一數一源是數據治理過程中最基本的原則之一。在高校應用場景中,多個部門共用相同的數據。最常見的是學生數據,同樣在校學生數,教務處、學工處、就業指導中心等多個部門都存在,但往往這些部門的數據因為各種原因無法對上。這就導致大家都有這個數據,卻不知道哪個數據為權威數據來源,有數據而不能用。
首先確定了“一張表”涉及到的每一個數據項的權威來源部門,其他部門只能從權威數據來源讀取數據。其他部門在數據使用過程中,發現問題必須到權威來源部門去修改,保證數據的權威性和準確性,梳理清楚數據的來源和去向。
(2) 主題定義與分類、數據表結構和碼表。數據標準主要包含3個部分,主題定義與分類、數據表結構、標準代碼[14](如圖3所示)。其中主題定義與分類包含本次“一張表”數據所涉及的人事數據子集、教務數據子集、研究生數據子集和科研數據子集。每個數據子集中又包含各自所涉及的數據表結構:字段定義、類型、長度、值空間、約束、字段描述等。標準代碼記錄信息項的固定碼值,碼值取自國標、行標、校標以及一些規范性引用文件。

圖3 崗位考核數據標準
在“一張表”工程中,梳理業務涉及到的35張表,268個字段,以國家標準為基礎對所涉及的關鍵數據進行梳理,進而形成全校統一的業務定義和業務規則,確保全校各信息系統中的數據定義保持一致。此后學校在數據共享與交換過程中,嚴格按照標準實行,保證了數據在各種應用場景中的一致性。
(1) 數據集成。將各個源頭的數據加載到學校的數據倉庫,再通過數據倉庫統一為包含“一張表”在內的各個應用提供視圖,其標準流程如圖4所示。

圖4 數據集成過程示意圖
根據數據的現狀,“一張表”通過3種方式填充數據。有系統的單位可以通過系統的同步采集數據,最大程度的保證了數據的實時更新;沒有系統,用Excel電子表格維護數據的單位,我們還提供數據導入的方式,這種方式非常靈活,能夠把一些線下數據收集起來;對于暫時缺失的數據,我們采用教工填報的方式主動的把這些數據收集起來。
(2) 基于標簽的權威數據維護。在數據維護過程中,采用打標簽的方式來保證數據的權威性,具體流程如圖5所示。數據獲取后,會獲得權威的認證標簽,例如從人事處同步的數據,會標記人事處的標簽。進入權威數據庫。同樣,Excel導入的數據會標記導入數據部門的標簽,教師填報的數據,經過權威部門審核后會標記相應權威部門的標簽,并進入權威數據庫。

圖5 權威數據修改流程圖
同時,“一張表”涉及的數據繁多,需要不斷的進行更新修改。根據數據來源形式不同,分為3種修改審批方式。如果數據是通過系統同步進入的,需要在原系統中進行修改,再通過每天的數據同步進入“一張表”。從系統同步進入的數據會自動標記相應權威部門的認證標簽。如果是Excel導入或者填報的數據,修改后權威認證標簽消失,需要相應的權威來源部門審批,通過之后,才能重新獲得權威標簽,作為有效數據使用。
數據的價值是在使用過程中體現出來。在“一張表”中,首先將與教師相關的人事、教學、科研業績等數據以電子檔案的方式展示出來,并將各個模塊的管理部門聯系方式以及數據修改方式標注在旁邊,這樣教師可以自助的來修改數據,確保數據真實可靠。
同時通過崗位考核、職稱評審、導師遴選等具體工作為載體,不斷地使用校驗數據。在高校的管理工作中,上述管理抓手都是非常嚴肅的應用場景,數據的真實性和準確性不僅關系到教師的切身利益,還關系到教師的職業道德和操守,因此數據流程得到認真完整地運行。相同的數據使用于不同場景,通過權威部門認證標簽的方式,在減少審核的工作量的同時,在不斷的使用中確保數據質量。
高校數據難以溝通,難以利用,難以整體防護等問題,從源頭看還是數據歸屬的分布性和數據管理的碎片化問題[15]。所以建立高校統一的數據倉庫,實現對數據的統一的管理、調度和共享交換非常必要。數據倉庫中數據的存放也必須嚴格分類,學校數據倉庫的層級結構(見圖6)。
如圖6所示,數據倉庫中,第一層為業務數據層,是各個業務系統的數據庫以及管理部門的Excel電子表格,通過數據共享平臺以及ETL數據交換工具抽取到原始數據緩沖層,也就是ODS貼源層。ODS貼源層是與源業務系統最為貼近的數據層,一般采用松耦合的方式,將業務系統中的主數據以接口的形式提供給數據倉庫。ODS貼源層的特點是數據粒度盡可能的小。以教學課程數據為例,在貼源層會細分為課程、教室、選課、排課等最細粒度,在數據倉庫的更上層組裝生成更加綜合的數據內容。

圖6 數據倉庫層級結構示意圖
主題數據層是按照學校數據標準形成,按照主題存儲的,能夠支持快速數據查詢,并遵循統一業務編碼的數據層。主題數據層的特點是是按照學校數據標準生成。數據標準是在教育部2012年發布的行業標準《中華人民共和國教育行業標準JY/T 1006-2012 教育管理信息 高校學校管理信息》的基礎上根據學校實際的情況調整而形成的。
聚合數據層是根據常用的數據統計主題和統計維度以及業務指標匯總的數據層。其特點反映學校常用數據需求。以教學課程數據為例,最為常用的接口是教師和學生課表。其中教師課表是由教師基本信息、教師授課信息和教室地點信息匯總而成的。通過一個接口即可獲得教師和課程以及教學地點之間的關聯關系,在高校課程信息中,使用頻率非常高,因而在聚合數據層專門存放教師課表視圖,以供直接調用。
分析應用層是根據具體的數據需求,例如領導駕駛艙或者對于一個具體數據維度,比如對科研業績的統計分析而產生的數據層,其特點是針對特定主題。分層分級管理使得數據在適量冗余的前提下,最大限度的方便各種應用場景的提取和應用。
通過“一張表”相關數據的治理,理清了人事、教學、科研等學校核心數據。進而通過這些數據的應用,解決了學校四大難點問題。
(1) 保證了學校核心數據的權威性、一致性。通過對教工相關的數據治理,將教工相關的基本信息,教學信息,科研信息等核心數據匯總到學校數據中心,并完成了這些常用數據的日常維護和在學校范圍內的共享交換。數據權威來源部門統一發布數據,由數據中心統一分發,其他部門共享使用。
(2) 切實減少了部門的審核量。“一張表”系統匯聚了人事、教務、科技、研究生院、國際教育學院等相關部門的35張表,268個字段。數據記錄總量203 287條,其中教師填報了46 798條占數據記錄總量的23.002%。教工填報量占整個數據記錄總量的不到1/4。超過3/4的數據都是通過系統集成或管理部門數據導入,這些數據原本就經過管理部門認定,所以這些數據不需要審核,因而也減少了相關部處和學院的審核量將近3/4。
(3) 消滅了數據重復填報。在收集到的核心權威數據的基礎上,不僅完成了人事職稱評審,人事崗位考核,人事崗位聘用等工作,同時還可以支持學院工程教育認證、研究生院導師遴選、學院年底津貼計算等多種應用。通過不斷的迭代新的填報表單,消滅高校的數據重復填報。將教工從重復數據填報中解放出來,節省了教工寶貴的時間。
(4) 為領導決策提供權威數據支持。通過將數據不斷的應用于崗位考核、職稱評審、研究生導師遴選等高校重點工作,極大地提高了數據質量,保證數據準確性和權威性。通過對這些準確數據的匯總分析,可以獲得關于學校方方面面準確的分析結果,為學校的發展和領導決策提供權威數據支持。
“一張表”的建設,取得了良好成效。為今后更多應用、權威的數據和便捷服務作進一步拓展,完成學校各業務部處表格的自動填報,消滅了數據重復填報;不斷提高數據質量與教工相關的核心數據分析結果;結合一站式服務大廳,將線下的服務搬到線上,讓數據多跑路,讓師生少跑腿,不斷創新學校的管理和服務。