付博 武興華

[摘 要]文章將國家開放大學數字圖書館現有業(yè)務特點和發(fā)展重點作為研究內容,在闡述數據治理概念及研究基本情況的基礎上,分析開放大學數字圖書館發(fā)展情況與存在問題,根據其自身特點提出有針對性的數據治理框架,意在提升開放大學數字圖書館數據資產的服務水平,提高數據的利用率和數據價值。
[關鍵詞]開放大學;數字圖書館;數據治理;數據質量
[中圖分類號]G258.6 [文獻標識碼]A [文章編號]1008-7656(2019)01-0081-05
在信息化與數字化的技術驅動下,數據科學時代拉開序幕,新的研究范式應運而生。隨著數據科學不斷發(fā)展,管理過程設定、業(yè)務流程決策以及數據處理方法也在時刻發(fā)生變化。異構海量數據的產生使傳統(tǒng)的數據管理方式“捉襟見肘”,亟需對數據進行科學治理以確保數據的高效利用與最大增值。
一、數據治理的概念及數據治理研究的基本情況
(一)數據治理的概念
目前,國內外的研究機構和學者從不同視角對數據治理進行定義,但還未形成統(tǒng)一共識。一些國外學者從法案中提出數據治理,定義了一系列規(guī)則和政策[1];國際數據管理協(xié)會(Data Management Association)認為,在數據管理的十大職能中,數據治理最為核心,在數據的管理和使用層面對數據進行規(guī)劃、監(jiān)督及控制,用以支持頂層決策與戰(zhàn)略實施[2];還有一些學者主張數據治理應從數據管控的責任與技術等角度出發(fā),在人與技術的集中使用背景下,組織中的數據作為一項資產得到合理使用[3-6]。美國全球數據管理協(xié)會 (DAMA) 認為,數據治理是對數據資產管理行使權利和控制的活動的集合 (DAMA, 2012) [7]。國際數據治理研究所 (DGI The Data Governance Institute)認為,數據治理是指針對信息相關過程的決策權和職責體系,這些過程遵循“在什么時間和情況下、用什么方式、由誰、對哪些數據、采取哪些行動”的方法來執(zhí)行[8]。在國內,數據治理的定義還沒有統(tǒng)一,多數研究與數據的生命周期相關,例如數據的采集、加工、存儲、利用等,或采用數據管護、數據管理等名詞[9-14], 還未提到數據治理的本質。數據治理源于IT治理,其將數據作為一項有重要價值的資源,不僅僅是對數據管理過程的計劃執(zhí)行,更是對管理過程的指導、監(jiān)督和評估。
(二)數據治理研究的基本情況
框架方面,除DGI框架和DAMA框架[15]外,國外也有學者提出了決策域模型和驅動力模型[16][17] 。國內包冬梅等總結了數據治理框架中的職能及關系、工作區(qū)間、任務、組織結構、責任分工、成效的評估標準等,同時提出了高校圖書館的數據治理框架CALib[18]; 許曉東等設計了高等教育數據治理的分析框架[19];李青、韓俊紅設計了教育數據治理框架[20]。
在圖情領域,顧立平從數據獲取、數據共享、數據重用三方面證實了數據治理是圖書館事業(yè)發(fā)展重要的機遇[21];劉潔璇闡述了數據治理在知識管理中的應用與價值,并討論了發(fā)展前景[22];任亞忠分析了大數據時代背景下,數據治理為圖書館帶來的一系列轉變[23]。
二、開放大學數字圖書館發(fā)展情況
開放大學采用多媒體數字化資源辦學的特點,決定了信息化與數字化將是支撐其遠程教育的核心與焦點。數字圖書館作為開放大學重要的組成部分,在現代信息技術的支撐下,采用網絡化、數字化提供服務已是常態(tài)。
(一)業(yè)務特點——海量數據與大數據利用
開放大學的學生數量龐大,分布在不同的年齡層次,也遍布不同的城鄉(xiāng)區(qū)域、機構崗位與社會階層,知識背景與學習能力也各不相同,同時,學生學習規(guī)律、認知習慣、學習動機、學習環(huán)境方面也差異明顯。因此,每個學生在使用數字圖書館時,存在不同的學習行為與學習路徑,構成了海量讀者行為數據的來源。與此同時,在大數據飛速發(fā)展的背景下,如何將這些行為數據加以價值最大化利用,這成為了目前的研究熱點并值得深入挖掘。
(二)發(fā)展重點——數字資源深度組織與開放獲取
數字圖書館是用戶獲取數字資源及相關服務的平臺。依據傳統(tǒng)的服務模式,數字資源通過數據庫和網頁形式向用戶呈現,根據數字資源自身主題或學科導航進行資源揭示,由用戶主動進行資源獲取,該模式下的需求導向不足。同時,數字資源整合深度難以滿足用戶的個性化需求,挖掘深度較淺。開放大學強調優(yōu)質資源的共建共享,將免費開放與傳播的公共學習資源納入數字化服務中,契合開放大學的辦學理念與服務宗旨,能夠推動開放大學數字圖書館資源整合空間的無限延伸,開放獲取將得到拓展和開辟。
三、開放大學數字圖書館數據治理框架
圖1 開放大學數字圖書館數據治理框架圖
開放大學數字圖書館數據治理是在開放大學圖書館發(fā)展戰(zhàn)略和規(guī)劃的指導下實施的,因此,其數據治理工作具有鮮明的行業(yè)特征,通用的數據治理框架并不完全適用。通過上述對開放大學數字圖書館的業(yè)務特點和發(fā)展重點進行分析,提出開放大學數字圖書館數據治理框架(見圖1)。
從內容上來看,開放大學數據治理包括數據治理戰(zhàn)略、數據治理活動體系、數據治理實施三個層面。在這三個層面中,包括數字圖書館的文化內涵與愿景、規(guī)章制度與組織保障,以及資源服務、數據整合、基礎IT支持等多個方面。
(一)數據治理戰(zhàn)略
數據治理戰(zhàn)略處于框架的最頂層,對整個數字圖書館的發(fā)展具有最高指導意義。數字圖書館秉持“時時、處處、人人”的服務理念,為學生終身學習打造優(yōu)質平臺,并逐步適應目前先進的技術與大數據環(huán)境,與時俱進,使各類學習者不受空間時間限制,隨時隨地獲取數字資源服務。同時,數據治理的戰(zhàn)略意識也應當貫穿到數字圖書館建設的各個層面,以戰(zhàn)略為指引,形成具體活動與舉措的規(guī)劃。
(二)數據治理活動體系
1.規(guī)章制度與組織保障
數據治理覆蓋面廣,各項規(guī)劃與舉措,各類業(yè)務和流程,各種系統(tǒng)與平臺,要求每項工作都必須從制度上加以規(guī)范與保障,將各類章程、辦法、考核等貫穿到各項工作的始終。在規(guī)章制度的指導下,進行人力財力等的有效組織,保證數據治理工作的順利進行。根據學校的愿景和目標,設定總方向,獲得領導層的支持;進行跨部門的協(xié)調,執(zhí)行數據治理具體計劃;業(yè)務部門劃定具體業(yè)務的負責工作組或工作人員,履行職責,解決問題。
2.數據存儲治理
對于數字圖書館來說,各類數據的存儲安全是最不能忽視的一個問題。數據的存儲是其持續(xù)利用的關鍵點,存儲安全應當得到優(yōu)先保證,并且需從以下幾點著手并逐步制度化、常態(tài)化。
(1) 安全規(guī)劃。安全規(guī)劃應保證存儲在數據庫中的所有數據安全有效,在經過長時間存儲之后仍能被訪問和使用。具體措施如定時評估數據、監(jiān)測技術環(huán)境、測試存儲功能、對所部署的安全措施進行審計、注意數字資源的權限管理等,了解可能發(fā)生的安全事件。
(2) 日志分析。日志被認為是一類非常重要的數據,它顯示出了數據的存儲方式、存儲路徑等,基于日志的分析能夠幫助系統(tǒng)管理員更好地了解數據訪問使用情況,了解所出現的問題并能及時查看。
(3) 訪問控制。為了防止數據被不正當訪問,減少數據濫用與數據泄露發(fā)生的可能,需要對數據的訪問進行權限設置,某些權限只能授予那些需要訪問數據的人,以此來降低越權訪問率與事故后的處理難度。
(4) 容災備份。容災備份實際上提供了一套復制數據的機制,將數據保存在另一個物理獨立的存儲容器中。容災備份對所有通信和數據定期檢查,以確保在數據庫運行崩潰時,能夠在最短時間內使資源得到安全、高效的恢復。
3.數據描述治理
(1) 數據編碼標準。建立統(tǒng)一的資源數據編碼標準可以保證在全體數字資源的范圍內,將數據進行一致性管理,為實現數據庫的數據集成共享,管控協(xié)同,一體化運行做好良好的基礎保障。
(2) 數據編碼原則。結合數字資源管理需求,制定數據編碼規(guī)則如下。
識別唯一性:統(tǒng)一資源數據編碼要求具有唯一的識別標志。
特征一致性:保證資源數據編碼的關鍵特征在不同應用、不同系統(tǒng)中的高度一致性。
數據穩(wěn)定性:資源數據編碼本身的屬性不會隨管理過程中的數據流轉而被修改。
長期有效性:資源數據編碼所代表的數據對象在存儲中仍然存在,該組員數據編碼就應該保持有效性。
(3) 元數據描述標準。元數據是具有對數據進行定位、描述、選擇等多種功能的數據,具有連貫有效地描述、管理、編目網絡資源的功能。通過對元數據的管理,對數據進行分類組織,實現無縫信息檢索、內容調用和資源共享,是數據治理的重要內容。在元數據管理中,可以制定三大類元數據項:必選項(必須有)、條件項(有則應用)和可選項(有用時)。
4.數據質量治理
數據質量治理是提高和改善數字資源數據質量的一項活動,是對數據的每個階段——采集、存儲、管理、共享到應用中可能引起的各種數據質量問題進行管理,從而進行資源監(jiān)測、問題識別與事故預警。質量治理是一個循環(huán)管理,其最終要達到的目標是提升數據質量,通過可靠的數據提升其使用價值,并最終獲得管理效益。
數據的質量治理最主要包括完整性、準確性與有效性等三個方面。
(1) 數據的完整性。數據的完整性就是數據之“全”。即在數據生命周期開始時,把所需信息盡可能采集完整,這對于全面把握數據,對數據進行分析并發(fā)現其中規(guī)律及問題具有重要意義。隨著數據表格、數據庫的深度使用,能夠對數據完整性進行完善。
(2) 數據的準確性。數據的準確性是指數據是否符合其真實的情況。對于數字資源來說,其數據的準確性尤為重要。因此,我們進行資源數據管理時,在整合、傳輸等各個環(huán)節(jié),都有可能受到各個方面的影響,因此我們要盡可能將誤差控制到最小,以保證數據的準確性。
(3 )數據的有效性。在保證數據的完整性與準確性的同時,還需要考慮數據的有效性。也就是說,我們在衡量數據時,過期的、不符合要求的數據是不產生價值的,是應該被剔除的。
5.統(tǒng)計、評估與優(yōu)化
數字圖書館數據采集系統(tǒng)將用戶的行為數據記錄下來,并進行統(tǒng)計分析,直接服務于提升數字圖書館的建設水平和服務質量的活動。在加強統(tǒng)計分析與數據挖掘的同時,推動學科服務、知識服務等的完善。建立可實行的、可測量的統(tǒng)計與評估指標體系,了解數據治理的現狀和差距,對數據治理框架中的各項內容進行不斷優(yōu)化,制定改進路徑,促進數據治理向成熟發(fā)展。
(三)數據治理的實施
數據治理的實施指在戰(zhàn)略規(guī)劃及關鍵活動指導下,在IT支持層面、數據層面和服務層面所做的具體措施。
IT支持層面包括技術路線、支撐平臺、遠程服務等,在支撐整個數字圖書館系統(tǒng)運行的基礎上,針對開放大學師生遍布全國的特點,提供遠程登陸、聯合認證等服務;數據層面包括數據模型、數據架構、數據整合、數據發(fā)現四個方面。數據架構是系統(tǒng)和軟件架構層面的描述,主要是從系統(tǒng)設計和實現的視角來看數據流和信息流。數據模型包括概念數據模型、邏輯數據模型和物理數據模型等。同時,在標準化、開放性與集成化的標準環(huán)境下,整合數據庫的各類資源、整合紙本與數字資源、整合專業(yè)、小眾的學科資源提供知識路徑等,也正在成為數字圖書館系統(tǒng)發(fā)展的主流;服務層面包括構建基于開放網絡的、適合開放大學特點的學術資源體系,進行資源整合,建立特色資源庫,采用最適合的元數據方案,加強數字資源元數據編目,針對成人教育的特點,對資源進行更細粒度、更小單元、更深層面的組織和揭示。與此同時,在開放大學系統(tǒng)中,充分挖掘各分部發(fā)展需求,整合各地優(yōu)勢資源,為整個開放大學體系提供服務。
四、結語
開放大學數字圖書館隨著技術與數字資源的不斷前進演變,越來越以數據為核心。隨著國家“十三五”規(guī)劃進入關鍵時期,數字圖書館的發(fā)展與建設也應該站在“十三五”規(guī)劃的高度,對數據治理加以重視。應樹立數據治理的理念,在新環(huán)境中進行轉型,在總體戰(zhàn)略的引領下,明確職責分工,加強組織保障,完善標準體系,提供高質量的數據服務,將數據作為寶貴資產加以利用,為開放大學的師生提供便捷、滿意的服務。
[參考文獻]
[1]Donaldson A,Walker P.Information governance—A view from the NHS[J].International Journal of Medical Informatics,2004(73).
[2]國際數據管理協(xié)會 [EB/OL]. (2015-
05-31)[2018-10-12]. https://dama.org.
[3]Fernandes L,O’Connor M. Data governance
and data stewardship. Critical issues in the move toward EHRs and HIE[J]. Journal of AHIMA/American Health Information Management Association,2009 (80).
[4]Rosenbaum S.Data governance? and? steward
ship: Designing data stewardship entities and advancing data access[J]. Health Services Research,2010 (45).
[5]Haider? A. Asset? lifecycle? data? governance
framework[A]. Proceedings of the 7th World Congress on Engineering Asset Management(WCEAM2012)[C]. Switzerland:Springer International Publishing,2015.
[6]Malik P. Governing big? data: Principles and
practices[J]. IBM Journal of Research and Development,2013 (3).
[7]DAMA International.The DAMA Guide to the
Data Management Body of Knowledge[M]. 1st ed.New York: Technics Publications,2009.
[8]Data? ?Governance? Institute. The? DGI Data
Governance Framework[R/OL].(2015-08-20)[2018- 10-10]. http: // www. datagovernance. com / the-dgi-framework /dgi-framework.pdf.
[9]程蓮娟.美國高校圖書館數據監(jiān)護的實踐及其啟示[J].圖書館雜志,2012(1).
[10]錢鵬,鄭建明.高校科學數據組織與服務初探[J].情報理論與實踐,2011(2).
[11]丁培.數據策展與圖書館[J].圖書館學研究,2013(6).
[12]曹霞.國內Data Curation研究現狀與熱點分析[J].圖書情報工作,2014(18).
[13]王芳,慎金花.國外數據管護(Data Curation)研究與實踐進展[J].中國圖書館學報,2014(12).
[14]張閃閃,顧立平,蓋曉良.國外信息服務機構的數據管理政策調研與分析[J].圖書情報知識,2015(5).
[15]劉桂鋒,錢錦琳,盧章平.國內外數據治理研究進展:內涵、要素、模型與框架[J].圖書情報工作,2017(21).
[16]Khatri V,Brown C V.Designing data governanc[J].Communications of the ACM ,2010 (1).
[17]Martijn N,Hulstijn J,Bruijne M,et al.Determining the effects of data governance on the performance and compliance of enterprises in the logistics and retail sector[C]. International Federation for Information Processing,2015.
[18]包冬梅,范穎捷,李鳴.高校圖書館數據治理及其框架[J].圖書情報工作,2015(18).
[19]許曉東,王錦華,卞良,孟倩.高等教育的數據治理研究[J].高等工程教育研究,2015(5).
[20]李青,韓俊紅.數據治理:提升教育數據質量的方法和途徑[J].中國遠程教育,2018(8).
[21]顧立平.數據治理——圖書館事業(yè)的發(fā)展機遇[J].中國圖書館學報,2016(5).
[22]劉潔璇.高校圖書館知識管理中的數據治理[J].情報科學,2018(1).
[23]任亞忠.從數據管理走向數據治理——大數據環(huán)境下圖書館職能的轉變[J].四川圖書館學報,2017(4).