白茹花
【摘要】在高校檔案管理中引入大數據思維,圍繞高校內部檔案建設需求和用戶體驗,采用不同的大數據收集和分析方法,將檔案管理提升到更互聯網化的管理模式,以提高檔案的利用率和用戶滿意度。
【關鍵詞】大數據;檔案管理;高校
高校的檔案建設往往按照自身工作要求,對檔案進行分類、收集、加工、保存等工作。經過多年的積累,形成具有通用與專業內容并存的檔案結構體系。然而,目前不少高校的檔案數據容量雖然很大,但檔案的重復利用率普遍不高,未能充分發揮出檔案服務的價值。檔案的獲取受時間、空間、地點、查詢速度等條件的限制和約束。在這種情況下,高校檔案管理與服務應逐步形成高校的大數據思維,打造更互聯網化的檔案管理模式,才能提高檔案的利用率和用戶滿意度。
一、高校內部檔案管理存在的問題
(一)檔案系統內部相互獨立,信息孤島問題嚴重。高校內部的檔案建設體系,基本上是按照業務方向進行分類,這些系統的業務內容不同,對檔案處理方式也就不同,造成檔案格式各自為政,檔案之間形成所謂的信息孤島,雖然易于各類檔案的建檔與管理,也利于建設人員專注于檔案的專業化程度。但是由于無法形成一個完整檔案建設和管理體系。在內容上不能互聯互通,在數據格式上造成多種形式并存,在邏輯上顯得雜亂無序,不利于站在一個整體的角度對高校檔案建設進行發展規劃。
(二)高校檔案利用率不高,用戶體驗有待改進。高校檔案的價值,不僅僅是為了解決數據保存的完整,也是要讓檔案得到二次利用,要讓更多的用戶獲取與使用,從而直接或間接產生價值。目前大部分電子檔案數據在數據庫中都是按照條目進行存儲,而當用戶試圖使用這些資源時,也是按照條目來瀏覽和使用的。這種模式缺少資源條目之間的縱向聯系,對用戶來說,卻往往需要通過不同緯度獲取多種檔案。比如通過文章標題能夠找到多年來類似的公文,大家已經習慣了互聯網上的搜索引擎一站式的查找資料方法,并不關注要找的資料是哪種格式或存儲在什么位置,如果為了找到某一條信息,用戶需要進行若干次查找和瀏覽,本來簡單的操作被成倍放大,用戶體驗就變的很差。檔案利用率上不去,也就不能發揮應有的作用。
二、高校內檔案管理與服務引進大數據的必要性
大數據技術讓不同的數據聚合產生新的知識,通過收集來自各種不同格式、不同分類的檔案數據源,可以提取有用的信息,經過數據清洗、轉換、重構形成新的數據集合,然后通過合適的查詢和分析工具、數據挖掘工具、聯機處理工具對數據進行加工處理,最終轉化為滿足不同用戶的新知識。
高校檔案管理引進大數據技術,通過針對現有檔案管理系統數據庫進行關聯分析,找出數據的相關性,提取有價值的信息,可以為檔案管理與數據提取提供廣泛、深入的數據支持。同時,大數據技術還可以從大量數據中發現那些難以分析接納的知識,實現真正意義的數據整合。
三、大數據在高校內部檔案服務的應用探索
在高校檔案管理中引進大數據思維,圍繞高校內部檔案建設需求和用戶體驗,采用不同的大數據收集和分析方法,將檔案管理提升到更互聯網化的高度。
(一)基于用戶行為的檔案服務定制。傳統高校的檔案服務方式習慣于采用被動服務方式,其特點是不關注不了解用戶的實際要求,檔案管理系統開發人員按照工作經驗進行檔案的收集開發。用戶處于被動接受地位,檔案到用戶屬于單向流動,這種服務方式已經遠遠滿足不了用戶的真實需要。要想真正了解用戶必須借助大數據,通過統計工具收集用戶的上網行為數據,然后就可以通過對用戶行為數據按照一定算法進行分析和歸納。以用戶行為產生的歷史數據為基礎,實現向用戶主動推送檔案;同時,還可以向用戶提供智能化檢索功能,使用戶能夠更快更全地找到所需要的檔案信息。
(二)基于用戶評價的檔案管理。檔案最大的價值來自于再次利用,來自于服務用戶。因此,用戶對檔案評價數據具有非常大的價值,它是高校了解現有檔案的內容質量、運行效率、服務水平等方面的數據渠道。用戶評價既包含對檔案現狀的具體意見和整體評價,還包含對檔案未來發展的期望和需求。通過對用戶評價數據的分析,可以為檔案在加工、發布、保存等環節上提供操作依據。
(三)實現檔案的互聯互通。檔案之間的格式、形式可能不同,但往往相互之間有著緊密的聯系,例如某個發文有可能和合同、財務報銷單據等的某些內容相一致或者存在關聯關系,單獨的一份檔案可能不能滿足用戶索取需求,與其他檔案關聯與使用成為了必然。然而,不同檔案之間來源和內容側重點不同,造成檔案之間沒有建立邏輯關系,仍然存在著“信息孤島”問題。只有通過大數據手段,按照檔案的關鍵詞、內容片段等信息對不同結構、不同來源的檔案進行組合,可以將原本隸屬于不同種類的檔案進行關聯,在邏輯上整合為一個實體,當用戶在查看或瀏覽某一資源的同時,與之相關聯的檔案就可以同時展示給用戶。避免用戶重復查找。這些所謂的“信息孤島”將能夠通過數據挖掘和數據分析的手段進行整合,原本互相不可能關聯的獨立檔案信息就可以組合為一個有機的生態系統。
四、結論
大數據時代讓數據流通變得更多更快、也為高校的檔案關聯提升帶來契機。高校內部檔案管理與服務面臨的問題就是檔案分類多,檔案關聯性差,用戶對檔案的需求多樣。因此高校內部的檔案管理必須通過借助大數據分析手段,真正實時了解用戶,充分挖掘現有檔案的數據價值,對檔案進行調整和邏輯整合。不斷優化用戶體驗,從而最大程度發揮高校檔案的應用價值。
【參考文獻】
[1]吳建成.大數據時代背景下的檔案利用服務探討.湖北檔案,2013(03).