文 / 吳毓
檔案信息資源共建共享是檔案工作的重要組成部分,也是共建共享社會治理格局的必然要求。在大數據時代,檔案信息資源共建共享迎來了新的發展契機。檔案信息資源共建是共享的前提,共建模式從一定程度上決定了共建工作的效果,因此研究大數據環境下檔案信息資源的共建模式有益于檔案行業實現檔案信息資源共建共享的目標。
“大數據(Big Data),或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產”。維克托·邁爾—舍恩伯格認為:“大數據是指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。”[1]美國互聯網數據中心指出:“互聯網上的數據每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數據是最近幾年才產生的。”[2]在中國,隨著“互聯網+”計劃的實施,數據的飛速增長也超出了人們的想象。2016年3月17日,《中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》指出:“把大數據作為基礎性戰略資源,全面實施促進大數據發展行動,加快推動數據資源共享開放和開發應用,助力產業轉型升級和社會治理創新。”[3]可見,大數據的時機已經來臨,它將在眾多領域掀起變革的巨浪。
“由于檔案也是信息資源大家族中的一員,它也具有一般信息所具備的屬性”[4]。因此,在大數據環境下,檔案信息資源具有大數據特征,即數據量大、數據類型多、處理速度快。“如果把大數據比作一種產業,那么實現盈利的關鍵在于提高對數據的‘加工能力’,通過‘加工’實現數據的‘增值’”[5]。為了實現檔案信息資源的“增值”,打破“信息孤島”現象,檔案信息資源的共建成為大數據時代檔案工作的重要內容,同時也是檔案部門亟待解決的問題。檔案信息資源共建模式是解決檔案信息資源共建問題的方法論,是一種參照性指導方略。它反映了檔案信息資源共建中隱藏的規律關系。因此,構建共建模式是檔案信息資源共建過程中的必然要求。此外,目前的檔案信息資源共建活動空前活躍,構建檔案信息資源共建模式有利于充分開發檔案信息資源,突破檔案資源建設瓶頸,提高檔案資源開發與用戶需求的契合度,保障檔案信息資源共建工作有效開展。
為了順應大數據時代潮流,確保檔案信息資源共建模式完善可行,在模式構建時應遵循以下原則。
任何一個國家檔案信息資源共建模式的構建都是社會和自然因素綜合作用下的產物,離不開該國政治、經濟、文化、科技等因素的影響。首先,檔案信息資源共建模式應該符合國家政治、經濟體制現狀。國家政治、經濟體制是檔案信息資源共建模式構建的基礎,兩者具有直接聯系。[6]我國是社會主義國家,實行人民民主專政的高度集中的政治體制和社會主義市場經濟體制,這與世界上很多國家有較大區別。因此,檔案信息資源共建模式構建應該適應我國當前國情。其次,檔案信息資源共建模式要適應我國檔案事業發展需要和現有的檔案工作體制機制。大數據環境下,檔案信息化、數字化已經成為我國檔案工作發展的新趨勢,由此可見,檔案信息資源共建模式構建要符合這一發展方向,進一步促進檔案資源朝著信息化、數字化方向發展。最重要的是,適應性原指生物體與環境相適合的生存潛力,是生態學術語,現引申為戰略方針在所處環境的適應程度。檔案信息資源共建模式的構建處于大數據環境下,其根本就是要適應大數據環境,適用大數據時代的需要,適用大數據時代海量檔案數據的特征,具有實際操作性。
由于大數據具有4V特征:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。[7]其中,大量代表數據體量巨大,存儲單位從過去的GB到TB,直至PB、EB;高速代表數據采集、處理、計算速度較快,能夠滿足實時數據分析需求;多樣代表種類和來源多樣化,包括結構化、半結構化和非結構化數據,具體表現為文本、圖像、視頻、音頻信息等等;價值代表數據價值密度低,但將原始數據經過采集、清洗、深度挖掘、數據分析之后,具有較高的商業價值。因此,大數據環境本身就是一種不斷變化發展的動態性環境。同時,檔案信息資源共建也是一個動態過程。在大數據動態性環境下,檔案信息資源共建模式也應該是非僵化、動態變化的,即遵循動態性原則。構建檔案信息資源共建模式,要將檔案行政部門、檔案保管部門和社會公眾等聯動起來,多主體參與到檔案資源共建,同時根據用戶需求的動態變化,對檔案數據進行實時處理分析,完善檔案資源共建模式;[8]要樹立動態發展觀念,遵循動態性原則,來構建檔案信息資源共建模式,以期推動檔案信息資源共建工作更好地發展。
大數據環境下地方檔案行政管理部門和系統專業主管部門之間仍然存在不少矛盾,存在地方檔案管理“條塊分割”現象,并且,地區間檔案信息化和網絡化程度發展不平衡,區域間檔案信息資源共建工作發展不均衡。這要求檔案信息資源共建模式決不能采取一刀切模式,必須量體裁衣,靈活多樣。只有構建靈活多樣的檔案信息資源共建模式,才能使檔案信息資源共建富有更加強大的生命力和活力。大數據環境下產生了“檔案大數據”概念。“檔案大數據”主要是由檔案部門管理保存的各類檔案數據和檔案部門在實際工作中形成的大量數據這兩部分構成的。檔案部門管理保存的檔案數據包括紙質檔案和電子檔案,檔案部門在工作中形成的檔案數據包括用戶訪問檔案網站形成的瀏覽記錄和查閱數據,以及檔案信息資源共建共享平臺的日志、檔案統計系統形成的數據、檔案數字化過程產生的數據等[9]。對“檔案大數據”進行充分挖掘,有利于檔案信息資源的合理配置,對檔案信息資源共建具有重要作用。龐雜的檔案數據類型不僅對檔案部門處理數據的能力提出了挑戰,而且對檔案信息資源共建模式提出了更高要求,決定了共建模式構建應當具備多樣性,以便對大數據環境下檔案信息資源進行有效利用。
確定檔案信息資源共建模式,既要立足于現實,又不能囿于現實,應當具備可持續發展觀念和大局意識,把握未來發展方向,模式設計適度超前,與國家地方中、長期規劃相結合,為將來增加新的功能或重建模式預留空間,要具有可擴展性。[10]并且,既定的模式應保持較強的穩定性,不宜隨意更改,否則,將影響檔案信息資源共建的進程,也會給國家帶來不應有的損失。[11]互聯網、金融、銷售等以數據為導向的行業,可以通過大數據的決策與預測功能,深度挖掘自身企業數據并進行處理分析,制定企業未來發展規劃,以期達到服務企業長遠發展需要。[12]因此,企業不僅可以利用大數據進行實時數據采集分析,而且可以利用大數據分析預測未來發展方向,例如,今日頭條通過關鍵詞查找可以實時分析用戶特征和興趣愛好,[13]淘寶通過用戶消費記錄與瀏覽數據可以預測用戶購物需求,推薦用戶可能要購買的商品[14]等等。大數據環境下,檔案部門建立網絡平臺系統,構建適度超前的檔案信息資源共建模式,共建檔案信息資源,對檔案數據進行實時收集、實時歸檔、實時計算、實時分析,既可以預測用戶潛在需求,又可以為社會公眾提供更加全面的檔案個性化服務。
在大數據環境下檔案信息資源共建模式構建原則的基礎上,筆者認為共建模式大體上可以分為四種類型。
檔案聯盟模式是指在一定范圍內,通過制定相關的合作框架和協議,檔案行政管理部門、各級各類檔案館和其他檔案機構等具有檔案保管權的共建主體圍繞相同的共建目標,建立起統一的合作組織,以達到檔案信息資源共建的目的。檔案聯盟模式充分體現了適用性原則,其優點在于匯集了檔案信息資源共建主體中最重要的部門,能夠在這些部門之間建立起合作組織,有利于實現檔案信息資源、人力資源和管理資源的優化配置。因此,它可以發揮傳統合作模式無法比擬的功效。
檔案聯盟模式一般分為區域性檔案聯盟模式、全國性檔案聯盟模式以及區域性和全國性相結合的檔案聯盟模式。區域性檔案聯盟模式一般是指在省級范圍內,由各省檔案局(館)作為牽頭部門,和各市、縣級檔案局(館)以及各機關、企事業單位內的檔案機構等建立起區域性的檔案聯盟組織,在檔案信息資源的共建工作中按照事先制定的規劃進行各種資源的統籌分配,從而形成區域內的檔案信息資源共建格局。全國性檔案聯盟模式是指由國家檔案局(中央檔案館)作為牽頭部門,和各省、市、縣級檔案局(館)以及各機關、企事業單位內的檔案機構等建立起全國性的檔案聯盟組織,從國家層面制定各種規則和標準、合理分配各種資源,從而達到全國檔案信息資源共建的目的。目前,全國性的檔案聯盟模式在短時間內較難實現,然而在大數據環境下檔案信息資源的共建工作又十分迫切,因此區域性和全國性相結合的檔案聯盟模式可以很好地解決這兩者之間的矛盾。區域性和全國性相結合的檔案聯盟模式是指在建立各省級檔案聯盟的基礎上,國家檔案局(中央檔案館)將各省級檔案聯盟聯合起來,建立起一個由國家檔案局(中央檔案館)領導、各省級檔案聯盟共同組成的組織,并通過相應的協調機制對各省級檔案聯盟進行指導,從而達到全國檔案信息資源共建的目的。
公眾參與模式是指檔案機構改變檔案信息資源共建權限,將社會公眾和檔案部門一起作為共建主體,通過互聯網媒介作用,讓每個人都成為參與者,所有參與者構成虛擬網絡社區,圍繞著相同的共建目標,最終實現檔案館與公眾協同作用共建檔案信息資源。公眾參與模式充分體現了動態性原則,其優點在于能夠將社會公眾引入到專業性的檔案信息資源建設之中。通過社會公眾的主動參與,檔案信息資源共建工作可以更加全面地把握用戶的動態需求變化,有效地開發利用檔案信息資源,實現檔案信息資源的豐富化、有序化和最優化。因此,公眾參與模式比傳統單一主體共建模式具有更加完善的優越性。
公眾參與模式一般分為權限轉移模式和意見征詢模式兩種。[15]權限模式一般是指檔案信息資源開發專業人才權限轉移,檔案部門通過某種方式向公眾轉移,開始接受外部人員參與檔案信息資源共建。該模式通過動員公眾參與到大量檔案信息加工和處理工作,將社會公眾從檔案信息資源共建的“旁觀者”變為檔案信息資源共建工作過程中的“參與者”,汲取公眾智慧,彌補了人力資源的不足,節約了人力成本。檔案眾包是依托于網絡技術,將檔案信息資源共建的相關業務外包給網絡大眾的最典型的形式。[16]意見征詢模式是指檔案部門通過檔案網站、社交媒體平臺或其他方式來收集公眾對于檔案信息資源共建的意見和建議,包括用戶需求、用戶體驗或對檔案信息資源共建的改進方法等,完善檔案信息資源共建工作。目前,我國社會公眾參與檔案信息資源共建的實踐結果不盡如人意,根本原因在于缺乏國家性政策和資金的支持。我國公共檔案社會意識和公眾參與意識也不是很強,對檔案、檔案工作、檔案信息資源共建沒有清楚的認識。為了吸引公眾主動參與檔案信息資源共建,檔案部門應當建立激勵機制鼓勵社會公眾積極參與檔案信息資源共建。
大數據時代,面對數量龐大、種類多樣、來源廣泛、生成速度快的檔案大數據,單靠檔案部門自身的力量很難完成對它們的收集、處理、加工、應用等工作,必須引入市場機制,利用市場的力量來彌補檔案部門在檔案信息資源共建中資金、技術、人才等方面的劣勢。市場調節模式是指發揮市場在促進資源合理流動中的作用,以市場需求為導向,引入更多的市場主體參與到檔案信息資源共建的過程中,以期為檔案用戶提供更加優質的服務。
以云計算、數據挖掘、分布式計算等為代表的大數據技術,不僅改變了信息服務的手段,而且還打破了傳統的檔案信息資源共建模式。“一元模式”已經被打破,伴隨而來的是共建的“多元模式”,即發揮市場在檔案信息資源共建中的調節作用,促進資源的合理流動,節約成本。市場調節模式包括“公益制模式”和“產業制模式”,向著“雙軌制”方向發展。“公益制模式”的主體是國家各級檔案行政管理部門。他們在檔案信息資源共建中提供無償性的服務,不以盈利為目的,但必須按照市場的變化和規則來調整自身的服務方向,以市場為導向來建設檔案信息資源。“產業制模式”則是直接由市場調節,但必須接受國家法律法規的約束,以獲取經濟利益為目標,在此基礎上共建我國的檔案信息資源。如眾包模式就是利用市場來調節檔案信息資源的共建,將檔案的數字化加工、深度挖掘、檔案文化產品開發等業務外包給市場,利用市場在資金、技術和人才等方面上的優勢來共建檔案信息資源,實現資源的豐富化、有序化和多樣化,提升檔案館的服務質量,提高用戶需求與資源供給之間的匹配度。
大數據的環境改變著社會的組織結構和社會中各角色之間的關系,個體、組織和社會之間緊密地交織在一起并形成復雜的網絡關系,在互聯互動的發展中重新定位自己的角色。而建立檔案信息資源、檔案服務和檔案用戶之間的聯動關系則是大數據環境下檔案信息資源共建的發展趨勢。多方聯動模式是指檔案部門在日常的檔案工作中,以檔案信息資源建設為基礎,以檔案服務為連接,以檔案用戶的需求為出發點和落腳點,把三者構建成有機的聯系體,并始終圍繞著社會公眾,避免檔案信息資源建設和檔案服務的盲目性、片面性和單一性。長期以來,我國的檔案信息資源、檔案服務和檔案用戶之間處于分散、孤立的狀態,檔案信息資源的收集、開發和利用未能從滿足檔案用戶多樣化需求的角度出發,檔案服務未能立足于特色館藏和檔案用戶的個性化、多樣化、便捷化需求,檔案用戶利用檔案存在重實際輕休閑的行為目的,諸多因素加在一起阻礙了我國檔案信息資源共建多方聯動模式的形成。
多方聯動模式的實現需要利用大數據發展的技術,搭建檔案信息資源建設、檔案服務以及檔案用戶管理的聯動平臺。“三個平臺間有一定的邏輯關系,是相互關聯的,其最終目的是滿足公眾需求,實現檔案資源建設、檔案服務與檔案用戶的動態聯動”[17]。檔案信息資源建設平臺,在收集上要覆蓋廣大人民群眾,利用數據挖掘技術和可視化分析技術對檔案信息資源之間的關系進行挖掘和分析,找出數據與數據之間潛在的關系,加速檔案數據的知識化轉向,提高館藏檔案的質量,為大數據時代檔案用戶多樣化的信息需求做好準備。檔案用戶管理平臺在利用館藏資源對檔案用戶進行線上和線下服務的同時,注重對用戶的利用需求進行分析,找出用戶需求與檔案數據之間的關系,并將形成的檔案用戶數據及時提供給檔案服務平臺。檔案服務平臺要在收到數據之后,對檔案館已有的服務模式、理念、資源等進行優化,通過不斷的反饋提高服務質量,在滿足用戶既有需求的基礎上利用大數據技術預測出用戶的潛在需求。
[1][13]維克托·邁爾—舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013:3-8,109-104.
[2]云創大數據.大數據向人類認知方式提出新挑戰[EB/OL].http://www.cstor.cn/textdetail_4392.html.
[3]新華社.十三五規劃綱要(全文)[EB/OL].http://sh.xinhuanet.com/2016-03/18/c_135200400_6.htm.
[4]馮惠玲,張輯哲.檔案學概論[M].北京:中國人民大學出版社,2006:103-127.
[5]陶水龍.大數據視野下檔案信息化建設的新思考[J].檔案學研究,2017(3):93-99.
[6]高波.文獻信息資源共建共享模式新論[J].中國圖書館學報,2002(6):24-27.
[7]陳明.大數據概論[M].北京:科學出版社,2015:7.
[8]吳加琪.多主體與的區域檔案信息資源共建共享機制研究[J].浙江檔案,2016(7):7-9.
[9]鄭金月.關于檔案與大數據關系問題的思辯[J].檔案學研究,2016(6):37-40.
[10]吳加琪.構建區域檔案信息資源共建共享平臺的思考[J].北京檔案,2014(8):24-27.
[11]高波.文獻信息資源共建共享模式新論[J].中國圖書館學報,2002(6):24-27.
[12]張濤.大數據帶來的變革及應對策略[J].高科技與產業化,2013(5):59.
[14]于英香.檔案大數據研究熱的冷思考[J].檔案學通訊,2015(2):4-8.
[15]寇京.公眾參與式檔案信息資源共建模式探析[J].北京檔案,2017(7):29-31.
[16]孫洋洋.基于眾包模式的檔案館信息資源協同共建研究[J].浙江檔案,2015(11):17-21.
[17]周耀林,趙躍.檔案資源建設與服務聯動模式探析[J].檔案學通訊,2015(5):51-57.