


[摘要]國外在高校機構知識庫聯盟系統工作流設計方面起步較早并取得了一定成效。其中,澳大利亞ARROW項目發展較為成熟,包括4種工作流模式:機構知識庫—科研管理系統模式、科研管理系統一機構知識庫模式、聯合導入與審核模式、功能集成模式。其為國內高校機構知識庫聯盟系統工作流模式的開發及應用帶來如下借鑒和參考:因庫制宜的工作流設計理念、明確各參與主體的職責與分工、重視聯盟系統間的協同化發展。
[關鍵詞]機構知識庫聯盟 工作流模式 澳大利亞聯機研究倉儲
[中圖分類號] G250 [文獻標識碼]A
1引言
1962年美國校際政治與社會研究聯盟(Inter-Uni-versity Consortium for Political and Social Research,簡稱ICPSR)成立,為向用戶提供優質的數據資源,ICPSR將組織目標及過程管理方案納入到了其年度戰略規劃,由ICPSR委員會負責統一管理和執行,成為高校機構知識庫(Institutional Repository,簡稱IR)聯盟工作流管理的重要典范。高校機構知識庫聯盟在國外已有50多年的發展歷史。隨著數據量的膨脹和聯盟規模的擴大,對高校機構知識庫聯盟業務流程的合理規劃變得日趨必要,工作流設計對于聯盟的有效運行也越來越重要。除ICPSR外,當前國外發展較成熟的高校機構知識庫聯盟,如面向世界的澳大利亞聯機研究倉儲(Australian Research Repositories Online to the World,簡稱ARROW)、英國的7校機構知識庫聯盟項目SHERPA-LEAP(London Eprints Access Project-Securing a Hybrid Environment for Research Preservation and Access,倫敦在線資源獲取項目——確保研究(數據)保存和獲取的綜合環境)等,在機構知識庫聯盟工作流模式開發及應用方面也已取得較好的應用成效。而國內高校機構知識庫聯盟在相關方面的研究和實踐尚處于起步階段,有針對性的案例也更加少見。筆者以ARROW項目的工作流模式為例展開討論,通過實例分析為國內相關領域的研究和實踐提供借鑒與參考。
2高校機構知識庫聯盟系統工作流模式現狀研究
1996年,工作流管理聯盟(Workftow Management Coalition,簡稱WfMC)認為,工作流即全部或部分業務過程的自動化,在此過程中,文檔、信息或工作任務會根據特定程序規則從一個執行者(環節)傳遞至另一個執行者(環節)。將組織業務過程從現實世界中抽象出來,采用形式化方法對其進行描述,其結果即該組織的工作流模式。WfMC指出,通過工作流模式進行過程管理,有利于優化組織人力資源配置并促使其沿正確方向發展,同時還可提高組織業務效率,降低工作成本,改善用戶服務質量。目前,國內外不少高校機構知識庫聯盟組織均根據自身實際情況開發了不同的工作流模式,以促進聯盟科研服務功能的充分發揮。
在對已有文獻進行調研的基礎上,結合目前國外高校機構知識庫聯盟建設實踐,筆者認為高校機構知識庫聯盟主要采用以下3種工作流模式:①機構知識庫數據導入型工作流模式,是指由聯盟各成員機構知識庫負責數據采集,將收集組織好的數據導入到聯盟科研管理系統,由其統一提供給用戶使用;②聯盟科研管理系統數據導入型工作流模式,是指由聯盟科研管理系統負責數據采集,將收集組織好的數據導入到各成員機構知識庫,數據服務仍由聯盟科研管理系統負責;③混合式工作流模式,是對以上兩種模式或其他模式的綜合運用。據此,筆者對國內外部分高校機構知識庫聯盟的工作流模式進行了統計分析(見表1)。
由表1可知,在調研的23家高校機構知識庫聯盟中,機構知識庫數據導入型工作流模式作為傳統的過程管理方法仍占據著主導地位,采用該模式的占56.5%。聯盟科研管理系統數據導入型工作流模式多運用于區域性高校機構知識庫聯盟的建設,采用該模式的占21.7%。混合式工作流模式兼具二者的優勢,采用該模式的占21.7%。目前,美國、澳大利亞等機構知識庫聯盟事業發展較為成熟的國家已經開始了實踐探索,中國的香港、臺灣機構知識庫聯盟系統也開始嘗試混合式工作流管理模式。工作流模式在數據管理領域的運用和推廣對于科研人員工作效率的提高以及數據資源的有效共享具有重要意義。
3 ARROW系統工作流模式及適用性分析
ARROW是由澳大利亞聯邦教育、科學與培訓部資助的國家示范項目,也是澳大利亞高等教育研究信息基礎設施框架的重要組成部分。在聯盟系統工作流管理方面,ARROW側重于元數據流的采集管理。由于ARROW所面臨的是多個系統之間的數據管理問題,其科研管理系統需要與各成員機構知識庫系統進行有效協作。因此,ARROW項目高等教育研究數據采集(The Higher Education Re-search Data Collection,簡稱HERDC)工作組針對不同成員機構知識庫的實際情況開發了以下4種工作流模式:①機構知識庫一科研管理系統模式;②科研管理系統一機構知識庫模式;③聯合導入與審核模式;④功能集成模式。各成員機構知識庫在聯盟數據流管理過程中可因庫制宜,選擇最佳實踐方案。
3.1機構知識庫一科研管理系統模式
該模式工作流程為:①數據采集,由成員機構知識庫負責并進行條目驗證,數據提供者具體包搖學術型員工、專職研究員、院系教師、信息發布者、行政管理者、圖書館員以及研究辦公室人員等;②數據導入與管理,聯盟科研辦公室需向HERDC工作組做匯報,才能將數據由成員機構知識庫導入科研管理系統,科研管理系統對未收集齊的數據進行補充收集并反饋給成員機構知識庫;③數據輸出,科研管理系統作為統一服務平臺,將整合后的數據提供給用戶使用(見圖1)。
該模式的特色在于:①在數據收集過程中,各成員機構知識庫負責進行條目驗證,可有效提高科研管理系統數據質量,減少數據冗余。②模式運行可依托于現有軟件系統,編程和開發工作主要應用于成員機構知識庫與科研管理系統之間數據流的同步和更新,從而有效避免數據不同步問題。但采用該模式需考慮以下兩方面問題:①各成員機構知識庫系統負荷量較大,模式運行速率較慢,可能會影響資源利用率。②科研辦公室和各成員機構知識庫需在涉及HERDC報告的所有問題上事先達成一致。
因而,機構知識庫一科研管理系統模式較適用于聯盟成員較多,且各成員機構知識庫系統運行環境相對一致的高校機構知識庫聯盟的建設,以保證系統資源的有效整合。成員機構知識庫負責數據采集的主要工作,還應具備較高的資源監控能力。在實際運行過程中,由于該模式目前發展較為成熟,很多大規模高校機構知識庫聯盟的建設較傾向于采用該模式完成業務流程管理。
3.2科研管理系統一機構知識庫模式
該模式與機構知識庫—科研管理系統模式的主要區別在于數據采集主體的變化。其工作流程為:①數據采集,由科研管理系統集中采集,數據的提供者不變;②數據導入與管理,科研管理系統對收集到的數據資源進行加工整合后導入到各成員機構知識庫,成員機構知識庫對未收集齊的數據進行補充收集并反饋給科研管理系統;③數據輸出,科研管理系統作為統一服務平臺,將經成員機構知識庫審核后的數據資源提供給用戶使用(見圖2)。
該模式的特色在于:①由科研管理系統負責數據采集,無需進行HERDC驗證與審核,直接將數據存儲于成員機構知識庫,在很大程度上減少了數據的二次驗證過程。②數據由科研管理系統導入成員機構知識庫,可借助現有數據輸入/輸出工具批量實現,減少了數據導入工作量,服務效率更高。但采用該模式需考慮以下兩方面問題①科研管理系統收集用戶所需的所有數據,包括文獻的數字對象標識符(Digital Object Identifier,簡稱DOI)信息和摘要,這給數據系統和科研辦公室都帶來了巨大的工作負荷,對聯盟科研辦公室工作人員的從業能力也提出了更高要求。②由于各成員機構知識庫系統存在差異,科研管理系統作為系統間數據同步與更新的主體,無法通過常規的數據接口實現,需要專門的定制軟件來完成。
因而,考慮到科研管理系統的運行效率,機構知識庫一科研管理系統模式較適用于中小型高校機構知識庫聯盟的建設。該模式下,聯盟科研辦公室工作人員需具備較高的專業素養,能對數據進行有效甄別和遴選,同時具備一定的軟件開發與應用能力。
3.3聯合導入與審核模式
該模式的工作流程為:①數據采集,設計獨立的數據導入與審核系統來負責資源采集工作,數據的提供者不變;②聯合導入與審核,數據導入與審核系統在對所收集的數據資源進行審核與組織之后,將其導入到科研管理系統和各成員機構知識庫,二者可對未收集齊的數據進行補充收集,并反饋給聯合導入與審核系統進行審核。③數據輸出,科研管理系統作為統一服務平臺,將經成員機構知識庫審核后的數據資源提供給用戶使用。但在數據服務過程中,科研管理系統可根據用戶實際需求,與成員機構知識庫進行互動與協調(見圖3)。
該模式的特色在于:①聯合導入與審核系統會向資源貢獻者一次性收集所需信息并對其進行即時檢測,最大程度地降低了其資源貢獻成本;②輸入工具方面有所創新,聯合導入與審核系統可自動識別系統需求,針對每個系統只提供其所需數據;③數據采集模塊獨立于科研管理系統和各成員機構知識庫,有效降低了二者系統的負荷量。聯盟科研服務效率得到保障。但采用該模式需考慮的主要問題是:數據采集工作不依賴于科研管理系統和各成員機構知識庫,需獨立開發聯合導入與審核系統并將其嵌入到相應工作模塊。系統開發一方面面臨著技術挑戰,另一方面也需大量的資金支持。
因而,采用聯合導入與審核模式建立高校機構知識庫聯盟,首先,需要各成員高校機構知識庫系統在功能設計與兼容性方面具備較高的同質性,為新系統的開發、嵌入及運行提供有利條件。其次,由于該模式涉及聯合導入與審核系統的開發,聯盟科研辦公室與各成員機構知識庫需就系統開發的成本投入、數據共享方案等問題達成一致。
3.4功能集成模式
該模式工作流程為:將數據的獲取、管理和揭示功能集成到新的系統中,由新的集成化服務系統直接負責數據的輸入與服務,具體工作環節包括:數據輸入—數據管理與揭示—數據輸出(見圖4)。與前3種模式不同的是,該模式實行集成化服務,數據的管理與揭示、數據的輸出等任務均由新系統完成,科研管理系統和各成員機構庫在業務完成過程中的系統負荷相對較小。
該模式的特色在于:①聯合導入與審核模式類似,數據收集及存儲工作基本一次性完成,可降低用戶資源貢獻成本,消除系統間的數據不同步問題。②通過功能集成,由集成系統統一向用戶提供數據服務。但采用該模式需考慮的主要問題是:①集成系統在各成員機構知識庫系統中不存在,需進行本地開發并完成系統嵌入。這就需要成員機構知識庫為開源軟件或能提供足夠的應用程序編程接口(Application Programming Interface,簡稱API)支持本地開發。②本地開發的軟件易受機構知識庫系統升級或變化的影響,軟件維護成本較高。并且,單個系統的協議框架、預期發展及管理問題等都需聯盟科研辦公室與各成員機構知識庫達成一致。
因而,采用功能集成模式建立高校知識聯盟,一方面對成員機構知識庫系統開發環境具有較高要求,開發成功后的軟件維護成本問題也應納入預期規劃。另一方面,由于數據的采集、管理與應用均由新的集成系統完成,聯盟科研辦公室與各成員機構知識庫對新系統的適用性進行預調研,同時應做好宣傳推廣工作并針對用戶開展相關培訓。
4國內高校機構知識庫聯盟系統工作流設計建議
由以上分析可知,高校機構知識庫聯盟工作流設計是一項系統化工程,需考慮軟件開發成本、系統運行環境、聯盟及各成員機構知識庫之間的協調等一系列問題。ARROW機構知識庫聯盟在工作流設計方面,可為國內相關實踐發展提供參考和借鑒。具體而言,可從強調因庫制宜的工作流設計理念、明確各參與主體的職責與分工、重視聯盟系統間的協同化發展3方面進行闡釋。
4.1強調因庫制宜的工作流設計理念
高校機構知識庫聯盟的工作流設計面臨著對各成員機構知識庫數據資源的統一組織與調配問題。高校機構知識庫聯盟的數據管理系統需要與各成員機構知識庫系統實現有效對接。ARROW從系統設計的角度出發,充分考慮了不同高校機構知識庫系統在數據收集情況、管理方法、系統性能以及運行環境等方面存在的客觀差異,開發了針對不同機構知識庫的多種工作流模式,使得各成員機構知識庫可根據自身實際運行情況選擇最佳方案,從而使聯盟系統充分發揮其科研效用。這種因庫制宜的設計理念將在很大程度上降低系統負荷,提高系統運行效率。近年來,國內高校機構知識庫陸續建立并取得了初步發展,呈現出區域性聯盟發展趨勢。但各地發展并不均衡,高校機構知識庫的資源建設水平也存在差異。ARROW這種因庫制宜的工作流設計理念,可為國內高校機構知識庫聯盟的建設發展提供新思路。
4.2明確各參與主體的職責與分工
在工作流設計過程中,各參與主體的職責分工明確與否對整個系統的順利運行有著非常重要的影響。ARROW開發的4種工作流模式,均對數據采集、數據審核與驗證、數據資源的補充與更新、數據服務等各項工作任務進行了明確分工。其中,機構知識庫34研管理系統模式與科研管理系統一機構知識庫模式的聯盟過程管理主要是通過成員機構知識庫和科研管理系統實現的。聯合導入與審核模式與功能集成模式,通過系統開發與功能集成,將數據審核、數據服務等工作任務分配至新系統,降低了原有系統的工作負荷。目前,國內高校機構知識庫陸續建立并取得了初步發展,區域性聯盟趨勢日漸明顯。但現有高校機構知識庫聯盟在工作流的設計過程中,并未對各參與主體的職責與分工做出明確規定,通常都是由聯盟科研管理機構負責統一管理與協調,成員機構知識庫只是作為聯盟會員進行數據上傳,對于資源審核、數據更新等工作流程的設計仍有待完善。因而,國內可借鑒ARROW這種責任制工作流模式,提高聯盟工作效率。
4.3重視聯盟系統間的協同化發展
由ARROW案例分析可知,在高校機構知識庫聯盟工作流設計過程中涉及到的系統協同化問題主要分為兩類:其一是現有系統之間的協同化問題,即科研管理系統與各成員機構知識庫之間的數據同步與更新。其二是為合理規劃業務流程、滿足用戶需求而新開發的系統與現有系統之間的API對接與數據統一管理問題。數據系統間協同性的高低是影響高校機構知識庫聯盟科研效用的重要因素。因此,從長遠來看,我國高校機構知識庫聯盟的建立和發展應充分考慮系統間的協同化問題。
具體而言,應從以下3方面著手解決:①明確數據補充采集與更新的主體。將數據同步問題作為聯盟工作流模式運行的獨立業務環節進行規劃,確保各系統間數據資源的及時更新。②正確評估本地系統開發及運行環境。在工作流設計過程中,如需進行系統開發,首先應對現有系統的性能和運行環境進行準確評估,為新系統的開發及其與現有系統的有效對接創造條件。③提供系統的協同化運行及維護的資金保障。系統的協同化發展需要一定的資金支持,尤其是在本地系統維護或新系統開發過程中,需要大量的成本投入,因而,聯盟在工作流模式開發或選取時,應將該問題納入重點考慮范圍。
5結語
基于對國內外相關研究成果和實踐情況的調研分析,本文立足于國內高校機構知識庫聯盟建設的現實需求,對國外高校機構知識庫聯盟成功案例ARROW項目的工作流模式進行了分析。經研究發現,ARROW在工作流設計理念、模式開發、參與主體的職責分工以及多系統間的協同化發展等方面已經取得了較為成功的實踐探索,對我國高校機構知識庫聯盟工作流模式的開發和應用具有重要借鑒意義。目前,國內相關研究成果多集中于對高校機構知識庫聯盟建設宏觀性問題的分析,涉及高校機構知識庫聯盟工作流模式的研究還比較少。與此同時,業界相關方面的實踐尚處于項目調研或系統開發階段。因此,未來國內高校機構知識庫聯盟的建設和推廣一方面有賴于政府、學術界和業界的多方支持與參與,另一方面也可借鑒ARROW等國外成功案例的實踐經驗,設計與優化適應我國國情的高校機構知識庫聯盟工作流模式。