999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機構科研數據知識庫聯盟建設模式比較*

2018-08-08 03:09:06
圖書館論壇 2018年8期
關鍵詞:建設

越來越多的學術機構將產出的科研數據存放在機構知識庫中。盡管科研數據機構知識庫可作為保存、共享科研數據的選擇,但所收集的數據資源僅來源于本機構,共享范圍僅限于機構內部。科研數據管理面臨的挑戰與日俱增,任何學術機構均難以憑借自身有限的力量獨自應對。因此,由個體獨立的“機構知識庫孤島”逐漸走向協同一體的機構知識庫聯盟,是科研數據機構庫發展的必然趨勢,也是科研數據共享的內在要求。科研數據資源是機構科研數據知識庫聯盟存在與運行的基礎,也是聯盟各項工作的基本對象,系機構科研數據知識庫聯盟建設的最基本要素。其收集管理方式對于聯盟的組織管理形式具有實質性影響,因而從根本上決定著聯盟的建設模式。國內外機構知識庫聯盟主要采用集中采集管理(保存)資源與分布采集管理(保存)資源兩大方式[1-4]。機構科研數據知識庫聯盟就其本質而言是一種機構知識庫聯盟,因此在建設中可在對數據實施集中采集管理、分布采集管理的基礎上,構建相應的聯盟組織與管理機制,進而形成兩種聯盟建設模式——集中式建設模式與分布式建設模式。實踐中,芬蘭Doria等機構知識庫聯盟同時采用集中采集、分布采集加元數據收割這兩種資源收集方式[4]。由此可見,綜合集中式與分布式模式之長,形成融兩者特點于一體的聯盟建設模式也應可行,筆者將其稱為混合式建設模式。

1 集中式建設模式

1.1 運行架構

由參與機構共建、共用一個集中式的機構知識庫是構建機構知識庫聯盟的途徑之一,其稱為共享型機構庫聯盟[5]。集中式建設模式是指多所學術機構組成一個聯合體,只建立一個科研數據平臺,各機構的內部成員將元數據與數據提交至該機構數據管理部門,再由其提交至該平臺;或直接將元數據與數據提交到該平臺,然后通過統一的用戶界面為成員機構和/或聯合體外部用戶提供服務,所構建的科研數據平臺實際上是聯合體的科研數據機構庫。從數據提交到數據開放使用的全過程,所有的數據管理與維護實行集中管理,每個聯盟成員遵循相同的數據開放獲取協議。聯盟設有中樞管理負責機構,由能力較強的成員主導聯盟構建和管理,其余成員安排聯絡人員,就自身的需求進行溝通,協調,保障科研數據平臺的統一管理與運行。模式架構見圖1。

圖1 集中式建設模式架構圖

1.2 優勢與不足

1.2.1 優勢

(1)各參與機構的成本低,避免重復性投入,易于產生數據管理與共享的規模效應。

(2)集中力量對提交的數據進行系統的篩選和組織、加工,協力解決數據管理與保存中的難題,從而提高數據資源建設與管理的質量。

(3)由于應用統一的技術標準,便于科研數據元數據的管理與開放乃至平臺與外部數據平臺的互操作,也有助于實現服務的標準化。

(4)對建設條件欠缺且無法獨立地保存科研數據的成員機構,通過實施該模式可以快速實現科研數據的有效管理與安全保存,并在共建過程中提升建設能力,最終有益于保障數據的長期再利用。

1.2.2 不足

(1)聯盟政策制定困難。為使聯盟政策盡可能兼顧各成員的利益,須高度依賴成員機構間的反復協調和聯盟管理中心的統籌規劃,但成員的特殊訴求仍不易滿足,統籌協調過多會降低管理效率。

(2)較難處理成員間的利益平衡。一方面聯盟只建立一個科研數據平臺,其或以某一核心機構徽標為標識,或以聯盟徽標為標識,不能展示各成員的身份;對外宣傳時無法詳加說明每個成員機構的貢獻與付出,因而使多數成員不易得到外界的認可與關注,缺少歸屬感,從而挫傷其積極性,最終可能削弱其提交數據的意愿。另一方面,當聯盟成員對聯盟所作貢獻與從中所得大不相稱,投入與回報差距較懸殊時,易引發聯盟行政管理層面的問題,誘發成員間的矛盾,甚至導致貢獻大的成員退出聯盟。

(3)聯盟數據平臺的使用與推廣有所受限。成員機構均沒有自己專屬的科研數據機構庫,而由于各成員內部的相關系統(如教師成果系統、實驗室管理系統、科研管理信息系統)在接口、標準規范、協議、體系結構等方面存在差異,聯盟的科研數據平臺較難與這些系統進行有機集成,使科研數據平臺不易嵌入研究人員的日常科研環境中,從而對其使用和宣傳推廣造成不利影響。

(4)建立大規模的機構科研數據知識庫聯盟時存在較多困難。為保障海量數據的長期安全保存,并及時響應、處理來自各方的數據操作與服務請求,科研數據平臺必須具備優異的效能。依托一個科研數據管理系統/平臺支撐聯盟的運行,即使在其建設和維護上予以大量投入,科研數據管理與保存的風險仍可能隨著時間的推移而不斷增大,用戶服務也將面臨巨大壓力。

1.3 適用情境

(1)科研數據的總量較小或數據的增長速度較慢。集中式模式下,聯盟僅僅依靠一個數據管理共享系統/平臺擔負管理、保存所有成員的科研數據與提供各類服務的重任,對平臺的效能、可靠性要求很高。因此,若數據量過大或者數據持續激增,平臺在數據管理、存儲、檢索等方面的性能也必須隨之迅速提高。平臺如不能及時地更新升級,將很可能難堪重負。

(2)各成員機構之間具備良好的合作歷史或具有共同的隸屬關系。加入集中式聯盟往往意味著將數據資源托付給數據管理經驗豐富的機構代管,這顯然要求聯盟成員對彼此間的情況較為熟悉,且對代管機構具有較強的信任。還需要各成員在事關科研數據管理與共享的重大問題上保持一致,且成員間無明顯的利益沖突。因此,如果成員機構具有共同的隸屬關系或彼此間的交往與合作較密切,則更為適用該模式。

(3)成員機構遵循統一的標準協議。一方面,實行數據的集中采集、管理與存儲必然要求各成員依據一致的數據選擇標準、組織加工標準和統一的數據管理規程開展相應工作。另一方面,成員機構都通過同一個平臺/系統獲取科研數據,因而也必須遵循統一的數據開放使用協議才能保證各成員在共享、利用數據時享有平等的權利、義務,以維系聯盟內部關系的和諧。

(4)成員機構對科研數據共享持開放態度。采用集中式模式的聯盟對科研數據實施集中管控,或由少數實力較雄厚的成員代為履行數據保管職能,或另辟存儲空間,實行成員機構共管,因此參與成員愿意將數據置于外部空間保管。如成員機構大力支持科研數據共享,則往往并不過分在意數據存儲的位置(機構內或機構外)。所以成員機構對科研數據共享的態度積極與否也是聯盟是否選擇集中式建設模式的影響因素。

(5)數據的來源學科較單一,種類較少。當集中保管成員機構的所有科研數據時,原則上應依照統一的元數據標準進行描述。然而,科研數據的類型、格式極為繁多。尤其在自然科學領域,不同學科甚至同一學科內不同研究領域的數據的屬性都差異顯著,難以使用一種元數據標準進行描述。只有數據來自同一學科或若干鄰近學科,選用統一的元數據標準才較為可行。

2 分布式建設模式

2.1 運行架構

從各成員的機構知識庫中收割數據,構建集成檢索平臺,使用戶經由統一檢索界面訪問和獲取資源是構建機構知識庫聯盟的另一策略。中國農業科學院機構知識庫采取的“集中揭示、分布部署”的“院-研究所”兩級建設模式即是上述策略的具體應用[6]。據此,機構科研數據知識庫聯盟的分布式建設模式是指成員機構根據共同的數據交互標準,分別建立物理空間獨立的科研數據機構庫,使數據資源呈離散式分布。同時在實現各機構庫中資源獨立搜索的基礎上,收割各庫中數據的元數據并匯集到一個元數據倉儲中或向其中分別導入元數據文檔,通過建立統一檢索平臺的方式為用戶提供聯盟中所有科研數據機構庫內資源的一站式檢索。該元數據倉儲實際上成為聯盟數據資源集成共享的紐帶。成員機構仍遵循統一的數據開放獲取協議(但某機構內部人員訪問、利用本機構科研數據機構庫時可能執行與此不同的開放獲取協議)。聯盟的管理組織架構相對松散,可能不必設置中樞管理機構,僅訂立合作協議或章程。模式架構如圖2所示。

圖2 分布式建設模式架構圖

2.2 優勢與不足

2.2.1 優勢

(1)易于宣傳各成員及其科研數據機構庫。建立的多個科研數據機構庫構成科研數據資源節點網絡,一旦形成整體性的科研數據共享聲譽、品牌,個體科研數據機構庫便可展現出自身價值。借助網絡效應,在更高層次和更大范圍內幫助本機構提升學術形象和擴大影響。

(2)成員機構能較好地保持自主性。作為相對獨立的節點,成員機構在數據資源采集和組織加工方面所受的限制與約束較小,便于實現數據資源建設的連續性和特色性。各成員不僅參與聯盟開展的各項公共服務,還可以根據自身的戰略規劃和內部人員的數據管理需求開發和拓展本地化和個性化的功能、服務,從而提升聯盟服務的層次性和多樣性。

(3)利于深化和拓展成員間的合作。成員機構在建設的過程中都可能遇到有關機構庫管理政策框架、數據保存技術、數據管理與服務系統、知識產權保護等方面的相同或類似問題。通過聯盟的紐帶作用,各成員很容易建立和形成更多聚焦科研數據機構庫建設的社群,利于科研數據機構庫的推廣普及,同時也為成員間凝聚共識提供了條件,有利于促進整個聯盟的協同可持續發展。

(4)建設難度較低。OAI-PMH、OAI-ORE等開放互操作標準在包括科研數據平臺在內的數字化知識庫系統的開發中得到普遍應用,并已基本成為一種默認標準。科學數據云,尤其是領域科學數據云的發展顯著優化了分布式科研數據中心的資源存儲、聚合、檢索與共享。機構科研數據知識庫聯盟分布式建設模式實現的技術難度由此大大降低。

2.2.2 不足

(1)各成員選用的數據管理軟件/系統可能相異。該模式強調聯盟成員的高度自治性,并不強制其采用同一軟件,只是推薦使用某種軟件/系統,或自主開發原型系統供成員選擇。這固然有助于使各成員較好地滿足自身的實際應用需求,但不利于主流科研數據管理系統工具的推廣應用,系統間的互操作也面臨挑戰。聯盟成員不便分享系統運行、維護、更新等方面的經驗或教訓,某個成員遇到有關系統開發與維護的疑難時也難以向其他成員尋求解決方案。

(2)使用的元數據標準可能不一致。該模式的實現建立在對各聯盟成員本地科研數據機構庫元數據的采集基礎之上,而各成員采用的數據管理軟件的不同以及對數據描述與組織的要求相異決定了各個機構庫應用的元數據標準也有所差別。這就需要專門設計元數據互操作解決方案,在統一跨庫檢索時完成元數據間的互操作,否則將會降低數據檢索的檢全率、檢準率。

(3)制定的政策不盡相同。每個成員自主管理本地數據機構庫,聯盟管理層或領導機構盡管可通過編制宏觀性的數據管理政策指南以明確成員機構政策的編制原則和基本框架,但并不統一規定各成員的數據管理共享政策與方式。這種彈性管理增加了成員在行動上保持一致的難度。例如,數據采集政策的區別可能導致不同機構庫中數據資源的種類有所差異,影響數據收集的完整性以及數據的整合效果。成員制定的數據加工處理或質量控制標準不同,也會使各機構庫中數據的質量參差不齊,削弱聯盟數據的整體質量。

(4)可能引發數據資源的重復建設。由于科研合作行為的普遍存在,多個機構、人員可能擁有同一科研數據(集)。由于各成員使用的元數據標準不同,多條元數據記錄可能指向同一數據對象,因此,分頭獨立建設科研數據機構庫時難以避免對數據資源的重復收集,且不易及時發現。由此不僅額外耗費建庫人員的時間和精力,還造成數據一站式檢索時的檢索結果的去重問題,增加了系統平臺的處理負擔,降低了檢索質量。

2.3 適用情境

(1)聯盟成員的實力均較為雄厚。實施分布式建設模式的前提是所有成員都建有科研數據機構庫,且該模式下聯盟運行中主要依靠成員的自身力量負責各機構庫的長期管理和維護,這必然要求成員均具備相應的技術能力,并能為機構庫的建設提供穩定充足的人力、物力和財力投入。

(2)聯盟成員的來源面廣。當聯盟成員來源較廣時(如成員中既有高校,又有科研院所和其他學術性組織),其在機構性質、科研活動特征等方面差異明顯。這種差異使不同機構中科研人員的科研數據管理與保存方式、習慣各具特點,對科研數據管理與服務的需求隨之多元化、個性化。為滿足這些需求,由各成員分頭建立科研數據機構庫,在向聯盟提交元數據或允許收割元數據以使外部用戶獲取、利用數據的同時,也專為該機構用戶提供一定的個性化定制服務較為合適。

(3)成員機構對科研數據共享的態度較謹慎。若研究機構相對謹慎地看待科研數據共享,往往顧慮數據的安全性,擔心自身的數據保存在本機構外部將容易丟失、毀壞,造成無可挽回的損失。因此更希望數據保存于該機構內。而一般情況下,采用分布式模式的聯盟的數據存儲空間均位于各機構的網絡防火墻以內,由各成員獨立監管維護。

(4)數據來自多個學科,類型多樣。由于對科研數據實施分布式存儲,不同機構可以根據數據特征與自身需求,采用不同的分類編碼標準和元數據標準進行描述、組織。這就為聯盟管理和保存眾多學科、類型的研究數據奠定了基礎,更容易構建內容全面、綜合性強的機構科研數據知識庫聯盟。

3 混合式建設模式

3.1 運行架構

從資源聚合方式看,兼具集中提交和元數據收割兩種方式的機構庫聯盟即為混合式機構庫聯盟。對機構科研數據知識庫聯盟,混合式模式是指在建設機構科研數據知識庫聯盟時,部分有條件的機構分別建立自己的科研數據機構庫,其余機構共建單個或多個科研數據倉儲,組成若干集中式機構科研數據知識庫聯盟;在此基礎上形成一個科研數據機構庫群,分別采集各機構庫/倉儲中數據的元數據并將之存儲到一個集中的元數據倉儲中,通過統一的科研數據檢索平臺查找聚合后的元數據,實現對所有成員機構數據資源的一站式檢索。采用混合式模式的機構科研數據知識庫聯盟在建設中同時采用了集中式模式與分布式模式。其管理與組織形式相對靈活多樣,既可實行集中式統籌管理,也可采取自愿協議式管理。模式架構如圖3所示。

圖3 混合式建設模式架構圖

3.2 優勢與不足

混合式模式的最大優點在于不同規模、能力水平的成員可以選擇適合自身狀況的模式,較好地滿足其科研數據管理與共享需求;也能在更大范圍內實現聯盟成員的資源共享,聯盟的包容性和可擴展性較好。已建成的科研數據機構庫也可得到保留,不致造成人、財、物等資源的不必要浪費。部分成員采用集中式模式共建共管科研數據機構庫,有利于在數據采集和管理、數據服務、數據平臺開發等領域積累協作經驗,為優化聯盟整體的管理及服務提供借鑒。不足之處是集中式機構科研數據知識庫聯盟與各分布式科研數據機構庫所采用的政策、標準、規范與協議的差異增加了數據整合的難度。采用不同建設模式的聯盟成員間的管理與協調也面臨更多風險。當部分成員具備相應能力時,可能會單獨創建自己的科研數據機構庫而退出集中式聯盟,由此可能影響聯盟的穩定運行,這一點尤為值得注意。

3.3 適用情境

混合式模式可以在一定程度上兼顧不同規模的成員機構的需求。對于小型學術機構來說,加入已有的集中式機構科研數據知識庫聯盟能省去開發自身的科研數據管理系統和服務平臺的開銷,不失為節約數據管理成本的理想選擇,并可從中學習和汲取關于數據管理與服務的知識、經驗與技能。而對于大型學術機構而言,則可單獨創建本機構的科研數據共享平臺,形成科研數據資源節點,并與已有的集中式聯盟簽訂科研數據共享協議,允許聯盟對其科研數據的元數據進行采集收割。由此,可在滿足其內部人員的個性化數據資源與服務需求,激發自主創新能力,宣揚自身學術成果和實力的同時,積極探索不同情境下科研數據機構庫的最佳實施策略,推進科研數據機構庫建設的推廣普及。

建立較大范圍(如全國或跨國范圍)內的機構科研數據知識庫聯盟時,鑒于成員數量眾多、來源廣泛,在機構規模、研究領域、學術交流(數據共享)習慣及認知、科研數據資源現狀與管理能力等方面差異大,對聯盟的建設模式較難形成共識,如一部分成員已建立科研數據機構庫/平臺,宜選擇混合式模式。這樣可在尊重各成員的實情及意愿的基礎上,保留已有的科研數據機構庫/平臺,加快實現聯盟成員的數據資源共享。

4 結語

在數字化科研與數據密集型研究范式興起的環境下,構建機構科研數據知識庫聯盟對促進科研數據管理與共享事業的意義無可置疑。通過對國外機構庫聯盟管理運行機制以及科研數據機構庫建設要素的分析,筆者認為機構科研數據知識庫聯盟的建設可實行集中式模式、分布式模式與混合式模式。三種模式各有優勢和不足,分別適用于一定的環境。總結各模式的適用情境可知,成員擁有科研數據的現狀(數量、種類、分布)、思想觀念(對科研數據開放共享的看法)、科研數據管理基礎與能力、聯盟的參與規模是確定機構科研數據知識庫聯盟建設模式的主要考量因素。有意于組建此類聯盟的各類學術機構應在充分剖析、研判上述因素的基礎上,秉承協商一致的原則,審慎選擇符合實際的建設模式。

猜你喜歡
建設
自貿區建設再出發
中國外匯(2019年18期)2019-11-25 01:41:56
基于IUV的4G承載網的模擬建設
電子制作(2018年14期)2018-08-21 01:38:28
《人大建設》伴我成長
人大建設(2017年10期)2018-01-23 03:10:17
保障房建設更快了
民生周刊(2017年19期)2017-10-25 10:29:03
數字電視分前端建設隨談
野三化冶建設
“三化”建設
“三化”建設
“三化”建設
“三化”建設
主站蜘蛛池模板: 日韩二区三区无| 婷婷色狠狠干| 啊嗯不日本网站| 人人艹人人爽| 91激情视频| 亚洲精品午夜无码电影网| 亚洲综合精品香蕉久久网| 五月婷婷综合在线视频| 在线色综合| 亚洲国产精品不卡在线| 国产精品久久久久婷婷五月| 欧美亚洲欧美| 国产精品成人一区二区| 国产一级毛片网站| 免费国产黄线在线观看| 美女无遮挡拍拍拍免费视频| 国产素人在线| 操国产美女| 亚洲一级色| 深爱婷婷激情网| 99视频精品全国免费品| 思思热精品在线8| 狠狠干综合| 日本黄色不卡视频| 天天激情综合| 国产成人精品2021欧美日韩| 人妻中文久热无码丝袜| 999国产精品永久免费视频精品久久| 精品久久久无码专区中文字幕| 情侣午夜国产在线一区无码| 高潮毛片无遮挡高清视频播放| 国内丰满少妇猛烈精品播| 久久亚洲国产最新网站| 国产呦精品一区二区三区网站| 国产香蕉在线| 亚洲午夜18| 国产精品自在拍首页视频8| 亚洲黄色视频在线观看一区| 亚洲国产精品日韩专区AV| 91青青草视频在线观看的| 成人另类稀缺在线观看| 亚洲中文字幕在线观看| 色偷偷男人的天堂亚洲av| 欧美精品影院| 天堂久久久久久中文字幕| 男人天堂亚洲天堂| 国产高清免费午夜在线视频| 国产成人免费手机在线观看视频| 午夜爽爽视频| 丝袜亚洲综合| 人妻中文字幕无码久久一区| 日本尹人综合香蕉在线观看| 亚洲第一成人在线| 喷潮白浆直流在线播放| 国产呦视频免费视频在线观看| 99热线精品大全在线观看| 色婷婷狠狠干| 久久黄色一级片| 熟妇丰满人妻av无码区| 九九热免费在线视频| 亚洲无码高清一区| 国产美女一级毛片| 无码免费的亚洲视频| 国产成人亚洲日韩欧美电影| 亚洲人成网站日本片| 永久免费无码日韩视频| 1024你懂的国产精品| 精品久久久久无码| 99精品一区二区免费视频| 精品少妇人妻无码久久| 久久频这里精品99香蕉久网址| 国产欧美日韩在线在线不卡视频| 伊人网址在线| 欧美一区国产| 欧美第九页| 伊人久久婷婷| 亚洲欧洲国产成人综合不卡| 日韩精品成人在线| 国产成人精品无码一区二 | 高清乱码精品福利在线视频| 亚洲妓女综合网995久久| 国产成人欧美|