宗興慧,王 芳,羅皓潔(山東理工大學信息管理研究院)
自國際學術界、出版界、圖書情報界為推動科研成果及人文信息的廣泛交流而采取開放獲?。∣pen Access,OA)以來,OA期刊和倉儲得到迅速發展。2018年,聯機計算機圖書館中心(OnlineComputer Library Center,OCLC)全球理事會與OCLC Research合作開展了一項關于全球圖書館基礎開放內容的調查,希望進一步了解全球圖書館開放內容活動的現狀[1],其將廣義的開放內容定義為“免費提供、不受限制、任何類型在線內容的全部范圍”,包括科學OA期刊文章、專著和預印本,以及其他類型的開放資料、開放教育課程、政府文件、灰色文獻、數據集、數字化特殊館藏和其他遺產館藏、可免費獲取的視頻、軟件、工具或其他類型的原始數字資源。2020年7月1日,OCLC發布《圖書館開放內容活動:方向相同,軌跡不同——來自2018年OCLC全球理事會調查結果》(以下簡稱《圖書館開放內容活動》)報告[1],該報告通過對圖書館開放內容活動的廣泛定義以及對全球圖書館開放內容活動現狀的廣泛調查,為圖書館界開展開放內容活動提供了嶄新的視角。
《圖書館開放內容活動》報告共38頁,包括前言、摘要、引言、調查范圍和方法、關于受訪者、調查結果、討論、致謝、附錄9部分。調查結果部分包括當前和計劃中的活動類型、活動開展年限、活動投資金額、活動成功性評價、提升活動影響力的最佳范圍及OCLC在全球開放內容活動支持方面的作用等內容。該調查報告有助于全面了解全球圖書館開放獲取與開放內容的現狀以及其他相關內容。
該報告以研究型圖書館與大學圖書館的開放內容活動為研究對象,將研究型圖書館與大學圖書館的開放內容活動作為一個整體予以考察,體現出調查研究的系統性。報告主要采用訪談法收集數據,調查樣本由來自69個國家的511個受訪者構成,涵蓋了不同制度文化背景下的開放內容活動,體現出調查研究的多樣性。在調查結果分析中,使用大量圖表進行數據分析,體現出調查研究的可靠性。
該報告一共收集了14項開放內容實踐活動以及不同國家在開放內容活動中的政策支持。該報告從開放內容活動實踐出發,到調查報告結果總結,緊扣報告主題,肯定了OCLC對全球開放內容活動的支持以及疫情防控期間開放內容活動的貢獻,能夠指導圖書館應對開放內容活動中的挑戰,對圖書館開展開放內容活動具有實踐指導意義。
在調查過程中,考慮到不同國家的圖書館在開展活動中呈現出的差異性,調查組設計了一組在訪談過程中可以使用的開放內容活動作為參考,以便全面掌握與開放內容相關的圖書館政策、活動和服務范圍。開放內容活動被劃分三個類屬(開放內容生產、開放內容的可發現性和可用性、開放內容的收集和管理)14項開放內容活動。首先,開放內容生產,包括開放內容推廣(目的是使人們獲取到開放內容,包括數據標準化工作和員工培訓)、開放內容出版(即作為出版商的圖書館)、數字化館藏(包括明晰數據開放共享產權以及在公共領域提供館藏資源)、支持作者/研究人員/教師創建開放內容、數據服務(即開放研究數據管理的活動)、文獻計量服務。其次,開放內容的可發現性和可用性,包括用戶數字素養教育(包括廣泛的后臺工作,使外地制作的開放內容能夠在本地使用,如鏈接到開放內容的目錄或lib指南以及電子資源管理許可證)、選擇非圖書館管理的開放內容、促進開放內容的可發現(使開放內容更易于查找和使用,如設置OA按鈕)、與開放內容的深度交互(即通過統計和機器學習技術與數字化開放館藏交互,包括幫助用戶與開放內容進行交互的服務與平臺,如用于文本挖掘或數據可視化工具的API)、評估。最后,開放內容的收集與管理,包括機構知識庫、數字圖書館、原生數字(合法化)館藏/網頁存檔等。
在“圖書館當前和計劃開展的活動”問答方面,97%的受訪者表示正在參與當前的開放內容活動,74%的受訪者計劃在當前活動之外參與新的開放內容活動。由表1可知,在當前參與的開放內容活動中,機構知識庫是參與度最高的活動,其次是用戶數字素養教育和促進開放內容的可發現。在計劃參與的開放內容活動中,每一項開放內容活動都有11%~18%的圖書館計劃參與,其中數據服務以及與開放內容的深度交互是計劃參與度最高的活動,這在一定程度上表明圖書館參與開放內容活動的積極性正在提升。
由表2可知,除數據服務和與開放內容的深度交互外(由表1可知這兩項活動是計劃參與度最高的活動),評估、數字圖書館、開放內容出版、促進開放內容的可發現、原生數字(合法化)館藏/網頁存檔、文獻計量服務及開放內容推廣是未來較受關注的開放內容活動類型。同時,不同國家在計劃開展開放內容活動方面存在差異。在德國,數據服務和促進開放內容的可發現排名較高;在英國,數據服務、評估和開放內容出版排名較高;在加拿大,數據服務和評估是計劃開展較多的活動;在荷蘭,與開放內容的深度交互及開放內容出版是計劃開展較多的活動;在美國和澳大利亞,評估和數字圖書館占比較高。

表1 當前參與和計劃參與的開放內容活動

表2 按國家分類的圖書館計劃參與的活動類型(占比20%及以上)
在“不同國家圖書館參與當前開放內容活動”問答方面,可以揭示出一些有趣的現象。如表3所示,在14項開放內容活動中,澳大利亞、加拿大、荷蘭和英國在絕大多數活動的參與度上都要高于樣本平均值,而美國有一半的開放內容活動低于樣本平均值。出現這種差異的一個重要原因是國家開放政策。如,英國在評估、澳大利亞在文獻計量服務方面遠高于平均水平,與英國的科研質量評價框架及澳大利亞的卓越研究報告有密切關系,這些國家開放政策對評判科研活動資助經費和評價機構科研實力產生了重要影響。此外,在國家的資助機構中,英國、澳大利亞、荷蘭要求那些被資助的科研項目成果要以開放的形式提供,歐盟“地平線2020”計劃也要求經同行評審的科學出版物和科研數據能夠開放獲取。

表3 不同國家圖書館當前參與開放內容活動的類型
在“當前參與的開放內容活動(基于您的衡量標準)有多成功”問答方面,超過一半的受訪者認為其參與的開放內容活動是成功的,不到十分之一的受訪者認為活動沒有成功,10%~20%的受訪者表示他們對開放內容活動的成功沒有衡量標準。由表4可見,受訪者在對非常成功的開放內容活動評價上呈現出國別差異。機構知識庫在美國、英國和荷蘭被認為是非常成功的開放內容活動,而在機構知識庫上參與度最高的澳大利亞卻沒有將此項活動評價為最成功的開放內容活動,而數字化館藏、開放內容出版、數字圖書館被認為是最成功的活動。由此可知,圖書館在對開放內容活動的成功性評價方面是以個人主觀評價為主,缺乏客觀統一的評價指標。

表4 不同國家非常成功的開放內容活動
由表5可知,在“當前參與的每項開放內容活動開展年限”問答方面,有一半的受訪者表示曾參與過這14項活動中的12項,并且參與時間都超過三年。在當前參與的開放內容活動中,有超過70%的受訪者表示在機構知識庫、數字圖書館、數字化館藏、支持作者/研究人員/教師創建開放內容這4項活動中有三年以上的參與經驗。在開展年限1—3年的活動類型中,與開放內容的深度交互、評估、數據服務、促進開放內容的可發現、選擇非圖書館管理的開放內容這五個活動類別占比比較大。在開展年限小于一年的活動類型中,占比最高的兩項開放內容活動是評估和文獻計量服務。另外,大多數圖書館(69%)表示沒有停止任何開放內容活動,在少數停止開放內容活動的案例中,其綜合原因是財務因素和活動對機構價值的不確定性。通過研究圖書館開放內容活動的開展年限可以發現,圖書館在整個開放內容活動中的參與范圍越來越廣,且參與度與成熟度具有相關關系。

表5 當前參與的開放內容活動的開展年限
在“當前參與的開放內容活動的資金來源(預算項目、FTE分配、項目專項資金)”問答方面,70%或更多的受訪者可以表明資金來源的活動是:機構知識庫(79%)、數字化館藏(76%)、數字圖書館(74%)、數據服務(74%)、開放內容出版(72%),并且前三項活動也是參與度和成熟度較高的活動。由表6可知,在預算項目中,機構知識庫和數字圖書館占比最高,究其原因,這兩項是產生主要年度運營成本的服務(軟件、硬件、托管費用、財團費用等);在FTE(全職人力工時,也稱相當全時工作量,是對從事科技活動人員投入量的一種測算方法)中,數據服務排名第一,其次是文獻計量服務,表明這兩項活動的開展需要依賴更多的專業知識和工作人員;在項目專項資金中,數字化館藏占比最高。此外,受訪者普遍只能具體說明當前參與的開放內容活動的資金來源,無法說明圖書館在當前參與的開放內容活動上的投入和支出,也不能提供在當前參與的開放內容活動上的預算支出占圖書館預算總額的百分率,其原因在于大多數圖書館在預算編制和規劃實踐中通常不會區分開放內容和付費內容。

表6 開放內容活動的資金來源
在“開放內容活動提升影響力的恰當范圍是什么”問答方面,45%—79%的受訪者認為“機構”和“地方”是最佳范圍。另外,在提升具體某一項開放內容活動影響力的最佳范圍上呈現出一定的差異(見表7)。如機構知識庫、原生數字(合法化)館藏/網頁存檔、數字圖書館、開放內容出版以及與開放內容的深度交互這幾類活動在“全球”范圍比例僅次于“機構”,說明這些活動除了在“機構”還適合在“全球”范圍內開展。此外,值得注意的是,不同受訪者對于“最佳范圍”觀念的差異也與國家開放獲取和開放內容所處的階段不同有關。如,隨著英國開放政策的不斷深入,圖書館已經從國家宣傳工作過渡到地方執行國家任務階段,因此英國受訪者表示提升活動影響力的最佳范圍是“機構”與“地方”,而在“國家”范圍提升的影響力較小。

表7 提高影響力的最佳范圍
在“以下哪個OCLC研究領域與您的開放內容活動最相關”問答方面,大多數受訪者表示,促進開放內容的可發現、元數據的標準化、優化資源共享、研究數據管理、特殊收藏與檔案及鏈接數據是與圖書館開放內容活動最相關的研究領域。此外,一些發展中國家圖書館希望OCLC能夠圍繞開放獲取和開放內容方面的專業發展,為他們提供更多有關開放內容研究和培訓方面的幫助。如,巴哈馬圖書館希望OCLC能提供關于開放內容研究和培訓的現有文獻和倡議;納米比亞圖書館建議OCLC為圖書館員提供短期在線的專業發展課程,創建一個知識庫平臺,使圖書館員能夠存放其開放內容,從而通過社交網絡分享對課程學習的反饋;尼日利亞圖書館表示在非洲,開放內容活動概念仍然相對較新,圖書館員在這一領域需要大量的培訓,但仍然相信未來能夠在開放獲取和開放內容方面有所作為[1]。
調查顯示,在14項開放內容活動中,圖書館的參與度正在不斷提高,相比其他類型圖書館,研究型圖書館和大學圖書館更可能參與到大多數的開放內容活動中。絕大多數圖書館正在加緊當前參與以及計劃參與開放內容活動,并且他們認為所參與的開放內容活動是成功的。超過一半的受訪者希望提高他們所參與的開放內容活動的影響力。圖書館的數據服務活動有望加快,并且數據服務在提高開放內容活動影響力、未來規劃和資金來源方面的比重相對較高。圖書館對評估和文獻計量服務的參與度增加,表明人們對收集有關開放內容活動數據的興趣日益增加。對于大多數受訪者而言,在其參與的開放內容活動中提高影響力的恰當范圍是“機構”和“地方”。
機構知識庫、數字圖書館和數字化館藏是參與度和成熟度最高、預算資金覆蓋范圍最廣、成功率最高的開放內容活動,其他開放內容活動普遍不夠成熟,也沒有足夠的資金保障。但值得一提的是,數據服務在資金和速度方面都具有很強的優勢,因此我們可以預測它將成為未來的增長領域。除此之外,在開放內容活動的參與度、成熟度及成功率方面,國家之間存在差異。在某些情況下,如在開放內容推廣、數據服務和文獻計量服務方面,國家間的差異也反映了不同國家采取的開放科學政策差異。
對于大多數圖書館來說,量化開放內容活動的投資額存在困難,即受訪者可以指出當前每項開放內容活動的資金來源,但是卻無法說明圖書館在當前參與的開放內容活動上的投入和支出,也不能提供在當前參與的開放內容活動上的預算支出占圖書館預算總額的百分率。
該調查數據收集時間為2018年底至2019年初,反映了新冠肺炎疫情之前的時間快照。疫情發生后,全球圖書館迅速以開放的方式提供與新冠肺炎相關的科學文獻、發現和數據集,幫助醫療機構加快研究進度,這對大規模開放研究數據和科學信息無疑是一個巨大的推動。從前在線獲取資料的重要性從未像新冠肺炎疫情防控期間那樣引人注目,可以說,疫情的到來直接對圖書館支持開放內容活動的實施產生了重要的影響。
圖書館認為未來OCLC在支持其開放內容活動,特別是在開放內容可發現性和可用性方面發揮著重要作用。同樣,他們認為OCLC在研究開放內容的可發現性和元數據的標準化方面是與圖書館開放內容活動最相關的兩個方面。OCLC主要通過以下方式支持開放內容,同時提高開放內容的可見性和可發現性:①記錄來自出版商、圖書館館藏和WorldCat第三方的開放內容;②支持開放獲取發現過濾器并將Unpaywall集成到發現產品中;③建議在MARC21中指明OA訪問和許可元數據;④參與國際圖像互操作框架(IIIF)工作,在CONTENTdm中實施IIIF,并嘗試在開放館藏中發現資源;⑤開發通用的AI工具,幫助用戶在超大型元數據集和文本語料庫中探索實體和上下文;⑥幫助訂閱管理者跟蹤期刊資料包中的開放獲取資源比例,并對開放獲取和許可內容使用進行比較,協助圖書館的規劃和決策;⑦開展用戶行為研究,重點是“在用戶的生活中思考圖書館”,尤其是用戶不斷發展的信息檢索、獲取和再利用行為[1]。
調查結果顯示,機構知識庫、用戶數字素養教育和促進開放內容的可發現是當前圖書館參與較多的活動,我國圖書館目前對這三項活動有較高的參與度,如我國在高校和科研系統中共開設279個機構知識庫列表,其中約92%的高校機構知識庫元數據量在10萬條以上[2]。今后,我國圖書館需要繼續深入開展圖書館開放內容活動,提高14項開放內容活動的整體參與度,尤其是新興活動,如與開放內容的深度交互、評估、數據服務、促進開放內容的可發現、選擇非圖書館管理的開放內容、文獻計量服務等。這些新興活動是圖書館參與開放科學的一個很好的切入點,我國可以先由全國性的圖書館聯盟或協會、組織來全面推進和指導圖書館開展開放內容活動,同時加強開放內容活動設施建設,使圖書館具備開展開放內容活動的硬件條件,為用戶提供有效的開放內容活動服務。
調查結果顯示,圖書館開放內容活動的參與度受國家開放政策影響。我國目前已經制定了一些開放政策,如國家自然科學基金委員會和中國科學院分別發布的《國家自然科學基金委員會關于受資助項目科研論文實行開放獲取的政策聲明》和《中國科學院關于公共資助科研項目發表的論文實行開放獲取的政策聲明》,用于支持公共資助的科研論文的開放獲?。?]。今后,我國可以借鑒英國、澳大利亞、荷蘭等國家的先進經驗,如英國的科研質量評價框架、澳大利亞的卓越研究報告等,積極參與開放獲取政策的制定,與科研基金資助機構、研究人員、學術團體、出版商共同努力,促進我國圖書館開放內容活動的實施,從而構建更為開放、公平、高效的學術生態環境。
疫情發生后,全球圖書館迅速作出反應,以開放的方式提供與新冠肺炎相關的科學文獻、發現和數據集,可以說,新冠肺炎疫情的暴發直接對圖書館支持開放內容活動的實施產生了重要的影響。因此,在疫情防控期間,圖書館要及時對大流行病開放內容活動情況進行整理與分析,發現其中的新進展以及產生的新問題,并提出相應的研究思路與對策。另外,針對疫情防控常態化及疫情防控期間的高校網絡教學,高校圖書館應積極行動起來,積極開展諸如線上讀書會、實施閱讀推廣、共建教學平臺、設立學科館員、加入在線課程等方面的工作,推動開放內容活動的發展進程,為圖書館開放內容活動在后疫情時代的繼續發展掃除障礙,使圖書館的發展能夠不斷適應新環境下的各種新需求。
調查結果顯示,OCLC在支持開放內容活動尤其是技術層面發揮了積極的作用。近幾年,我國圖書館開始注重對開放內容技術領域中新技術的應用,如國內第一個區塊鏈圖書館(前海區塊鏈圖書館)于2017年建成[4],天津大學AI“智圖”機器人研發成功并投入使用[5],復旦大學在2019年底引入了IIIF即國際圖像互操作框架[6]。但是,國內圖書館仍然缺乏自有的、統一的開放內容技術框架[7],因此,國內圖書館應積極開展與OCLC等相關機構的合作,牢牢抓住技術發展帶來的契機,積極在開放內容活動方面進行突破,不斷改革與創新,同時結合國內實際情況,在理論研究和實踐探索中有選擇地實施和改進,從而為圖書館提供更高效、便捷的開放內容[8]。
調查結果顯示,大多數圖書館對于量化開放內容活動的投資額存在困難,即受訪者可以指出當前每項開放內容活動的資金來源,但是卻無法說明圖書館在當前參與的開放內容活動上的投入和支出,也不能提供在當前參與的開放內容活動上的預算占圖書館預算總額的百分率。因此,國內圖書館要根據實際情況,吸取全球圖書館在開放內容活動方面的經驗,在預算編制和計劃實踐中區分開放內容和付費內容,探索新形勢下的資金重組模式,認真研究開放內容活動的資金量化機制,為今后的圖書館資金量化工作打好基礎。