李 睿
(遼寧師范大學圖書館,遼寧 大連 116029)
在第14 屆柏林開放獲取會議上,中國國家自然科學基金委等機構明確表示中國支持OA2020和開放獲取S計劃,支持公共資助項目研究論文立即開放獲取[1]。截至2019年2月19日,我國大陸有13家機構簽訂了該意向書。隨著開放獲取運動實踐的推進,國內開放獲取研究呈現出哪些熱點呢?筆者嘗試以國內圖情領域相關期刊論文為基礎,運用文獻計量和共詞分析的方法來發現國內開放獲取研究的熱點。
2019 年 2 月 16 日,在 CNKI 高級檢索頁面中,選擇“主題”字段,對“開放獲取”“開放存取”“OA”“open access”進行邏輯“或”檢索,同時將學科限制為“圖書情報與數字圖書館”,期刊來源限制為CSSCI 期刊和核心期刊,檢索結果為1277 條。閱讀文獻題錄后發現,2011 年前以開放獲取為主題進行綜述研究的文獻較多,故筆者選取發表年度為2011年至2018年間的文獻為分析樣本,去掉重復、無關及弱關聯文獻后,得到樣本文獻775篇。
將775篇文獻按年度做發文數量統計分析,如圖1所示,可以發現,8年來圖情領域開放獲取年度核心期刊發文量始終在60 篇以上,研究熱度可見一斑;同時,開放獲取研究在2012年到2015年間,呈現出直線上升趨勢,此后逐年下降,亟待尋求新的研究增長點。

圖1 2011—2018開放獲取文獻年度發文情況
利用Excel對樣本題錄進行處理,得到1165個作者。按照普賴斯定律[2],計算出高產作者應為前34位,部分高產作者發文情況如表1所示。由最高產作者發文量17 篇,可計算出核心作者發文量約為3.1 篇。在樣本中,發文量大于3 篇的核心作者共101 位,發文共計288 篇,分別占作者總數的8.67%和論文總數的37.16%。

表1 部分高產作者發文情況
對101位核心作者進行發文合著網絡分析,發現44 位作者之間存在合著關系,利用VOSviewer對合著作者進行共現分析,得到開放獲取研究領域核心作者合著網絡圖譜,如圖2所示。從圖2中可看出開放獲取研究領域的合著作者主要形成了7 個大的子網,結合相關文獻的研究主題,發現以黃金霞為中心的子網研究主題為開放獲取資源建設、管理與服務;以張曉林、李麟為中心的子網研究主題為開發獲取政策、技術和開放出版;以盛小平為中心的子網主要研究社會網絡理論與開放獲取機制;以顧立平為中心的子網主要研究開放獲取政策與實踐;以聶華為中心的子網研究主題為機構知識庫建設與政策;以劉茲恒為中心的子網和以初景利為中心的子網主要研究圖書館與數字出版。

圖2 開放獲取研究領域核心作者合著網絡圖譜
在Excel 中用條件語句析出樣本的關鍵詞,詞頻共計3168次,透視后得到關鍵詞1479個。對關鍵詞進行同義詞合并處理,如將“開放存取”“開放獲取”“OA”3個同義詞合并為“開放獲取”,對于合并后一篇文獻中出現兩個相同關鍵詞的則算作1次。由于在樣本構建過程中采用“開放獲取”為主題詞,在描述研究熱點時意義不大,故將其從關鍵詞列表及后續共詞分析中去除。根據需要,選擇詞頻≥8 的42 個關鍵詞作為高頻關鍵詞(如表2),高頻關鍵詞的詞頻總量占總詞頻的28.55%,滿足知識圖譜的分析標準。

表2 高頻關鍵詞
3.2.1 構造共詞矩陣
用Excel 統計42 個高頻關鍵詞在樣本文獻中兩兩共同出現的頻次,得到共詞矩陣如表3 所示。共詞矩陣是一個對稱矩陣,行列相交的數據表示兩個關鍵詞之間的共現頻次,如表3 中“開放獲取政策”與“開放出版”的共詞頻次為3,表示這兩個關鍵詞共在3 篇文獻中同時出現。關鍵詞共現頻次可以體現關鍵詞之間的相關性,數值越大,說明兩個關鍵詞之間的相關程度越高。

表3 高頻詞共詞矩陣(部分)
3.2.2 構造相異矩陣
為了適應不同的多元統計方法對數據的要求,一般需要使用Ochiai系數把共詞矩陣轉化為相關矩陣,Ochiai 相關系數其中,Aij表示關鍵詞Wi和Wj在文獻中共同出現的頻次;Ai表示關鍵詞Wi在文獻中出現的頻次;A表示關鍵詞Wj在文獻中出現的頻次,Oij表示關鍵詞Wi和Wj共同出現的概率。因使用Ochiai 系數轉換后的相關矩陣中0 值較多,容易造成統計誤差,我們用1 減去相關矩陣中的數據,得到表示兩個關鍵詞之間相異程度的相異矩陣,如表4 所示。在相異矩陣中,數值越大越接近于1,表明兩個關鍵詞之間的距離越遠,相關程度越小;反之數值越小越接近于0,表明兩個關鍵詞之間的距離越近,相關程度越大。

表4 高頻詞相異矩陣
3.3.1 聚類分析
在SPSS22.0 軟件中,使用組內聯接法和Minkowski 距離對高頻詞相異矩陣進行聚類分析,得到高頻詞聚類如圖3 所示。圖3 中關鍵詞大致可以聚為6 類。第一類包括資源共享、圖書館聯盟、社會網絡分析、數字出版、出版服務、信息資源建設;第二類包括學術圖書館、學術交流、資源建設、開放獲取資源、圖書館和信息資源;第三類包括數字圖書館、信息服務、高校圖書館、MOOC、學術出版、美國、學科服務;第四類包括開放獲取政策、高校、學位論文、機構知識庫、OpenDOAR、版權、Altmetrics;第五類包括知識服務、數據管理、元數據、科學數據、數據共享、開放科學、開放數據、開放出版;第六類包括學術期刊、DOAJ、開放獲取出版、影響因子、CSSCI、期刊、開放獲取知識庫、開放獲取期刊。

圖3 高頻詞聚類圖
3.3.2 多維尺度分析
在SPSS22.0中,選擇ALSCAL多維尺度分析對高頻詞相異矩陣進行“Euclidean 距離”分析,得到結果如圖4所示。圖4中關鍵詞大致可劃分為6個領域,分別用A-F的字母表示。A領域關鍵詞包括圖書館聯盟、開放獲取資源、學術圖書館、數字出版、出版服務、資源共享、資源建設、學術交流、社會網絡分析;B領域關鍵詞包括元數據、信息資源、知識服務、信息資源建設、開放出版、圖書館;C 領域關鍵詞包括高校圖書館、美國、學術出版、MOOC、學科服務;D領域關鍵詞包括高校、開放獲取政策、機構知識庫、版權、學術期刊、學位論文;E領域關鍵詞包括Altmetrics、信息服務、數據管理、數字圖書館、數據共享、科學數據、開放科學、開放數據;F 領域關鍵詞包括CSSCI、OpenDOAR、DO?AJ、開放獲取期刊、期刊、開放獲取知識庫、影響因子。

圖4 高頻詞多維尺度分析結果
在對共現關鍵詞的多元統計分析中,聚類分析中得到的第一至六類關鍵詞分別與多維尺度分析中得到的第A 至F 類關鍵詞大致對應。根據共詞分析結果,結合作者合著網絡及相關文獻,總結出我國圖情領域開放獲取研究熱點主要集中在以下6個方面。
3.4.1 開放獲取對學術交流的影響
涉及的關鍵詞有數字出版、出版服務、社會網絡分析、資源共享、圖書館聯盟、學術交流和信息資源建設。學術期刊開放獲取從根本上改變了作品創作者和使用者的關系,即作品傳播由讀者付費驅動普遍轉向作者付費驅動[4],但開放獲取不只是錢的問題,更是一個文化的問題[5]。參與數字出版的圖書館數量在不斷增長,在ICOLC 收錄的圖書館聯盟中,參與數字出版的已達47%,圖書館聯盟的角色有向數字資源出版者轉變的趨勢[6]。李金林等[7]就開放獲取對國家科技發展、圖書館、出版商和科研人員等的影響進行了探討。初景利等認為圖書館出版是圖書館在長期的學術出版活動中對自身角色的重新定義和選擇,圖書館應增強內容獲取能力、出版增值與傳播能力、資金籌集能力,積極參與學術出版[8]。劉茲恒、涂志芳、苗美娟等[9-13]對圖書館出版的定義、內涵及特點進行了深入探討,并圍繞國外高校圖書館參與數字出版的模式、實踐、動因等進行了系列研究,指出學術圖書館在技術平臺、內容資源、用戶和人才等方面都有優勢,參與學術出版是學術圖書館使命、角色與功能定位的內在要求。
3.4.2 開放獲取對圖書館資源建設的影響
涉及的關鍵詞有資源建設、開放獲取資源、開放出版、信息資源、圖書館和學術圖書館。圖書館開放獲取資源收集應遵循需求性原則、特色化原則、權威性原則和積累性原則,通過建立站點導航等形式來組織開放獲取資源[14]。馮晴[15]建議圖書館將OA 期刊納入館藏時,應考慮OA 期刊的影響因子及其在商業數據庫中的收錄情況;卞長云[16]認為建立OA 倉儲聯盟是圖書館開放存取資源建設的大方向。鄭岱霞[17]提出利用OA資源優化圖書館數字特藏的設想,建議利用OA資源拓展圖書館在支持教學科研及數字特藏知識化服務方面的能力。黃雪梅等[18]調研京津冀高校圖書館主頁中所揭示的OA資源后發現,圖書館對“OA資源”認知不統一、缺少統一的OA資源檢索平臺、OA資源維護度不高,應著力建設高校圖書館OA 資源統一平臺。麻思蓓[19]表示開放共享是信息資源的必然趨勢,開放獲取對圖書館信息資源建設戰略、館藏結構等方面有重要影響,圖書館應著力探索和研究適合OA資源的組織規范。
3.4.3 開放獲取對圖書館信息服務的影響
涉及的關鍵詞有數字圖書館、高校圖書館、信息服務、知識服務、學術出版、學科服務、MOOC 和美國。2010 年,有 73 個“211 工程”大學圖書館網站上揭示了開放獲取資源[20];到2017年,中國大陸879 所本科院校圖書館中有51.99%或多或少進行了免費網絡資源的組織[21]。張理華[22]認為自建開放獲取整本電子期刊是新媒體時代圖書館一項重要的創新服務工作內容;何立芳[23]指出MOOC為學科館員提供了一個重新定位角色的機會,學科館員可以為教師提供MOOC 資源導航、信息素養教育和課程支持;趙奕[24]認為在當前學術交流模式發生根本變化的情況下,圖書館應該積極參與開放獲取,通過建立機構知識庫、承擔資源數據長期保存任務、宣傳學術出版等方式來創新圖書館服務。美國高校圖書館十分重視學術出版服務,注意與出版社的合作,積極組建高校機構知識庫,走出了一條成功的圖書館學術出版服務道路[25];弄清動力與目標需求,加強數字出版和開放獲取也是國外高校圖書館已見成效的學術出版服務策略[26]。
3.4.4 開放科學與科學數據
涉及的關鍵詞有數據共享、科學數據、開放科學、開放數據、數據管理。黃永文等[27]較早將開放科學數據的含義及國外開放科學數據倉儲、數據政策建設情況進行了綜述;黃如花等[28]介紹了6種獲取科學數據的途徑,夏姚璜[29]就re3data 中美國與中國的科學數據倉儲進行了對比分析,指出我國科學數據倉儲建設應重視數據內容類型、數據管理、數據獲取等多個方面;邱春艷、黃如花[30,31]、張曉青、尤霞光、盛小平[32,33]等圍繞歐盟、英國及其他國際組織在科學數據共享領域的重要戰略決策、報告、項目和實踐等進行了研究,認為國家層面對科學數據開放共享價值的重視十分重要,我國應積極參與國際科學數據開放共享政策的制定與項目合作,建構不同層級的科學數據開放共享政策體系,并對公共資助的科學數據實施強制性開放共享政策。
3.4.5 開放獲取期刊組織與評價
涉及的關鍵詞有CSSCI、元數據、開放獲取期刊、期刊、影響因子、開放獲取知識庫、Altmetrics、DOAJ。開放獲取作為一種新的學術交流方式,其作用日益突顯,但始終面臨文章處理費用、內容質量保障和信息技術迅猛發展3 個重要問題,其中,內容質量問題是關鍵[34]。劉錦宏等[35]認為開放獲取期刊利用率不高的主要原因之一是用戶對OA期刊的分布情況不了解。王智博、盛小平等[36,37]將中心性指標和社會網絡理論中的核心——邊緣結構理論應用于OA期刊評價中,發現入度中心度可作為OA期刊評價的指標,核心——邊緣結構分析可以作為OA 期刊核心期刊評選的一種角度。劉洢穎等[38]發現開放獲取論文在出版當年,引用頻次多于非開放獲取論文,但隨著出版后時間的增加,兩者在學術影響力上逐漸趨同。黃金霞等[39,40]從OA 期刊的采集、組織、保存和再利用出發,對OA資源建設標準體系進行了探索和實踐;涂志芳、劉茲恒[41]介紹了DOAJ、GoOA兩個開放存取期刊集成平臺的期刊收錄標準及遴選原則,指出OA期刊集成平臺期刊遴選標準一方面應公平、公開、公正,另一方面應盡量科學、嚴謹、明確并具有可操作性。
3.4.6 機構知識庫與開放獲取政策
涉及到的關鍵詞有開放獲取政策、高校、學位論文、機構知識庫、OpenDOAR、版權、學術期刊、開放獲取出版。機構知識庫是開放獲取運動的產物之一,實現開放獲取是機構知識庫建設的終極目標,“落實政策”是推動開放獲取的重要舉措之一[42],機構知識庫建設要“建制與建庫并重”[43]。機構知識庫建設中不可避免地涉及存儲協議、版權轉讓等版權沖突,我國應盡快出臺OA運動相關版權說明[44];日本的開放獲取策略數據庫和科學技術振興機構制定的各種開放獲取政策,對我國機構知識庫建設有借鑒作用[45]。張強等[46]提出通過制定強制性開放獲取政策、獲取出版機構的集體授權、建立國家許可證制度等途徑來解決機構知識庫的著作權問題。龔亦農等[47]對構建開放獲取政策的操作層面提出3 點建議:重視二級機構、建立強制性政策和關注OA 實踐效果及OA 出版;白林林等[48]對國外30個機構知識庫的存繳機制及政策進行了調研,預測中介存繳、OAI-PMH 開放獲取收割方式是必然趨勢。汪琴等[49]的調研結果表明國家宏觀政策的缺失是我國機構知識庫發展不力的關鍵因素,圖書館可以從擴展機構知識庫的服務領域與功能、支持對科學數據的管理、為機構管理層提供決策依據等方面為機構知識庫的可持續發展提供根本性支撐。