張新玲,陳 譽
(重慶三峽學院 傳媒學院,重慶 404020)
隨著網絡技術的發展和用戶需求的變化,商業出版商對學術信息的壟斷和暴利經營引起了大量用戶的強烈不滿,引發國際圖書界及情報界等開展了一場免費獲取信息資源的運動,即開放獲取。通俗來講,開放獲取就是將要發表的科研成果放到互聯網上,供大眾免費使用,其理念是自由、開放、共享,其意義在于學術信息的免費獲取以及可獲得性。開放獲取促進了科學信息的廣泛交流,大大提升了科學研究的公共利用程度,保障科學信息的長期保存,提高了科研成果傳播的效率,是國際出版界的一種新趨勢[1]。隨著大眾對開放獲取關注度與認可度越來越高,國際上很多國家迅速推出了開放獲取政策,來保障公眾能無障礙地獲取所需開放資源[2]。同時,理論界的學者也從不同角度對開放獲取展開了深入研究,產生了大量相關科研成果。為了及時了解開放獲取的研究現狀及研究熱點,國內外大量研究者對開放獲取進行了綜述性研究[3-6],大大推動了開放獲取研究的進一步發展。然而,隨著研究的深入,研究主題也在動態變化,目前鮮見研究者對國際開放獲取不同時期的研究主題及演化路徑進行定量分析,這不利于讀者整體把握開放獲取研究的發展脈絡、研究趨勢及研究熱點。鑒于此,本文借助SciMAT軟件分析國際開放獲取不同時期的研究主題和演化路徑[7],為我國相關領域的研究者盡快把握國際開放獲取研究發展動態,豐富開放獲取理論研究視角并順利開展開放獲取實踐提供借鑒和參考。
Open Access譯為開放獲取,這個專業術語意義廣泛,除了應用于信息學、圖書館學及圖書情報學等領域,還廣泛應用于醫學、化學、物理學等領域。為了獲取信息學、圖書館學及圖書情報學領域的開放獲取文獻,本文通過限制學科類別的方式,以主題為檢索途徑,以WoS核心合集SSCI及A&HCI為數據源,具體檢索策略為:TS=“open access”,同時限制文獻類型為Article、Proceeding paper、Review,檢索年限為1900—2020年,共檢索出100個Web of Science 類別的文獻7 123篇,精煉INFORMATION SCIENCE LIBRARY SCIENCE類有效文獻1 335篇,檢索時間為2021年1月1日。
本文以西班牙格拉納大學開發的SciMAT軟件[8-9]對研究數據進行處理分析,SciMAT具有強大的預處理功能,可以構建多種文獻計量學網絡,并可對結果的影響力進行定量分析,還可以通過配置向導的方式引導用戶分析[10]。
據檢索到的文獻可知,最早的文獻在1966年,故起始年設在1966年。將研究區間劃分為4個時區:1966—2007年為第1個時區,有文獻211篇;2008—2013年為第2個時區,有文獻392篇;2014—2017年為第3個時區,有文獻394篇;2018—2020年為第4個時區,有文獻338篇。
數據清洗分為兩步:首先是軟件自動清洗,自動合并關鍵詞單復數,如將“OPEN-ACCESS-JOURNAL”“OPEN-ACCESS-JOURNALS”合并為“OPEN-ACCESS-JOURNALS”,將“LIBRARY”“LIBRARIES”合并為“LIBRARIES”等。之后再進行手動清洗,合并同義詞和同一聚類關鍵詞,如將同義詞“GOLD-OA”“GOLD-OPEN-ACCESS”合并為更常用的“GOLD-OPEN-ACCESS”,將同一聚類關鍵詞“GOOGLE-SCHOLAR”“GOOGLE-SCHOLAR-CITATIONS”“GOOGLE-SCHOLAR-METRICS”合并為關鍵詞“GOOGLE-SCHOLAR”,停用無效關鍵詞“OOS”“ICT”等。
經過多次嘗試后,選取最優分析參數。分析單元為Words(Author’s Words 和 Source’s Words);4個時區的數據精簡閾值(Data Reduction)依次為2、2、2、2;選擇矩陣形式為共現矩陣(Co-occurrence);4個時區網絡精簡閾值(Network Reduction)依次為2、2、2、2;標準化網絡的相似度指標為Salton系數(Salton’s Cosin);聚類算法為簡單中心算法(Simple Centers Algorithm),設置網絡最大值為12,最小值為3;聚類質量的指標選擇文獻總被引(Sum Citations)和篇均被引(Average Citations);演化圖和關鍵詞覆蓋圖的相似度指標選擇Salton系數(Salton’s Cosin)。
1966年,OpenAccessinSovietPublicLibraries的發表開啟了開放獲取研究的序幕。1966—2020年,開放獲取領域的文獻共有1 335條,h指數47,總被引頻次14 116。發文量超過50篇的期刊依次為LEARNEDPUBLISHING(144)、SCIENTOMETRICS(138)、INTERLENDINGDOCUMENTSUPPLY(76)、SERIALSREVIEW(66)、PROFESIONALDELAINFORMACION(54),發文量超過50篇的國家為美國(358)、英國(204)、西班牙(139)、加拿大(65)、中國(64)、德國(60)及巴西(59)。研究方向主要集中于INFORMATION SCIENCE LIBRARY SCIENCE、COMPUTER SCIENCE、COMMUNICATION等。
通過SciMAT繪制4個時區的聚類戰略圖,如圖1所示。橫軸為中心度(Centrality),代表與其他主題的關聯程度;縱軸為密度(Density),代表領域內部關鍵詞之間的關聯程度。節點代表聚類主題,節點內的數字代表相關文獻量。節點在不同的象限代表不同的戰略意義:右上象限的主題屬于發展好且重要的研究主題,右下象限代表基礎性的有待發展的研究主題,左上象限是穩定的專業主題,左下象限代表新興或者衰退的主題[11]。

圖1 4個時區開放獲取主題的聚類戰略
綜合4個時區開放獲取主題戰略圖和主題聚類指標值發現:(1)早期主題詞數量較少,后期主題詞數量較多,但早期主題詞與后期主題關聯性強,是后期研究的基礎;(2)研究主題的中心度值和密度值總體上越來越高,尤其是開放獲取主題一直是4個時區的熱點潛力主題,且中心度值和密度值呈上升趨勢;(3)研究主題多分布在右上和左下象限,表明研究主題呈現兩極分化的狀態,熱點研究主題越研究越深入,非熱點主題會逐步分化或消亡。下面具體闡述每個時區的研究主題。
(1)1966—2007年聚類為5個主題:開放獲取(OPEN-ACCESS)、信息(INFORMATION)、存檔(ARCHIVES)、科學(SCIENCE)、作者(AUTHORS)。這個時期是開放獲取研究的萌芽期,熱點主題及文獻量較少。右上象限的開放獲取受關注度高,是這個時期成長狀態的核心主題;左上象限的存檔和科學主題屬于發展較好專業主題,尤其是存檔,是實現綠色開放獲取的主要途徑;右下象限的信息和作者主題中心度高、密度值低,內部聯系弱,與其他主題聯系緊密,是有很大發展潛力的研究主題。
(2)2008—2013年聚類為9個研究主題:開放獲取(OPEN-ACCESS)、萬維網(WEB)、職業(PROFESSION)、鏈接數據(LINKED-DATA)、馬來西亞(MALAYSIA)、文獻計量學(BIBLIOMETRICS)、館際互借(INTERLENDING)、行為(BEHAVIOR)。研究主題的分布呈現兩極分化的狀態,多集中于右上和左下象限。右上象限有4個成長狀態的核心熱點主題:開放獲取、萬維網、館際互借、行為。右下象限只有一個主題:研究,中心度值較高,密度值較低,說明該主題與其他聯系緊密,有待于進一步發展。該時區唯一的專業主題是左上象限的鏈接數據,鏈接數據是早期開放獲取采用的主要技術手段,文獻數量較少,篇均被引頻次卻達到了14。左下象限有3個研究主題:職業、馬來西亞、文獻計量學,這3個主題中文獻計量學的密度值和中心度值較高,屬于新生的研究主題,很有可能繼續在下一時區出現,而職業和馬來西亞研究主題密度值和中心度值較低,可能是逐漸衰退或消亡的主題。
(3)2014—2017年聚類為13個熱點主題:開放獲取(OPEN-ACCESS)、信息(INFORMATION)、影響因子(IMPACT-FACTOR)、版權(COPYRIGHT)、資源(RESOURCES)、社交媒體(SOCIAL-MEDIA)、模型(MODEL)、研究者(RESEARCHERS)、文獻計量學(BIBLIOMETRICS)、開放數據(OPEN-DATE)、期刊(PERIODICALS)、市場(MARKET)、在線(ONLINE)。本時區的研究主題多集中于右上和左下象限。右上象限有6個主題:開放獲取、信息、影響因子、版權、社交媒體、研究者,相比于前一時區,中心度值和密度值均有很大的提升,尤其是開放獲取、影響因子和研究者等,受關注度較高,演化動力極強。文獻計量學從上一時區左下象限轉移至本時區的右下象限,文獻數量也由原來的18篇增長到32篇,具有研究連續性,且研究熱度明顯提升,屬于研究者持續關注的主題。左上象限的資源主題,密度值較高,中心度值低,屬于學科領域中發展成熟的專業主題。左下象限有5個主題:開放數據、期刊、市場、在線、模型,開放數據和在線的受關注度較高,篇均被引在10以上,結合戰略圖和演化圖綜合分析,開放數據和在線可能屬于新生的熱點主題,其他主題可能逐漸分化或消亡。
(4)2018—2020年聚類為12個主題:開放獲取(OPEN-ACCESS)、研究(RESEARCH)、掠奪性出版(PREDATORY-PUBLISHING)、影響因子(IMPACT-FACTOR)、看法(ATTITUDES)、出版者(PUBLISHERS)、2019新型冠狀病毒(COVID-19)、網絡(NETWORKS)、開放科學(OPEN-SCIENCE)、社交媒體(SOCIAL-MEDIA)、Scopus數據庫(SCOPUS)、未來(FUTURE)。右上象限有4個主題:開放獲取、研究、掠奪性出版、看法。相比于上一時區,開放獲取的文獻數量和被引頻次都有所下降,表明這一時區開放獲取的研究熱度有所降低;掠奪性出版的密度值和篇均被引頻次較高,也屬于此時區的核心研究主題。位于中心度軸上的出版商主題,文獻量較少,由上一時區的研究者演化而來。影響因子從上一時區的右上象限移至本時區的右下象限,文獻量和篇均被引頻次直線下降,研究熱度明顯降低。左上象限的兩個專業主題為2019新型冠狀病毒和網絡。為了有效抗擊新冠病毒,130個國際組織共同簽署了協議,承諾與疫情相關的研究成果將在第一時間開放獲取,以協助全球抗擊疫情。因此,開放獲取背景下新冠文獻計量學研究成為專業的熱點話題。左下象限及密度軸有4個主題:開放科學、社交媒體、未來及Scopus數據庫。開放科學是從上一時區的開放數據演化而來的新生主題,很有可能還會在下一時區繼續出現;社交媒體文獻量由53篇下降至19篇,篇均被引頻次也由15.4驟降至3.1,這個主題在逐漸萎縮;未來主題比較寬泛,主要包括開放獲取未來的商業模式、發展形勢、管理模式、數據庫存儲、計劃等,未來及Scopus數據庫屬于新生主題,尤其是Scopus數據庫發展潛力很大。
通過SciMAT繪制熱點主題演化路徑圖(見圖2),由左至右的時區依次是1966—2007年、2008—2013年、2014—2017年、2018—2020年,節點表示開放獲取領域的熱點主題,節點的大小表示文獻數量的多少,實線表示主題的演化和分裂,虛線表示主題的分化,線的粗細表示兩個熱點主題的關聯程度,線越粗,表示兩個主題間的演化動力越強[12]。

圖2 開放獲取研究熱點的演化路徑
利用開放獲取研究熱點的演化路徑圖,結合開放獲取主題戰略圖,追蹤開放獲取領域的研究熱點可在3個研究方向上形成 6 條明顯的演化路徑。
(1)開放獲取。開放獲取演化路徑由3條子路徑構成:①開放獲取、信息、科學→開放獲取→開放獲取→開放獲取;②開放獲取→館際互借→版權→掠奪性出版;③開放獲取→館際互借→資源。
1966—2002年是開放獲取研究的萌芽期,文獻總量只有34篇。這段時間公眾的開放獲取意識淡薄,對開放獲取了解較少,研究熱度低,開放獲取研究多與圖書館研究相關聯。2002年之后,隨著網絡技術的發展及用戶需求的不斷提高,廣大用戶不滿于開發商對學術信息的壟斷和暴利經營,紛紛提出抗議并開展了一系列的運動,這助力開放獲取更進一步。2003年,Martin Sabo在美國國會上提交了《公共獲取科學法案》提案,要求受聯邦政府實質性資助的科研作品能為公眾免費獲取。一石激起千層浪,這一提案受到了科學界、出版界及社會公眾的高度關注,商業出版商、非商業出版商及部分研究者強烈反對,而圖書館、部分研究者、大學及讀者卻大力支持和擁護。此后,進行了較長時期的拉鋸戰,開放獲取的真正實踐還有待進一步推進。2006年,《聯邦研究公共獲取法案》再一次要求受其資助的科研成果要開放獲取,之后很多機構和大學頒布了開放獲取政策,開放獲取逐步走向實踐;同年,非營利出版商和倡導科學研究轉化的組織科學公共圖書館(PLoS)創辦的開放獲取期刊PLoSONE,幾年就迅速成長為世界上最大的開放獲取期刊,影響因子也一路飆升。這開創了開放獲取期刊的新模式,其成功的出版案例為開放獲取期刊的發展指明了方向。這個過程研究者圍繞開放獲取的出版模式、技術手段、付費模式、版權問題、相關政策、質量評價等一系列問題展開研究,形成了3條清晰的演化路徑:第一條開放獲取路徑一直是核心研究主題,在演化過程中少有分裂和融合,演化動力強,發展最穩定。第二條開放獲取——掠奪性出版路徑是開放獲取分化的一條路徑。掠奪性出版是指依托開放獲取,利用學術出版的黃金模式,以獲取利潤為主要目的的出版活動,是一些出版商借助開放獲取騙取學界的稿源與出版費等資源的手段,因此這條路徑是開放獲取的反面聲音。有研究者認為從開放獲取到掠奪性出版是科學出版的烏托邦。第三條路徑是開放獲取——資源路徑,演化路徑簡短有力,這條路徑主要從實現開放獲取的技術手段方面發展,如館際互借是不同圖書館間的文獻借閱和傳遞,館際互借和開放獲取的目的都是抵制過高期刊價格的一種方式,但開放獲取為讀者提供免費的資源,給館際互借帶來了嚴峻的挑戰,也加快了館際互借的消亡速度,電子資源的共享及存儲等演化為研究熱點。
(2)文獻計量學:①文獻計量學→影響因子→影響因子、Scopus;② 文獻計量學→文獻計量學→開放獲取。
1969年,英國著名情報學專家阿倫·普理查德首次提出情報學領域的專業術語BIBLIOMETRICS(文獻計量學),故在第一時區研究者只進行一些基礎性研究,研究熱度低。2008年之后,文獻計量學開始發展,起步很快、發展迅速,涉及的專業領域也越來越多,迅速成長為開放獲取領域的新生熱點主題。經過幾年的發展,文獻計量學逐步從理論研究轉向應用研究,2014年之后演化為文獻計量學內容體系的評價指標影響因子。開放獲取使學術資源的獲取變得更加簡捷,為文獻計量學的研究提供了數據基礎;反過來,文獻計量學又應用于開放獲取研究,包括開放獲取論文的質量評價,而影響因子是開放獲取論文的重要評價指標。Scopus數據庫是由Elsevier于2004年建立的一個綜合性的科學文獻檢索工具,是目前世界上最大的文摘和索引數據庫,Scopus共收錄期刊21 670種,其中OA期刊2 914種,占比13.45%,遠高于WoS收錄期刊的OA占比9.79%,故Scopus成為文獻計量學研究的一個重要分支,這也就是文獻計量學的第一條演化路徑。第二條演化路徑隨著時間的推移逐步被開放獲取吸收,這兩條路徑的研究主題始于第二時區,研究熱度較高,演化動力較強。
(3)開放科學:鏈接數據→開放數據→開放科學。開放科學演化路徑是開放獲取研究的主要技術路徑,鏈接數據、開放數據及開放科學之間是緊密的承繼關系。鏈接數據、開放數據是開放科學的前提和基礎,開放科學是開放獲取的目標。鏈接數據是計算機領域的專業術語,是一種基于語義技術在互聯網上發布和關聯結構化數據的方法,利用Web在不同數據源之間創建語義關聯。鏈接數據是產生于開放獲取初期的一個技術手段,隨著公眾對開放獲取的關注度越來越高,開放獲取的技術手段也在逐步升級,鏈接數據逐漸演化為開放數據。開放數據是指沒有任何版權、專利和其他機制的限制,能被任何人無障礙、重復利用和重新分配的數據資源[13]。相比鏈接數據,開放數據的應用范圍更廣,隨著信息技術和科學傳播的進步,開放科學作為一種更開放的科學生態系統產生[14]。開放科學是指各種形式科學知識在科學發現過程初期實現其開放共享的理念和范式,主要包括開放數據、開放方法、開放獲取、開放同行評審、開放資源等維度。開放科學加強了研究人員之間的合作和資源共享,保證學術出版物、研究和學術方法產生數據的免費可用性。開放科學是世界文獻供給的未來,是開放獲取的愿景和希望。此路徑脈絡非常清晰穩定,演化過程少有分化和吸收,受關注度越來越高,未來研究潛力較大。
綜上所述,1996—2007年和2008—2013年,主題數量少,尤其是1996—2007年,只有5個主題,但與后期主題關聯緊密,是后期開放獲取研究的基礎。2014—2017年和2018—2020年主題數量增多,研究熱度明顯提升,核心熱點穩定發展。不同時期的主題關聯緊密,無一孤立主題出現。
國際開放獲取領域始于1966年,早期發展緩慢,主題數量較少,研究熱度低。2003年《公共獲取科學法案》的提出推動了開放獲取研究的快速發展。因此,2005年之后,文獻數量驟然提升,隨后,研究熱度越來越高,主題數量越來越多,主題內容也越來越豐富,演化過程穩定,主要形成3個研究方向6條演化路徑。開放獲取是最主要的研究路徑,演化動力強,一直是該領域的核心主題;文獻計量學路徑始于2008年,演化過程中研究熱度逐漸增強;開放科學路徑脈絡清晰有力,受關注度越來越高。這些演化路徑是信息學及圖書館學領域開放獲取研究的主要知識脈絡,將持續成為該領域的研究熱點,給我國開放獲取的理論研究和發展實踐很大的啟示。
開放獲取對于科學成果的廣泛傳播有著不可估量的積極意義。從2003年開放獲取明確提出到2020年已有17年的歷史,美國、墨西哥等國家的開放獲取已進入立法階段,美國地球物理聯盟、世界衛生組織等紛紛制定開放獲取政策,開放獲取實踐逐步推進。我國在開放獲取理論研究和實踐推進方面也取得了一定的成績,但整體來說國內社會各界對開放獲取的認識和重視程度還落后于西方一些國家,只是近10年來,開放獲取的理念才逐漸被部分科研工作者所了解。要讓開放獲取走近大眾并惠于大眾,需要加大對開放獲取的宣傳力度,通過各種途徑宣傳開放獲取對科研成果傳播的重大意義,推廣開放獲取理念,鼓勵學術界、出版界、圖書情報界更廣泛地參與開放獲取。目前,2012年開始舉辦的每年一屆的中國開放獲取推介周可能是唯一持續的宣傳活動,除此之外只有少許零星的研討會。因此,亟須通過各種途徑舉辦多樣的開放獲取宣傳活動,真正實現“知識開放獲取,學術走近大眾”。
開放獲取論文的出版經費是開放獲取順利實現的重要途徑,如果僅由作者個人支付開放獲取出版費用,會加大作者的經濟壓力,不利于開放獲取的推進。2014年,中國政府明確表示,要支持建立公共資助的科學知識開放存取機制。開放獲取論文的經費來源可以考慮這幾個方面:一是專門設立開放獲取出版基金,用于支付開放獲取論文的出版費用;二是將科研項目經費的一部分用于開放獲取論文出版,在某種意義上,開放獲取出版費用等同于論文版面費;三是作者所在的機構或聯盟設立專門開放獲取通道,并與數據庫等機構簽訂協議,按照開放獲取論文的數量提供一定的折扣;四是出版機構可掛靠在大型出版商旗下實現商業化運營,獲取的利益用于支付開放獲取出版費用。
我國的開放獲取平臺并不多,科技期刊開放獲取平臺有中國科技期刊開放獲取平臺、國家科技學術期刊開放平臺、中國科技期刊論文在線、開放獲取一站式檢索服務平臺,社會科學期刊開放獲取平臺有國家哲學社會科學學術期刊數據庫等,也有很多期刊通過刊物網站及微信公眾號自建開放獲取平臺。與國外開放獲取平臺比較,我國開放獲取平臺還存在一些問題:開放獲取比例不高,覆蓋面不夠,學科嚴重失衡,論文的時效性不強,不利于資源管理和共享。很多期刊僅把開放獲取平臺當成一種宣傳雜志的手段,未真正認識到開放獲取對期刊快速傳播,提高影響力、競爭力所起的作用。因此,必須加強開放獲取平臺的建設,為開放獲取提供更多高品質的平臺。
目前,存在的開放獲取模式有:由作者向期刊支付出版費用,通過期刊進行開放獲取的金色OA,由作者將論文放至主頁上或者委托機構知識庫中進行開放獲取的綠色OA,熱心讀者將所得文獻傳于網上供大家免費下載的黑色OA。這些模式都存在自身的缺點,如綠色OA一般存在禁錮期,即論文發表后的6~12個月才能公開自存儲的論文,金色OA必須依賴作者或所在機構付費出版,黑色OA可能存在一定的侵權行為。如何解除禁錮期又不需要作者付費?商業機構的參與可能是雙贏的舉措。商業機構等與數據庫、社交網站、個人主頁合作并簽訂協議,通過廣告、微商等獲取一定的經濟效益,用于支付開放獲取的出版費用,同時縮短出版時滯。
掠奪性出版是一種以開放獲取為基礎獲取利潤的出版經營手段,其特征有:發文量巨大、同行評議不嚴謹。不關注論文質量、出版費用高昂。掠奪性出版是開放獲取出版模式固有缺陷的反映,嚴重破壞了當前的學術環境,歪曲科研人員的學術態度,并助長了學術不端行為,造成了學術侵權現象,因此,必須嚴格整治掠奪性出版。科研管理機構要曝光這些期刊,并嚴格監督這些期刊的審稿制度,針對這類期刊建立專門的刊后審讀制度。同時,科研人員在投稿和引用時也要提防掠奪性期刊,共同抵制掠奪性出版,凈化學術出版環境。
總之,我國對開放獲取的理論研究和實踐探索正處在發展起步階段,尤其是開放獲取政策的制定與實施方面還存在一些問題,希望上述國際開放獲取領域的相關研究可以豐富國內研究者的研究視角,為我國開放獲取理論研究的實踐推進提供參考。