潘穎+袁潤



〔摘 要〕本文通過文獻計量、共詞分析、社會網絡分析等方法對2002-2014年CNKI核心期刊論文的統計分析,對我國機構知識庫研究進行系統梳理和全面回顧。文章首先在宏觀層面展現該領域的年度發文趨勢、期刊分布、核心作者、重要研究機構等情況;其次,分析了作者合作、機構合作的規模、緊密度等情況,詳細討論了每個發展階段的研究內容,展示了機構知識庫研究主題的演變歷程。最后在此基礎上對機構知識庫未來的發展提出建議。
〔關鍵詞〕機構知識庫;文獻計量;共詞分析;社會網絡分析
DOI:10.3969/j.issn.1008-0821.2015.11.003
〔中圖分類號〕G306 〔文獻標識碼〕A 〔文章編號〕1008-0821(2015)11-0018-08
Research on Development of Domestic Institutional Repository
Pan Ying Yuan Run
(Institute of Science and Technology Information,Jiangsu University,Zhenjiang 212013,China)
〔Abstract〕The article presented a comprehensive review on domestic institutional repository research,through the multiple analysis of the papers published by CNKIs core journal from 2002-2014.Firstly,it showed the annual year issued trend,periodical distribution,core author,major research institution etc.at the macro level.Secondly,it analysed the size and the close degree of the author collaboration,institution collaboration,and showed the evolution process of the research subject of institutional repository by discussing the content of each stage of development in detail.At last,it put forward the proposals for development of the institutional repository in the future.
〔Key words〕institutional repository;literature metrological analysis;co-word analysis;social network analysis
數字技術和網絡化通信的日益發達催生了代表學術交流共享新理念、新模式——開放存取的產生,推動了機構知識庫(Institutional Repository,IR)的發展[1]。IR是收集、保存單個機構或數個機構知識產品的數字館藏,是展示機構學術成果,傳播共享學術信息的平臺。目前,IR是開放存取的主要途徑之一,是開放存取運動的主力軍[2]。經統計,ROAR收錄的全世界知識庫共3 469個,其中美國、英國、德國的數量較多,資源也最豐富。雖然我國的IR建設處于起步階段,目前只有有147個開放存取知識庫被ROAR收錄[3],占全球的42%,但是發展迅速,已經有越來越多的學術機構、圖書館和科研人員關注IR。本文擬通過對該領域研究文獻的計量統計、內容分析等研究,展現機構知識庫的發展歷程,挖掘各階段的研究內容,梳理IR研究主題的發展脈絡,以期為后續IR建設提供參考和借鑒。
1 數據來源和研究方法
本文以CNKI核心期刊庫為數據來源,檢索策略為:主題=“機構知識庫”OR 篇名=“機構知識庫”OR 關鍵詞=“機構知識庫”。截止到2014年11月,共檢索到570篇。經過數據清洗,刪除會議通知、目錄等信息,與機構知識庫相關的研究論文共518篇。考慮到數據庫在2014年文獻收錄時間上的延遲,本文中2014年的統計數據會低于實際值。
本文采用文獻計量統計方法從年度發文、期刊分布、核心作者、重要機構等角度展示我國機構知識庫研究的客觀狀況和發展趨勢,通過共現分析、社會網絡分析研究該領域作者合作、機構合作規模、緊密度等情況,通過內容分析挖掘每個發展階段的研究內容,梳理IR研究主題的變遷。
2 結果與討論
21 年度發文分析
圖1 機構知識庫年度發文量
我國機構知識庫的研究始于2002年。清華同方在《知識服務與知識倉庫——關于信息與知識產業化服務模式的探討》中提出“知識倉庫+知識服務平臺”是實現從信息服務到知識服務轉變的關鍵[4]。2002-2005年是萌芽階段,這個階段的文章數量少,圖書館界、數據庫商剛剛接觸到“機構知識庫”,還處于翻譯、引介、學習國外IR研究理論時期。2006-2012年是IR第一個發展階段,在這個階段,學者們從國外調研、建設環境、政策制定、構建流程、服務模式等多個方面對機構知識庫展開了理論研究和實踐建設。2013年開啟了第二個發展階段,發展態勢不容小覷,2014年的發文量較之第一個發展階段的頂峰2010年的還要多,除了對前期研究內容的深入探討外,面對大數據環境的出現、作者惟一標識等需求的提出,學者開展角度更多的研究見圖1。可以預測,在未來的一段時間,隨著新技術、新方法、新需求的不斷涌現,機構知識庫的研究內容更廣泛,研究熱情將持續增強。endprint
對518篇文獻的載文期刊進行統計,共有50份核心期刊刊載機構知識庫研究論文,其中以圖書情報領域的期刊為主,說明圖書館是機構知識庫建設研究的主體,機構知識庫是圖書館工作的重要部分。計算機軟件及應用的期刊也有部分,這主要是因為IR的研究還涉及到軟件系統、構建框架等技術內容。表1展示了發文量排名前十期刊的年度發文趨勢,這10份期刊共刊載329篇文獻,占總發文量的64%,是IR研究論文的主要投稿對象。其中圖書情報工作、圖書館學研究、現代圖書情報技術、情報理論與實踐、圖書館工作與研究期刊在近兩年非常關注IR的研究,說明IR越來越受到圖書館界的重視。
通過對作者的統計分析可以看出該領域的研究群體還是比較龐大的,共有699位作者發文或聯合發文。表2以發文量排序列出了排名前十位作者。中國科學院國家科學圖書館的祝忠明發文最多,研究的內容也比較廣泛,有IR主題標引、數據搜索、人名消歧等。值得注意的是,前十位中有7位作者都是中國科學院單位。反映出中科院在IR方面已經形成一支實力很強的研究團隊,無論是理論還是實踐都有著深入的研究。
232 合作發文
圖2 IR作者合作研究關系網絡圖
統計發文兩篇以上的作者,并繪制他們之間的合作研究關系。從圖2可以看出,在IR研究領域,獨立發文、合作發文現象共存,合作發文還是相對較多的,說明IR研究需要發揮團隊的智慧和力量。在作者合作網絡關系中,明顯的看出以祝忠明、盧利農、張旺強、李麟為核心人員是網絡中最大的子群,他們的發文量不僅多,而且和其他作者的聯系非常緊密,這個子群的作者大多數都屬于中科院系統,反映了中科院在IR方面團隊建設很強勢。
24 機構分析
241 重要機構
通過對作者單位的整理,統計出國內共有358個機構研究IR,表3列出了發文量不低于6篇的單位,從單位的數量上看,科研機構和高校平分秋色,但是發文量以科研機構居多。中科院是目前國內IR建設最早、運行效果最好的機構。作為一個擁有多個學科、多類不同性質單位的大型機構,在IR的建設上和推廣上,遵循“全面規劃、系統設計、分層遞進”的思想指導,在IR技術平臺開發、建設服務、政策研究、內容利用服務等具體的操作上配置了學科館員、研究支撐團隊、激勵機制等強大的后臺支撐,在政策研究、技術開發、服務支持等方面開展研究,并付諸于實踐[5]。比如將IR與科研管理信息系統整合,減輕提交條目負擔;建設中科院IR網絡集成服務門戶(CAS IR Grid),通過元數據及內容自動采集技術形成全院聯合的機構知識倉儲;思考責任者惟一標識符在IR中的應用等。吉林大學、北京大學等是高校圖書館IR建設的代表,側重于IR的構建及如何應對構建中遇到諸如知識產權等問題的研究[6]。
242 合作機構
機構之間的合作有助于拓展學科的研究領域、共享科學資源。對發文量不低于2篇的機構進行合作網絡關系的繪制,識別IR領域中重要的學術機構和學術合作群體。從圖3可以看出與作者合作網絡圖不同,更多的機構喜歡獨立發文,與其他機構有沒有合作研究的關系。在合作機構中,屬于同一個單位的機構聯合發文比較多,比如,湘潭大學圖書館和湘潭大學公共管理學院,上海大學圖書情報檔案系和上海大學圖書館,說明IR研究還僅限于本單位不同部門的聯系,圍繞某個學院的需求開展IR的研究。不同機構合作的比較少,一般是側重于技術方面的研究,比如像清華大學圖書館和北京愛琴海軟件公司的合作是針對清華大學機構知識庫的建設,提出使用DSpace的核心開發接口進行擴展開發的方法,有效地解決DSpace主流版本的升級和本地化功能的兼容問題[7]。在合作關系網絡中,以中國科學院研究生院和中國科學院國家科學圖書館蘭州分館為核心機構組是最大的子群,他們不僅與中科院系統內的機構開展合作研究,與高校圖書館也有較多的聯系。
25 研究熱點分析
關鍵詞是論文核心內容的反映,高頻關鍵詞反映了該領域的研究熱點。對有近千個關鍵詞進行頻次統計排序,發現“機構知識庫、開放存取、圖書館、學術交流、知識產權、知識管理與服務、資源建設、機構知識庫聯盟、Dspace、發展研究”是十大熱門關鍵詞,反映了學者們對IR的構建模式,資源建設、組織與保存,基于IR的知識共享、交流、獲取等領域關注度比較高,分析在建設過程中版權的歸屬、長期保存等問題,思考可持續發展的途徑,比如開發和完善軟件功能、加強聯盟建設。特別將IR和圖書館的工作緊密結合,思考圖書館如何在IR的環境下開展知識管理、學科服務工作。為了探索IR研究主題的發展歷程,文章對IR不同的發展階段進行高頻關鍵詞共現分析。
萌芽階段(2002-2005年)。在這個階段,國外大學已紛紛開展IR建設,2001年俄亥俄州州立大學建立了IR的最初雛形知識庫[8]。麻省理工學院2002年建立了開放源代碼的軟件平臺Dspace系統,截止到2003年全球有3 500個機構下載了Dspace的開放性源代碼并建立了自己的IR。而此時國內還處于初步接觸,逐漸熟悉的過程。通過文獻的查閱,逐步了解IR的概念、范疇、特點及主要構建工具。將它與傳統的以正式出版物為主的學術交流、知識共享進行了比較分析[9]。闡述了IR對圖書館的知識管理、知識挖掘、應對期刊價格上漲對策等方面的積極意義[10]。提出了建立“知識倉庫+知識服務平臺”的運作模式是圖書館實現從信息服務到知識服務的轉變[4]見圖4。在這一階段召開了“2005年海峽兩岸圖書館服務發展與創新高層論壇”,把“機構知識庫、機構知識管理系統與圖書館服務”特別設立專題討論。
第一發展階段(2006-2012年),這是IR發展的第一個階段。在這個階段,IR的研究經歷了快速發展和緩慢回落。從圖5中可以看出這一階段的高頻詞為IR、開放存取、圖書館、學術交流、版權等詞,主要從理論、構建層面開展以下研究。
(1)對IR與開放存取、圖書館之間的關系進行思考、梳理。普遍認為在數字技術和網絡化通信日益發達的環境下,開放存取通過價格壁壘、使用權限壁壘的打破加速了科研成果傳播利用的速度,代表著學術交流共享新理念、新模式。作為一個機構智力財產倉庫的IR其目的是通過自存檔提供開放獲取文獻輸出和長期保存機構的數字資源。所以IR本質上是一個學術信息傳播共享、增值利用的平臺,已成為認為是開放存取運動的主力軍[11-13]。負有保存學術資源、傳播學術成果責任的圖書館是機構知識庫創建的主要力量。endprint
(2)從宏觀層面研究其建設環境、政策制定、構建流程、服務模式等方面內容。IR建設管理需要學校領導和相關職能部門的理解和支持。IR其實是一項圖書館主要負責,相關職能部門協同合作的工作[14-15]。需要制定相關政策來保障IR的順利建立,比如館藏政策、內容收錄政策、內容提交原則和流程、元數據的標準及其質量控制規范等[14]。宣傳推廣工作在IR建設過程中得到更多部門的認同和支持。從資源使用者、資源提供者、IR工作人員3個角度開展IR服務模式[16]。
(3)詳細的探討IR構建工具、資源獲取和質量等具體環節。比較分析了軟件系統DSpace、Eprint、Bepress、Fedora的特點,目前利用DSpace系統構建IR的機構最多,DSpace也已頒布了10個版本。基于元數據抽取和收集兩種方法提出一種元數據自動生成系統框架結構,從完整性和精確性兩個方面對元數據的質量進行評估。研究了IR自存儲資源的獲取策略和質量控制策略等內容[17-18]。
(4)對一些建設過程中遇到的問題大量調研國外做法。比如在“IR內容長期保存”上,由澳大利亞教育科學和培訓部(DEST)資助的APSR用于確保機構知識庫中對數字對象的長期存取,英國國家圖書館和南安普敦大學運用Eprints收集的元數據來構建一個基于OAI的保存服務模型[19]。在版權問題上,由美國研究圖書館協會(ARL)發起的作者補遺模式(Model form Authors Addendum)是作者
圖5 IR第一發展階段研究熱點共現圖
保留在網絡上張貼作品權利的主要方法,通過合同補遺模式,作者可以將自己的文章存入機構知識庫。對于著作權等法律問題可以通過版權許可協議、存儲許可協議、數字版權管理機制等制度保護版權所有者的利益[20-21]。
(5)隨著對IR的不斷深入,一些學術機構和高校開始實踐建設IR,浙江大學將DSpace系統與大學URP數字化校園建設結合,設計和實現了知識資產管理系統,目前該知識庫從2009年正式上線以來,實現了近30萬師生原生性資源的保存、展示、查閱等功能。中國人民大學圖書館和科研處合作,建設中國人民大學教師成果數據庫。北京科技大學通過自編程序將各個數據庫的題錄數據轉換為規范的元數據格式的方式構建機構庫[22-23]。為了避免技術設施重復投入,使IR資源內容被更廣泛地認可,實現規模宣傳效益,開展IR聯盟相關討論。比如香港機構知識庫,美國的HELIN數字知識庫,俄亥俄州數字知識庫聯盟就是采用分布采集模式構建,華盛頓研究圖書館聯盟數字知識庫采用集中存儲模式構建。徐州高校開展教學聯合體機構知識庫聯盟建設的可行性、構建模式、服務內容、運營機制等方面的討論[24-25]。
(6)思考如何利用IR充實、加強圖書館的服務。比如,通過IR工作機制健全學科館員服務制度,構建知識服務團隊,利用IR的資源建立開放存取全文數據庫、建立機構特色資源庫等。對IR的功能進行擴展,如中科院將機構知識庫與科研信息管理進行整合,將中國科學院資源規劃系統中的數據集成到IR中,減輕科研人員提交數據的負擔[26]。
第二發展階段(2013年-),經過2012年的研究谷底,“2013中國機構知識庫”學術研討會打開了第二個發展階段的序幕。在前一個階段的基礎上,IR相關技術更成熟,研究內容和研究角度更豐富,研究方法也更多元化,對有爭議的問題解決辦法更多,如圖6所示。
(1)在IR建設方面更加重視新技術、新環境與IR的結合。提出了“以用戶需求為導向”、“個性化推薦的IR用戶模型”,研究如何根據用戶的瀏覽行為判斷其興趣,為其開展有針對性的個性化服務[27];提供一站式數字信息共享空間,建立基于IR的用戶科研績效管理體系等。研究在大數據時代將知識發現、數據整合與挖掘、知識推薦等大數據技術融入IR的服務平臺建設[28];在“學者惟一標識”的呼聲下,研究在IR中建立作者標識與作品認領機制,保證作者與作品的惟一性,清華大學借鑒ResearcherID理念,采用數據挖掘方法為清華大學學者建立惟一標識[29]。對更多建設技術開展,研究OAI互操作數據同步、IR語義知識獲取方法[30]、引入oai-pmh元數據收割協議和dc元數據來保證元數據的規范性等等。聯盟技術日趨成熟,中國科學院建立了China IR信息支持門戶,包含了IR聯盟建設交流與推進等功能,北京大學圖書館等5個示范館聯合建設
Calis高校機構知識庫項目,根據各高校的通用及特定需求,開發完成了3套機構知識庫系統[5,31];河北省高職高專 IR聯盟[3]。
(2)在IR應用效果方面,注重用戶的使用感覺,開展科研人員對IR的認可度與使用調查、IR數據價值的鑒定和使用效果的評估。進一步拓展IR服務功能,開展增值利用研究,比如如何基于IR的資源開展收錄引用、機構學術成果評測、機構學術研究領域結構分析、國際學術論文管理模式研究,為機構管理者提供發展戰略規劃和決策的基礎數據等研究[32-33]。
(3)將其他學科領域的研究方法運用到IR研究中,采用社會網絡理論、信息生態論、資源生命周期法、TOPSIS法、質量評估等方法對IR的建設成本、激勵機制、網絡影響力、發展趨勢等方面開展多層面的討論,進一步完善IR的建設和使用[34-37]。
(4)在法律、聯盟建設、學科服務等的問題上,在學習外國的成功做法的基礎上思考我國的方法,比如在版權問題上要注重機構知識庫建設和管理中利益關系,采用“合理使用”原則、制定知識共享許可協議等。在聯盟建設上可以采取政府主導,項目拉動的策略,“統一平臺、分散建設、集中呈現“的發展模式,采取企業化管理運營模式保障聯盟的可持續發展[38-39]。IR是一個“知識服務”的陣地、工具和渠道的方向。聯盟平臺服務、機構庫內容服務、科研數據服務等是學科化知識服務的趨勢[40]。endprint
(5)對目前IR的建設現狀進行調研思考,認為我國IR建設進入快速增長期,但是在開放存取意識、科研人員對IR的認同、政策支持等方面還存在一些問題。對未來可持續發展提出了建議,比如在IR內容和元數據存繳的操作方式上可以加強與出版社、內容商等的合作,采取合作存儲的方式;在IR存繳與傳播方面積極爭取教育科研機構層面的激勵政策,拓展系統平臺功能等[41]。
3 總結和建議
通過上述的分析,可以看出我國IR建設經歷了從理論分析到實踐操作過程,在一些問題的解決上也逐步從國外學習轉為結合具體情況改進轉化,相關技術越來越成熟,隨著環境的改變,新需求的提出,在更多層面開展更廣泛研究。對于未來IR的發展,需要進一步加強政策支持,加大宣傳力度,提高IR認同度,將IR與開放存取深度結合,鼓勵吸引更多類別的科研院所、技術團隊參與機構庫建設,開展研究成果的國內與國際交流;建立健全相關制度機制,完善IR的運作管理,保證存儲內容的合法性、多樣化、更新率;拓展、完善系統平臺的功能,為機構發展需求、用戶需求挖掘提供新服務,提升IR的社會影響力。
參考文獻
[1]劉海霞,方平,胡德華.開放存取研究進展述評[J].圖書與情報,2006,(4):10-16.
[2]王穎潔.我國機構知識庫模式構建與流程設計[J].圖書情報工作,2008,(4):104-107.
[3]劉宗利.河北省高校機構知識庫發展現狀及展望[J].圖書館學研究,2013,(23):37-39.
[4]王明亮,張振海,劉學東,等.知識服務與知識倉庫——關于信息與知識產業化服務模式的探討[J].現代圖書情報技術,2002,(S1):7-9.
[5]張冬榮,祝忠明,李麟,等.中國科學院機構知識庫建設推廣與服務[J].圖書情報工作,2013,(1):20-25.
[6]韋成府,聶華,崔海媛.多館協作開發的機構知識庫建設——以CALIS機構知識庫項目為例[J].大學圖書館學報,2014,(3):69-73.
[7]曾婷,涂飛平,董麗,等.DSpace事件機制的研究及其在擴展開發中的應用[J].現代圖書情報技術,2012,(3):73-77.
[8]吳建中.圖書館VS機構庫——圖書館戰略發展的再思考[J].中國圖書館學報,2004,(5):7-10.
[9]常唯.機構知識庫:數字科研時代一種新的學術交流與知識共享方式[J].圖書館雜志,2005,(3):16-19.
[10]應峻,谷口規矩雄.日本大學圖書館期刊價格上漲對策研究[J].大學圖書館學報,2005,(5):86-89.
[11]柯平,王穎潔.機構知識庫的發展研究[J].圖書館論壇,2006,(6):243-248.
[12]李楓林,趙雪芹,胡吉明.機構知識庫:開放獲取的有效實現形式[J].情報雜志,2007,(6):115-117.
[13]蔡迎春.機構知識庫:基于開放存取的學術交流機制[J].情報理論與實踐,2008,(5):680-683.
[14]李愛國,陸美.學術圖書館機構知識庫的創建[J].圖書情報工作,2006,(06):119-121.
[15]陳欽琳.學術交流與知識共享的新平臺——機構知識庫[J].現代情報,2006,(9):150-151.
[16]王學勤.機構知識庫建設相關政策研究[J].中國圖書館學報,2007,(3):44-47.
[17]鄧君,畢強,韓毅.機構知識庫(IR)系統Archimède與eDoc比較研究[J].圖書情報知識,2008,(1):28-34.
[18]楊武健,王學勤.DSpace機構知識庫系統的分析與研究[J].現代情報,2006,(11):220-222.
[19]劉華.國外機構知識庫的長期保存研究及其啟示[J].情報資料工作,2007,(3):49-52.
[20]于佳亮,吳新年,賈彥龍.機構知識庫資源建設中的產權策略研究[J].情報理論與實踐,2008,(3):353-355.
[21]肖可以,龍朝陽.機構知識庫建設及其法律問題研究[J].圖書館學研究,2008,(11):39-41.
[22]趙亞萍,周東升,程艷旗.基于DSpace的大學個性化知識資產管理系統研究與設計——以浙江大學機構知識庫系統為例[J].中國教育信息化,2012,(15):60-63.
[23]熊秀忠,唐靜,陳華,等.機構知識庫建設實踐與探討——以中國人民大學教師成果數據庫建設為例[J].圖書情報工作,2012,(S1):143-145.
[24]陳雨杏.我國區域機構知識庫聯盟的構建模式選擇與實施策略[J].圖書館學研究,2011,(7):59-63.
[25]渠芳.高校教學聯合體機構知識庫聯盟建設研究——以徐州高校教學聯合體為例[J].情報理論與實踐,2010,(11):83-85.
[26]馬建霞,祝忠明,唐潤寰,等.機構知識庫與科研管理信息化環境集成的嘗試[J].現代圖書情報技術,2008,(2):14-18.
[27]卞藝杰,趙,張慶龍,等.機構知識庫個性化推薦的用戶模型研究[J].情報理論與實踐,2013,(12):78-82.
[28]朱維喬.面向大數據的機構知識庫構建模式創新研究[J].圖書館學研究,2014,(13):32-36.
[29]竇天芳,張成昱,張蓓,等.ResearcherID現狀分析及應用啟發[J].圖書情報工作,2014,(4):40-45.
[30]王思麗,祝忠明,姚曉娜.機構知識庫語義知識獲取方法分析及實驗研究[J].現代圖書情報技術,2014,(4):7-13.
[31]張曉丹,張志平.科研機構的機構知識庫構建研究[J].現代情報,2014,(7):45-49.
[32]李穎.數字圖書館機構知識庫與信息資源使用效率優化[J].蘭臺世界,2013,(26):114-115.
[33]鄧君,馬曉君,賈曉青.機構知識庫數據價值鑒定研究[J].情報科學,2014,(7):24-28.
[34]姜勇峰,肖可以,楊錦榮,等.基于質量評估的機構知識庫激勵機制研究——以廈門大學學術典藏庫和美國RePEc為例[J].情報理論與實踐,2013,(11):41-44.
[35]龐恩旭,張倩,何蕓.基于資源生命周期的機構知識庫成本模型研究[J].圖書館工作與研究,2014,(3):27-31.
[36]姜穎.基于信息生態論的機構知識庫內容建設發展策略研究[J].圖書館工作與研究,2014,(1):109-112.
[37]李銘,翁淳光.我國機構知識庫網絡影響力研究[J].現代情報,2015,(4):17-21.
[38]田麗君,張靜鵬.芬蘭Doria和Theseus聯盟機構知識庫建設模式及其啟示[J].圖書館學研究,2014,(5):37-41.
[39]柳菁.美國機構知識庫版權問題的解決方式及啟示[J].情報科學,2013,(6):157-160.
[40]周成效,江曉波.基于機構知識庫的學科服務趨勢探析[J].現代情報,2013,(12):86-90.
[41]姚曉霞,聶華,顧立平,等.我國教育科研機構知識庫建設現狀調查與分析[J].現代圖書情報技術,2014,(5):1-9.
(本文責任編輯:郭沫含)endprint