●韓 紅,朱 江,王春明,姜恩波,柴苗嶺
(中國科學院成都文獻情報中心,成都610041)
開放學術會議文獻信息服務模式探索
——以中國科學院重要會議開放資源采集與服務系統為例
●韓 紅,朱 江,王春明,姜恩波,柴苗嶺
(中國科學院成都文獻情報中心,成都610041)
開放獲取;學術會議;服務模式;服務機制;系統集成
介紹了中國科學院在開放學術會議文獻信息服務方面的實踐與成效,分析了目前存在的問題與不足,并從機制建設、數據關聯、系統集成、功能完善等方面提出了進一步推進開放學術會議文獻信息服務的措施和建議。
學術會議文獻是科學研究的重要參考文獻類型之一,隨著網絡技術的發展與學術交流模式的改變以及開放獲取(Open Access)運動的不斷推進,學術會議文獻資源也突破原有的商業出版模式,出現了許多以開放獲取方式發布和傳播的開放會議資源。
1.1 開展開放會議資源利用與服務的意義
開放會議資源主要是一些學術科研機構及學協會在網絡上直接發布的其組織召開的學術會議的會議論文全文或摘要供用戶免費使用,其目的是加快學術交流、擴展科研成果的傳播范圍和影響,這些開放會議資源與正式出版會議文獻一樣,能夠及時反映相關學科領域研究的新發現、新進展、新成就、新動向和新觀點,并且比正式出版的會議文獻時效性更強、更符合當今科研人員獲取文獻的習慣并具有較高的學術價值,正越來越受到科研人員的關注和學術界的認可,對這類會議資源的需求也日益強烈。
但是,由于這類資源往往只在網絡上發表并不再正式出版,具有動態性、分散性等特點,只有訪問相關學術機構或學協會的網站才能分別獲取,而圖書館由于受傳統資源建設理念和模式的慣性影響,也未將此類資源進行系統有效的收集和組織,造成目前的會議文獻資源保障體系主要由正式出版的學術會議文獻印本和數據庫組成,使學術會議文獻,特別是非正式出版的開放會議文獻成為較難獲取的一類資源。[1]
全球每年召開的學術會議產生的會議論文達數十萬篇,其中,以開放獲取方式發布的學術會議資源也在不斷增加,單個開放會議網站的訪問量雖然不大,但從整體上就形成了規模優勢;加之開放會議資源的生命周期非常有限,如不及時采集保存,很容易造成“滅失”。[1]中國科學院成都文獻情報中心牽頭研究建設的中國科學院重要會議開放資源采集與服務系統,正是為彌補這一缺失和滿足用戶對這類文獻的需求所作的探索和嘗試。
1.2 中國科學院重要會議開放資源采集與服務系統簡介
中國科學院重要會議開放資源采集與服務系統(http://or.clas.ac.cn)的建設目標是遴選科學技術領域的重要學術會議,包括USENIX、CEUR Workshop、ESAIM、SIAM、PMC、BMC、iufro、Arxiv、斯坦福大學SLAC、IoP、DOE等國際著名學術機構的開放會議錄,系統通過采集、保存、標引這些重要學術會議在互聯網上發布的會議論文全文或摘要,為科研人員提供會議及會議文獻信息的檢索、瀏覽、原文傳遞和基于Google Map的可視化展示,科研人員還可以通過系統平臺向圖書館員推薦會議及會議文獻,通過這樣的方式為用戶合理利用與免費獲取開放會議文獻與信息提供了一條便捷有效的途徑。目前,系統已發布會議信息2萬余條、會議論文全文3.2萬余篇。
1.3 系統服務對象需求分析
中國科學院重要會議開放資源采集與服務系統的服務對象有兩種類型的用戶:一類是自然人用戶,包括科研人員和負責資源加工的圖書館員;另一類是機器用戶,平臺提供基于Web Service的第三方接口和基于RSS的最新信息發布,第三方工具可以通過上述標準協議獲取平臺的信息資源,在數據協議許可的前提下進行進一步的整合和應用。
自然人用戶中的科研人員是系統資源的最終使用者,主要關注會議文獻和信息的便捷獲取,圖書館員關注如何高效地實現會議資源采集、規范組織與加工、發布并快速提供服務;機器用戶則需要系統提供相應的接口和規范的數據,以實現不同類型開放資源服務系統的集成服務。
2.1 服務機制研究與建設
首先,系統建設機構在本單位的崗位設置中新設了開放資源建設和開放資源系統開發崗位,從人員方面確保系統建設工作的可持續開展。同時,在尊重知識產權的前提下擬定了系統管理和服務方案,其主要原則是系統一般只提供全文的原始URL鏈接,指引用戶鏈接到原始網站下載全文,只在原始網站全文鏈接失效的情況下,才提供延時的Email全文傳遞,并提供中、英文的知識產權保護提示,以此嘗試建立系統的長效服務機制,保障系統長期順利運行。另外,系統建設者還在系統建設的各個環節引入院所協同和用戶參與機制,以用戶需求驅動系統開發與服務,變被動為主動,使用戶不僅成為信息的索取者,更是信息的提供者,也使系統成為一個有著廣泛用戶基礎,能為廣大用戶所用的系統。同時,滿足項目建設各階段知識需求,將用戶可能存在的、能夠支撐項目長期發展的創新信息及時吸納到項目的開發建設中,為項目長期、穩定發展提供良好的基礎。[2]
2.2 服務推廣與宣傳培訓
在系統建設過程中將系統的服務推廣與宣傳培訓納入本單位的學科化服務、區域信息服務等工作中。首先,依托高素質的學科化服務團隊,在每年的下基層院所服務活動中,將相關內容列入用戶培訓和年度宣傳推廣計劃中,組織系統的宣傳推廣,對中國科學院重要會議開放資源采集與服務系統開展了多種形式的推介宣傳活動,使科研人員了解到除了商業會議文獻數據庫外,還可以通過中國科學院重要會議開放資源采集與服務系統提供開放獲取的方式獲得豐富的會議信息和文獻。部分研究所和學科組還在其主頁上對這一系統進行公告和設置系統鏈接,僅2013年就向中國科學院18個研究所開展了133場宣傳培訓,參與科研人員達3244人次。其中,中國科學院近代物理研究所等5個研究所近30個課題群組平臺希望能夠將中國科學院重要會議開放資源采集與服務系統納入其課題群組平臺系統,方便研究團隊檢索使用會議資源系統。另外,在面向四川省內各地的科研院所以及上海、重慶、廣西等地方科學院的區域信息服務中,也將該系統的宣傳推廣納入其中,為地方科研用戶推薦了一條獲取學術會議信息與文獻的有效渠道。
2.3 針對自然人用戶和機器用戶需求特點開展研發與建設
針對兩類用戶不同的需求特點,系統設計、開發了用戶服務平臺和資源采集加工平臺。前者為科研人員提供資源瀏覽與檢索、原文傳遞、RSS定制、資源推薦以及基于Google Map的可視化展示等服務;后者利用WebLench、PDFBox等開源工具并結合開放會議與會議文獻資源的特點,實現了開放會議文獻的采集、標引、審核、發布和用戶管理的一整套工作流程。
另外,為了讓開放資源能夠更加廣泛地得以應用,平臺還研發了基于RSS和Web Service的第三方接口,為第三方應用系統無縫連接本平臺提供了有效途徑。目前,中國科學院群組平臺已經依據相關接口開發了開放會議服務組件,已在中國科學院近代物理研究所、天津工業生物技術研究所、長春應用化學研究所、長春光學精密機械與物理研究所、南京地理與湖泊研究所等5個研究所的近30個課題組進行了部署和個性化定制。
2.4 服務效果
通過幾年的建設和宣傳推廣,中國科學院重要會議開放資源采集與服務系統已經形成了基本的服務能力,達到了一定的服務效果。從來訪者的分布情況看,國內訪問者來自北京、上海、天津、重慶、寧夏、臺灣、香港等31個省區市;國外訪問者來自美國、德國、英國、俄羅斯、烏克蘭、希臘等。從網站點擊量看,截至2013年7月總點擊量為12669213次(其中,用戶:7973937次,蜘蛛:4695276次),平均日點擊量:20141次。
3.1 系統建設機制有待完善
(1)工作機制。目前,系統的建設主要是以項目管理的方式開展,資金來源于項目經費支持,沒有固定的經費來源,雖然設立了專門的崗位,但并沒有實現真正意義上的專職,工作人員還承擔著其他一些業務工作,這不利于系統建設的深入和持續。為保證系統持續運行和服務的完善,需進一步探索更加適合的管理機制和工作機制。
(2)宣傳推廣機制。盡管采取了多種方式開展宣傳與推廣,但系統平臺的普及性仍不夠。目前,注冊用戶僅320位,還沒有形成較為穩定的用戶基礎規模。另外,由于該系統與其他開放資源系統之間缺乏互通性,加上平臺檢索功能的精準性等內在因素,也影響了系統平臺的推廣;雖然在系統建設的各個階段都引入了用戶參與機制,但由于缺乏具體的用戶鼓勵政策,這些用戶參與系統建設的積極性仍然不足,系統與用戶之間的互動性相對較弱。另外,雖然為第三方系統應用提供了Web Service接口,并針對群組集成知識平臺(IIP平臺)和SKE平臺開發了重要會議開放資源系統組件,但在實際推廣過程中基本靠用戶組依靠群組平臺項目開展進行推介,缺乏更加有力的途徑和制度上的保障。
(3)合作建設機制。相對于DOAJ、Highwire等開放期刊平臺資源的集中和數量規模,開放會議資源分布較為零散,除CEUR、PoS、USENIX等少數幾個相對較大的學術會議資源發布系統外,絕大多數開放會議資源均分散在學術機構網站或專門建立的會議網站上,這無疑給資源的采集和更新帶來了困難,需要系統在資源搜集和獲取方面與其他學術會議資源服務系統探索建立合作服務機制。
3.2 系統服務存在一些局限
(1)系統采集的開放學術會議論文的格式還比較單一。一方面,系統目前主要采集文本型的會議文獻包括PDF和PPT格式的論文。從系統分析處理情況看,現在對于PDF格式的論文自動分析技術已基本成熟,但對于PPT的分析只能分析出題名和作者兩個基本字段,有待于進一步完善分析模板,才能將這類會議論文更加準確、全面地揭示;另一方面,對于非文本格式音頻視頻文件目前還沒有進行采集和加工,而這類文件也是學術會議文獻的重要組成部分,有利于用戶了解會議的詳細情況。因此,如何為用戶提供這類文獻的服務是在今后的系統建設中需要考慮的。
(2)系統資源更新速度不夠及時,需進一步跟上網上開放學術會議資源的更新速度,這可能與工作機制、資源獲取渠道、系統的自動化程度都有一定關系。
(3)平臺目前只提供了基于Web Service的第三方接口。后續將會逐步豐富接口類型,例如OAI-PMH、SRU以及嵌入式(基于JaveScript)的檢索接口等。另外,應該提供更為簡單、易用的第三方接口學習與部署材料(宣傳冊、部署視頻等),擴大影響力度。
4.1 完善系統服務功能,促進開放會議系統與其他系統的集成與聯合服務
(1)增強系統的自動化處理能力及與其他系統的關聯。目前,開放會議平臺的資源發現與標引環節主要還是由人工完成。雖然采用了部分措施來加強資源獲取與標引的“自動”能力,但效果有限。因此,需要大力強化互聯網學術會議資源的“自動”發現與預報能力,提高資源采集環節的工作效率。在標引環節,利用命名實體識別等技術提高會議文獻信息抽取與信息識別的準確率。再者,在互聯網環境下,各信息群落應該開放關聯,真正形成Web of Data。雖然項目組利用D2R開源系統以RDF方式發布了部分會議及會議文獻數據,[3]但是,根據關聯數據5星標準來評價,尚缺乏最后1星,即與其他資源信息的關聯。只有實現了這一關聯,才能讓用戶通過開放會議平臺的數據獲取更多的相關信息。
(2)增強系統平臺的服務功能,為科研用戶提供增值服務。科研用戶使用開放學術會議資源,除了借此途徑獲取到需要的會議論文,也希望了解這些會議論文的學術價值和影響力。學術研究成果以開放獲取方式發表的好處之一是能夠追蹤到研究成果的查看次數和下載次數,實現基于文章的統計評價。開放會議系統也可以借鑒PLOS的ALM(Article Level Metrics)[4]文章計量服務、德國的OAS(OpenAccessStatistics)[5]開放獲取統計項目的做法,通過對系統檢索、瀏覽、全文下載等情況進行統計分析,并將統計分析服務作為一項增值服務提供給用戶,這既有利于完善系統的資源建設,提高資源建設的目的性和權威性,也能讓用戶更充分地認識到開放會議資源的學術價值,吸引更多的用戶關注和使用開放會議資源服務系統。
4.2 加強院所協同機制建設,全面推進開放科技資源文獻信息服務
(1)制定切實可行的服務宣傳推廣計劃,多途徑推廣開放學術會議文獻信息服務。為改變本系統目前普及程度不高的情況,需要進一步加強院所協同機制建設,加強頂層設計,依靠群組平臺建設項目等院中心提升科研一線服務能力的新增能力建設項目進行宣傳推廣,加大宣傳推廣的力度,聯合學科館員團隊協同開展宣傳推廣,在更多的研究所和課題組部署重要會議開放資源系統組件,讓更多的科研人員了解系統的資源與服務;積極組織更多的相關研究所圖書館承擔不同類型、不同學科開放會議資源從遴選到采集、標引、審核、發布的全過程,落實用戶參與機制,增強系統建設的互動性。
(2)加強系統集成,打造開放科技資源的整體服務實力。中國科學院于2009年啟動了針對開放資源的建設與服務的知識創新工程重要方向項目,先后開展了綜合科技資源集成登記、重要會議開放資源、開放科技課件、開放社會經濟信息、開放獲取期刊等不同類型開放資源的建設與服務探索實踐,取得了初步的成效,但各平臺之間關聯互通與系統集成還有待加強。目前,各方面正在研究制定開放資源元數據集成工作方案,以期將各類資源與服務共同融入綜合科技資源集成登記系統,形成中國科學院開放科技資源整體服務優勢,以整體宣傳方式在院內外的科研機構中進行推廣。同時,應嘗試與國家科技圖書文獻中心(NSTL)、中國高等教育文獻保障系統(CALIS)等服務平臺開展合作,大力提升開放科技資源信息服務的影響力。
4.3 優化工作機制,確保開放學術會議文獻信息服務的可持續開展
(1)妥善處理系統建設中的利益關系,拓展開放會議資源的獲取渠道。正如開放獲取的發展進程中總是伴隨著知識產權各關系主體的利益沖突一樣,開放學術會議資源建設過程中也需要妥善處理好作者、作者所屬機構、會議舉辦者、會議文獻出版者之間的利益關系,合理并且合法地獲取開放學術會議資源,確保資源的持續獲取和及時更新。可以借鑒中科院開放期刊項目在內容采集方面的做法,與CEUR、USENIX等國際知名開放學術會議資源發布機構以及一些重要學術會議的舉辦者和會議文獻出版者建立聯系,了解其開放獲取的政策和服務協議,嘗試建立符合雙方利益的數據共享與聯合服務模式。這既可以保障開放會議系統資源的來源和數據的更新,也可以促使系統建立并形成一套具有自身特色又符合知識產權原則的開放會議文獻信息服務政策。
(2)完善系統建設工作機制,切實推進開放學術會議資源的建設和服務。為保證系統的持續運行,還需進一步完善系統建設從項目機制到常規工作機制的轉變,適當增加開放資源建設工作崗位,進一步明確崗位職責,制定常規工作計劃和經費預算,完善工作考核方法。同時,繼續對系統建設中的技術難點和政策機制問題以項目支持的方式予以激勵。此外,在常規工作機制的建設中要更新觀念,跳出圖書館資源建設中的常規模式,嘗試引入“眾包”(Crowdsourcing[6])的工作模式,將“眾包”理念滲透到開放會議資源建設與服務的各個工作環節,從而形成基于“眾包”模式的快速服務機制,通過“眾包”業務的開展,尋找對開放會議資源建設與服務更有利、風險更小、成本更低的解決方案,[7]有效彌補資金和人力投入方面的不足,促進開放會議服務系統建設的深入和服務規模的擴大。
[1]朱江,等.會議文獻開放資源采集與服務系統的建設[J].情報理論與實踐,2010(7):117-119.
[2]陳漪紅,朱江.會議開放資源采集與服務系統用戶參與機制研究[J].圖書情報工作,2011增刊(1):61-62.
[3]柴苗嶺,等.開放會議資源的元數據研究[J].圖書館建設,2011(2):52-56.
[4]PLOS:Article-LevelMetricsmeasurethedissemination and reach of published research articles[EB/OL].[2014-03-25].http://article-level-metrics.plos.org/ alm-info/.
[5]The OAS infrastructure[EB/OL].[2014-03-25]. http://www.dini.de/fileadmin/oa-statistik/projektergebnisse/oas-poster-berlin8-noprint.pdf.
[6]Crowdsourcing[EB/OL].[2014-03-25].http://en. wikipedia.org/wiki/Crowdsourcing.
[7]盛芳,等.眾包與眾包館員制度:助推圖書館服務轉型[J].圖書館情報知識,2012(4):95-102.
G255.76
B
1005-8214(2015)06-0083-04
韓紅(1966-),女,中國科學院成都文獻情報中心副研究館員,研究方向:用戶管理與服務,開放資源建設與知識產權;朱江(1968-),男,研究館員;王春明(1973-),女,副研究館員;姜恩波(1972-),男,研究館員;柴苗嶺(1978-),女,館員。
2014-09-18[責任編輯]李金甌
本文系中國科學院文獻情報能力建設專項研究項目“開放會議資源服務系統建設”的研究成果之一。