施曉華



〔摘要〕本文圍繞介紹高校在建設學校學術成果基礎架構與服務過程,對高校學術成果管理系統與校園認證、評估系統之間學者身份的關聯,以及多機構管理系統之間學者身份的關聯,進行系統化的應用與研究。
〔關鍵詞〕高校;學術成果管理;學者;身份關聯;學者統一身份;ORCID;國際標準名稱識別碼(ISNI);機構知識庫(IR);研究信息系統(CRIS)
DOI:10.3969/j.issn.1008-0821.2017.05.022
〔中圖分類號〕G252〔文獻標識碼〕A〔文章編號〕1008-0821(2017)05-0132-05
Research of Correlation for Researcher Unified Account in
Academic Output Management ProcessShi Xiaohua
(Library,Shanghai Jiaotong University,Shanghai 200240,China)
〔Abstract〕This paper conducted a research on how to deploy the Researcher Unified Account service in the process of constructing the universitys academic output basic infrastructure,such as connection with CRIS system,SSO authentication with Campus Users,and inter-connection with different institutions.
〔Key words〕university;academic management;researcher;identity associated;unified researcher ID;ORCID;international standard name identifier;institutional repository;current research information system
全球信息需求者身處于信息爆炸的時代,如何能在大量的學術資源中,正確、方便的識別作者身份,并將學術研究動態、正確地歸屬至作者名下,已經成為一項極其重要的課題。正確地識別作者不僅能協助科研機構進行學術研究產出的追蹤與紀錄,有效提升研究者的學術能見度,對于優化學者的各個研究工作流程,推動跨學科、跨機構乃至跨國的協同合作,都至關重要[1]。
根據分析統計,2011-2014年間署名上海交通大學發表的2萬多篇SCI科技研究論文中,其作者名為‘Zhang,Jie者多達158篇,縮寫為‘Zhang,J的有701篇,分別在物理、生物、醫學和教育學等學科發表。結果顯示中文音譯的英文名稱為符合期刊或機構庫平臺的呈現格式而轉換為英文名稱及其縮寫后,容易導致產生同名同姓的問題。若考慮到不同語言的命名及縮寫規則時,姓名的標準化控制問題將更為復雜[2]。
目前國內外關于文獻數字對象的惟一標識符使用DOI(Digital Object Identifier,數字對象標識符)[3]方式來表示,國內基金項目也有對應的惟一項目立項號,而學者身份標識則還存在各種不同方式[4],如表1,常用有ORCID(Open Researcher and Contributor IDentifier)、ISNI、Research ID、Scopus Author ID和中科院的iAuthor等。
2009年,湯森路透和愛思唯爾等公司為解決全球學術圈的人名混淆問題,倡導設立了ORCID項目,并建立了Research ID和ORCID、Scopus Author ID和ORCID的關聯,目前各高校、研究機構和組織普遍開始使用ORCID作為學者惟一身份標識符,應用在各個學術系統和學術數據交互中學者的惟一標識[5]。本文將以ORCID為主要的學者統一身份方式,對其在高校學術成果管理中的各類應用進行研究
1學者惟一身份應用
如圖1,以學者惟一身份ORCID在大學中除了與不同方式賬號關聯,還可以有效支持學校研究信息系統(CRIS),融入不同學術工作流。總體來講,部署學者惟一身份可以為機構單位和學者帶來以下一些幫助[6]:
1)學者惟一身份將成為數字化校園的關鍵基礎,協助院系和研究教師完成基于學者維度的基金項目研究數據管理和開放獲取需求;
2)實現機構、基金項目、出版商以及其他學者標識符系統的相互關聯;
3)通過內部系統和外部系統之間的自動數據交換,實現學者個人CV自動更新;
4)支持更多的機構流程化應用,如外部資源在機構學者成果管理中的自動甄別;
5)方便實現學者在更換單位時的成果遷移工作;
6)支持國內及國際間不同機構和系統間的學術成果信息關聯;
7)提升研究數據質量,保障國內和國際上學術系統間的數據交換。
2014-2015年,英國的JISC-ARMA組織與美國的Sloan基金分別資助本地區的部分大學進行學者惟一身份的應用與實踐研究[7-9]。Jisc-ARMA試點項目(Jisc-ARMA ORCID Pilot Project)曾在英國的8所高校開展ORCID應用實踐[10],有效推動了本地區學術機構的學者統一化,在機構學術成果管理系統中部署ORCID應用,推動了區域內機構間的學術成果標準數據交換活動。
如圖2,有效的學者統一身份將會支持從基金申請、論文投稿、審稿過程、成果發表直至成果組織展示和評估的整個學術生命周期過程(Research Lifecycle)[11]。2015年8月起,作為世界最大的生物醫學研究基金之一,惠康基金(Wellcome Trust),已經要求基金主要申請者必須提供統一ORCID賬號來提交申請表[12],另有多個國家的基金也已要求申請者提供ORCID賬號[13]。基金組織可以根據ORCID賬號跟蹤受資助者的成果和獲獎數據、以及成果中對本基金的聲明。
PLOS、Hindawi、IEEE和Springer Nature的投稿平臺也已經要求作者在投稿時提供ORCID[14],有超過3 000種期刊已經通過稿件提交系統收集作者的ORCID賬號,以便后續的出版[15]。作者成果信息在其投稿、發表過程中即已形成,有效減少了用戶成果信息的重復錄入;同時基于如Crossref等文獻關聯平臺的自動更新功能,學者可以選擇通過ORCID自動更新他們的論文成果列表,并支持大學和其他系統與其同步更新,大大減輕學者機構學術成果清理、統計、評估和考核等各方面人員的負擔。
2學者統一身份在高校的應用部署
對于不同的組織機構,在學術生命周期過程中對學者統一身份的需求不盡相同,研究性大學主要是使用ORCID來建立起研究信息管理系統(CRIS)和ORCID信息資料之間的交互訪問。ORCID支持各種研究信息管理系統,如Converis、Elements、IRMA、DSpace CRIS、Pivot、PlumX、Profiles、Pure和Vivo等[16],一些主要的案例有[17]:
Notre Dame大學將ORCID嵌入其自建機構知識庫平臺Hydra;
Purdue大學將ORCID嵌入其研究合作平臺HUBZero;
Missouri大學將ORCID整合至DSpace平臺;圖2高校學術生命周期中的學者統一身份應用
Cornell大學將ORCID整合至VIVO平臺;
Boston大學的成果通過ORCID整合至Harvard大學成果系統;
香港大學Scholars Hub實現ORCID個人頁面(Researcher Page)與ORCID個人頁面的互相鏈接。
ORCID在國內高校的部署,主要包括ORCID在學校的普及,實現與ORCID的數據交互,與情報分析平臺和統一認證系統對接,以及校際之間的學術數據互操作。全校師生將能確信地實現作者與學術成果進行關聯,幫助圖書館、院系和科研管理部門獲取其成果的標準信息,并可以與其他高校、機構或平臺進行自動化信息交互,提升數據質量。
21學者統一身份與機構知識庫的自動數據交互
目前基于學者統一身份ORCID的在線成果(ORCID Profiles)錄入,主要有以下4個方式:
1)用戶手工錄入成果信息;
2)用戶導入BibTex文件進行錄入;
3)查詢數據庫上或其他研究管理軟件,進行批量導入;
4)從機構知識庫中,通過專用API接口,批量推送成果數據至ORCID。
總體比較,通過ORCID錄入外文成果比較方便,中文成果(如CSSCI)的錄入較復雜;而中文iAuthor或各機構庫產品,對外文的數據錄入支持不夠全面。所以,通過ORCID與機構知識庫的數據交互(圖3),可以互相彌補,有效完成不同成果數據的錄入和推送;既能提升機構知識庫成果收繳全面性,也能提升ORCID揭示更多中文或非出版成果[18-19]。
圖3ORCID與機構知識庫的數據交互
22學者統一身份與替代計量學(Altmetric)的結合應用在數字時代,基于惟一標識符DOI和學者統一身份如ORCID的惟一表示,使特定論文可以在網絡上被永久使用、下載和統計,讓特定學者得以整合完整的學術成果、建立動態學術履歷,作為積累研究產出、評價研究成果、尋求合作者和申請基金項目的依據。學者統一身份的應用將會有效甄別學者,提升成果數據純度,極大簡化情報分析中的數據預處理流程,節省情報分析工作量[20]。
最新的Altmetric(替代計量學)主要評判依據為使用(Usage)、獲取(Captures)、提及(Mentions)、社會媒體(Social Media)和引文(Citation)等五大方面。Altmetrics具有更全面的客觀性、公正透明性、社會性、補充性和實時性等特征。通過文獻研究、整理,得到在社交媒體中Altmetrics即時測量出的學術論文的影響力,與科技期刊的學術影響力相吻合。在開放存取領域中,Altmetrics學術影響力計量方法已得到認識、關注和應用,并為科技期刊的影響力計量化、可視化評價提供依據[21]。
以替代計量學的分析工具之一PlumX為例,在2015年,PlumX開始支持ORCID,通過搜索ORCID 賬戶查詢學者,并將ORCID賬號作為自動化元數據收割的標準之一。當學者建立ORCID后,通過PlumX可以很快速的連接其學術成果并跟蹤分析其研究影響力。PlumX使用ORCID API來查詢獲取研究者的個人信息和和學術成果,并生成學者個人頁面、收集學術影響相關的評判依據[22]。
高校機構知識庫在支持PlumX計量體系基礎上,融合學者統一身份,可以在從構思、設計、實驗、論文撰寫和發表研究過程中,通過永久標識符將機構內學者的主要研究工作流的各部分串聯起來。如基于整合帶有ORCID標簽的各類數據PlumX應用,可以立體化揭示誰正在使用或討論學者的研究成果[23-24]。
23學者統一身份與校園統一認證的結合
通過不同學者統一身份的API可以實現校園統一認證平臺與在線成果揭示平臺的SSO單點登錄,前提是校園認證平臺支持OAuth 20協議的應用開發高級接口[25-26]。UCLA(美國加州大學洛杉磯分校)的教師信息系統(Opus)項目將使用UCLA Shibboleth SSO(校園統一認證)進行身份驗證。通過用戶校園身份與ORCID賬號的結合,將可以使用Opus來跟蹤用戶標識和應用授權規則,基于ORCID賬戶返回口令認證聯合身份驗證和本地SSO[27]。這將有助于解決教師的校內或校外機構身份的變換所導致的難以判斷學者歸屬問題。
以上海交通大學的jAcccount校園認證系統為例[28],該系統已經支持OAuth 20協議,提供支持接入的兩個基礎設施:OAuth授權體系和開放API[29]。具體的登陸過程為:
1)ORCID網站通過OAuth獲取到訪問登錄用戶基本信息的Access Token;
2)ORCID網站使用Access Token調用Profile接口,獲取用戶的基本信息。
在申請jAccount接入后,學校網絡信息中心提供的Siteid和Secret同時也是OAuth應用的id和Secret,如圖4,設計訪問流程如下:
1)校內用戶在各校內認證系統登錄,客戶端獲取用戶認證登錄的信息;
2)進行ORCID認證前,首先在校園ORCID中心,通過jAccount返回信息,獲取對應的ORCID賬號;
3)使用用戶ORCID賬號,通過ORCID Member API進行登錄授權信息,授權通過后,返回授權令牌;
4)使用令牌,直接登錄進入ORCID個人中心。訪問令牌主要包括授權用戶信息,編輯權限信息和授權代碼(格式如8623f26a-41b5-433f-be2f-b7865020c71a)。
24校際系統之間學者統一身份的互操作應用
由于每個高校都有本地的認證和信息管理系統,學術管理系統中用戶的標識不盡相同,導致高校學術信息系統之間無法有效互操作。如圖5,學者惟一標識符使得不同地域、高校和研究機構之間學術成果可以準確、有效地進行溝通交互[30-31]。
為了促進研究人員和各類數據之間的關聯,歐洲的THOR項目正在開發支持包含ORCID賬號的學術數據庫和服務的有效方法[32],有效將ORCID整合至各類機構現有的關鍵數據倉儲中,進一步實現數據庫之間的互聯。通過開發,項目成功實現在3個不同學科的合作研究機構中,即PANGAEA(地球科學),EMBL-EBI(生命科學)和CERN(高能物理),來集成ORCID賬號和服務[33]。
每個合作機構在數據提交時使用ORCID賬號作為首選認證方式,通過ORCID進行身份驗證。因為基于作者關鍵字容易出現不同研究區域而同名學者的情況,具有可靠性和完整性的ORCID認證方法可以允許THOR的應用程序獲得認證許可,通過用戶獨有憑據保證惟一性,并獲取他們的ORCID成果記錄和提供一個其惟一的ORCID賬號和一些基本個人信息,如姓名、電子郵件和國家。以EBI(歐洲生物信息學機構)核心數據服務為例,提供各類下屬網站也可接受在數據提交時的ORCID注冊信息進行注冊。
意大利的Cineca組織也開發推出了在其DSPACE-CRIS系統中支持ORCID HUB(機構ORCID認證中心)功能[34-35],將促進各地區、各機構研究人員采用ORCID惟一標識符,將所有購買ORCID成員的機構,通過統一授權在多個服務中使用其標識符,獲得ORCID授權的人員可以在同一時間登錄到不同機構的不同應用程序服務,并在不同系統中實現用戶成果數據同步。ORCID HUB提供了支持全國性學術交流社區系統所需的技術和基礎設施,而ORCID是此架構的基礎部分,以在研究社區中標識服務的角色信息。
3展望
國外越來越多的期刊與會議投稿系統已經開始推廣學者統一身份(如ORCID等),從建設學術基礎數據架構和提升本校學者的學術成果影響力來講,盡早推行可以從根本上解決學者甄別和學者與學術成果的關聯問題,為機構知識庫建設節省大量的數據清洗工作量,也為今后情報分析服務提供了強有力的數據支撐[36]。針對目前國內中文期刊僅有CSCD的數據可以通過Scopus或Airiti導入到ORCID系統的問題,也急需進一步完善對應的數據交互接口規范,支持各種中文成果批量導入功能。
國內高校可以開展測試本校統一認證與不同學者統一身份認證的交互,以學術成果管理系統或機構庫系統與統一身份數據的互同步,完成一定數據交互應用。長遠來講,各高校應該積極參與校級聯盟合作(如ORCID聯盟),共同進行需求調研、功能推廣和聯盟會員申請,既節省每個單位的費用支出,也能促進校際間的學術成果共享,支持高校科研合作中的成果統一揭示與管理。
參考文獻
[1]臺大醫學院Research Portal建置與ORCID導入經驗分享[EB].http:∥ifii-enews.blogspot.com/2014/12/research-portalorcid.html.
[2]Tang,J.,Fong,ACM.,Wang,B.and Zhang,J.A unified probabilistic framework for name Disambiguation in digital library[J].IEEE Transactions on Knowledge and Data Engineering,2012,24(6):975-987.
[3]Digital Object Identifier System[EB].https:∥www.doi.org/.
[4]賢信,曾建勛.科研實體惟一標識系統研究[J].圖書情報工作,2015,(12):113-119.
[5]王海花,黃金霞.ORCID在機構知識庫建設中的應用研究[J].圖書情報工作,2015,59(17):134-140,133.
[6]Benefits-About ORCID-UK ORCID consortium membership[EB].https:∥www.jisc.ac.uk/orcid,2016-08-28.
[7]Jisc-ARMA ORCID pilot project[EB].https:∥orcidpilot.jiscinvolve.org/wp/,2016-08-28.
[8]HEI based projects[EB].https:∥orcidpilot.jiscinvolve.org/wp/hei-based-projects/,2016-08-28.
[9]Brown,Josh;Wilmers,Catalina;Haak,Laurel.Final Report:Sloan ORCID Adoption and Integration Program 2013-2014.figshare[EB].https:∥dx.doi.org/10.6084/m9.figshare.1290632.v1,2015.
[10]Henderson ,Helen,Johnson,Rob and Woodward,Hazel.Institutional ORCID Implementation and Cost-Benefit Analysis Report.2015.
[11]Katherine G.Akers,Alexandra Sarkozy,Wendy Wu & Alison Slyman.ORCID Author Identifiers:A Primer for Librarians[J].Medical Reference Services Quarterly,2016,35:2,135-144.
[12]Open Researcher and Contributor ID(ORCID)[EB].https:∥wellcome.ac.uk/funding/open-researcher-and-contributor-id-orcid,2016-08-26.
[13]Funder Mandates for ORCID[EB].http:∥orcid.org/blog/2015/12/04/research-funders-and-orcid-new-members-mandates-and-platforms.
[14]Seven Publishers Will Make an ORCID ID a Requirement For Publication;Springer Nature Reaches ORCID Milestone[EB].http:∥www.infodocket.com/2016/01/07/metadata-seven-publishers-making-orcid-id-requirement-for-publication-springer-nature-reaches-orcid-milestone/.
[15]Step by Step:Collecting and Connecting ORCID iDs in the Publishing Process[EB].http:∥orcid.org/blog/2016/04/20/step-step-collecting-and-connecting-orcid-ids-publishing-process.
[16]SUPPORT FOR ORCID IN CRIS SYSTEMS[EB].https:∥members.orcid.org/cris-tools,2016-08-26.
[17]General program integration categories[EB].https:∥orcid.org/organizations/institutions/usecases,2016-08-26.
[18]Bruce R,Weigert V.How to take advantage of ORCID in institutional repositories[J].Open Repositories 2014,2014.
[19]Troll Covey D.ORCID@ CMU:Successes and Failures[J].Journal of eScience Librarianship,2016,4(2):6.
[20]Baessa,M.,Lery,T.,Grenz,D.,& Vijayakumar,JK..Connecting the pieces:Using ORCIDs to improve research impact and repositories.F1000Research,4,195[EB].http:∥doi.org/10.12688/f1000research.6502.1,2015.
[21]Plum Analytics partners with ORCID[EB].https:∥www.researchinformation.info/news/plum-analytics-partners-orcid.
[22]Madjarevic N.Connecting Altmetric:Integrating with Institutional Publications Systems[version 1;referees:1 approved,1 approved with reservations][J].F1000Research,2015,(4):192.
[23]Maximizing the power of ORCID with PlumX interoperability[EB].http:∥plumanalytics.com/wp-content/uploads/2015/06/ORCID-Poster-2015.pdf.
[24]ORCID and Plum Analytics Work Together to Easily Provide Altmetric Information to Researchers[EB].http:∥plumanalytics.com/orcid-and-plum-analytics-work-together-to-easily-provide-altmetric-information-to-researchers/.
[25]INTRODUCTION TO THE ORCID APIs TECHNICAL WORKSHOP[EB].https:∥members.orcid.org/sites/default/files/orcid-api-workshop-OR2015-handout.pdf.
[26]Identity Management and Authenticated Session Management[EB].http:∥jenkins-1.dataone.org/jenkins/job/API%20Documentation%20-%20trunk/ws/api-documentation/build/html/design/Authentication.html.
[27]ORCID Use Cases[EB].https:∥wiki.refeds.org/display/OUT/ORCID+Use+Cases.
[28]http:∥developer.sjtu.edu.cn/wiki/JAccount[EB].
[29]https:∥developers.google.com/oauthplayground/[EB].
[30]Haak L L,Fenner M,Paglione L,et al.ORCID:a system to uniquely identify researchers[J].Learned Publishing,2012,25(4):259-264.
[31]Chen C,Ko M W,Lee V T.Migrating researcher from local to global:Using ORCID to develop the TLIS VIVO with CLISA and Scopus[M].Digital Libraries:Social Media and Community Networks.Springer International Publishing,2013:113-116.
[32]The THOR mission[EB].https:∥project-thor.eu/the-thor-mission/.
[33]de Mello,Guilherme et al..(2016).Demonstration of Services to Integrate ORCIDs into Data Records and Database Systems.Zenodo.10.5281/zenodo.58971.
[34]Mendes Moreira J,Cunha A,Macedo N.An ORCID based synchronization framework for a national CRIS ecosystem[J].F1000 Research,2015,(4):181.
[35]Galimberti,P.,& Mornati,S.The Italian model of distributed research information management systems:a case study.2016.
[36]Meadows A.Everything you ever wanted know about ORCID…but were afraid to ask[J].College & Research Libraries News,2016,77(1):23-30.
(本文責任編輯:孫國雷)