崔麗華
(北京師范大學圖書館,北京 100875)
SCI(science citation index)是美國《科學引文索引》的簡稱,由 ISI(Institute for Scientific Information)美國科學情報所編輯出版。SCI數據庫因收錄了世界上一流的優秀期刊,被全球學術界公認為最權威的科技文獻檢索工具。對于SCI這樣一個著名的數據庫,大多數人只是利用了它的收錄和引用功能,而它的分析功能利用率卻不高。SCI具有強大的結果分析功能,可以對檢索到的論文作者、作者機構、來源期刊、學科分類、文獻類型、出版年限等進行統計分析,解決科研人員非常關注的諸多問題,如:本研究領域發表論文最多的核心作者是誰;論文主要發表在哪些期刊上;發表論文最多的機構在哪里;哪一年發表論文最多;論文主要涉及了哪些學科等等。
筆者以生命科學領域的研究熱點“蛋白質組學”這一案例來說明如何利用SCI的結果分析功能,追蹤學術研究的發展軌跡,在避免重復研究、節省時間和精力的同時,把握學科發展前沿,了解我國在此領域所處的國際地位,為科研提供精準服務。
蛋白質組學的英文名稱為proteomics。以“proteomics”為檢索詞,選定年限為2000~2009(檢索日期為2010年1月12日)。檢索出題名中含有該檢索詞的文獻,共命中記錄5896條。
對5896篇論文作者的發表篇數進行統計,選擇項為分析全部命中條數,最多10000條記錄,最少記錄設定為20,表示只統計論文數量大于20的作者,按照作者發表論文的數量排序,結果顯示發表論文數量在20篇以上的作者有27名,選出前10名的作者(見表1)。

表1 發文量居前10名的作者
從表1中可以看出,前10名作者共發表了552篇文章,占總發文量的9.36%,這些作者的發表文章篇數都在31篇以上。還可對獲得的這些數據做進一步的分析,如繼續使用分析功能對其中某位作者的論文進行分析,了解發表在哪些期刊上,文獻類型有哪些,是研究論文還是綜述等。因為只有研究論文(ARTICLE)對指導研究更有意義,所以,對前3名作者的文章又進行了文獻類型分析,發現文章總數(134篇)排名第一的ANON,研究論文只有13篇,而NEWS ITEM 55篇,MEETING ABSTRACT 46篇,其他20篇。總數排名第二的AEBERSOLD,R(72篇)研究論文為34篇,比第一名ANON多21篇。第三名的MANN,M(57篇)研究論文為31篇。
由此可見,運用SCI的作者分析功能,可方便地發現研究領域發表文章最多的專家、領軍人物及核心作者群,跟蹤他們的論文可以了解學術研究的發展前沿。
對5896篇文章的來源期刊進行統計,選擇項仍為分析全部命中條數,最多10000條記錄,最少記錄設定為10,按照來源期刊中論文數量的多少進行統計排序,結果顯示發表蛋白質組學論文數量超過10篇的來源期刊有91種。如表2所示,前10名期刊收錄文獻2118篇,占總量的35.92%,可以視為該領域的核心出版物。這些期刊大量登載了蛋白質組學方面的論文,對于科研人員來說,是要重點閱讀的,是科研人員互相學習、交流、探索的最主要期刊。但是這一結果同時也顯示了來源期刊比較分散。科研人員如果掌握這些期刊分布狀況,對于指導投稿有重大意義,即選擇收錄相關論文量大的期刊進行投稿,有利于提高命中率。

表2 載文量居前10名的期刊
對5896篇文章考察作者所在機構,選擇項仍為分析全部命中條數,最多10000條記錄,最少記錄設定為10,表示統計發表文章數量大于10的機構。結果顯示發表文章數量在10篇以上的機構有208個。表3列出發表文章數量前10名的機構。前10名機構共發表文章743篇,占總發文量的12.6%。在前10名機構中,高校和科研機構占有絕對優勢。其中哈佛大學位居第一,發表文章102篇。其次,華盛頓大學發表88篇。中國科學院(CHINESE ACAD SCI)發表文章44篇,排名21位(表3未列出)。了解此領域發文機構,對加強學術研究與交流,尋找合適的合作伙伴有重要作用。

表3 發文量居前10名的研究機構
一個國家發文量的多少,可以考察這個國家在該領域內的科研水平及國際影響力。對5896篇文章進行國家統計分析,選擇項同機構分析。發文量較多的前10位國家如表4所示,依次為美國、德國、英國、中國、日本、加拿大、法國、瑞士、意大利和瑞典。前10位國家共發表文章4964篇,占總發文量的84.19%。其中美國遙遙領先,發表文章2292篇,占總發文量的38.87%。中國發文量位于第四,發文302篇。對這302篇文章又進行了出版年限分析,2000年與2001年各兩篇,2002年 1篇,2003年 11篇,2004年 52篇,2005年 18篇,2006年47篇,2007年44篇,2008年58篇,2009年67篇。可見2000~2002年為萌芽階段,2003年快速發展,2004~2009年發文量迅猛增長,但2005年有點例外。我國的發文量與蛋白質組學研究的發展進程基本吻合。
國際上蛋白質組學研究進展十分迅速,不論基礎理論還是技術方法,都在不斷進步和完善。多種細胞的蛋白質組學數據庫已經建立,相應的國際互聯網站也層出不窮。1996年,澳大利亞建立了世界上第一個蛋白質組學研究中心Australia Proteome Analysis Facility。丹麥、加拿大、日本也先后成立了蛋白質組學研究中心。在美國,各大藥廠和公司在巨大財力的支持下,紛紛加入蛋白質組學的研究陣容。瑞士成立的GeneProt公司,是由以蛋白質組學數據庫“SWIS.SPROT”著稱的蛋白質組學研究人員成立的,以應用蛋白質組學技術開發新藥物靶標為目的,建立了配備有上百臺質譜儀的高通量技術平臺。而當年提出Human Protein Index的美國科學家Normsn G.Anderson也成立了類似的蛋白質組學公司。2001年4月,在美國成立了國際人類蛋白質組學研究組織(Human Proteome Organization,HUPO),隨后歐洲、亞太地區都成立了區域性蛋白質組學研究組織,試圖通過合作的方式,融合各方面的力量,完成人類蛋白質組學計劃(Human Proteome Project)。2003年9月,國內正式成立了中國人類蛋白質組學組織(CNHUPO);2005年10月,第一家從事蛋白質組學研究的專業研究機構——北京蛋白質組學研究中心成立[1]。目前我國已擁有具有國際先進水平的高通量、高靈敏的蛋白質組學研究技術平臺,并且成功開展了有關人類重要生理及病理的蛋白質組學研究,如人胎肝的蛋白質表達譜和磷酸化修飾譜、肺癌和肝癌差異蛋白質組等研究[2]。

表4 發文量居前10位的國家
利用SCI提供的分析功能對檢索到的5896篇蛋白質組學文章進行了統計分析,通過這些分析,全方位地了解了蛋白質組學領域的研究狀況及發展前沿,解決了科研人員關心的諸多問題。
①蛋白質組學研究領域發表文章數量最多的是ANON,2000~2009年10年間共發表文章134篇,但如果以研究論文(ARTICLE)排名,AEBERSOLD,R排名第一,研究論文為34篇,而ANON只有13篇。利用SCI提供的作者分析功能,可方便地發現研究領域發表文章最多的專家、領軍人物及核心著者群。跟蹤他們的論文可以了解研究課題的發展前沿。
②收錄蛋白質組學論文數量超過10篇的期刊有91種。掌握與研究課題相關的期刊分布狀況,對指導科研人員進行科研交流探索及投稿有重大意義。
③通過考察蛋白質組學研究作者的所在機構,發現高校和科研機構占有絕對優勢,其中哈佛大學發文量位居第一,發表文章102篇。利用SCI提供的機構分析功能,可以了解研究領域的核心研究機構,對加強學術研究與交流,尋找合適的研究合作伙伴有重要作用。
④利用SCI提供的國家分析功能,了解一個國家發文量的多少,可以考察這個國家在該領域內的科研水平及國際影響力。對于蛋白質組學研究領域,美國是該研究的核心國家,發表文章2292篇,占總發文量5896篇的38.87%,說明其國內匯集了一批該領域的專家。中國發文量位居第四,發表文章302篇,表明我國的科學家在這一領域一直在努力向世界前沿邁進。
[1] 張麗霞,張國強,陳瑞麗.蛋白質組學研究的新進展.安陽工學院學報,2006(3).
[2] 蔣英芝,賀連華,劉建軍.蛋白質功能研究方法及技術.生物技術通報,2009(9).
[3] 龐景安.科學計量研究方法論[M].北京:科學技術文獻出版社,2002.
[4] 徐慧芳,仲維科.SCI在科學研究中的應用.情報學報,2005(5).崔麗華 女,1964年生。博士,副研究館員。