●任紅娟
(鄭州航空工業管理學院信息科學學院,鄭州450015)
國內外引用認同研究進展文獻計量分析
●任紅娟
(鄭州航空工業管理學院信息科學學院,鄭州450015)
引用認同;研究進展;文獻計量
以文獻計量學方法為基礎,分別選用Web of Science和中國知網、萬方知識服務平臺構建數據集來分析國內外引用認同的研究現狀,對國內外引用認同的主要載文期刊、高產作者、高被引作者等基本統計信息進行調查,并基于作者共被引方法分析了該領域的主要研究分支。在此基礎上綜合分析了國內外引用認同研究的內容,概括了引用認同的主要研究主題。
引用認同(CitationⅠdentity)是一種全新視角的引文分析方法,該方法從引用者出發對引用者和被引者都加以研究,是評價個體學者的一種新方法。研究引用認同在了解作者重復引用規律,把握作者研究風格,洞悉作者影響力和研究領域等方面都具有重要的意義。2000年,美國德魯克賽爾大學教授Howard D. White在《The Web of Knowledge:A Festschrift in Honor of Eugene Garfield》文集中第一次提及“引用認同”。[1]隨后于2001年在其論文“Authorsascitersovertime”中,White第一次正式提出了“引用認同”概念,他指出:引用認同是某位作者引用的所有作者的集合。[2]作為引用分析方法的新視角和重要組成部分,引用認同方法提出十多年來,從國內外的研究來看,對該方法的梳理和系統分析的研究還比較少。2010年,魯晶晶等發表了“引用認同研究進展分析”一文,對引用認同的發展現狀進行了簡要介紹。[3]本文擬利用文獻計量學的方法來綜合分析引用認同的發展現狀,以期能夠全面地把握該領域的研究狀況,分析該研究領域的發展趨勢以及該引文分析方法的不足之處。
1.1 數據集構建
國外數據選取Web of knowledge平臺的“Web of Science數據庫”,以“主題=citation identity*”進行檢索,檢索時間為2012年11月20日,得到11篇相關文獻。從結果來看,數據量偏小,這是由于部分文獻在主題中沒有直接采用該主題詞,但研究內容卻與之非常相關。按照邏輯,文獻的施引文獻是在某一個方面借鑒或者包含了與被引文獻相關的研究方法或者內容,因此利用這些文獻的施引文獻來進行數據集的擴展,可以保障這些文獻主題上一定程度的相關性;另一方面由于Web of science只收錄了全世界范圍內以英文語言為主的一小部分優質期刊資源,而利用這些文獻的施引文獻進行數據集擴展就可以把更大范圍內的相關研究文獻納入其中,從而擴大文獻的查全率。利用施引文獻擴展檢索之后,經過去重和不相關文獻的排除,共得到143篇相關文獻,去除不相關文獻之后,共有126篇文獻。
1.2 基本統計信息分析
(1)引用認同研究的起源及論文年代分布。對該數據集的論文年代分布進行分析,結果如圖1所示。由圖1可知,引用認同在2001年提出以后,起初幾年并沒有引起太多的關注,研究文獻增加速度比較緩慢,2005和2006年甚至還出現了下降的趨勢。2006年以后,相關論文數量經歷了快速的增長,2009年達到了一個頂峰,發表了25篇相關的文獻。在2010年,發文數量出現了急劇的下降,2011年開始回升,2012年由于數據統計的不完全,相比2011年論文數量有所下降,但相差不大??傮w而言,引用認同的相關研究以相對比較緩慢的速度在增長,在增長的過程中還伴隨著間或的下降。這也從一定程度上說明該領域的研究還不是很成熟,仍處在研究的起步階段。

圖1 國外引用認同論文年代分布圖

圖2 國外引用認同研究期刊分布圖
(2)被引頻次分析。126篇文獻的總被引頻次為1150次,篇均被引9.13次。被引用次數最高的是Borgman和Furner于2002年發表在《Annual Review of information Science and Technology》的一篇綜述文章“Scholarly communication and bibliometrics”,被引144次。排在第二的是2008年Bornmann和Daniel所著,題為“What do citation counts measures?A review of studies on citing behavior”的文獻,被引111次。排在第三位的是Bar-Ⅰlan的“Which h-index?-A comparison of Wos,Scopus and Google Scholar”,被引97次。排在前兩位的文獻都是綜述性文獻,對綜述性文獻的引用是獲取某一個主題研究全貌的一個很重要的途徑,因此其引用次數相對比較高,而實際上這些綜述文獻和引用認同的深入研究相關性并不大,但無形中提高了該主題篇均被引次數。White的“Authors as citers over time”的文章被引次數為78次,排在第五位。在該數據集中,有29篇文獻從未被引用。從這些文獻的分布年代來看,2012年的文獻有11篇,2011年的文獻有8篇,由于這些文獻發表較晚,因此存在有些文獻還沒有被該領域研究學者關注到的可能性,但也存在一部分文獻已發表一段時間卻仍未被引用。
(3)期刊分布。對該數據集中文獻的主要出版平臺進行分析,載文大于2的出版物如圖2所示。共包含了8種期刊,這8種期刊均集中在圖情領域,除了馬來西亞圖書館信息科學期刊之外,其余的期刊均為圖情領域的知名期刊。
(4)高產作者及高產機構。該數據集共有作者181位,分別對第一作者和全作者(所有作者,不分署名順序)的發文情況進行統計,結果如表1所示。表1中列出了產出大于1的35位作者,其中字體加黑的作者是以對第一作者產出進行統計的結果,共有19位作者。發文變化是指作為第一作者發文的數量與不分署名順序進行統計的全作者發文數量之間的差值。從表1中可知,沒有數量變化的均為所有作品都是以第一作者署名的作者,變化最大的是Shaw和Wolfram,說明這兩位作者的所有作品均不是以第一作者發表的。雖然他們的產出數量相對比較高,但是分析這些合作就會發現,Shaw是印第安納大學圖書館信息科學系的主任,她以第二作者發表的這幾篇文章都是和Cronin合作的,而Wolfram的合作者為其指導的博士生。所以,從表1不難發現,采用第一作者來進行高產作者的統計在有些情況下要更科學一些,但鑒于合作關系以及署名規則在不同機構之間的差異,可以把第一作者和全作者綜合的進行統計分析來確定領域的高產作者。對這些作者,無論是第一作者還是全作者,所在的機構進行分析,排在前三位的機構結果是一致的,分別是美國德魯克賽爾大學、美國印第安納大學和以色列巴伊蘭大學。
1.3 作者共被引分析
選擇被引頻次大于17的46位作者進行共被引分析,將遴選出的46位作者進行作者共被引分析,利用SPSS18.0對相似矩陣進行因子分析,在分析的過程中選用最大方差正交旋轉的方法來簡化因子結構。因子分析的結果共得到7個公因子,累積方差貢獻率為87.335%,可以代表引用認同研究主題的不同的學術共同體及其核心作者。因子負載的絕對值超過0.5才被接受,超過0.7則認為對解釋因子有幫助。[4]依據此標準,將46位作者分配在7個公因子中。其中,因子7中只包含Hyland,作者Drucker在任何公因子中的絕對值都不超過0.5,將Ducker和Hyland歸為第7個公因子中,他們的研究主題分別集中在營銷和應用語言學。通過對該數據集中引用高影響力作者文獻的作者關鍵詞以及標題詞詞頻分析,并通過Web of science數據庫檢索作者的作品并輔以Google scholar以及Google個人主頁、個人相關介紹等內容來為每個公因子進行命名。除了第7個公因子之外,其余6個公因子的研究內容分別是:科學計量學、網絡計量學、信息計量學以及文獻計量學領域的方法和實證研究;作者引用認同、引文分析理論和方法研究;科學交流與文獻計量學關聯研究;引用質量評價和影響因子;H指數;期刊引用認同及期刊評價。

表1 國外引用認同高產作者分布表
2.1 數據集構建
國內數據選取中國知網和萬方知識服務平臺來進行數據搜集,以“主題=引用認同”進行檢索,檢索日期為2012年11月20日,共得到27篇相關文獻。其中有兩篇為碩士學位論文,分別是中國科學院魯晶晶(2010)的“基于引用認同的科研機構認知方法研究”和吉林大學高歌(2011)的“基于引用認同的學科前沿熱點研究”,其余均為期刊論文。
2.2 基本統計信息分析
(1)文獻年代分布。2009年,馬鳳和武夷山撰文“引用認同——一個值得注意的概念”,將引用認同研究引入,引用認同開始受到我國學者的關注。2010年發表了8篇相關成果,2011年達到10篇,2012年由于檢索時數據不完全,相比11年略有下降,但兩者的數值相差不大。由此可知,我國越來越多的學者認識到引用認同研究的重要性,以逐年增加的趨勢投入到該主題的研究中。
(2)期刊分布。國內引用認同的成果大多集中在圖書館學和情報學領域期刊,排在前三的依次是《情報理論與實踐》《情報雜志》《圖書情報工作》。在這些期刊中,只有《科學學研究》屬于科學學領域,由于《科學學研究》與科學計量學研究領域有著密切的聯系,因此,該期刊也屬于圖情領域的親緣學科期刊??傮w而言,從期刊分析結果來看,引用認同的研究主要集中在圖情領域,在其他領域的拓展研究還比較少見。
(3)高產作者和高產機構。選取發文數量大于1的作者及其作者所在機構進行分析,而且高產作者按照第一作者和全作者分別進行統計。以第一作者發文最多的作者是蘇芳荔,其次是魯晶晶,鄭德俊等人并列第三。而對全作者進行統計分析,排在第一位的仍是蘇芳荔,鄭德俊位居并列第一,魯晶晶仍然排在第二位,其余作者并列第三。
發文最多的機構是南京農業大學信息管理系,其次是南京大學信息管理系、鄭州航空工業管理學院信息科學學院以及中國科學院文獻情報中心,排在第三位的是武漢大學信息管理學院。
(4)高頻關鍵詞。對數據集中文獻的關鍵詞進行統計分析,可以大體了解引用認同研究的主要內容。在統計分析的過程中,對同義詞進行合并,如實證研究、實證分析以及實例分析的含義相似,都合并為實證研究。表2列出了國內引用認同研究頻次大于1的18個關鍵詞。由表2可知,國內的引用認同研究主要是對(作者)引用認同、期刊引用認同、機構引用認同的實證分析。

表2 國內引用認同高頻關鍵詞
3.1 不同研究對象的引用認同實證研究
從國內外引用認同的研究文獻來看,引用認同主要包含三個研究對象:作者、期刊和機構。
White利用引用認同對8位信息科學家的引用認同進行了分析,正式提出了引用認同的概念。[2]Cronin和Shaw以3個圖情領域的教授為研究對象,分析了他們的引用認同。[5]2004年,White選取了來自不同學科的28位作者進行了引用認同的分析,把引用認同的研究拓展到了圖情領域之外。[6]高歌在其碩士論文中,利用引用認同在臨床神經學領域進行了分析。[7]這些研究都是以作者為分析對象進行的引用認同研究。
2006年,Ellen Nebelong-Bonnevie將引用認同的研究對象擴展到期刊,利用期刊引用認同作為期刊評價的指標對《Journal of Documentation》的引用認同進行了分析。[8]鄭德俊和葉繼元對期刊引用認同引申的期刊評價指標有效性進行了研究。[9]
魯晶晶等提出將引用認同方法用于科研機構的分析,選取印第安納大學圖書情報學院作為研究對象,研究該機構的引用認同,結果表明:引用認同方法可以用來分析機構的科研引用模式、科研領域布局和研究動向以及發現潛在的科研合作對象。[10]蘇芳荔對機構引用認同和機構合作進行了對比研究。[11]從構建的數據集來看,國外還沒有看到有機構引用認同研究的成果。
3.2 多數據源選取的引用認同研究
國外引用認同的分析大多數都是基于Web of science數據庫,但是該數據庫自身收錄的期刊種類在全世界或者某個國家發行期刊中比例是非常低的,而引用認同要求對作者某一段時間內作品集的所有被引作者進行分析。因此,數據庫選取以及數據覆蓋的全面與否對于最終的結果是有一定程度影響的。
Bar-Ⅰlan選用Web of Science、Google Scholar和Citeseer作為數據源,并對這三種數據源在計算機科學領域分析中的優勢和不足進行了深入的分析。[12]Cronin和Shaw選取網絡資源、圖書館館藏、作者個人簡歷等多種來源獲取該學者的作品集,然后利用web of science數據庫來收割分析對象所引用的作者列表。[13]
3.3 引用認同研究方法研究
引用認同的研究涉及分析對象作品集構建、引用對象的提取、引用對象與分析對象關聯強度的分析以及在定量分析基礎上的定性分析。每一個步驟對于最終的分析結論都有一定程度的影響。White主要是基于Dialog來檢索數據,如果作者X在他的5篇文獻當中,每篇都引用作者Noam Chomsky兩次,則X對Noam Chomsky的引用認同為5,而不是10,而且對于重復引用的次數統計,作者被引n次,重復引用次數應該為n-1,White指出由于Dialog系統只給出被引次數,他沒有進行調整,把被引大于1的引用看做是重復引用。[2]
Ellen Nebelong-Bonnevie將引用認同的研究對象從作者擴展到期刊,他在期刊引用認同研究中,將White的引用認同度量方法進行改變,提出用期刊參考文獻總數/被引期刊數得到的比值來計算期刊的引用認同,與White提出的用絕對被引次數來計算引用認同方法不同。魯晶晶等在研究機構引用認同時,對于采集到的機構的被引數據沒有進行去重處理,引用中出現1次,則引用認同的數值加1,也就是說,對于同一篇文獻的多次引用,引用認同值是累加的。[10]
本文利用文獻計量的方法對國內外的引用認同研究進行了系統的梳理,采用定量和定性相結合的方法對該主題的研究進行了深入的分析。從國內外的研究來看,引用認同作為引文分析的重要組成部分,具有很重要的研究價值,既可以用于描述特定作者、期刊、機構的研究主題和主題的遷移,也可以用于評價作者、期刊、機構等對象的寫作風格、研究的廣度和深度、影響力以及引用行為特征等,是一個非常重要的研究領域。然而,國內外相關研究也存在不足之處,總體而言還不太成熟,成果不夠豐碩。在現有的研究中,對于引用認同系統化的研究成果還相對較少,對于如何才能更加科學的搜集到某個作者、某個機構以及某個期刊的引用認同數據,缺乏全面的檢索工具和自動化的分析手段,以及如何才能進行大批量的引用認同分析,擴大引用認同研究對象數量的研究比較缺乏。同時,對于如何度量引用認同數值以及引用認同適用性的研究也有待進一步加強。隨著更多的方法研究和實證研究的出現,將會更有力的推動該研究領域的發展。
[1]Cronin B,Atkins H B.The Web of Knowledge:A FestschriftinHonorofEugeneGarfield[M].Medford:ⅠnformationToday,2000:475-496.
[2]White H D.Authors as citers over times[J].Journal of the American Society forⅠnformation Science and Technology,2001,52(2):87-108.
[3]魯晶晶,等.引用認同研究進展分析[J].圖書情報工作,2010,54(20):45-48.
[4]張勤,馬費成.國外知識管理研究范式——以共詞分析為方法[J].管理科學學報,2007,12(6):65-74.
[5]CroninB,ShawD.Ⅰdentitycreatorsandimagemakers: usingcitationanalysisandthickdescriptiontoputauthors in their place[J].Scientometrics,2002,54(1):31-49.
[6]WhiteHD.Reward,persuasion,andthesokalhoax:a study incitation identities[J].Scientometrics,2004, 60(1):93-120.
[7]高歌.基于引用認同的學科前沿熱點研究[D].吉林:吉林大學,2011.
[8]Nebelong B E,Frandsen T.Journal citation identity and journal citation image:a portrait of the journal of Documentation[J].JournalofDocumentation,2006, 62(1):30-57.
[9]鄭德俊,葉繼元.期刊引用認同及其被引評價新指標有效性分析[J].中國圖書館學報,2010,36(4):106-114.
[10]魯晶晶,等.引用認同用于科研機構分析的探討[J].圖書情報工作,2011,55(6):53-56.
[11]蘇芳荔.機構引用認同和機構合作的比較研究[J].情報理論與實踐,2012,35(11):125-128.
[12]Bar-Ⅰlan J.An Ego-centric citation analysis of the works ofJ].Ⅰnformation Processing&Management, 2006,42(6):1553-1566.
[13]Cronin B,Shaw D.Peers and spheres of influence: situating rob kling[J].Ⅰnformation Society,2007, 23(4):221-233.
G250.252
A
1005-8214(2014)08-0042-04
任紅娟(1979-),女,鄭州航空工業管理學院講師。
2013-07-04[責任編輯]菊秋芳
本文系教育部人文社會科學研究青年基金項目“引用認同的相關規律及其應用研究”(項目編號:12YJC870022),國家社科基金項目“引用認同和引證形象在引文分析中的應用研究”(項目編號:13TQ039)的研究成果。