宋玲玲
摘 要:嘗試將Altmetrics的應用指標融入高校圖書館學科數據服務,由新的替代計量視角來正面影響高校智慧圖書館的定位。本研究以2017~2021年近5年的Altmetric Top100 論文數據指標為研究對象,對其發表時間、來源期刊和研究學科主題開展統計檢驗和比較分析,討論這些特征的動態演化情況,并對影響Altmetric Top100論文的主要因素,采用描述性統計分析、相關性統計分析以及回歸模型分析等方法綜合探討。在研究影響Altmetric Top 100論文的主要因素的基礎上,立足于Altmetrics 思維提出數智時代高校圖書館學科數據服務的新途徑。
關鍵詞:Altmetrics;特征分析;影響因素分析;學科數據服務
當前,在線科學交流迅猛發展,引文至上的傳統學術評價體系已經不能完全滿足科研需求,Altmetrics以其廣泛的數據源,新穎的研究視角,精細的影響力評價受到學者們的密切關注。本研究以 Altmetric Top100 論文數據指標為樣本,研究分析高 Altmetrics 指標論文特征的動態和演化,并力求在現有基礎框架上,立足Altmetrics 研究思維,提出數智時代高校圖書館學科數據服務新思路,以期為數智時代高校智慧圖書館學科數據服務以及相關的研究領域提供一定的參考依據。
一、研究設計
1.數據來源及采集
Altmetric.com自2014年開始至2020年期間每年都會公布Altmetric分數(Altmetric Attention Score)排名前100的論文即Altmetric Top100(時間為每年的11月中旬或12月份左右),它們普遍在社交媒體中提及量相對較高,具有典型性和代表性研究價值。其官方網站每年公布的數據信息包含Altmetric Top100論文的Altmetric分數(Altmetric Attention Score)、學科分布(Subjects)、來源期刊(Journal/Collection Title)、出版日期(Publication Date)以及綜合計量Altmetric分數時所依據的社會大眾對論文的關注度(新聞報道中被提及討論的次數)(Number of news stories)等等最多共計47項。
本研究數據來源及采集具體步驟為:
自www.altmetric.com官方網站和https://figshare.com網站取得Altmetric TOP100 論文。
(1)根據api.altmetric.com 所提供的 API,選定近5年來的TOP100論文的元數據作為數據樣本;由于Altmetric Top 100數據也會上傳至 Figshare 網站,考慮到Altmetric.com自2021年沒有繼續發布提供Altmetric Top 100論文的數據,因此從Figshare 網站獲取2021年的Altmetric Top 100論文數據;
(2)根據文獻DOI的唯一持久性,由Altmetric TOP100 論文在Altmetric.com官方網站獲取的DOI繼續在WoS 數據庫匹配下載 TOP100 論文相應的文獻數據作為共同數據樣本。
其中從 api.altmetric.com 共計獲取 Altmetrics 近5年的 TOP100 論文的元數據13100條,從WOS 數據庫共計獲取1500條相關研究數據。
數據收集時間為2022年9月。
2.研究方法及數據處理
首先,就Top100論文發表時間的分布、來源期刊的分布及學科的分布等進行統計分析。其次,運用Stata和SPSS軟件對數據指標先后進行描述性統計分析、相關性統計分析、多元線性回歸模型分析等,測度Top100 論文各數據指標、論文在 WOS 數據庫的文獻指標之間的聯系,檢驗分析并探討影響高 Altmetrics指標論文的學術影響力的因素,并在此基礎上提出數智時代高校智慧圖書館學科數據服務的模式及策略。
3.變量設定
本研究選取2017~2021年近5年公布的共計500篇TOP100指標論文和其DOI匹配的WOS文獻數據為研究指標數據對象。依據前人相關研究以及在社交媒體中的數據提及量和受關注量,為了保證結果的準確客觀,更好地觀察指標演變特征,最終確定Stories、Tweets、Facebook、Reddit、Blog、Google+、Mendeley、Videos、Wikipedia、Dimensions典型數據指標為解釋標量,它們是該研究中的自變量。
4.回歸模型設計
本研究所有變量均滿足正態分布條件,所以,本研究選定多元線性回歸數學模型進行分析。
根據多元線性回歸模型表達公式:
ya=β0+β1x1a+β2x2a+…+βkxka+εa
綜合考慮論文指標多方面的影響因素,避免單一指標之間影響的缺陷,本研究集合能夠一定程度代表論文影響力的WOS數據庫的文獻指標和Altmetric分數(以下簡稱As)指標,并將其他影響因素固定的邊際作用考慮在內,進行多元線性回歸模型分析,以探測論文指標的真實影響。
二、研究結果與統計分析
本研究共構建四個回歸模型,顯示TOP 100指標論文的10個典型數據指標因素對因變量影響分析結果。
模型一,所有自變量對被引頻次TC的影響模型數據分析??梢钥闯觯琋ews對應的相關系數為-.403***,Tweets對應的相關系數為-.015***,顯而易見,論文在新聞報道中提及討論的次數與被引頻次呈顯著負相關關系。同樣,論文被推文提及討論的次數與被引頻次也呈顯著負相關關系,且都是在1%水平下顯著,即論文在新聞報道中提及討論的次數越多,對被引頻次的影響就越低,論文被推文提及討論的次數越多,對被引頻次的影響就越低。此外,Mendeley對被引頻次TC的相關系數為-.197**,在5%水平下顯著負相關,其余變量對TC并沒有產生顯著影響。
模型二,所有自變量對論文最近180天的使用次數U1的作用模型數據分析??梢钥闯觯宰兞糠謩e與最近180天的使用次數(U1)呈一定的負向相關關系,且均不顯著。從這里可以看出,這些自變量分別對最近 180 天的使用次數U1的影響比較小,從側面可以反映出WOS數據庫中的此類文獻指標,還不能顯著影響到As的大小。
模型三,所有自變量對2013 年至今的使用次數U2的影響模型數據分析??梢钥闯?,News與WOS數據庫中文獻指標2013 年至今的使用次數U2在1%水平下呈顯著負相關關系,相關系數為-.424***。Tweets與WOS數據庫中文獻指標2013 年至今的使用次數U2在5%水平下呈顯著負相關關系,相關系數為-.012**。Mendeley、Reddit、Wikipedia分別與WOS數據庫中文獻指標2013 年至今的使用次數U2在10%水平下呈顯著負相關關系,由數據可以看出News對U2的影響最為明顯,其值最高。其他變量對2013 年至今的使用次數U2沒有顯著影響。
模型四,所有自變量對As的影響模型數據分析??梢钥闯?,As和這10個自變量均呈現出正相關關系,所有自變量均能對As產生影響,且數值越高,對As影響越大,其中影響最大的是News、Blog這兩個變量。
三、討論分析
第一,論文發表時間演變層面。Altmetrics的指標對最新的研究論文成果的響應和反饋速度較引用指標快。社交網絡高速發展,高Altmetrics指標論文社交媒體討論度發展近5年來一直趨于大體上升態勢,公眾尤其是科研人員對在線網絡的交流討論的依賴性持續走高。
第二,近5年期刊演變特征分布層面。國際綜合性期刊《Nature》《Science》論文總數名列前茅,近5年來TOP100論文發表總數最多的是《Nature》,其科技價值和權威影響力可見一斑。排名前三的TOP100論文來源期刊影響因子普遍較高,均為自然科學類權威期刊,且均為Q1 區期刊。Altmetrics 指標論文能夠在一定程度上反映學術論文的質量。Altmetrics 不僅能夠衡量已發表期刊論文的關注情況,還可以衡量非期刊預印本平臺中論文的受關注情況。大部分期刊都可開放獲取,這也能夠推動人們對論文網絡的關注。
第三,研究學科主題特征演變層面。備受大眾社交媒體關注的論文學科類別為醫學和健康科學類、人類社會研究類、物理科學類以及信息與計算科學類,且高 Altmetrics 指標論文一直以醫學與健康科學為主導,國際科技論文在醫學領域比較集中,論文的As高,大眾媒體對其傳播也更加廣泛,其社會影響力也會增強,會促進科研人員對該論文的引用,從而提升了論文的學術影響力。
第四,由變量描述性統計分析和相關性分析來看,近5年來TOP100學術論文在社交媒體和大眾評議上引起的關注度普遍很高,體現了較強的學術影響力,且彰顯了較高的社會影響價值。論文被推文提及討論的次數能夠影響其As,且該次數越多As越高。論文被引頻次對于As的增長貢獻不大。
第五,由多元線性回歸模型結果分析來看,論文在新聞報道中提及討論的次數、論文被推文提及討論的次數與被引頻次呈顯著負相關關系,論文在新聞報道中提及討論的次數越多,對被引頻次的影響就越低。同樣,論文被推文提及討論的次數越多,對被引頻次的影響就越低。News、Tweets與U2、Mendeley、Reddit、Wikipedia分別與WOS數據庫中文獻指標2013 年至今的使用次數U2呈顯著負相關關系。所有自變量對As的影響均呈現出正相關關系,即所有自變量均能對As產生影響,且數值越高對As影響越大,其中影響最大的是News、Blog這兩個變量。
總之,Altmetrics以其對高水平文獻反饋速度快、影響廣、泛度高社會關注量大等優點,一定程度上彌補了傳統計量指標存在的局限性、時滯性,論文發表的“負的馬太效應”等。嘗試將Altmetrics的應用指標融入高校圖書館學科數據服務中,由新的替代計量視角來正面影響高校智慧圖書館的定位會有更好的前景。
四、對高校圖書館學科數據服務的深入研究
數智時代,Altmetrics數據評價指標的推廣,為高校圖書館學科數據服務帶來了新的發展機遇和挑戰。高校智慧圖書館建設需要更為豐富的館藏資源,需要高效過濾學科信息,及時向科研人員推送學術成果,研究本校專家學者的學術影響力等,Altmetrics數據評價工具以其發現和評價的核心功能可以被有效運用到其中。高校圖書館應及時更新智慧學科數據服務理念,考察用戶個性化需求,在多渠道宣傳引導Altmetrics數據評價指標使用的基礎上,鼓勵科研人員、高校教師將Altmetrics數據評價指標作為科研項目立項和評估的標準之一,呼吁電子出版商支持Altmetrics數據評價指標的開發和融入。高校圖書館學科數據服務既可以使用Altmetrics數據,也可以將其作為數據來源。高校圖書館應充分抓住此優勢,為高??蒲性u估、雙一流高校學科資源建設,提供創新型思路創新服務。
1.學科知識檢索層面
區別于傳統文獻檢索方式,引入Altmetrics數據指標之后的知識檢索,深度挖掘文本數據,實現個性化檢索,不僅可以采用主題檢索、關鍵詞檢索、全文檢索、摘要檢索和作者檢索等傳統檢索方式,還可以通過轉載量、討論量、瀏覽值、收藏量、推薦值和關注值等來提供檢索。并且,在此數據指標基礎上,來源期刊分布、學科主題分布都比較明顯,系統可以進行同行專家評議、開放共享數據和文獻收藏保存等,實現相關可視化推送,提高了時效性和精確性。
2.學科資源建設層面
館藏建設優化,學科資源建設是高校智慧圖書館發展的關鍵之一。其所選期刊或文獻資源是否可以納入館藏系統,可以將Altmetrics替代計量數據分析作為主要衡量依據之一。例如,高校圖書館可以考慮將一些開放獲取且學術影響力較高的期刊,如PLOS等OA資源納入學科資源來優化館藏建設。但是,在這個過程中要注意的是,不同的在線數據庫的Altmetrics指標類型不盡相同,數據來源多種多樣,如何用這些數據指標來源規范學科,高效選擇,客觀甄別,這對于高校圖書館運用Altmetrics替代計量指標服務教學科研來說是一個挑戰。
3.學科評估層面
在學科評估層面,專家學者對我國高校學科評估的研究主要體現在學科價值取向、國家政策影響、學科評估的影響因素和重點學科評價體系等方面,而且學科評估工作主要是基于CNKI、WOS、SCOUPS 等數據庫的引文資源數據來實現的,但除了學術文獻資源引文數據外,視頻資源、在線講義、電子書和音頻等學術資源并沒有提供引文數據,因此,學科評估系統有力引入Altmetric替代計量工具,采用Altmetric數據指標進行在線評估,發揮其開放性和智慧性評估優勢,能夠為高校學科評估作出貢獻。
4.特色數據庫建設層面
高校特色數據庫是根據高校發展特色來組織、建立、存儲和管理的特色館藏數據庫。高校圖書館可以將Altmetric數據指標組織整合進入特色數據庫,追蹤、評議高校特色學科發展成果的影響力,優化建設模式,提高高水平特色文獻反饋速度、影響廣泛度和社會關注度等。
參考文獻:
[1]曹麗江.基于Altmetrics的學者影響力綜合評價研究[D].蘇州:蘇州大學,2017.
[2]趙蓉英,王 旭.引入Altmetrics指標的學術期刊影響力評價研究——以國際圖書情報學期刊為例[J].圖書與情報,2018(5):1-10.
[3]楊 柳,陳 貢.Altmetrics視角下科研機構影響力評價指標的相關性研究[J].圖書情報工作,2015,59(15):106-114,132.
[4]雷淑義,呂先競.Altmetrics視角下的學術圖書影響力評價研究[J].西南民族大學學報(人文社科版),2017,38(6):225-231.
[5]余厚強,邱均平.替代計量學視角下的在線科學交流新模式[J].圖書情報工作,2014,58(15):42-47.
[6]魏思廷.結合替代計量學的數字圖書館知識服務新模式[J].圖書情報知識,2015(2):87-92.
[7]劉麗敏,王 晴.融合Altmetrics的圖書館服務增值業態及優化路徑[J].現代情報,2016,36(6):95-99.
[8]趙蓉英,王 旭.中美國際OA期刊影響力評價與比較[J].情報資料工作,2019,40(2):5-13.
[9]楊 昭.大數據時代高校圖書館世界一流學科評價服務研究[J].圖書與情報,2018(5):81-86.
[10]陳 銘,葉繼元.中文Altmetrics數據整合分析平臺的建立研究[J].大學圖書館學報,2022,40(04):110-119.
[11]周子番,邱均平,魏開洋.從文獻計量學到“五計學”:計量學方法的演化與發展[J].情報雜志,2021,40(10):171-178.
[12]魏思廷.結合替代計量學的數字圖書館知識服務新模式[J].圖書情報知識,2015(02):87-92.
[13]葛夢蕊,曾建勛.補充計量學在圖書館資源發現系統中的應用研究[J].圖書館建設,2017(11):41-48.
(作者單位:中國民航大學圖書館)