999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Altmetrics的睡美人文獻識別方法研究

2023-11-21 09:48:46陳華芳
情報學報 2023年10期

向 菲,陳華芳,沈 桐,2,曹 廣,劉 艷

(1. 華中科技大學同濟醫(yī)學院醫(yī)藥衛(wèi)生管理學院,武漢 430030;2. 華中科技大學同濟醫(yī)學院附屬同濟醫(yī)院,武漢 430030;3. 浙江省人民醫(yī)院,杭州 310014)

互聯(lián)網(wǎng)和社交媒體平臺的發(fā)展,使學術(shù)成果的傳播渠道得到進一步拓展,除傳統(tǒng)的期刊、圖書形式外,社交軟件、學術(shù)博客、視頻、論壇等成為學術(shù)成果傳播的新渠道。傳播渠道的拓展將學術(shù)成果的受眾范圍從同行業(yè)的學者擴大到社會大眾,學術(shù)成果影響力的體現(xiàn)形式也不僅局限于傳統(tǒng)的文獻被引頻次,還包括社交媒體平臺上的轉(zhuǎn)發(fā)、收藏、評論、反饋等[1]。Altmetrics 正是對社交媒體平臺上學術(shù)成果使用情況的測量。從本質(zhì)上看,Altmetrics 和被引頻次均是對學術(shù)成果影響力的計量,那么,由于論文內(nèi)容早熟、超前、顛覆等原因?qū)е略谝闹谐霈F(xiàn)的“睡美人”現(xiàn)象,在Altmetrics 中也同樣存在。因此,僅從引文、學術(shù)影響力的角度定義“睡美人文獻”是不全面的,睡美人文獻的概念、識別方法需要從Altmetrics 的角度進行補充。

睡美人文獻通常是富有價值的文獻,但一開始并不為人所知,導致知識浪費。社交媒體平臺具有用戶體量大、覆蓋范圍廣、傳播速度快等特點,實現(xiàn)Altmetrics 睡美人文獻的早期識別,有利于充分挖掘文獻價值,提高文獻利用率;有助于知識在社交媒體上的快速傳播,縮短公眾科學認知時滯,提升公眾智慧;可以反映公眾對于科學的關(guān)注,激發(fā)學者研究興趣。識別現(xiàn)有的睡美人文獻,是實現(xiàn)睡美人文獻早期識別的第一步。只有準確地識別出睡美人文獻,才能進一步分析睡美人文獻的沉睡原因以及檢驗睡美人預(yù)測模型的效果。

1 研究背景

1.1 睡美人文獻

睡美人文獻最早被稱為“阻滯發(fā)現(xiàn)”(resisted discovery)。1961 年,Barber[2]發(fā)現(xiàn),因為一些文化和社會原因,科學家們會對一些科學發(fā)現(xiàn)產(chǎn)生抵制。后來,Stent[3]認為這類科學發(fā)現(xiàn)遠超當時背景下科學家們的認知水平,與公認的知識不一致或無法在技術(shù)上被證實,屬于早熟的、超前的,于是將這類發(fā)現(xiàn)稱為“早熟發(fā)現(xiàn)”(premature discovery)。1980 年,Garfield[4]在總結(jié)這兩類發(fā)現(xiàn)的基礎(chǔ)上,提出了“遲滯承認”這一概念,是指這些論文在發(fā)表之后被閑置或不受重視,直至多年后被“重新發(fā)現(xiàn)”(承認),重新發(fā)現(xiàn)的過程可能是漸進的,也可能是突然的。2004 年,van Raan[5]引用經(jīng)典童話故事“睡美人”,定義發(fā)表后長時間沒有受到關(guān)注(“沉睡”)而后突然收獲大量引用(“被王子喚醒”)的出版物為睡美人文獻。

1.2 識別方法研究現(xiàn)狀

目前,關(guān)于引文的睡美人文獻識別方法已有較多研究,根據(jù)方法特性可將其大致分為4 類:人為參數(shù)類、客觀指標類、曲線擬合類和數(shù)據(jù)變換類[6]。

Garfield[7]以平均數(shù)為基礎(chǔ),提出總被引頻次高、前5 年及以上(最好10 年以上)的被引頻次接近每年1 次的為睡美人文獻。van Raan[5]制定了睡眠時間、睡眠深度和喚醒強度3 個指標用于識別睡美人文獻。①睡眠時間:連續(xù)處于睡眠狀態(tài)的時間為5~10 年;②睡眠深度:在睡眠期間,每年被引頻次不超過1 時為深度睡眠,大于1 且不超過2 時為深度睡眠不足;③喚醒強度:被喚醒后連續(xù)4 年總被引頻次大于20 則為蘇醒,總被引頻次越高,喚醒強度越大。

Costas 等[8]參考四分位數(shù)定義提出3 個指標:Year50%、P25、P75,將文獻劃分為普通論文、曇花一現(xiàn)、睡美人文獻3 類,發(fā)現(xiàn)不同類型論文的引用過程不同。Wang[9]根據(jù)論文自發(fā)表后被引頻次的積累過程提出“被引速率”。基于此,杜建等[10]結(jié)合年度累計被引頻次的標準差概念,提出延遲承認指數(shù)(delayed recognition index,DRI)。Li 等[11]參考基尼系數(shù)提出了Gs 指數(shù),計算睡眠文獻覺醒的概率。Sun 等[12]對Gs 進行改進,提出文獻老化向量,對睡美人文獻的檢測結(jié)果更加精準。Ke 等[13]提出了無參數(shù)指標“美麗系數(shù)”(beauty coefficient,B),用于量化一篇論文在多大程度上可以被視為睡美人文獻。杜建等[14]對被引速率和美麗系數(shù)兩種指標的識別結(jié)果進行對比分析發(fā)現(xiàn),美麗系數(shù)只考慮了論文發(fā)表年至最高被引頻次年的過程,而不是全部的引文窗口;被引速率反映了全部的引文窗口,但不能直接篩選出睡美人文獻。因此,2018 年杜建等在美麗系數(shù)的基礎(chǔ)上提出了一個新的無參數(shù)指標Bcp[15]。Teixeira 等[16]參考標準差概念提出了K 指數(shù)。同樣考慮引用分布的離散程度,唐潔等[17]引入變異系數(shù)設(shè)計了PCV 指數(shù)(product of CVyearlyand CVaccumulative,PCV)。

宋呈玉等[18]為了能夠更簡便、快速地識別睡美人文獻,將引用曲線均擬合為二次函數(shù),根據(jù)函數(shù)對稱軸與坐標軸的距離來識別睡美人文獻。侯劍華等[19]則借助Logistic 曲線擬合引文累積曲線,設(shè)計累積引文睡美人指數(shù)(cumulative citation sleeping beauty index,Cc Index)。從曲線擬合類的識別方法中可以看出,指標的計算結(jié)果會受到曲線擬合效果的影響,對于給定的曲線模型,擬合效果差時計算結(jié)果會出現(xiàn)嚴重偏差,若在應(yīng)用時加入擬合優(yōu)度約束,則識別率下降。

1.3 小 結(jié)

目前基于引文的睡美人文獻研究已經(jīng)有了一定進展,而基于社交媒體角度的睡美人文獻研究才剛剛起步[20-21]。Altmetrics 指標與被引頻次并不完全相關(guān)[22-28],兩類指標的累積情況也不完全相同[29],因此基于Altmetrics 的睡美人文獻不能直接照搬基于引文的睡美人文獻相關(guān)結(jié)論,兩類睡美人文獻的對比研究可能反映指標的差異,因此,研究基于Altmetrics 的睡美人文獻是有必要的。

2 研究數(shù)據(jù)

2.1 數(shù)據(jù)來源

Altmetric.com 可以追蹤文章在多個社交媒體平臺上的關(guān)注,指標豐富,覆蓋面廣,共有15 個指標帶有時間標簽:News、Blog、Policy document、Patent、Twitter、Peer review、Facebook、Wikipedia、Google+ 、 LinkedIn、 Reddit、 Pinterest、 F1000、Q&A、YouTube。通過其提供的Altmetric Explorer獲取文章,學科主題限定為“Medical and Health Sciences”,文獻類型限定為“articles”,為保證文章至少有3 年的累積時間,限定發(fā)表日期在“2018-11-30”之前的文章。檢索時間為2021 年12 月21日,檢索到685 萬余篇文章,其中475 萬余篇文章?lián)碛嘘P(guān)注分值(Altmetrics attention score,AAS)。根據(jù)睡美人文獻定義,睡美人文獻一定具有高關(guān)注度,參考高被引論文的界定方法[30],選取關(guān)注度排名前1%的文章共47533 篇為高關(guān)注度文獻(相同分值文獻一并納入)。由于Altmetric Explorer 每個指標只提供最新的1 萬條關(guān)注信息,因此,舍去部分指標數(shù)據(jù)缺失的文章,研究實驗集共47510 篇文獻,數(shù)據(jù)獲取時間為2021 年12 月21—25 日。

各指標值表示文章在不同來源平臺上的關(guān)注計數(shù)。Altmetric.com 根據(jù)指標來源平臺的影響覆蓋范圍賦予不同權(quán)重[31],AAS 的計算方法為

2.2 文獻的關(guān)注累積特征

統(tǒng)計實驗集中文章的關(guān)注累積過程所需時間,結(jié)果如表1 所示。有接近50%的文章的首次關(guān)注發(fā)生在發(fā)表前后一周內(nèi),約39%的文章在正式發(fā)表之前被提及,其中有接近3%的文章提前一年在社交媒體平臺上被提及,可見社交媒體平臺的發(fā)展使得文章可以更早獲得關(guān)注,甚至可以在正式發(fā)表前得到關(guān)注。與引文相比,Altmetrics 對文獻的關(guān)注反應(yīng)非常迅速。全部文章中有14%的文章在發(fā)表后一年內(nèi)才獲得首次關(guān)注,主要是因為“Altmetrics”概念于2010 年才被提出,2010 年以前發(fā)表的文章約占總文章數(shù)的12.14%,彼時社交媒體平臺還未發(fā)展普及,鮮有人在平臺上交流學術(shù)論文。2010 年前發(fā)表的文章在發(fā)表一年后才得到首次關(guān)注的文章占比約80%,2010 年后(包括2010 年)每年發(fā)表的文章中一年后才獲得首次關(guān)注的文章占比逐年下降(圖1)。在2010 年后隨著社交媒體平臺的推廣和使用用戶的增長,文章在發(fā)表后一周內(nèi)獲得首次關(guān)注的比例呈上升趨勢(圖1),文章更及時地在平臺上進行傳播,受到關(guān)注的學術(shù)論文占比逐漸增加。從文章關(guān)注累積各階段的平均時間也可以證明,雖然所有文章獲得首次關(guān)注的平均時間為341.04 天,但2010 年后(包括2010 年)發(fā)表的文章平均時間約為-0.63 天。由此可見Altmetrics 對于文獻關(guān)注的反應(yīng)速度。

圖1 不同年份文章正式發(fā)表后一段時間獲得首次關(guān)注的比例

表1 關(guān)注累積達不同階段所需時間的文章統(tǒng)計

文章從獲得首次關(guān)注到關(guān)注累積達25%所需時間平均值為675.86 天,從25%到50%所需時間平均值為186.32 天,從50%到75%需227.91 天,從75%到100%需889.49 天。關(guān)注累積過程平均時間如圖2所示,文章前期的關(guān)注積累比較緩慢,在有了一定關(guān)注基礎(chǔ)后,關(guān)注累積速度會加快,達到關(guān)注高峰后慢慢減少至零,類似Logistic 曲線。

圖2 文章累積關(guān)注的平均時間

在發(fā)表后一周之內(nèi)累積25%、50%關(guān)注的文章約占25%、20%,由此可見,Altmetrics 能夠及時反映文章的關(guān)注情況。若以周、月或年為單位觀察關(guān)注變化,則無法反映關(guān)注的迅速累積和文章間的差異性,91%的文章在發(fā)表后一年以上才失去關(guān)注,若以小時為單位分析全部關(guān)注累積曲線則過于繁雜,故研究關(guān)注的累積變化過程以天為單位更合適。

3 基于Altmetrics 的睡美人文獻識別方法設(shè)計

睡美人文獻是指發(fā)表后長期沒有受到關(guān)注,后突然被喚醒獲得大量關(guān)注的文獻。Altmetrics 主要體現(xiàn)的是文獻在社交媒體平臺上的受關(guān)注情況,因此,Altmetrics 睡美人文獻是指在社交媒體平臺上,獲得關(guān)注的時間比普通論文更晚,喚醒后迅速累積大量關(guān)注的文獻。參考基于引用的睡美人文獻分析結(jié)果,Altmetrics 睡美人文獻應(yīng)具有以下特征:①具有較高關(guān)注度;②比普通論文更長的睡眠時間;③關(guān)注增長過程具有明顯的“突增”特征。

在對于目前引文睡美人文獻識別方法的學習基礎(chǔ)上,本文以Altmetrics 睡美人文獻的特征為核心,用無參數(shù)指標體現(xiàn),設(shè)計了基于Altmetrics 的睡美人文獻識別方法:Altmetrics 睡美人指數(shù)(Altmetrics sleeping beauty index,ASB 指數(shù))。

3.1 四分位法與Bcp指數(shù)識別效果評價

目前有許多基于引文的睡美人文獻識別方法研究,其中,四分位法和Bcp 指數(shù)避免了主觀因素的影響,在識別時不會受到被引頻次大小的限制,可以在不同的學科中推廣使用,但分析識別結(jié)果發(fā)現(xiàn)其仍存在一些不足。

3.1.1 四分位法

考慮到不同的年份、學科和文檔類型的適用性,Costas 等[8]參考四分位數(shù)的定義提出了3 個指標:Year50%、P25、P75。其中,Year50%是指論文出版后累積引用首次達到50%的年份;P25、P75 是Year50%值的分布函數(shù)的四分位數(shù),即同年同領(lǐng)域內(nèi)累積引用達到50%較快的25%、75%論文所需的時間[8]。根據(jù)這3 個指標將文獻劃分為3 類:①普通文獻,P25≤Year50%≤P75;②曇花一現(xiàn)文獻:Year50%

雖然睡美人文獻在不同學科中的存在比例有差異,但均應(yīng)低于10%[32],更有學者認為睡美人文獻的比例約為1%甚至更低[33]。然而,根據(jù)四分位法識別得到的睡美人文獻約占25%,遠大于10%,識別不夠精確。

3.1.2 Bcp指數(shù)

杜建等學者認為,B 指數(shù)存在沒有考慮全部引文窗口、忽視發(fā)表之初的被引情況、依賴總被引頻次等問題,對其進行改進,并提出Bcp 指數(shù)[15]。

圖3 為論文的年累積被引頻次百分比曲線,ct是指論文年齡為t時的累積被引百分比,tm是指累積百分比為100%的時間,直線連接累積曲線的起點(0,c0)和終點(tm,1)兩點做參考線l。計算直線l與曲線之間差值的總和,即lt-ct的總和,得Bcp 值,計算公式為

圖3 Bcp指數(shù)示意圖

Bcp 指數(shù)的計算依賴于圖形的相對形狀。如圖3 所示,Bcp 指數(shù)默認文獻的累積引文曲線為J 形,但侯劍華等[19]認為累積引文曲線呈邏輯曲線形增長。從實際情況來看,文獻的累積引文曲線是復(fù)雜多樣的,Bcp 指數(shù)在計算其他形式的引文曲線時,指數(shù)值可能會存在偏差。例如,在計算累積曲線為S 形曲線的文章的Bcp 指數(shù)時,曲線高于參考線的部分lt-ct的值為負,會削弱Bcp 指數(shù)值,對于已經(jīng)完成喚醒再次陷入睡眠的睡美人文獻識別效果不好。

通過實證檢驗發(fā)現(xiàn),通過Bcp 指數(shù)識別得到的睡美人文獻平均年齡較大[34]。在李賀等[35]的Bcp 應(yīng)用研究中可以看出,Bcp 指數(shù)高的文獻發(fā)表時間較早。例如,M 和N 兩篇論文的累積引文曲線與參考線如圖4 所示,可以看出,N 更符合睡美人文獻的“突增”特點,但由于年齡較短,N 的Bcp 值為2.21,而M 的Bcp 值為11.86。Bcp 指數(shù)的計算結(jié)果會受到引文窗口長度的影響,在年齡相同或相近的文章中影響不明顯,但是累積時間相差較多的文章進行比較時這種影響就會放大。對于Altmetrics 來說,論文的關(guān)注變化以天為單位,文章之間的時間差異大,這種誤差不能忽略。

圖4 論文M和N的Bcp指數(shù)示意圖

3.2 ASB指數(shù)設(shè)計與喚醒時刻識別

基于上述對于四分位數(shù)和Bcp 指數(shù)的分析,以Altmetrics 睡美人文獻的特征為核心,全面考慮累積曲線的可能形狀,降低論文年齡的影響,本文設(shè)計了一種基于Altmetrics 的睡美人文獻識別方法,稱為Altmetrics 睡美人指數(shù),簡稱ASB 指數(shù)。

3.2.1 ASB指數(shù)設(shè)計

睡美人文獻最重要的兩個特點是較長的睡眠時間和關(guān)注的突增,Altmetrics 睡美人文獻也是如此[36]。Bcp 指數(shù)所用的差值總和可以體現(xiàn)睡美人文獻的睡眠狀況,考慮到關(guān)注累積曲線的多樣,采用直線l:lt=1 作為參考線,如圖5 所示。論文年齡為t時的累積關(guān)注百分比記為At,論文睡眠時1 -At值較大,隨著關(guān)注的累積1 -At逐漸變小。對于Altmetrics 睡美人文獻的識別來說,睡眠時間越長、睡眠深度越深,1 -At的差值總和越大。由于預(yù)印本等因素的存在,部分文獻在正式發(fā)表之前,就已經(jīng)在社交媒體平臺上得到關(guān)注,為懲罰早期關(guān)注,只計算自發(fā)表之日(t=0) 起至關(guān)注累積百分比為100%時(tm)的差值總和,發(fā)表日期之前的差值不納入計算。

圖5 論文關(guān)注累積過程示意圖

如果論文在關(guān)注累積百分比達到90%以后,在很長一段里偶爾獲得少量關(guān)注,那么累積曲線會有很長一段“尾巴”接近于參考線,這可能會使1 -At的總和偏大,影響對Altmetrics 睡美人文獻的識別效果。為了降低這種影響,使用指數(shù)函數(shù)對參考線與曲線間的差值進行轉(zhuǎn)換,即e1-At- 1,擴大1 -At值的差距,使“尾巴”部分的值更接近于0,以降低影響。

選取論文關(guān)注累積首次達25%和50%的時間t25、t50,如圖5 所示。t50-t25的值表示關(guān)注的突增情況,t50-t25的值越小,論文的關(guān)注累積越集中,突增越明顯,且不會受到論文年齡的影響。

根據(jù)睡美人文獻的特征,論文前期關(guān)注越少,睡眠時間越長,后期關(guān)注增加越突然,ASB 指數(shù)值越大,越有可能是睡美人文獻。因此,計算∑(e1-At- 1)與t50-t25的比值,通過預(yù)實驗結(jié)果對公式進行改進,得ASB 指數(shù)值計算方法為

對于t25、t50是同一天的文章,t50-t25的值取0.5。

3.2.2 喚醒時刻識別

睡美人文獻在睡眠時遇到“王子”之后,受到的關(guān)注開始大量增加,即喚醒。Altmetrics 睡美人文獻的喚醒時刻,也是關(guān)注的突增時刻,喚醒前關(guān)注少,喚醒前后關(guān)注的增長量大、增長速度快,還可能出現(xiàn)連續(xù)增長[36]。張靖雯等[37]對比多種引文“起飛”時刻識別方法的正確率發(fā)現(xiàn),人為參數(shù)法對于睡美人文獻喚醒時刻的識別正確率最高,年度引文增長率指標次之,還可以識別多次喚醒時刻。在此基礎(chǔ)上,結(jié)合睡美人文獻的喚醒特征,對Altmetrics睡美人文獻喚醒時刻的識別方法進行設(shè)定。

以圖6 睡美人文獻的關(guān)注分布為例,at表示文章第t天獲得的關(guān)注,當at為喚醒時刻時,喚醒前關(guān)注為0 或接近于0,at值小,喚醒后呈現(xiàn)大量增長,at+1應(yīng)該遠大于at。將喚醒時刻(t,at)分別與前后兩點(t- 1,at-1)、(t+ 1,at+1)連線,兩條連線的斜率差距應(yīng)該較大。Eom 等[38]識別引文爆發(fā)時認為年引文增長率大于3 則為爆發(fā)增長,參考年引文增長率指標設(shè)定關(guān)注增長率指標r,在利用r識別突增時也以3 為標準。Altmetrics 睡美人文獻的喚醒時刻t的具體計算方法為

圖6 睡美人文獻的關(guān)注示意圖

考慮到at作為分母時可能等于0,對于小于1 的分母,at取1。

人為參數(shù)法的正確率高,但識別率低[37],對于采用公式(4)沒有識別出喚醒時刻的文章,可以考慮刪去條件at-1< 3、at< 3 后重新進行識別。

4 ASB指數(shù)識別效果檢驗

通過實證檢驗結(jié)果驗證ASB 指數(shù)對Altmetrics睡美人文獻的識別效果。首先,計算實驗數(shù)據(jù)中所有文章的ASB 指數(shù)值;其次,根據(jù)ASB 指數(shù)值大小排序后選取不同排名位置的文章;最后,從關(guān)注累積曲線、指標特征兩個方面進行比較,分析ASB指數(shù)的有效性。

將實驗數(shù)據(jù)的指數(shù)值從大到小排列,ASB 指數(shù)值的分布情況如圖7 所示,約80%的數(shù)據(jù)分布在[0,1500],頭部數(shù)據(jù)分散,符合睡美人文獻數(shù)量少的特征,ASB 指數(shù)值最高的10 篇文章值均大于57000。

圖7 ASB指數(shù)分布

4.1 關(guān)注累積曲線

按照排序結(jié)果分別取ASB 值最高、中位、末位各10 篇文章,其關(guān)注累積曲線如圖8 所示。

圖8 30篇文章的關(guān)注累積曲線

從累積曲線可以看出,ASB 值最高10 篇文章的累積曲線均呈凹形,自正式發(fā)表之后超過25000 天才獲得首次關(guān)注,有很長的睡眠時間,喚醒后在短時間內(nèi)迅速累積關(guān)注,幾乎呈直線上升,關(guān)注增長速度快,增長量大。中位10 篇的首次關(guān)注發(fā)生在發(fā)表日期附近,早期就有一定的關(guān)注累積。由于ASB 指數(shù)為0 的文章有275 篇,采用隨機數(shù)方法從中隨機抽取10 篇代表排名末位文章,末位10 篇文章的關(guān)注均發(fā)生在正式發(fā)表之前,其中有6 篇的首次關(guān)注發(fā)生在發(fā)表日期的一個月以前,另外4 篇發(fā)生在發(fā)表前一周內(nèi)。通過對比排名先后文章的關(guān)注累積曲線可以發(fā)現(xiàn),最高10 篇文章的曲線睡美人特征最明顯,中位10 篇次之,末位10 篇最差,ASB 指數(shù)識別睡美人文獻的效果良好。

4.2 指標特征

參考基于引文的睡美人文獻特征指標擬定下列指標,用于衡量ASB 指數(shù)的識別效果。

(1) 睡眠時長:有多次喚醒的文章有多次睡眠。第一次睡眠時長是指自文章正式發(fā)表之日起至喚醒時刻的時間間隔。文章喚醒后關(guān)注量先上升后下降,若關(guān)注度持續(xù)1 天以上(不包括1 天)低于3,則認為文章再次進入睡眠。第二次睡眠時長是從第一次喚醒結(jié)束、再次進入睡眠時開始直至下一次喚醒時刻止計算睡眠時長,以此類推。

(2)睡眠深度:文章處于睡眠狀態(tài)時所有關(guān)注量之和(包括喚醒時刻)占總關(guān)注的比值。

(3)喚醒強度:文章被喚醒后處于蘇醒狀態(tài)時關(guān)注量之和(不包括喚醒時刻)占總關(guān)注的比值。

(4)突增強度:即關(guān)注增長率,文章的每一次喚醒都有一個突增強度值。

計算ASB 值最高的10 篇文章的喚醒時刻,其中有5 篇文章存在多次喚醒,利用人為參數(shù)法可以識別出喚醒強度較低的時刻,識別準確率更高。ASB 值最高10 篇文章的睡美人文獻特征指標結(jié)果如表2 所示。對于有多次喚醒的文章,僅保留第一次喚醒時刻和睡眠時長,突增強度保留最值。由于大多數(shù)中位10 篇和末位10 篇中文章的關(guān)注發(fā)生時間早于正式發(fā)表時間,因此,不計算睡眠時長、睡眠深度、喚醒強度。根據(jù)喚醒時刻的計算方法計算突增時刻,中位10 篇和末位10 篇文章的關(guān)注累積特征如表3 所示。表2 和表3 中突增強度的最大值為592,最小值為3.375,文章的突增強度差距大,文章關(guān)注的累積形式不同,正如Garfield[4]所述,重新發(fā)現(xiàn)的過程可能是漸進的,也可能是突然的。

表2 ASB值最高的10篇文章的睡美人文獻特征指標結(jié)果

表3 中位10篇和末位10篇文章的關(guān)注累積特征

由表2 可知,指標最高10 篇文章中,除第7 篇外,其余文章的睡眠深度均小于10%,符合睡美人文獻睡眠時關(guān)注度低的特征;喚醒強度均大于90%,符合睡美人文獻喚醒后關(guān)注大量增長的特征;喚醒強度與睡眠深度差距不大,首次睡眠時長從上到下呈遞減狀態(tài),表明ASB 指數(shù)可以有效根據(jù)睡眠時長排序文獻可能成為睡美人文獻的概率。與第6 篇相比,雖然第7 篇睡眠時長更長,但由于睡眠深度、喚醒強度、突增強度比較低,所以,第7篇的ASB 指數(shù)比第6 篇低。

由表3 可以看出,中位10 篇文章的首次突增時刻在發(fā)表日期前后,均小于30,即在發(fā)表后的一個月內(nèi)就在社交媒體平臺上受到關(guān)注;末位10 篇文章的首次突增時刻均為負數(shù),即在文章正式發(fā)表之前,就已經(jīng)得到大量關(guān)注;表2 中最高10 篇文章的喚醒時刻為發(fā)表后70~190 年,遠超另外兩組文章,滿足睡美人文獻睡眠時間長的特征。從最高10 篇文章的排序結(jié)果和睡美人文獻指標特征來看,ASB指數(shù)識別效果良好。

4.3 與Bcp指數(shù)識別結(jié)果對比

計算實驗集中所有文章的Bcp 值,分別選出ASB 值、Bcp 值最高的10 篇文章,其特征如表4所示。

表4 ASB值、Bcp值最高的10篇文章特征

由表4 可以看出,相較于Bcp 值最高的10 篇文章,ASB 值最高10 篇文章的發(fā)表時間較晚,t50-t25較小,符合3.1.2 節(jié)的論述,Bcp 指數(shù)的計算結(jié)果會受到引文窗口長度的影響。ASB 值最高10 篇文章的關(guān)注分值平均值高于Bcp 值,更符合睡美人文獻具有重要價值的特征。ASB 值最高10 篇文章的t50-t25為0 或1,與Bcp 值最高10 篇文章相比,ASB 值的關(guān)注突增更明顯。與Bcp 指數(shù)相比,ASB指數(shù)考慮了Altmetrics 指標及時性強、反應(yīng)快的特點,更適用于識別基于Altmetrics 的睡美人文獻。

最高10 篇文章的睡眠深度平均值為8.03%,喚醒強度平均值為91.97%,杜建等通過Bcp 指數(shù)識別出的引文睡美人樣本集的睡眠深度平均值為28%[15],從側(cè)面反映了Altmetrics 指標的關(guān)注分布更為集中,基于引文的睡美人文獻識別方法不能直接應(yīng)用于Altmetrics。

5 結(jié) 論

本文選取累積時間足夠長的實驗數(shù)據(jù)用于分析Altmetrics 指標的累積特征,根據(jù)觀察結(jié)果選取合適的時間單位用于睡美人文獻的識別方法設(shè)計。根據(jù)基于Altmetrics 的睡美人文獻的特征,本文選取論文年齡為t時的累積關(guān)注百分比At,論文關(guān)注累積首次達25%和50%的時間t25、t50,用于設(shè)計基于Altmetrics 的睡美人文獻識別方法ASB 指數(shù)。以高關(guān)注度文獻作為實驗數(shù)據(jù),比較ASB 值最高、中位、末位各10 篇文章的關(guān)注累積曲線和指標特征,研究結(jié)果表明,ASB 指數(shù)對基于Altmetrics 的睡美人文獻識別效果良好。

本文存在一些不足:①很多文獻會提前在線上發(fā)布,并不是等到發(fā)表之日才公開,但由于無法獲取文獻的具體上線時間,本文在計算過程中采用文獻的正式發(fā)表日期作為發(fā)布時間。后續(xù)研究可以考慮跟蹤一段時間內(nèi)的文獻發(fā)布情況,以獲取準確的文獻發(fā)布時間。②目前,文獻在社交媒體平臺上的傳播還沒有完全普及,仍然有大量的文獻沒有關(guān)注分值,即使是排名前1%的文章關(guān)注分值也比較低。隨著社交媒體平臺的發(fā)展和用戶知識水平的提升,當公眾逐漸認識并主動關(guān)注學術(shù)成果時,可能會有越來越多的論文在社交媒體平臺上得到關(guān)注,學者們也更愿意在平臺上分享科研成果。在后續(xù)研究中可以嘗試加入引文數(shù)據(jù),將基于Altmetrics 的睡美人文獻分析結(jié)果與引文分析結(jié)果相互引證。未來需要進一步驗證ASB 指數(shù)在不同學科、不同平臺以及中文環(huán)境下的有效性。睡美人文獻具有重要價值,后續(xù)需要對睡美人文獻進行喚醒過程與文獻特征分析,發(fā)現(xiàn)更多的早期識別線索,實現(xiàn)睡美人文獻的早期識別。

主站蜘蛛池模板: 区国产精品搜索视频| 国产精品视频系列专区| 色屁屁一区二区三区视频国产| 久久久黄色片| 婷婷亚洲综合五月天在线| 国产亚卅精品无码| 欧美a在线看| 精品视频一区二区三区在线播| 亚洲va精品中文字幕| 东京热av无码电影一区二区| 亚洲日韩第九十九页| 国产精品13页| 国产乱子伦无码精品小说| 国产在线拍偷自揄观看视频网站| 丝袜美女被出水视频一区| 91色综合综合热五月激情| av大片在线无码免费| 欧美在线导航| 欧美精品亚洲日韩a| 亚洲妓女综合网995久久| 国产视频自拍一区| 91青草视频| 新SSS无码手机在线观看| 日韩激情成人| 国产精品私拍99pans大尺度| 91欧美在线| 国产免费看久久久| 婷婷丁香色| 日本午夜三级| 国产成人综合日韩精品无码首页| 在线a视频免费观看| 激情六月丁香婷婷| 992tv国产人成在线观看| 极品性荡少妇一区二区色欲| A级毛片无码久久精品免费| 露脸真实国语乱在线观看| 人妻中文久热无码丝袜| 精品撒尿视频一区二区三区| 欧美一区二区三区不卡免费| 亚洲日本一本dvd高清| 欧美精品不卡| 国产网站在线看| 精品国产女同疯狂摩擦2| 伊人狠狠丁香婷婷综合色| 最近最新中文字幕在线第一页| 亚洲国产在一区二区三区| 国产精品刺激对白在线 | 99无码中文字幕视频| 精品人妻AV区| 日韩精品成人网页视频在线| 毛片a级毛片免费观看免下载| 成人a免费α片在线视频网站| 久久6免费视频| 黄色成年视频| 日韩麻豆小视频| 97免费在线观看视频| 日韩美一区二区| 亚洲无码熟妇人妻AV在线| 久久久黄色片| 77777亚洲午夜久久多人| 亚洲高清无码精品| 国产精品美人久久久久久AV| 国产成人亚洲毛片| 996免费视频国产在线播放| 国产美女丝袜高潮| 国产精品v欧美| 日韩精品中文字幕一区三区| 色天堂无毒不卡| 欧美激情视频一区二区三区免费| 亚洲欧美成aⅴ人在线观看| 欧美一级99在线观看国产| 九九九国产| 狠狠色噜噜狠狠狠狠色综合久| 99久久国产综合精品女同| 日本在线免费网站| 国产欧美精品一区二区| 亚洲天堂成人| 亚洲香蕉久久| www.亚洲一区二区三区| 97久久人人超碰国产精品| 精品国产免费第一区二区三区日韩| 欧美日韩亚洲综合在线观看|