向 菲,曹 廣,沈 桐,3,陳華芳
(1.華中科技大學同濟醫學院醫藥衛生管理學院,武漢 430030;2.浙江省人民醫院,杭州 310014;3.華中科技大學同濟醫學院附屬同濟醫院,武漢 430030)
大多數論文的“生命周期”是發表初期被引用次數較少,逐漸上升至引用高峰后逐漸減少為0(死亡)。大多數論文在發表之后的10 年內死亡[1],然而,部分文獻在發表后由于某些文化或社會原因,經歷了較長時間才開始被大量引用,比一般文獻彰顯影響力的時間更晚,這類文獻被稱為“阻滯發現”(resisted discovery)[2],隨著研究的發展,也被稱為睡美人文獻[3]。
目前的睡美人文獻通常從引用的角度進行定義。但Altmetrics 表明,學術成果的受眾不僅有學者,還包括通過社交媒體平臺獲取成果的社會公眾。在社交媒體平臺上也有可能存在睡美人文獻。借鑒引文中睡美人文獻的定義,將基于Altmetrics的睡美人文獻定義為:在社交媒體平臺上,獲得關注的時間比普通論文更晚,喚醒后迅速累積大量關注的文獻[4]。
文獻是知識的重要載體,睡美人文獻在喚醒后能夠迅速累積大量關注,說明其本身具有重要價值。由于社交媒體平臺具有用戶體量大、覆蓋范圍廣的特點,實現Altmetrics 睡美人文獻的早期識別,有助于知識的快速傳播,提高公眾整體知識水平,推動公眾智慧的發展。因此,在確定睡美人文獻的識別方法后,應該對睡美人文獻的特征、睡眠原因和喚醒過程進行分析,以期找到實現睡美人文獻早期識別的線索。
在提出睡美人文獻的識別方法后,學者們開始進行實證研究,對檢測出的睡美人文獻進行特征分析,以期能夠找到實現早期識別的線索。
Costas 等[5]對識別出的睡美人文獻進行特征分析發現:①論文合作水平的均值較低,每篇論文的作者、機構和國家比普通論文少;②每篇論文的關鍵詞較少。此外,與“曇花一現”論文相比,睡美人文獻的自我引用較少[6]。杜建等[7-8]對睡美人文獻進行內容分析,總結如下:①睡美人文獻是某個研究領域的標志性出版物,如“關于……的第1 份報告”,或者“關于……的經典理論”;②內容質量較高,其中部分是諾貝爾獎獲得者的論文;③主要是應用型研究,其中一半的睡美人文獻來自專利中的引用明顯高于普通論文;④主要是跨學科領域的研究,通常發表于綜合性期刊。
部分學者對于各個學科領域的睡美人文獻特征進行分析,包括數學史[9]、兒科學[10-11]、計算機科學[12]、國際商務[13]等學科,研究結果與上述結論基本一致。另外,有學者對于專利中的睡美人文獻進行研究,發現專利中睡美人文獻出現的比例略大于普通論文中睡美人文獻的比例,即應用型的研究中更有可能出現睡美人文獻,與上述結論一致[14-15]。
童話故事中,睡美人能夠從沉睡中蘇醒是因為王子的吻。睡美人文獻從沉睡轉變為大量引用,同樣可以形容為被“王子”喚醒的過程。
van Raan[3]通過實證研究識別出了睡美人文獻,認為王子文獻為第1 篇引用睡美人文獻的論文。Braun 等[16]認為王子文獻應該從第1 批施引文獻中尋找,其應該被高度引用或者至少達到平均水平,并且與睡美人文獻有充足的共同引用,研究發現王子文獻來源期刊的平均影響因子高于睡美人文獻的來源期刊,提出“誘導引用”的喚醒機制。杜建等[17-18]通過這些特征提出識別王子文獻的2 個指標,即共同延遲承認指數和同被引速率,其同樣認為王子文獻能夠起誘導引用作用。Ohba 等[19]覺得不應該局限于施引文獻,也可能是一起被引用的文獻,于是做出定義:①王子文獻發表年份與睡美人文獻引用突然增加的年份相同;②能夠誘導引用;③兩者的同被引次數超過喚醒后睡美人文獻總被引頻次的30%。Li 等[20]特別指出,王子文獻也可能是沒有標注引用但是引用了觀點的文獻。
除了對王子文獻的識別之外,國內有學者總結了影響睡美人文獻的施引文獻成為王子文獻的3 個因素:文獻被引頻次、發表年與喚醒年的時間跨度以及同被引次數,并提出“王子系數”(Pr 指數)量化識別王子文獻[21]。Teixeira 等[22]對于檢測出的睡美人文獻整個引文窗口做了監測,詳細分析王子文獻對睡美人文獻的喚醒過程,研究發現:①睡美人文獻可能需要多篇王子文獻,甚至是一組王子文獻才能喚醒;②多位“王子”對睡美人的喚醒可能是同時的,也可能是先后進行的。
只有討論睡美人文獻出現的原因,才能對癥下藥,縮短睡美人文獻的沉睡時間。Costas 等[5]發現睡美人文獻的合作水平較低,認為合作水平高的論文可以通過合作者網絡在更大的讀者群中更快、更廣泛地被引用,而合作水平較低但高質量的論文則需要更多的時間才能得到充分的傳播、了解、認可和引用。杜建等[18]對王子文獻喚醒睡美人文獻的過程進行分析,歸納得出以下幾點原因:①研究類型原因;②學科發展原因;③接受新理念的過程需要時間;④根據少數專家的意見形成的診斷標準很難快速得到認可;⑤對照實驗的結果沒有顯著差異,不易被采納。此外,有學者對單一因素進行分析,發現導致睡美人陷入沉睡的原因還可能是:①論文作者是科學新秀而不是權威,直至后來權威進行了相似的研究并表示認可,睡美人文獻才受到關注[23];②科研作者研究方向的變化和科研團隊的解散[24];③論文主題若與所發表期刊的領域不一致,則期刊受眾與論文受眾不一致[25]。
Teixeira 等[22]通過案例分析解釋了睡美人文獻覺醒的原因:①提出的方法或工具被其他研究人員采用,睡美人文獻的科學價值得到了承認;②顛覆性的或者非傳統的想法逐漸被接受,甚至占據主導地位;③概念模型和明確的理論參考出現,能夠嚴格地表現睡美人文獻的科學性;④高影響力作者(高h 指數)的引用,這一點與其他學者的研究結果[26]一致;⑤睡美人文獻作者的自引。并不是所有的睡美人文獻均需要王子文獻喚醒,Zong 等[27]在研究中發現部分文獻沒有王子文獻,其主要原因是:①這些文獻本身是高水平的,其沉睡不是因為沒有被學者注意到,而是需要等待各種理論、技術和應用的發展;②王子文獻不一定需要與睡美人文獻共被引;因此,他們認為共被引標準不一定是識別王子文獻的唯一標準,有必要進一步驗證和考慮其他標準。
根據目前基于引文的睡美人文獻的研究發現,睡美人文獻中確實存在一些線索可以用于早期識別,降低睡美人文獻沉睡的概率。不過,基于引文的睡美人文獻的王子是文獻,而Altmetrics 是對社交平臺上學術成果影響力的測度,基于Altmetrics的睡美人文獻的王子不應該是文獻,可能是社交媒體平臺或者平臺用戶。對基于Altmetrics 的睡美人文獻的喚醒機制進行分析,除了分析文獻本身內容、文獻特征等可能導致沉睡的原因,還需要將文獻的傳播平臺納入考慮范圍。
Altmetric.com 可以追蹤文章在多個社交媒體平臺上的關注,覆蓋面廣。根據Banshal 等[28]的研究結果,社交媒體平臺上醫學科學的占比較高,為保障Altmetrics 指標的覆蓋率,本文選擇醫學健康領域文獻作為研究對象。通過Altmetric Explorer 檢索文獻,學科主題限定為“Medical and Health Sciences”,文獻類型限定為“articles”,發表日期在“2018-11-30”之前。檢索時間為2021 年12 月21 日,選取關注分值Altmetrics attention score(AAS)非零的文章中排名的前1%作為實驗數據集,舍去部分指標數據缺失的文章,實驗數據集共47510 篇,數據獲取時間為2021 年12 月21—25 日。根據不同平臺的影響覆蓋范圍,Altmetric.com 對指標賦予不同權重,根據其所提供的權重進行加權計算,得到AAS 值,計算方法[29]為
本文采用Altmetrics 睡美人指數(Altmetrics sleeping beauty index,ASB 指數)作為基于Altmetrics 的睡美人文獻的識別方法[4]。睡美人文獻最重要的兩個特點是較長的睡眠時間和關注的突增,ASB指數用無參數指標體現這兩個特征,計算方法為
其中,論文年齡為t時的累積關注百分比記為At;發表之日的時刻t為0;關注累積百分比為100%的時刻記為tm;t25、t50分別表示論文關注累積首次達25%和50%的時刻。根據睡美人文獻的特征,論文前期受到的關注越少,1-At值越大;論文的睡眠時間越長,值越大;關注增加越突然,t50-t25值越小。因此,論文前期關注越少,睡眠時間越長,后期關注增加越突然,ASB 指數值越大,越有可能是睡美人文獻。
根據實驗數據集的ASB 值計算結果,選取ASB值最高的10 篇文章作為基于Altmetrics 的睡美人文獻代表,分析睡美人文獻的特征和喚醒機制,以尋找早期識別線索。
睡美人文獻的喚醒時刻也就是關注突然增加的時刻,喚醒前關注少,喚醒后有大量關注,關注增長率大。有學者對比人為參數法和年度引文增長率指標等多種引文“起飛”時刻的識別方法正確率,發現人為參數法正確率最高,且可以識別多次喚醒時刻[30]。因此,采用公式
識別睡美人文獻的喚醒時刻。其中,at表示文獻第t天的關注。公式(3)限制了喚醒時刻前和喚醒時刻的關注度,同時通過設定突增強度r的閾值判斷關注量的增長情況,識別喚醒時刻的正確率高。但人為參數法的識別率低[30],對于采用公式(3)沒有識別出喚醒時刻的文獻,可以考慮刪去條件at-1<3、at<3 后重新進行識別。
ASB 值最高的10 篇文章的發表時間是1829—1939 年,睡眠時長為70~190 年。以這10 篇文章作為基于Altmetrics 的睡美人文獻代表,對文章的多項特征進行詳細分析,歸納睡美人文獻特征。
統計10 篇文章的基本特征,包括是否開放存取、是否學科交叉、有無資助、期刊是否被JCR(Journal Citation Reports,期刊引用報告)收錄、歸屬分區等,統計結果如表1 所示。

表1 ASB值最高的10篇文章的基本特征
從表1 可以看出,雖然Altmetrics.com 可以追蹤到15 種平臺的關注,但這10 篇睡美人文獻的關注來源平臺僅集中于6 種。其中,Twitter、News 和Blog 是目前的國際主流媒體平臺,用戶體量大,受眾多元,覆蓋面廣,是文獻關注的主要來源平臺;Wikipedia、YouTube 和Patent 的覆蓋率分別是28.48%、25.21%、14.12%,總的來看,關注來源平臺并不小眾,因此才能迅速累積關注。Facebook 的覆蓋率為78.43%,但這10 篇文章均沒有收到來自Facebook 的關注。由此可見,文章覆蓋率高的指標平臺不一定會有睡美人文獻的傳播,應該結合文章其他特征和平臺特征進行考慮。在不同平臺上實現睡美人文獻的早期識別,需要結合用戶的關注喜好有針對性地開展。
關于數據集中文章的特征分組,本文采用Mann-Whitney 秩檢驗方法比較不同組的AAS 值、ASB 值,結果如表2 所示。

表2 不同特征文章的AAS值、ASB值比較
ASB 值最高的10 篇文章中有0 篇獲得資助,從表2 可知,有資助的文章AAS 值更高且ASB 值更低,表明人們更信賴前期經歷過嚴格審查的有資助文章,特別是公眾受到自身知識水平的限制,更偏向于選擇性地關注有資助的文章。但從崔建勛等[31]的研究結果可以得出,有資助和無資助的文章在質量上并無明顯差距。
從表2 可以看出,文獻開放存取更容易獲得關注,與其他研究結果一致[32-34]。需要支付訂閱費用的文章獲取模式可能會導致俱樂部產品的情況產生,這種情況可能會扭曲研究議程,造成研究軌跡的區域或全球鎖定,導致資源分配效率低下;而開放存取有助于知識免費,提高知識生產的多樣性和效率,使科學活動的分布更加均勻[35]。10 篇文章中仍有4 篇是開放存取的,由此可見,雖然開放存取可能降低文獻成為睡美人文獻的概率,但依然有可能成為睡美人文獻,文獻的內容、期刊等其他因素均可能是文獻初期陷入沉睡的原因。
雖然非學科交叉的文章AAS 值更高,但學科交叉與非學科交叉文章的ASB 值并沒有顯著區別,這與基于引文的睡美人文獻結果不同[36]。石麗等[37]通過研究證明,并不是論文的跨學科性越強就意味著其受到的關注度越高,如果學科交叉的程度超出了社交媒體平臺用戶的知識范疇,那么會導致參與人數減少,以及關注量下降。在社交媒體平臺上,醫學科學的內容占比較高[28],大眾關注健康知識,但由于醫學學科的內容知識壁壘較高,以及受限于公眾自身知識水平,人們會更關注文獻內容的適用性。
這10 篇文章中有8 篇的來源期刊被JCR 收錄,其中有6 篇刊載在JCR 的Q1 區期刊上,可以一定程度上說明文章的內容質量很高,但在前期沒有被及時分享在社交媒體平臺上,因此沒能快速獲得關注。學術用戶在傳播中占據重要地位,因為他們更熟悉和理解專業領域內學術信息的獲取渠道,在一定程度上更容易發現學術成果,進而傳播給更多受眾[38]。文獻作者、專業學者或者期刊等機構賬號可以主動將文獻分享在社交媒體平臺上,在發布時可以結合公眾興趣或者通俗易懂的例子對文獻內容進行簡單、易理解的描述,以幫助公眾快速理解文獻,節省時間精力,從而產生更多關注。
除了非開放存取、無資助,文獻的內容、期刊等其他因素均可能是文獻陷入沉睡的原因。如果要早期識別基于Altmetrics 的睡美人文獻,那么可以多關注非開放存取、無資助的文獻。此外,還應該結合文獻其他特征和社交媒體平臺特征進行考慮。文獻是知識的重要載體,學術用戶可以主動將文獻分享在社交媒體平臺上,同時通過自己的專業知識進行簡單描述,以搭建學術與公眾的溝通渠道。
通過對10 篇文章內容的閱讀,發現大致可以將其歸為兩種類型:首創型文獻和經典案例型文獻。其中,首創型文獻是指內容具有新穎性的文獻,包括新發現、新方法、新應用等;經典案例型文獻是指有代表性的診斷、疾病、實驗、藥物、生理特征等內容。
10 篇文章中第2、3、4、8、9 篇是首創型文獻。其中,第2 篇(1832 年)是關于靜脈注射鹽水治療霍亂的研究[39],這是第1 個關于人體靜脈輸液的結果報告。第3 篇(1873 年)對當時詩歌作者描述的大型貓科動物尾巴末端的“刺”進行了研究,發現其是乳頭狀皮膚組織[40]。第4、5、10 篇均是關于傷寒的研究:第4 篇(1907 年)是Soper[41]對傷寒第1 位無癥狀攜帶者、超級傳播者——傷寒瑪麗的調查報告;傷寒是經典的傳染病案例,第5、10篇發表于第4 篇之后,應屬經典案例型文獻。第8篇(1934 年)文獻認為服用催眠藥和鎮靜劑可能會由于過量或長期積累產生毒性影響,導致血小板減少癥,對脊髓產生有害作用,即后來的中毒性血小板癥[42]。第9 篇(1935 年)在新生兒腸道菌群中發現一種新的致病性厭氧菌,即艱難梭狀芽孢桿菌(Bacillus difficilis),后來被確定為艱難梭菌[43]。
第1、5、6、7、10 篇是經典案例型文獻。其中,第1 篇(1829 年)是一份糖尿病診斷記錄,以及早期關于糖尿病的尿液檢驗手段、臨床描述等,包含一些有趣的詞匯,如“愉快的甜味”“純糖漿”等[44]。第5 篇(1908 年)講述的是傷寒的無癥狀攜帶者,并提出了預防建議[45]。第6 篇(1921 年)主要是關于天花疫苗接種前后的情況對比,驗證了疫苗的有效性[46]。第7 篇(1919 年)在報告中提及兩個關于病毒傳染性的實驗[47]。第10 篇(1939 年)與第4 篇出自同一作者,該作者在其中詳細講述了調查瑪麗事件的全過程和她后來的生活情況[48]。
隨著人們對于身體健康的日益關注,對于疾病知識、養生知識等健康知識的需求也水漲船高,人們在平臺上看到健康信息時常常會留意并關注,出現健康信息需求時也會主動通過社交媒體平臺獲取相關知識,還可能在平臺上尋找病友、分享治療經驗等。這10 篇文章涉及的糖尿病、傳染病、疫苗、靜脈注射、藥物過量等,都是在日常生活中會頻繁出現的健康話題,因此,這類知識在社交媒體平臺上會吸引大量的關注。
眾所周知,醫學健康這門學科存在較高的知識壁壘,因此文獻在社交媒體平臺傳播時會受到公眾理解能力的制約。雖然這些文獻已經沉睡了很長時間,但文獻內容并沒有過時。隨著社交媒體平臺的發展和人們知識水平的提高,獲取這些內容變得簡單,且現在的人們掌握了理解這些內容需要的基礎知識,在閱讀這些文獻時并不會感到費力,這可能是這些文獻在多年后才得到廣泛關注的原因之一。
基于引文的睡美人文獻內容一般是新方法、新系統、新應用、新發現或與熱門觀點相反的觀點等[8,49],而基于Altmetrics 的睡美人文獻內容除了相似的首創型文獻之外,還包括經典案例型文獻。與學術領域偏好具有新穎性的文獻不同,社交媒體用戶可能還會關注有趣的、適用性較強的或者與自己切身相關的內容。正如Chandrashekhar 等[50]的推測,一篇論文的新穎性或獨創性可能不太會引起在線社區的興趣,那些引起轟動的或者流行的論文在展示和分享方面可能有更高的價值。
Altmetrics 主要體現來自社交媒體平臺的關注,因此,喚醒Altmetrics 睡美人文獻的“王子”應該是代表平臺的指標,將Altmetrics 睡美人文獻喚醒時刻后第1 天內對影響力分值增長貢獻量最大的指標稱為王子指標。蘇醒時長是指文章被喚醒后處于蘇醒狀態的時長,自喚醒時刻后第1 天計起至文章再次進入睡眠前的時間。關注高峰是指文章每次喚醒期間的影響力分值最高點,若最高點不止一個,則取最早的點為關注高峰。Garfield[51]研究發現,睡美人文獻被重新發現的過程可能是漸進的,也可能是突然的,將漸進的影響力累積形式稱為“滾雪球”式:從少量開始經過傳播獲取越來越多的關注,在喚醒后的第2 天或更晚時間才達到本次喚醒的關注高峰;將突然的累積形式稱為“爆發”式:在喚醒后第一天就直接達到本次喚醒的關注高峰。
第1~3 篇文章關注累積過程如圖1 所示。糖尿病是一種常見的慢性病,當人們逐漸關注和了解該疾病后,第1 篇文章中關于癥狀的有趣描述吸引了大量關注。第2 篇文章的多條新聞推送都是一樣的內容:介紹靜脈輸液無菌鹽水的發展,如今大家對于靜脈輸液習以為常,但較少有人詳細地了解其發展過程,推送具有科普作用。第3 篇文章打破了詩歌作者對于大型貓科動物尾巴末端是“刺”的誤解,是有趣的、打破日常認知的知識,Twitter 用戶對這個有趣的、打破認知的發現感到驚訝,由此引發了大量關注,且這種關注是逐漸傳播擴散產生的。

圖1 第1~3篇文章的關注累積過程
第4、5、10 篇都是關于傷寒的研究,且第4、5 篇都發表于同一期刊;第4、10 篇的作者都是發現了“傷寒瑪麗”的研究者George A.Soper,其關注累積過程如圖2 所示。這3 篇文章影響力的累積過程相似,有一部分關注是重合的,新聞經常同時提及,因此,將這3 篇文章一同分析。可見不止是在引文中論文存在同被引現象,在社交媒體平臺上,同一作者或者同一期刊、同一主題的論文也可能會同時受到關注。

圖2 第4、5、10篇文章的關注累積過程
第4 篇的影響力來源于多個平臺,在被喚醒之前,它已經在Wikipedia 上收獲一些關注,主要被用于傷寒瑪麗的詞條中;第1 次喚醒時的關注內容是關于超級傳播者的描述;第2 次喚醒時刻是在2020年4 月,在全球爆發新冠疫情的背景下,很多人錯誤地使用“傷寒瑪麗”標簽形容故意傳播疾病的人,News 平臺的主要關注內容是對當年傷寒瑪麗事件的敘述,科普這一事件,為瑪麗正名;第3 次喚醒是在介紹傷寒瑪麗的故事時提及;沉睡之后在Twitter 上的關注主要是對于醫學歷史學家的討論,YouTube 上的關注內容與第2 次喚醒的主要內容相似。由此可見,即使是同一篇文章,在不同時期、不同平臺上受到的關注也有可能不同。第5 篇的蘇醒日期、關注內容與第4 篇文章在第2 次喚醒時期內所受到的關注一致。
第10 篇文章同一平臺上的關注內容相近,除了與第4 篇文章共同獲得的關注之外,其余關注內容可以根據平臺進行劃分:News 平臺上2020 年之前的關注內容主要是介紹瑪麗與傷寒的故事,2020 年后的主要內容是在介紹瑪麗故事的基礎上,從中吸取教訓為當下疫情提供借鑒,如相信科學、保持距離、戴好口罩等;Blog 平臺上主要是介紹瑪麗故事和新冠病毒的防范措施;Wikipedia 上是介紹傷寒和瑪麗的詞條;Twitter 上是對于瑪麗事件的介紹。從整體上看,超過一半的關注集中在2020 年,即第5~14 次喚醒,主要是受2020 年疫情的影響,關注內容多是對謠言的科普或是從過去相似的事件中總結學習經驗應對當前問題。
第6~9 篇的關注累積過程如圖3 所示。第6 篇3次喚醒的關注內容相同,都是針對網絡上流傳的新冠病毒疫苗謠言,媒體梳理天花疫苗推廣過程中曾遭受的質疑,介紹疫苗的科學性,具有科普作用。這篇文章3 次蘇醒的時間都處于2021 年7 月,當時正值新冠病毒疫苗的全球接種推廣時期,為消除公眾質疑,News、Blog 平臺在以過往事件為例普及知識時,會選用高質量論文來支持他們的論點。第7 篇2 次蘇醒狀態的時間相近,集中在2021 年10 月的一個星期內。從蘇醒狀態和睡眠狀態看,文章的關注分布較集中,關注內容相似,主要是圍繞該文章實驗結果討論病毒的傳染性。在疫情背景下,人們對于病毒的傳染問題保持高度關注,這給文章帶來了一定的關注基礎。第8 篇文章在Wikipedia 平臺上的關注是止血詞條;在Twitter 平臺上獲得大量關注的契機是一個有影響力的賬號根據某公眾人物的血小板減少癥狀,以該文章作為佐證,提出中毒的猜想,引起熱議,關注的內容主要是圍繞公眾人物事件,但也有少部分是對文章的看法;大部分關注都集中在同一國家。正如之前研究的結果,有影響力的發布用戶更容易帶來大量關注[32]。這也體現了在遇到問題時,人們會尋求現有的經驗以解決問題。如果文獻與公眾關注事件聯系在一起,這會給文獻迅速帶來大量關注,但這些關注更多集中于事件本身,較少會注意到文獻,而且這些關注多來自公眾人物所在的國家。第9 篇每次喚醒的間隔時間較長,喚醒期內的關注內容不同,第1 次喚醒時期的關注內容為艱難梭菌在醫院外的感染變得普遍,在梳理艱難梭菌研究過程時提到了該文章;第2 次關注內容為糞便移植方法的發展歷程描述;第3 次關注內容是對艱難梭菌的命名看法。睡眠期在其他平臺上的關注內容為:Wikipedia 平臺上是艱難梭菌相關詞條,Patent 平臺上是抗菌成分專利,Twitter平臺上是關于糞便移植史的參考書目推薦。該文章內容是發現了一種新細菌,最早在Patent 和Wikipedia 上獲得關注,由此可見,Patent 和Wikipedia 平臺比較青睞首創型文獻,在這兩類平臺上更容易早期識別內容具有新穎性的文獻。

圖3 第6~9篇文章的關注累積過程
根據上述對于10 篇文章的喚醒過程分析發現,不同平臺上文獻的受關注情況不同,不同平臺的用戶偏好不同。知識的傳播會受到許多因素影響,包括信息的內容、社會關系和接收者的采用能力等[52]。以下分平臺對文章的傳播情況和產生原因進行分析。
在Twitter 上獲得關注的文章共有7 篇,期刊來源多樣,包括未被JCR 收錄的期刊。Twitter 上用戶多是個人,可以自由發表自己的看法、分享和表達自己的興趣,所以對于文獻的期刊來源并沒有太多關注,更多依賴于文獻內容本身。Twitter 上的關注內容可以大概分為3 類:①第1、3 篇文章在Twitter平臺上引起關注的原因是文章中有趣的內容;②第4、9、10 篇主要是對于相關知識的推廣普及;③第7、8 篇主要是與熱點事件關聯帶來的關注。Twitter上的用戶動機包括興趣動機、傳播推薦動機和利他動機等[53]。社交媒體平臺上的用戶不只是接收方,也是傳播方,社交媒體所代表的關注來源更多是普通群眾,當他們在Twitter 上遇到有趣的內容時會積極分享,在遇到問題時對具有科普作用的經典案例也會轉發推廣。同時,社交媒體平臺上的關注容易受到環境影響,如第8 篇文章,與熱點事件相關聯可以給文獻迅速帶來大量關注,但這些關注多來自公眾人物所在的國家且多停留于熱點事件本身,關于其涉及的文獻內容的閱讀討論并沒有很多。正如Thelwall 等[54]所發現的,關于學術文章的推文似乎不太可能深入了解讀者對文章的接受程度,除非在不尋常的情況下,如特別有爭議或開創性的研究。有一部分原因是公眾對于文獻內容并不在意,不愿意花費時間精力去閱讀;另一部分原因可能是公眾理解文獻并提出看法有一定困難,不過使用社交媒體平臺的學者們可以發表評論或者表達態度,幫助公眾理解,引導他們關注文獻。
有6 篇文章在News 平臺獲得關注,分別是3 篇首創型文獻和3 篇經典案例型文獻。可見不管是首創型還是經典案例型,在News 平臺上的關注內容都具有明顯的科普性,與Twitter 相比沒有明顯的趣味性。News 作為社會大眾媒體平臺,關注人數多,在發布內容時需要考慮自身的影響力與所承擔的社會責任,所以對于關注內容的要求更嚴謹、嚴肅。推送時也會結合公眾話題,特別是與社會各方生活密切相關的新冠疫情,例如,第4、5、10 篇的關注中指出人們對“傷寒瑪麗”的錯誤使用,第6 篇回應公眾對于疫苗的質疑。大部分文章主要的喚醒方式是新聞,因為新聞具有受眾廣、解釋性強等特點,相對于其他平臺新聞更具有公信力,影響覆蓋范圍廣,當公眾有相關的信息需求時,新聞是一個良好的反饋渠道,可以起到正確引導公眾的作用,在日常新聞也可以是學術界與公眾之間的溝通橋梁,在科學知識的傳播中承擔起中介作用。
在Blog 平臺獲得關注的文章與News 相同,而且關注內容也相似。認真對比兩類平臺上相同關注內容的發布時間,有些內容先在Blog 上發布,有些先在News 上發布,這兩類平臺之間互相關注。對比News 與Blog 上的關注內容發現,Blog 上的內容更加多樣化,例如,第9 篇在Blog 上的關注內容包括對于艱難梭菌的命名看法,第10 篇包括現有疫情防控措施的宣傳。由此可見,除了與News 上相同的科普之外,Blog 的關注內容還多了一些自我表達。有學者對新聞和博客提及的文獻進行社會網絡分析,結果顯示網絡是集中的,大眾媒體處于中心位置,而博客網絡是專業、分散的,少數專業媒體充當主題中心[55]。可能是因為Blog 用戶中包括個人賬號,并不需要像News 承擔相應的傳播責任,因此對于文獻的關注表達也更隨心所欲。
有4 篇在Wikipedia 上獲得關注,其中第4、8、9 篇都是首創型文獻、第10 篇屬于經典案例型文獻,推測首創型文獻更容易在Wikipedia 上獲得關注。第4、8、9 篇在Wikipedia 上的最早關注時間早于所有喚醒時刻,第10 篇的Wikipedia 最早關注時間早于大部分喚醒時刻,對Wikipedia 的關注文獻進行宣傳可能實現睡美人文獻的早期識別。
只有第4、10 篇在YouTube 平臺上獲得關注,且這兩篇文章在同一個視頻中獲得關注,其關注內容主要是對于傷寒瑪麗的科普。YouTube 的覆蓋率約25%,可見較少文獻可以在YouTube 上獲得關注,YouTube 用戶多是在科普工作時引用文獻,而掌握醫學健康知識的臨床工作者工作任務繁重,幾乎沒有精力去制作視頻,因此文獻在YouTube 上獲得的關注較少。
只有第9 篇在Patent 上獲得了關注,且是該文章首次獲得關注,被專利關注的時間早于王子指標的喚醒。第9 篇文章發現了一種新的致病菌,關于該病菌的治療需求催生了藥物專利方面的關注。對Patent 關注的首創型文獻進行推廣可能實現睡美人文獻的早期識別。
同一作者且同一主題的論文在引文網絡中會出現同被引,在社交媒體平臺上也存在共同關注現象,例如第4、5、10 篇在同一篇News、Blog 中被使用,第9 篇在Twitter 上與其他文獻一起被推薦,第4、10 篇被同一個視頻提及。正如Costas 等[56]所認為的:基于引文中同被引、引文耦合的原則,對于大多數社交媒體指標來說,也可以將類似的網絡關系概念化,學術成果也可以通過對于社交媒體事件、用戶和關注方式的共同參與相結合。
綜上所述,不同平臺上的傳播情況不同。Twitter 上關注的文獻來源多樣,多是有趣的、科普的或者與熱點事件相關的文獻。News 上發布的關注內容嚴謹、嚴肅,同時具有受眾廣、解釋性強等特點,可以在科學知識的傳播中起中介作用。Blog 與News 相似,但關注內容更加多樣化;Wikipedia 上更青睞首創型文獻;YouTube 的文獻覆蓋率較低。文章在Wikipedia、Patent 上得到關注的時間早于大部分喚醒時刻,重視這兩類平臺的關注文獻可能實現睡美人文獻的早期識別。此外,類似于引文網絡中同被引現象,在社交媒體平臺上存在著共同關注現象。
對ASB 值最高的10 篇文章詳細喚醒情況的匯總如表3 所示,其中高峰間隔是指本次喚醒期間的關注高峰與上一次關注高峰間的時間間隔。以這10篇文章為例分析Altmetrics 睡美人文獻的關注累積過程特征。

表3 ASB值最高10篇文章的喚醒情況
從表3 可以看出,在王子指標為News、Blog 的喚醒中影響力的累積形式都是爆發式累積,在王子指標為Twitter 的喚醒中滾雪球式累積出現3 次、爆發式累積出現2 次。分析Twitter 的2 次爆發發現,第7 篇中2 次喚醒時間接近,在有第1 次熱度鋪墊的基礎上第22 次喚醒實現了爆發式累積;第8 篇是由于與公眾人物事件關聯而引發的爆發式累積。由此可見,社交平臺和新聞平臺的信息傳播結構是不同的,以Twitter 為代表的社交平臺多是病毒傳播或者混合傳播[57],前期累積速度較慢,文章被用戶分享到平臺后需要一定的傳播擴散時間,才能達到關注高峰;News 和Blog 兩者相似,偏向于廣播傳播,在喚醒后第1 天就可以達到關注高峰。
在這10 篇文章的每次喚醒中,喚醒后達到關注高峰的時間均不超過3 天,每次蘇醒時長均不超過一個星期,由此可見,在社交媒體平臺上信息的傳播速度非常快,文獻得到喚醒后的關注變化速度也非常快。從高峰間隔來看,數值差距非常大,文獻短時間內較密集的喚醒關注內容通常是相同或者相近的,相隔時間較久的喚醒中關注內容可能會發生變化。關注內容可能受到多種因素的影響,如環境變化、公眾事件、有影響力的賬號推薦等,這些因素均可能給文獻帶來新一輪的關注。如果要開展基于Altmetrics 的文獻傳播軌跡研究,那么既需要將時間單位限定得足夠小,使其可以反映關注的變化過程,又要保證前后的時間跨度足夠大,使全部的時間窗口均能被納入考量范圍。
以ASB 值最高10 篇文章為例,分析基于Altmetrics 的睡美人文獻特征發現,文獻內容主要可以歸為兩類:首創型文獻和經典案例型文獻。睡美人文獻的內容質量較高,文獻涉及的話題均是日常生活中頻繁出現的話題。與學術領域的關注內容相比,社交媒體用戶還會關注有趣的、科普作用較強的或者與自己切身相關的內容。
導致基于Altmetrics 的睡美人文獻沉睡的原因可能有:①非開放存取;②沒有得到資助;③文獻的內容、期刊等其他因素;④公眾理解能力的制約等。睡美人文獻被喚醒的原因有:①公眾知識水平的提高;②遇到相似問題;③與公眾事件相關;④有影響力的賬號推薦等。
對于Altmetrics 睡美人文獻的早期識別,除了對首創型文獻的追蹤外,還要關注具有典型性的文獻。另外,對于非開放存取、無資助的文獻要保持更多關注,同時應該結合文獻其他特征與不同的社交媒體平臺特征進行考慮。在Patent 和Wikipedia 平臺上的關注時間早于王子指標的喚醒時刻,重視這兩類平臺的關注可能實現睡美人文獻的早期識別。社交媒體平臺的學術用戶在實現基于Altmetrics 的睡美人文獻早期識別方面具有重要作用,這些學術用戶更熟悉和理解專業領域內學術信息的獲取渠道,在一定程度上更容易發現學術成果,進而將其傳播給更多受眾;可以在社交媒體平臺上發表專業評論,幫助公眾理解,引導他們關注文獻內容。文獻作者、專業學者或者期刊等機構賬號可以主動將文獻分享在社交媒體平臺上,在發布時結合公眾興趣或者公眾熟知了解的例子對文獻內容進行簡單、易理解的描述,有助于公眾快速了解文獻內容,節省時間精力,從而產生更多關注。
實驗數據集只采用了醫療健康領域文章,其他學科領域的睡美人文獻情況有待進一步探究,未來可以從其他學科角度進行相關研究,以發現更多的早期識別線索。本文分析了社交媒體的平臺特征和學術文章的關注累積特征,后續可以考慮結合關注的累積過程和引用的累積過程,探究Altmetrics 指標是否可以體現早期的引用意愿,或者Altmetrics指標是否可以比王子文獻更早喚醒基于引文的睡美人文獻。通過對比基于引文的睡美人文獻和基于Altmetrics 的睡美人文獻內容特征可知:除了相似的首創型文獻之外,Altmetrics 睡美人文獻還包括經典案例型文獻;學科交叉與非學科交叉的文章,成為Altmetrics 睡美人文獻的概率沒有顯著性區別;兩類睡美人文獻的特征不完全一致,后續研究可以進一步比較它們的區別。