李明杰,岳昕晨,胡劍波,吳 曄,閔 勇,傅晨波*
(1. 浙江工業(yè)大學網(wǎng)絡空間安全研究院 杭州 310023;2. 浙江工業(yè)大學信息工程學院 杭州 310023;3. 北京師范大學計算傳播學研究中心 廣東 珠海 519087;4. 北京師范大學新聞傳播學院 北京 海淀區(qū) 100875)
新冠疫情所帶來的影響是多樣性的。研究表明,新冠疫情對科研活動也產(chǎn)生了較大影響,科研工作者的平均工作時長和產(chǎn)出大幅下降[1],交流方式也因為空間限制有所改變[2]。
科研合作是現(xiàn)代科學研究中的一個重要行為,在推動科學發(fā)展的進程中一直扮演重要角色。近年來,越來越多的人類行為模式研究表明,科研合作能帶來更積極的影響[3-5]。隨著科研團隊合作的數(shù)量和規(guī)模的增長,團隊的影響越來越顯著。如團隊作品比個人作品具有更高的影響力[6-7]。這一現(xiàn)象在精英科學家身上尤為顯著,相對于同一時代的其他研究者,他們更加適應團隊合作[8]。科學研究是一個復雜的問題,往往需要多個學科的知識,而一個人的精力有限,無法兼顧多個學科,所以一個具有互補專業(yè)知識的研究團隊就顯得尤其重要[9-10]。此外,團隊合作的規(guī)模也是科研合作的重點,隨著開展研究所需要的知識和資源越來越多,團隊合作的模式也在不斷變化[11-13]。除了研究科研合作中團隊的作用外,科研合作中的“領頭羊”作用也被廣泛研究。一個好的指導者在一個團隊里尤為重要,與其合作的文章更容易在高水平的期刊中發(fā)表[14],且能有效地提高團隊生產(chǎn)力和被引數(shù)[15]。
相關研究表明,此次新冠疫情改變了科學團隊的結(jié)構(gòu),縮小了團隊規(guī)模,使成員結(jié)構(gòu)更傾向于精英化[16]。與以往發(fā)表H1N1、寨卡、埃博拉、艾滋病和結(jié)核病研究的作者群體相比,針對COVID-19研究的作者的增長要快得多,數(shù)量也大得多。圍繞COVID-19 研究領域的學術交流正在加速發(fā)生變化。
本文研究的主要對象是新冠疫情下的國際科研合作,通過合作網(wǎng)絡研究了在疫情發(fā)展的不同時期里國際科研合作網(wǎng)絡的演化過程,對抗疫情的中心國家,以及中心國家對于整體科研合作的影響。使用國家合作新鮮度這一指標量化了各國對于合作的態(tài)度,分析了各國態(tài)度變化的原因。并使用斷點回歸探究了美國參與疫情研究的原因,確定了正是疫情的爆發(fā)促使了美國積極參與國際合作以對抗疫情。
科研合作數(shù)據(jù)來源于Dimension 公司的開源數(shù)據(jù)集,該數(shù)據(jù)集包含了新冠期間與COVID-19 相關的出版物信息。本文選取2020 年2 月1 日- 2021 年2 月17 日有關COVID-19 的論文,刪除不包含國家信息的數(shù)據(jù)后,共剩余173 618 篇論文。由于本文主要研究疫情對國際合作的影響,所以從中選取了擁有國際合作關系的論文共35 639 篇。
當前,網(wǎng)絡構(gòu)建方法被廣泛應用于計算社會學、電力網(wǎng)絡、交通網(wǎng)絡、生物網(wǎng)絡、金融網(wǎng)絡等領域中[17-18]。科研合作網(wǎng)絡[19-22]也是一種社會網(wǎng)絡,在當前多學科交互的背景下,科研合作已經(jīng)成為一種普遍的現(xiàn)象,并成為發(fā)展交叉學科及解決全球化問題的主要途徑。
本文使用網(wǎng)絡分析的方法分析新冠疫情期間國際科研合作的演化過程。透過網(wǎng)絡視角,可以更好地從全球合作角度查看新冠疫情對人類活動,特別是對科研活動的影響。基于此構(gòu)建了疫情期間的國家科研合作網(wǎng)絡,如圖1 所示。其中每個節(jié)點代表一個國家,若一篇文章的作者歸屬于兩個或多個國家,則將這兩個或多個國家之間兩兩連邊。圖1a展示了疫情期間主要國家之間的科研合作網(wǎng)絡,其中節(jié)點的大小代表該國家的合作次數(shù),連邊的粗細代表兩個國家之間的合作頻率。在整個合作網(wǎng)絡中共有192 個國家或地區(qū)參與,產(chǎn)生了5 406 對合作關系,平均每個國家或地區(qū)與56 個國家或地區(qū)產(chǎn)生了合作。圖1b 顯示了網(wǎng)絡大小隨時間的變化趨勢。為了評估疫情對合作網(wǎng)絡的影響,本研究采用以下網(wǎng)絡指標[19]來衡量網(wǎng)絡的變化。

圖1 新冠疫情期間國家科研合作網(wǎng)絡
度:與一個節(jié)點連接的節(jié)點數(shù)量,表示對于選定國家的合作國家或地區(qū)的數(shù)量。
聚類系數(shù):度量合作的緊密程度。聚類系數(shù)(無權(quán)網(wǎng)絡)和聚類系數(shù)(有權(quán)網(wǎng)絡)分別為:


疫情在全球不斷蔓延,疫情爆發(fā)3 個月之后,美國進入了緊急狀態(tài)(2020 年3 月13 日)。考慮到文章從創(chuàng)作到發(fā)表需要一定時間,將2020 年3 月29 日設為關鍵時間點(斷點),將2020 年3 月29 日之前定義為疫情前期,2020 年3 月29 日之后(包括3 月29 日)定義為疫情蔓延期,分別構(gòu)建疫情前期和疫情蔓延期的有關疫情研究的合作網(wǎng)絡。以國家為節(jié)點,將一篇論文所有作者各自歸屬的國家全連邊,以合作次數(shù)為邊的權(quán)重,用來衡量兩個國家的合作強度,根據(jù)連邊的權(quán)重和節(jié)點的權(quán)重來衡量國家在合作網(wǎng)絡中的重要程度,如圖2 所示。

圖2 不同時期國家科研合作網(wǎng)絡圖
圖3 顯示的是兩個主要合作中心(中國和美國)的網(wǎng)絡特征屬性隨疫情蔓延的變化趨勢。可以看出,隨著疫情的全球蔓延,以中美為中心相互合作的國家數(shù)量有所提升,如圖3a 所示。其中,美國作為傳統(tǒng)科研強國,始終處于聯(lián)系全球的重要樞紐位置,如圖3b 所示,且在網(wǎng)絡中與其他國家的距離更近,如圖3c 所示。這可能是由于科研個體在尋求合作者時,更傾向于選擇科研實力較強的合作者以獲得更多關注[14]。相比而言,中國雖然在科研網(wǎng)絡中的地位沒有美國那么顯著,但從圖3d 可以看出,其合作緊密度要遠大于美國。此外,中國從疫情前期過渡到蔓延期時,網(wǎng)絡特征屬性有著明顯的上升或下降,也顯示了中國在疫情前期的科研合作網(wǎng)絡中有著不可或缺的作用,這與中國在疫情前期分享了大量相關數(shù)據(jù)是分不開的。

圖3 科研合作網(wǎng)絡特征隨時間的變化
相較于無權(quán)網(wǎng)絡,有權(quán)網(wǎng)絡保留了更多交互信息。在有權(quán)網(wǎng)絡中,邊的權(quán)重表示了節(jié)點間的交互強度,而在無權(quán)網(wǎng)絡中,邊只代表交互存在或不存在[23-24]。在本文中,邊的權(quán)重代表了國家間的合作強度。為了探明權(quán)重的影響,在加入權(quán)重后重新計算了介數(shù)中心性和聚類系數(shù),如圖4 所示。
簡單的加權(quán)方式可能導致不同論文貢獻差異很大,如一篇有5 個國家參與的論文對總權(quán)重的貢獻為10,而兩個國家參與的論文對總權(quán)重的貢獻僅為1,前者是后者10 倍,因此考慮將整個網(wǎng)絡的權(quán)重歸一化。歸一化的過程中使用了Newman[25]的加權(quán)方法,其權(quán)重計算的公式為:

式中,u,v代表合作國家;k代 表文章;nk表示文章k的作者數(shù)量。修改權(quán)重計算方法后得到的介數(shù)中心性與聚類系數(shù)如圖5 所示。

圖5 權(quán)重修改后科研合作網(wǎng)絡特征隨時間的變化
對于介數(shù)中心性而言,無論是否加入權(quán)重,美國的介數(shù)中心性總體高于中國,但兩者在數(shù)值上整體變小。這可能是由于在不考慮權(quán)重的情況下,除中美之外國家的重要性被低估,在考慮權(quán)重之后,這些國家的重要性被顯現(xiàn)出來,導致了中美兩國的介數(shù)中心性相對降低。對于聚類系數(shù)而言,中國和美國的聚類系數(shù)在加入權(quán)重前后趨勢相同,但是差值變小,這可能是因為,大多數(shù)國家僅僅選擇與中美合作,但是他們之間很少合作。加權(quán)方式改變后,聚類系數(shù)在中間部分呈增長趨勢,這可能是因為文章數(shù)量持續(xù)增長,而每篇文章的平均合作國家數(shù)保持穩(wěn)定。
為了進一步探索各國在國際科研合作中的作用,本文研究了科研合作中心對整個網(wǎng)絡的影響。具體而言,分別對比了當合作網(wǎng)絡中刪除中國或美國,及同時刪除中國和美國時網(wǎng)絡的結(jié)構(gòu)變化,如表1 所示。在疫情前期,當失去中國或美國時,合作次數(shù)分別下降了26.13%和35.87%,當同時失去中國和美國時,整個網(wǎng)絡縮小了將近一半,這說明中美雙核心都對疫情期間的國際科研合作有著極大的影響。在疫情蔓延期,各個國家開始加大研究力度,顯著地擴大了合作網(wǎng)絡,導致中美在整個合作網(wǎng)絡中的影響力都有下降,其中中國的下降尤其明顯,這說明了國際科研合作的中心隨著疫情的蔓延逐漸從中美轉(zhuǎn)移到了歐美,很可能是因為中國疫情防控取得了快速和巨大的成效,使得在中國開展研究的急迫性和數(shù)據(jù)量逐漸下降[26-27]。

表1 刪除部分節(jié)點后網(wǎng)絡節(jié)點和邊的變化
新鮮度原是用于研究科研工作者之間的團隊模式及文章的原創(chuàng)性和學科交叉之間的關系,其定義為無合作關系的團隊成員占總合作團隊成員的比例[28]。本文將新鮮度概念擴展到國家,以國家為基本計算單元,月份作為時間窗口,構(gòu)建每個月的科研合作網(wǎng)絡并計算每個國家的合作新鮮度。其中,國家新鮮度定義當月合作過且上月沒有合作過的國家數(shù)占當月合作的所有國家數(shù)的比例。本文用國家合作新鮮度衡量該國家的合作開放程度,即積極與非固定合作國家展開新合作。并利用國家新鮮度隨時間的變化反映出疫情期間科研合作的動態(tài)演化。圖6 為國家合作新鮮度的示意圖,以中國為例,其中,虛線表示當月有合作關系,實線表示上月有合作關系。從圖6a 可見,中國在上月和當月合作的國家是相同的,故合作新鮮度為( 3-3)/3=0。如圖6b所示,中國上月未合作的國家有加拿大,則合作新鮮度為 (4-3)/4=0.25。如圖6c 所示,中國與所有國家都在上月沒有合作,故合作新鮮度為(3-0)/3=1。

圖6 國家新鮮度計算示例
如圖7 所示,2020 年3 月-2020 年5 月,中國、美國和歐洲的合作新鮮度都有不同程度的下降,其原因可能是合作國家數(shù)量迅速增加,也可能是疫情的爆發(fā)使各國傾向于持續(xù)穩(wěn)定高頻的合作。在這之后,中國的合作新鮮度基本趨于穩(wěn)定,因為2020 年4 月,中國的疫情已經(jīng)趨緩。而歐美的合作新鮮度在2020 年5 月之后不斷下降,在8 月到達谷底,之后逐漸上升,于10 月到達頂峰。這可能是由于不同時間段歐美地區(qū)受到了不同程度的疫情影響。此時,中國疫情已基本得到有效控制,正在不斷輸出抗疫經(jīng)驗與研究成果,因此在合作新鮮度上高于同時段的歐美地區(qū),這說明中國對參與國際科研合作的態(tài)度十分積極。

圖7 國家合作新鮮度隨時間的變化
近年來,因果推論方法在各個不同學科取得了長足發(fā)展,在經(jīng)濟、教育,甚至是人工智能領域中[29-31],因果推論也受到了極大關注[32-33]。目前推斷因果關系最有效的方法是進行隨機對照實驗,對照組和實驗組之間的期望差異就是因果造成的影響。然而,現(xiàn)實中的隨機對照實驗因其具有受試者數(shù)量受限、只關注樣本平均值及涉及倫理等問題而難以廣泛應用,因此更多時候需要利用現(xiàn)有的觀察數(shù)據(jù)尋找因果關系[34]。目前已有許多方法從統(tǒng)計數(shù)據(jù)中分析因果關系,如斷點回歸、格蘭杰因果關系檢驗、傾向值匹配法、工具變量法、雙重差分法等。相比于其他方法,斷點回歸方法更接近于隨機實驗[35],所以可以采用斷點回歸方法去評估疫情的影響。
斷點回歸構(gòu)造了一個類似隨機實驗的環(huán)境,它適用于研究社會科學事件中存在的因果關系。這些事件的特點是:個體受到事件的影響,存在某個可觀測變量的臨界值[36]。斷點回歸可以觀測到社會事件的發(fā)生對于個體的影響,與之具有相似作用的還有雙重差分法等。但不同于雙重差分法需要控制組的缺點,斷點回歸并不需要其他數(shù)據(jù)。由于疫情的影響范圍廣、程度大,很難有不受疫情影響的控制組數(shù)據(jù),因此斷點回歸便成為了實驗的首選。
作為一個依靠觀測數(shù)據(jù)的方法,使用斷點回歸估計因果關系,其數(shù)據(jù)至少含有3 個基本變量,即驅(qū)動變量、斷點和觀測結(jié)果。驅(qū)動變量是個體的一個連續(xù)變化的特征值,變量的值大于斷點個體將接受處置。要求驅(qū)動變量的值在斷點附近不能被準確操控,即始終存在一部分隨機因素,使驅(qū)動變量的值大于或小于斷點存在偶然性。斷點的量綱與驅(qū)動變量的量綱相同,其值用以決定個體是否接受處置。斷點的選擇是獨立的,不受到驅(qū)動變量的分布的影響,否則就會造成系統(tǒng)性差異,使斷點附近的個體不是局部隨機的。觀測結(jié)果為所觀測的個體接受處置和未接受處置的可觀測變量,是衡量處置效應的重要依據(jù)。除了所研究的觀測結(jié)果在斷點附近產(chǎn)生跳躍式變化外,其他的觀測結(jié)果應該在斷點處沒有顯著性差異。
確定了基本變量之后就可以對斷點兩邊的數(shù)據(jù)分別進行線性回歸,這樣就可以初步在斷點處觀測到一個處置效應。根據(jù)在斷點處的處置效應,可以初步確定斷點回歸的可行性。
本文使用斷點回歸方法以判斷疫情在美國本土的爆發(fā)是否是美國積極參與新冠合作的主要原因。以時間為驅(qū)動變量,將美國在此期間的合作文章數(shù)量作為觀測結(jié)果,以探究疫情的爆發(fā)和蔓延對美國在疫情相關科研合作的影響。
圖8 為疫情期間美國合作文章數(shù)量的斷點回歸估計效應圖,從圖中可以看出在斷點處美國研究疫情的合作文章數(shù)量呈現(xiàn)出明顯的跳躍趨勢。這一結(jié)果證明了疫情確實推動了美國與國際間的科研合作。在斷點前后存在顯著的階躍也說明美國在國內(nèi)疫情還未爆發(fā)時對疫情并沒有足夠重視,等到國內(nèi)疫情爆發(fā)后才意識到問題的嚴重性,于是開始尋求國際合作以對抗疫情的發(fā)展。

圖8 斷點回歸估計效應圖
雖然得到的回歸曲線具有明顯的跳躍,仍不能認為這個處置效應是由于疫情爆發(fā)所引起的,所以在進行斷點回歸設計之前,需要進行有效性檢驗。對此可以檢驗個體非研究觀測結(jié)果在斷點處的連續(xù)性,以確保跳躍是由疫情爆發(fā)所引起的。此外,還需檢驗驅(qū)動變量在斷點處的連續(xù)性[37]。該檢驗有助于評估驅(qū)動變量是否表現(xiàn)出異常特征,從而確定驅(qū)動變量是否滿足隨機分配的條件,以確定設計的合理性。
為了消除內(nèi)生性影響,需要對模型進行驅(qū)動變量密度連續(xù)性檢驗以及其他變量在斷點處的連續(xù)性檢驗以分析有效性。但當驅(qū)動變量為時間這類密度一致的變量時,就不需要進行密度連續(xù)性檢驗,所以只對美國新冠期間的文章的合作比例以及合作文章的作者數(shù)量進行了連續(xù)性檢驗,觀察數(shù)據(jù)在斷點處有無明顯階躍。合作比例定義為參與合作的文章數(shù)量占全部文章數(shù)量的比例,團隊大小定義為文章所包含的機構(gòu)數(shù)量。如圖9 所示,合作比例和團隊大小在斷點處沒有明顯階躍,所以用斷點回歸觀測疫情爆發(fā)美國合作文章數(shù)量的處置效應在理論上是可行的。同時可以觀察到,在疫情前期,美國疫情相關論文擁有非常高的合作比例。這可能是由于在疫情前期,美國尚未爆發(fā)疫情,與疫情相關的文章數(shù)相對較少且缺少疫情相關數(shù)據(jù),因此要對疫情展開研究只能與其他國家合作。在本土疫情爆發(fā)后,美國發(fā)表了大量疫情相關研究使合作比例有略微下降。隨著疫情的蔓延,美國也針對這一全球性災難加強了國際合作,合作比例逐步上升。

圖9 斷點回歸有效性驗證
為了得到在斷點處準確的處置效應,可以利用多項式回歸去評估觀測結(jié)果在斷點處的處置效應。本研究首先進行全局多項式回歸,將兩邊的回歸多項式合并:

則回歸的多項式為:

式中,c為斷點; α表示回歸系數(shù)。
從全局回歸的結(jié)果中發(fā)現(xiàn)在處置效應上只有一次項是顯著的,其中時間的高次項系數(shù)也基本為0,對于處置效應在統(tǒng)計上也不顯著,所以全局高次多項式回歸在時間序列上不適用 。因此在時間序列上采用局部低次多項式回歸,以消除離斷點較遠的樣本對評估處置效應的影響,只評估離斷點較近的樣本對評估處置效應的影響。
當采用局部多項式回歸時,應當考慮到不同的帶寬可能會對評估處置效應產(chǎn)生一定的影響。由于高次多項式回歸在局部回歸的時候更容易造成過擬合的情況,所以在選擇回歸次數(shù)的時候,本文僅考慮一次多項式和二次多項式。使用三角核函數(shù)作為回歸的核函數(shù),然后根據(jù)不同次數(shù)、不同帶寬分別做局部多項式回歸,觀察其處置效應。從表2 中可以看出,局部多項式回歸的結(jié)果是顯著的。并且這個結(jié)果在選擇不同的帶寬時依舊顯著,這證明本文的結(jié)果具有一定的魯棒性。綜上所述,本文通過斷點回歸發(fā)現(xiàn)美國本土疫情的爆發(fā)促使其更多地參與到國際科研合作中,這一結(jié)論是可信且有效的。
在表2 中,mserd 表示一種用于斷點回歸的處置效果估計器的均方誤差最優(yōu)帶寬選擇器;msetwo 表示在高于斷點值和低于斷點值分別有一個斷點回歸的處置效果估計器的均方誤差最優(yōu)帶寬選擇器;cerrd 表示一種用于斷點回歸的處置效果估計器的覆蓋誤差率最優(yōu)帶寬選擇器;certwo 表示在高于斷點值和低于斷點值分別有一個斷點回歸的處置效果估計器的覆蓋誤差率最優(yōu)帶寬選擇器。

表2 局部多項式回歸結(jié)果
本文基于科研合作網(wǎng)絡及因果分析方法,使用疫情相關研究的論文數(shù)據(jù)構(gòu)建國家科研合作網(wǎng)絡,探究了疫情期間國際科研合作網(wǎng)絡的演化模式及合作中心國家對于合作的態(tài)度。
本文發(fā)現(xiàn),在疫情前期,科研合作網(wǎng)絡的中心為美國和中國,但隨著疫情的不斷蔓延及中國疫情的緩和,科研合作網(wǎng)絡的中心逐漸由中國轉(zhuǎn)移到歐美地區(qū)。中國在疫情前期為全球抗疫事業(yè)做出了突出貢獻,并一直保持著與其他國家的緊密合作關系。但是在科研合作網(wǎng)絡演化視角下,合作中心的轉(zhuǎn)移意味著中國還需要將科研方面的優(yōu)勢轉(zhuǎn)化為自己的國際影響力。
為了進一步探究國家積極參與國際科研合作的原因,本文使用斷點回歸研究了疫情爆發(fā)對美國合作文章的影響。結(jié)果顯示,在美國疫情爆發(fā)前后,美國對于新冠疫情合作研究的態(tài)度發(fā)生了明顯的改變。在疫情爆發(fā)后,美國意識到了疫情的嚴重性,并加深了國際間科研合作的程度,這說明重大災難是促使人們更加團結(jié)的原因之一。