999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多代參考文獻的單篇論文學科分類方法研究

2024-06-03 23:23:55黃穎虞逸飛孫蓓蓓等
現代情報 2024年6期

黃穎 虞逸飛 孫蓓蓓等

關鍵詞: 多代參考文獻; 學科分類; 學科結構; 引文分析; 多學科期刊; 跨學科研究

DOI:10.3969 / j.issn.1008-0821.2024.06.010

〔中圖分類號〕G254.1 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2024) 06-0119-17

將科學文獻歸入適當的學科領域是實施有效的科學計量學分析的基本前提之一[1] 。學科分類系統不僅用于劃分研究領域[2] , 也在引文指標歸一化[3] 、跨學科測度[4] 、期刊排名[5] 等科學計量學實踐中發揮重要作用。鑒于此, 學者們進行了不同粒度或結構層次的分類方案的實踐探索, 主要可以劃分為基于期刊的分類方法和基于論文的分類方法兩種路徑。

在期刊總是接受契合其出版范圍的稿件這一假設下, 學術論文的學科在一定程度上可以通過期刊主題類別來定義。Web of Science(WoS)數據庫和Scopus 數據庫是期刊分類系統的典型代表。在這些系統中, 期刊被分配到1 個或多個學科類別, 學術論文的學科類別由其所發表的期刊類別決定。盡管WoS 和Scopus 憑借易于理解和可獲得性等優勢得到研究人員的廣泛關注[6-8] , 但其分類準確性也受到諸多質疑[9-12] 。除了數據庫出版商提供的分類系統外, 研究人員還進行了諸多嘗試, 提出了諸如魯汶-布達佩斯(Leuven-Budapest) 學科分類(又稱ECOOM 學科分類)[1] 、UCSD 分類[13] 、Science -Metrix 分類[14] 等應用于不同場景的期刊分類體系。但是, 基于期刊的直接映射方式存在諸多弊端, 例如學科分類存在偏差[15] 、無法細分在多學科期刊上發表的論文[16] 、沒有提供足夠的分析清晰度進行文獻計量標準化[17] 等。

面對文獻研究主題廣泛多元的挑戰[18] , 加之跨學科研究的趨勢愈發明顯, 基于單篇論文層面的學科分類方法應運而生。與基于期刊的粗粒度分類方式相比, 基于單篇論文的分類從文章自身特點出發, 是一種自下而上的分類方法[19] , 其中基于引證關系和文本內容是兩種主要的分類策略。文獻間的引證關系, 從本質上揭示了知識流動與知識轉移的過程[20] , 而參考文獻作為施引文獻的知識基礎, 可將其認作是參考文獻中的知識流向了施引文獻[21] 。因此, 施引文獻的主題往往可以由參考文獻的學科分類來描述。Gl?nzel W 等[22] 基于參考文獻信息實現了綜合性期刊中單篇論文的主題分類; WaltmanL 等[23] 根據出版物之間的直接引用關系, 在構建三級分類體系的基礎上, 實現了對近千萬出版物的研究領域分配; 在此基礎上, Ruiz-Castillo J 等[24]基于引用關系對出版物進行大規模聚類, 構建了12 個不同粒度的分類系統; Klavans R 等[25] 比較發現, 基于直接引用得到的分類結果比基于引文耦合或共引的分類結果更加準確。基于文本內容的單篇論文學科分類是另一種分類途徑, 已有諸多探討和實踐。例如, Dimensions 數據庫根據標題、摘要等文本內容并采用機器學習技術對其所收錄的論文進行了學科類別標注[26] ; Kandimalla B 等[27] 應用深度注意力神經網絡基于摘要文本信息對學術論文進行了分類; Eykens J 等[28] 基于論文標題和摘要利用有監督的機器學習方法對社會科學期刊的論文進行了單篇論文層面的類別劃分; Dunham J 等[29] 通過文本信息識別了人工智能領域的相關出版物, 并為其分配了學科主題。此外, 也有學者嘗試采用引用與文本相結合的混合聚類方法來提高分類效能[30] 。總體而言, 基于引證關系和文本內容的單篇論文學科分類方法各具優劣, 前者揭示了論文之間的鏈接但忽略了文本特征, 后者反之[19] 。基于單篇論文的學科分類可以有效解決期刊與論文之間的主題偏差, 實現對發表在多學科期刊上的論文分類, 但單篇論文分類在宏觀分析中也存在局限[31] 。

作為對當前學科分類體系的補充, 本研究提出了一個基于多代參考文獻的參數化分類方法, 以實現對單篇論文的學科分類。在該學科分類方案中,一篇文獻的學科分配以其多代參考文獻的研究領域為基礎, 利用多代參考文獻的學科分類信息來降低目標文獻中學科分類的熵值, 從而將目標文獻分配到1~3 個學科類別中。該方法與基于期刊的直接映射方法相比, 可以實現對于多學科期刊上的單篇學術論文分類; 與現有的基于論文的分類方法相比,該方法的操作復雜度相對降低, 并且可以為跨學科學術論文的識別提供可行方案。

1 研究方法

1.1 方法基礎

在科學文獻體系中, 各科學文獻之間并非孤立存在, 而是相互聯系的。文獻之間的相互引證關系即為科學文獻相互關系的主要表現。Porter A L 等[32]認為, 參考文獻有效反映了科學知識和信息從被引文獻流向施引文獻的過程, 其所屬學科分布也常被認為是揭示目標文獻研究學科的重要依據[22,25,33] 。從邏輯上來說, 參考文獻多樣性是文獻知識整合的最好測度[34] , 因而屬于顯性知識的參考文獻以其極高的可獲得性被廣泛應用于相關研究中。

本研究將目標文獻直接引用的若干篇參考文獻稱作一代參考文獻。一代參考文獻同樣擁有其知識基礎來源(二代參考文獻)。以此類推, 基于文獻間的引用關系可以迭代產生多代參考文獻。圖1 展示了目標文獻的多代參考文獻模型。其中, 灰色部分表示有效參考文獻, 即那些被數據庫索引收錄的文獻, 擁有學科分類信息; 白色部分表示無效參考文獻, 即沒有被數據庫索引的、學科分類不明確的文獻, 在操作中需要剔除。因此, 如果一代參考文獻中有大量的無效文獻或發表于多學科期刊的文獻,可能會掩蓋目標文獻的主要知識來源學科信息。通過增加不同代際的參考文獻可以擴大知識來源文獻規模, 有助于增加目標文獻知識整合的學科范圍。

引文網絡中的知識流動可用于跟蹤技術或科學知識的發展軌跡[35] 。從科學發展規律看, 知識流動具有明顯的累積性和繼承性[36] 。參考文獻反映了目標文獻學科領域基礎研究和應用研究的知識累積[37] , 不同代際參考文獻之間的知識同樣是相互聯系、彼此滲透的。Gl?nzel W 等[1] 于2003 年提出了ECOOM 學科分類體系, 該兩級分類體系均勻覆蓋了整個科學領域。如圖2 所示, 以WoS 核心合集(SCIE, SSCI, AHCI)在1999—2018 年收錄的文獻為參照, 根據文獻所屬期刊的學科類別, 計算了不同ECOOM 學科領域文獻的前二代參考文獻學科相似度占比分布情況。學科相似度越高, 意味著一代參考文獻與二代參考文獻的學科結構越相似。結果顯示, 地球與空間科學(G)領域有72 9%的文獻的學科相似度位于[0.95,1.00]的區間范圍內, 說明該學科領域文獻的兩代參考文獻學科高度相似。在ECOOM 的16 個學科領域中, 學科相似度高于0.8的文獻平均占比超過90%。其中, 藝術與人文科學(K)占比最低(71. 3%), 而神經系統科學與行為科學(N)則最高(96.6%)。整體上看, 各領域文獻的一代與二代參考文獻之間的學科相似程度處于較高水平, 說明不同代際參考文獻之間的知識存在傳遞性, 因而參考文獻在多輪迭代的過程中保持著相對一致的學科結構。由此可見, 通過多代參考文獻的迭代方式, 豐富的信息量可以更好地呈現目標文獻的知識來源結構, 進而為目標文獻的類別分配提供依據。同時, 考慮到參考文獻用以表征目標文獻的精確度隨著迭代次數的增加而降低, 可以賦予間接引用的參考文獻較低的權重, 進而降低信息熵。

1.2 方法步驟

本研究提出了一種基于多代參考文獻的學科分類方法, 嘗試在單篇論文層面將文章劃分至特定的學科類別(每篇文章都歸入1 個或多個類別), 可以在一定程度上解決學術論文與發表期刊主題不一致、多學科期刊論文分類等問題。具體方法流程如圖3 所示, 包含以下3 個步驟:

1) 數據獲取與預處理

WoS 學科分類系統是在綜合考慮引用關系、期刊標題和專家意見的基礎上建立的, 其在期刊分類準確性方面具有優勢[10] 。ECOOM 學科分類體系建立在WoS 學科類別的基礎上, WoS 學科分類在ECOOM 分類體系中被映射為16 個學科領域和74個學科類別[38] 。本研究以WoS 數據庫為數據來源,獲取目標文獻的多代參考文獻及其WoS 學科分類信息。由于更多的學科分類會增加引用不同學科分類來源的可能性, 同時增加學科分類的模糊性[39] ,因此本研究選擇74 個ECOOM 學科類別作為基準學科, 將多代參考文獻基于期刊進行映射, 并最終為目標文獻分配若干個學科類別。

基于目標文獻的多代參考文獻的學科分類信息,使用全計數法計算歷代參考文獻中74 個ECOOM 學科分類的占比情況, 具體公式如式(1) 所示:

權重系數的設置標準最終影響著文獻的學科分類結果, 因此, 本研究設置了5 種權重規則, 如表1 所示。不同權重的分配結果存在差異, 多種方式結合為提高分配成功率提供了可能。為此, 本研究進一步提出了(W1+W2)和(W1+W2+W5)這兩種擴展方案。當權重類型設置為(W1+W2) 時,代表先基于W1 權重規則對文獻進行分類, 針對無法分配的文獻, 再使用W2 權重規則予以補充; 與之相類似, (W1+W2+W5)代表文獻依次使用W1、W2 和W5 的權重規則, W1 的學科分類結果的優先級最高, 其次是W2 和W5。

為簡化運算規模并提高論斷準確性, 本研究選取目標文獻的一代參考文獻及二代參考文獻的學科分布情況作為本研究文獻分類的參照。當n =2 時,基于以上規則, 權重系數設置如表1 所示。

3) 分配論文學科類別

為兼顧多學科研究特征與計算效能, 本研究將學科類別規模限制為3 個, 即每篇學術論文最多被分配3 個學科。就單篇論文而言, 其參考文獻中某學科的占比越高, 意味該學科是文獻知識基礎的主要來源, 因而該篇文獻更有可能屬于此學科范疇。基于這一假設, 本研究選取FS(?) i 數值最高的4 個學科, 降序排列后相鄰的兩個學科依次比較。經過細致的比對檢驗并結合領域專家的經驗, 本研究最終將閾值設定為2/ 3(0.667), 并以此為標準設置參數化模型, 進而為目標文獻標記上1~3 個學科,具體的判定流程如表2 所示。對于經過3 輪比較之后尚未被確認學科歸屬的學術論文標記為待定(TBD), 此類學術論文極有可能是真正的跨學科研究。為驗證文獻主題分配結果的準確性, 本研究綜合考慮文獻的標題、關鍵詞、摘要等信息, 同時結合文獻來源期刊和參考文獻的學科分類情況, 對目標文獻的學科分類結果進行綜合評估。

在以上學科判定與條件的指導下, 本研究選取了若干篇發表于多學科期刊Nature 上的學術論文來說明分配過程。如表3 所示, 文章1 ( UT:000419769300025)的參考文獻中占比第一的學科類別是地球科學與技術(G2), 且排名第二的學科類別(X0)與該學科的商小于0. 667, 因此這篇學術論文判定為屬于G2。通過閱讀文章1 的全文可知,該文主要探討了最后一次冰川過渡時期的全球海洋平均溫度, 符合G2 的學科范疇。又如, 文章2(UT: 000419769300035)研究了用于哺乳動物宿主體內微生物無創成像的聲學報告基因, 其兩代參考文獻中排名第一的學科和排名第二的學科與其后一位學科的商分別為0.729 和0.376, 因此被歸入微生物學(Z3)和生物化學/ 生物物理學/ 分子生物學(B1)中, 學科分類劃分結果契合研究內容。同理,文章3(UT: 000419769300037)被分類至3 個學科,而文章4(UT: 000419769300030)則無法確定學科歸屬。結合4 篇文章的具體研究內容來看, 本研究提出的基于多代參考文獻的單篇論文學科分類方法具有可行性和可操作性。

對于在多學科期刊上發表的論文, 將其進行更細致的學科分類被視為有效措施[22] 。本研究以是否在原始計算結果中和計算比重時考慮多學科科學為劃分依據, 提出4 種不同的處理策略, 并以2018年發表在Nature 上的文章(UT: 000419769300037)為例開展案例分析, 具體過程和結果如表4 所示。其中, 除了方法A1 的分類結果包含多學科科學(X0)外, 細胞生物學(B2)和生物化學/ 生物物理學/ 分子生物學(B1)在4 種方法中均被判定為該文獻的學科類別, 分析結果具有穩健性。因此, 通過應用本研究提出的方法, 發表在多學科期刊上的學術論文可以實現學科類別的歸屬判定。

2 學科分類效果的比較

為深入了解基于多代參考文獻的單篇論文學科分類方法的應用效果, 本研究隨機抽取文獻進行核驗。如表5 所示, 列舉了6 篇論文在不同分類方案下的分類結果。其中, WoS 學科分類和ECOOM 學科分類均為基于期刊的學科分類方法, 前者來自WoS 數據庫, 后者是在文獻WoS 學科分類的基礎上映射而來的。Fields of Research(FoR)學科分類是澳大利亞和新西蘭標準分類(Australian and NewZealand Standard Research Classification, ANZSRC)的重要組成部分, 包含22 個一級學科領域和157 個二級學科類別[40] 。Dimensions 數據庫根據論文的文本內容, 采用機器學習技術實現單篇論文自動分類[19] 。每篇論文至少分配到1 個FoR 學科領域中[26] 。作為一種單篇論文分類方案, 其分類結果具有相對準確性[41] 。以上各方法的學科分類結果將與本研究提出的方法進行詳盡比對分析。

表5 中前3 篇文獻均來自國際知名多學科期刊——Nature。基于期刊的學科分類方法將以上3篇文獻都簡單分類至多學科科學。然而, 基于單篇論文的學科分類方案捕捉了文獻研究內容的差異,賦予了文獻更細粒度的分類結果。

文章1(UT: 000342420800048)在本研究提出的方法中屬于生物化學/ 生物物理學/ 分子生物學和細胞生物學兩個學科類別, 與FoR 分類結果保持相對一致。

文章2(UT: 000413247900053)介紹了一種人工智能算法, 在Dimensions 數據庫中被分配至人工智能和機器學習兩個類別中, 而在本研究所提出的方法中被判斷為計算機科學/ 信息技術領域。

文章3(UT: 000441673400035)研究了一種低溫掃描電鏡繪圖方法, 是材料科學和物理化學領域的前沿創新, 同樣可以運用本研究所提出的方法予以準確識別。

對于發表在具體學科期刊上的文章, 本研究提出的方法同樣可以相對準確地判斷其研究主題。

文章4(UT: 000262300600010)論證了“具有正曲率算子的流形是空間形式”, 發表于世界數學界最頂尖期刊之一的Annals of Mathematics 上。4 種學科分類方法均將其歸入純數學領域, 表明該篇文獻無論是在發表期刊還是在知識基礎上都嚴格遵循數學領域的研究范式。

文章5(UT: 000263319600062)來自多學科化學期刊Journal of the American Chemical Society, 基于單篇論文的分類方案予以更為具體的學科類別。運用本研究所提出的方法不僅可以識別出其可以劃分為材料科學和應用物理學, 還補充了“P6-固體、流體與等離子體物理學” 這一學科類別, 契合該文中“抑制劑的化學位移擾動的幅度和方向模式的分析”。

文章6(UT: 000261996400002) 發表于Bioin?formatics 這一生物信息學領域的頂級期刊。該期刊涵蓋了生物化學研究方法、生物工程學和應用微生物學等在內的5 個WoS 分類, 分屬于4 個ECOOM學科領域。以該期刊出版的文獻為例, 基于期刊映射的學科分類方法將全部期刊類別分配給了文章6, 而從單篇論文本身的研究內容出發, 則被認定是生物化學/ 生物物理學/ 分子生物學和微生物學的研究成果。

以上討論表明, 與基于期刊的學科分類方法相比, 本研究提出的方法從目標文獻的知識來源視角出發, 通過對目標文獻知識基礎的學科結構進行測度, 進而為其分配1 個或多個具體的學科類別, 使得分類結果具備較高的準確性。因此, 本研究方法不僅彌補了僅依據期刊映射得到的過于寬泛的結果,而且在處理發表于多學科期刊上的論文或者具有跨學科屬性的論文時表現出顯著優勢。與同樣為單篇論文學科分類方法的FoR 分類相比, 本研究方法的分類結果與其在學術論文的研究主題識別上有相對一致性。然而, 加權多代參考文獻的論文分類方法以文獻的學科類別為評判依據, 相較于論文的主題文本而言, 數據可得性更高, 且操作復雜度更低,因而是一種更為簡便的學科分類方案。此外, 本研究方法的基準學科類別不受限制, 可適用于不同的學科分類體系中, 兼容性相對更好。

3 學科分類的應用場景

學科分類方法的可靠性不僅取決于典型數據分類結果的準確性, 還取決于其對不同分析層次的適用性、就不同目的的靈活性以及解釋與復制的簡易性[33] 。為探究本研究方法的實際應用效果, 本研究借助前二代參考文獻來實現目標文獻的學科類別歸屬判定, 并從不同學科領域和不同類型期刊層面的單篇論文分類的應用場景予以探討。

3.1 不同學科領域的論文學科分類

本研究以WoS 核心合集收錄的發表于1999—2018 年的學術論文作為研究對象, 根據論文發表期刊所在學科, 將文獻劃分至ECOOM 的16 個學科領域中。在此基礎上, 運用不同的權重設置規則和多學科科學處理策略, 探究不同參數設置條件對分類結果的影響, 進而全面分析基于多代參考文獻的單篇論文學科分類方案在不同學科領域的表現。

如表6 所示, 展示了不同領域文獻的覆蓋率分布情況, 其中覆蓋率代表成功分配的文獻數占該領域文獻總數的比重。不同學科領域因其研究范式和知識結構特征各異, 在基于多代參考文獻的主題分配下得到了不同的結果。其中, 社會科學Ⅱ(經濟、政治和法律科學)(L)的覆蓋率最高, 近97%的學術論文被確定學科類別歸屬, 其次為數學(H)。但是, 生物醫學研究(R)和化學(C)的分配成功率較低, 在各類參數條件中, 平均約16%的學術論文處于待定狀態。值得注意的是, 以上兩個學科的覆蓋率甚至低于多學科科學(X0)的覆蓋率(85%),這在一定程度上表明生物醫學研究和化學領域文獻的跨學科性更為顯著, 導致更多文章無法被歸入特定學科類別。而就多學科期刊上的文章的主題分配問題而言, 結果顯示, A3 和A4 策略的覆蓋率略勝于A1 和A2, 說明在計算比重前后剔除多學科科學(X0)可以在一定程度上提升分配效果。

在5 種不同的權重設置規則中, W1 在各學科領域上的表現相對更佳, 平均覆蓋率超過90%。但是, 單獨使用W2~W5 的權重分配方案通常會導致較低的覆蓋率。為進一步提高分配效果, 本研究進一步提出了(W1+W2)和(W1+W2+W5)這兩種擴展方案, 前者在W1 的基礎上補充W2 的結果,后者統籌考慮了3 種權重方案的分配結果。數據顯示, 當使用(W1+W2) 時, 平均覆蓋率為93%,生物醫學研究(R)的覆蓋率更是顯著提升了5%;當權重規則為(W1+W2+W5)時, 平均覆蓋率高達96%。由此可見, 權重系數疊加的方式有效地提高了分類方法在不同學科領域的適用性。

對于少量無法分類的文獻, 本研究進一步分析了它們的特征, 主要涉及以下原因: ①文獻沒有參考文獻; ②參考文獻發表時間早, 超出了數據庫檢索范圍, 即發表于1991 年之前; ③大部分參考文獻所在期刊沒有被WoS 收錄, 因而這些參考文獻沒有WoS 學科分類, 導致無法映射至ECOOM 學科類別中; ④文獻是跨學科研究, 即整合不同學科來源的知識以解決研究問題的學術論文, 其參考文獻中各個學科均不占主導地位。

3.2 不同類型期刊的論文學科分類

本研究進一步遴選了3 本多學科領域期刊(Nature, Science, Proceedings of the National Acade?my of Sciences(PNAS)) 和3 本信息科學與圖書館學領域期刊(Journal of the Association for InformationScience and Technology(JASIST), Journal of Informe?trics ( JOI ), Scientometrics ( SCIM )), 獲取其在1999—2018 年發表的全部學術論文及其多代參考文獻, 從期刊層面展開討論。

如表7 所示, 描繪的各期刊在不同參數條件下的學科分類情況, 可知多學科領域期刊的平均覆蓋率(85%)顯著低于信息科學與圖書館學領域期刊,這與多學科期刊本身廣泛的研究領域和多元的學科背景息息相關。其中, A2 條件下的覆蓋率相對更低, 此時僅有約79%的Nature 文獻可以被劃分至細粒度學科中。與上一節學科領域的比較結果類似, A3 和A4 可以顯著提升多學科期刊上文獻的被分配概率, Nature 的覆蓋率提高至近89%。而當權重設置為(W1+W2+W5)時, 多學科期刊的覆蓋率達到95%以上, 表明擴展方案是提高分類覆蓋率的可靠途徑。此外, 研究也發現發表在信息科學與圖書館學領域期刊上的學術論文也有部分屬于跨學科研究, 難以歸屬到特定的學科類別中。

為了進一步挖掘上述6 本期刊的學科類別分布詳情, 本研究分析了在(W1+W2+W5)和A4 的條件下, 各期刊論文的學科類別數量分布如圖4 所示。總體而言, Nature、Science 和PNAS 的學科數量分布情況十分接近, 盡管以上期刊屬于多學科范疇, 但超過40%的論文歸屬單一學科, 而同時涵蓋3 個學科領域的文獻占比約為20%。以上結果說明, 發表于多學科期刊上的文獻未必具有多學科的研究背景, 基于多代參考文獻的學科分類方案更加聚焦于論文本身, 可以合理細分此類文獻。信息科學與圖書館學的期刊文獻則呈現出不同的分布情況,有大量論文被歸類于兩個學科, 尤其是發表于JOI期刊上論文。一方面, 信息科學與圖書館學是一門跨學科廣度大、強度高的學科, 其知識基礎來源十分廣泛[42-43] ; 另一方面, 此領域期刊往往同屬于計算機科學/ 信息技術(E1)和教育與信息(Y1)等學科, 導致諸多參考文獻被映射至上述兩個學科。

進一步, 本研究追溯了各期刊文獻的具體學科類別, 如圖5 所示。可以看出, 多學科期刊上所發表論文的學科類別十分豐富, 其中生物化學/ 生物物理學/ 分子生物學(B1)、細胞生物學(B2)和遺傳與發展生物學(B3)是此類期刊的主要研究領域。Nature 和Science 都十分關注應用化學與化工(G2),而PNAS 更關注神經系統科學與精神(病)藥理學(N1)和微生物學(Z3)。信息科學與圖書館學的3本期刊呈現出相似的結果, 教育與信息(Y1)和計算機科學/ 信息技術(E1)占據了主要位置, 也有一定數量的文獻被納入商業/ 經濟/ 規劃(L1)、心理學與行為科學(N2)等學科范圍內。這說明該領域文獻以本領域學科為主, 并傾向于借鑒管理學、心理學等相關領域的知識和技術。

4 結論與討論

當前單篇論文的學科分類系統大多是在期刊層面上定義的, 可以高效便捷且相對準確地對學科屬性明晰的文獻進行分類。但是由于期刊的映射方法過于寬泛, 因此無法辨識發表于相同期刊文獻的研究主題差異, 且在多學科或者綜合性期刊文獻的處理上存在困難[23] 。此外, 隨著學科邊界日益模糊,研究人員向其他學科領域期刊投稿的現象愈發普遍, 僅僅依靠期刊對文獻的研究主題進行界定存在局限。

本研究提出了一種基于多代參考文獻的單篇論文學科分類方法, 其核心是挖掘目標文獻的多代參考文獻學科信息與結構, 通過一系列參數化模型和推導程序, 將單篇學術論文歸入1~3 個學科類別中。本研究以1999—2018 年發表的WoS 文獻為研究對象, 首先對單篇論文的分類結果進行比較評估,然后從學科領域和期刊層面分別驗證了該方法的應用價值。與基于期刊的學科分類方法相比, 本研究提出的方法在單篇論文層面構建了與當前科學研究結構緊密匹配的、更具兼容性的學科分類方法, 整體而言, 其優越性主要體現在以下3 個方面:

第一, 該方法基于單篇論文層級而不是期刊層級, 因此它保留了來源于同一期刊的文獻之間潛在的學科差異, 并且可以捕捉單篇論文更細致的研究主題。實踐證明, 期刊的學科類別與其出版文獻的研究領域并非完全一致, 因而基于期刊的學科分類方法存在誤判的可能。相較而言, 本研究提出的方法從文獻的知識來源視角出發, 以其多代引文的學科分類作為參考, 進而為單篇論文分配1~3 個主題, 其分類結果更契合文獻研究內容, 具有一定優越性。

第二, 該方法可以有效解決來自多學科期刊的文獻學科分類問題。傳統的基于期刊的分類方法將發表于多學科期刊或者綜合性期刊的論文標記為多學科論文, 顯然忽視了文獻自身的學科屬性。通過運用不同的權重設置規則和多學科科學處理策略,本研究提出的加權多代參考文獻的學科分類方法將可分類的論文占比提高到95%, 在一定程度上解決發表在覆蓋面廣、出版主題模糊的多學科期刊上文獻的學科細分問題。

第三, 該方法為識別跨學科論文提供了一種可行方案。本研究選用的學科類別規模合適, 并允許將單篇論文分配至多個研究領域, 符合當代科學發展中跨學科性日益凸顯的趨勢。若一篇論文無法劃分到1~3 個學科類別中, 可推測出其參考文獻的學科跨度十分廣泛, 且沒有學科占主導地位, 表明這類論文具有顯著的跨學科性。

然而, 本研究提出的基于多代參考文獻的單篇論文學科分類方案完全依賴于文獻引用關系, 也存在諸多局限。其一, 該方法以參考文獻為基礎, 因此只能應用于有參考文獻的出版物, 這使得許多早期發表的論文因沒有參考文獻或參考文獻沒有被WoS 收錄而無法進行分類, 而那些只有少量參考文獻的出版物容易被錯誤劃分而導致偏差; 其二,參考文獻具有學科分類的出版物占比在不同領域之間存在較大差異, 例如在藝術與人文科學中, 僅有54.6%的文獻含有WoS 檢索的參考文獻, 而該比例在生物科學(一般生物學; 細胞及亞細胞生物學; 遺傳學)中高達99.4%, 這會使得某些領域文獻的學科分配效果不佳; 其三, 本研究使用的基準學科仍然依賴于WoS 學科分類, 無法避免WoS 期刊分類錯誤的根源性漏洞以及ECOOM 學科類別的映射偏差, 最終導致分配結果出現偏差甚至錯誤。

總體而言, 本研究提出的方法不僅實現了多學科期刊文獻的學科類別劃分, 同時也為基于期刊的單篇論文學科劃分提供了補充方案, 進而可以為面向國家、機構、個人等多元主體的科研評價與相關研究提供新的方法參考。然而, 參考文獻數量及其學科分類情況會直接影響文獻分類的精度。因此,在后續的研究中, 除了解決參考文獻層面的文獻數據問題之外, 還需要針對方法本身進行優化。例如,可以配合直接引用或耦合分析等方法進一步提升分類效果, 或結合論文的主題文本數據進行綜合評估等。

主站蜘蛛池模板: 青青青国产视频| 国产菊爆视频在线观看| 午夜高清国产拍精品| 日韩在线欧美在线| 久久综合激情网| 精品欧美一区二区三区久久久| 91年精品国产福利线观看久久| 日韩欧美中文| 欧美在线网| 久久精品嫩草研究院| 午夜免费视频网站| 丁香婷婷久久| 国产一区二区精品福利| 欧美一区二区福利视频| 亚洲精品卡2卡3卡4卡5卡区| 欧美成人亚洲综合精品欧美激情| 国产欧美日韩专区发布| www.91在线播放| 国产aaaaa一级毛片| 国产白浆在线观看| 午夜丁香婷婷| 国产成人高清亚洲一区久久| 999国产精品| 国产精品漂亮美女在线观看| 99在线视频网站| 自拍偷拍欧美| 欧美亚洲国产精品第一页| 久久99精品久久久久久不卡| 国产色图在线观看| 2021天堂在线亚洲精品专区| 亚洲一区波多野结衣二区三区| 国产成年女人特黄特色大片免费| www.av男人.com| 91国语视频| 天天躁夜夜躁狠狠躁图片| 日本高清免费不卡视频| 91视频首页| 在线观看亚洲精品福利片| 欧美日韩午夜| 欧美亚洲国产精品久久蜜芽| 无码免费视频| 欧美国产菊爆免费观看 | 999国内精品久久免费视频| 在线中文字幕网| 91在线日韩在线播放| 国产精品开放后亚洲| 成人在线观看一区| 免费高清自慰一区二区三区| 国产成人综合亚洲欧美在| 丁香五月婷婷激情基地| 色香蕉网站| 成年女人18毛片毛片免费| 午夜啪啪网| 国产精品免费露脸视频| 黄色a一级视频| 国产主播在线一区| 青草视频在线观看国产| 久久网综合| 国产精品女主播| 影音先锋丝袜制服| 特级精品毛片免费观看| 国产永久免费视频m3u8| 男女男免费视频网站国产| 亚洲制服丝袜第一页| P尤物久久99国产综合精品| 亚洲日韩久久综合中文字幕| 五月婷婷亚洲综合| 国产精品欧美在线观看| 日本妇乱子伦视频| 国产呦精品一区二区三区网站| 国语少妇高潮| 浮力影院国产第一页| 国内精品九九久久久精品| 91在线日韩在线播放| 毛片久久网站小视频| 国产精品欧美日本韩免费一区二区三区不卡 | 国产精品久久精品| 国产高清在线精品一区二区三区| 亚洲色图欧美在线| 喷潮白浆直流在线播放| 高清无码手机在线观看| 六月婷婷精品视频在线观看|