999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

社會科學數據集的跨學科性研究

2023-08-31 02:26:34劉智鋒王繼民
現代情報 2023年9期

劉智鋒 王繼民

關鍵詞: 社會科學; 數據集; 跨學科; CHARLS; CGSS

DOI:10.3969 / j.issn.1008-0821.2023.09.014

〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2023) 09-0165-13

隨著開放獲取運動的不斷興起, 開放科學得到了科研社區的廣泛關注[1] 。開放科學數據作為開放科學的重要組成部分, 是促進科學數據高效利用的重要途徑。早在2018 年, 國務院辦公廳發布了《科學數據管理辦法》[2] , 提出促進科學數據的開放共享, 以支撐科技創新與社會經濟發展。學界圍繞開放科學數據開放共享開展研究, 重點關注科學數據共享平臺[3] 、開放政策[4] 、影響因素[5] 等方面。

科學數據集開放只是共享的第一步, 數據集開放之后如何被學者利用, 則是科學數據發揮價值的關鍵所在, 同時也是理解科學數據開放共享如何促進科學進步的途徑。關于數據集的利用, 當前圖情領域學者多數從數據集利用主體出發, 重點關注數據復用行為特征[6] 及其影響因素[7] ; 也有學者研究了科學數據集的知識擴散[8] ; 卻鮮有研究關注數據集如何被不同學科領域的學者利用。數據集作為實證研究的基礎, 同一數據集不僅被本學科領域的學者利用, 也可被不同學科的學者復用[9] 。分析數據集被哪些學科使用, 跨學科性如何、是否存在跨學科合作社區, 相關研究的主題以及跨學科研究如何演化等問題, 有助于理解數據集在不同學科的擴散規律以及數據集如何在不同學科發揮作用的機制。

隨著數據驅動的研究范式在社會科學領域不斷盛行, 數據集已成為社會科學領域量化分析的重要基礎[10] , 社會科學數據集的數量快速增長, 數據集的影響力不斷增強。社會科學數據是指人類各類社會系統運行過程中所產生的各類數據[11] , 與自然科學數據存在顯著差異。在自然科學研究中, 實驗等方法獲取的數據標準性較好, 如在計算機科學和生物醫學等領域, 基于同一實驗數據集, 研究者可以從不同角度或采用不同方法進行研究, 從而具有較高的重復利用率; 相比之下, 社會科學數據主要通過調查等收集, 數據較為主觀, 質量參差不齊,且大部分社科數據集是研究者根據自身研究需求進行獲取, 盡管存在一些高質量數據集, 但滿足統一標準的數據集相對較少, 數據集的共享和重復利用率較低。為了促進社會科學數據集的共享與使用,社會科學領域學者不斷推進高質量的數據集建設,如北京大學牽頭開展了中國健康與養老追蹤調查,收集一套中國中老年人及其家庭的高質量微觀數據等, 高質量的社科數據不斷增加。

以往研究更多聚焦于科學數據集的共享與重復利用研究[12] , 對社會科學數據集的跨學科擴散研究較少。因此, 本文擬以被廣泛使用的中國健康與養老追蹤調查(CHARLS)和中國綜合社會調查(CGSS)兩個社會科學數據集為研究對象, 從數據集的跨學科性測度分析、數據集跨學科合作社區結構與主題識別以及數據集跨學科合作演化研究3 個方面, 對社會科學數據集的跨學科性進行研究, 以期為促進社會科學數據集在不同學科之間的開放共享、高效利用以及數據集的影響力評價等方面提供理論支持。

1相關研究

1.1科學數據集使用特征研究

科學數據集是描述科學研究對象、狀態、條件等因素的數字、文字和符號[13] , 可以分為調查數據、實驗數據、統計數據、記錄數據等不同類型,對實證研究具有重要研究意義[14] 。以科學數據集作為研究對象, 學界從不同視角對科學數據集的特征開展了一系列相關研究。從數據生命周期的視角出發, 孟祥保等[15] 分析了教育學、歷史學等6 個學科的數據創建主體、數據組織、數據存儲、數據出版以及數據引用5 個方面的特征。屈亞杰等[16] 從被引社會科學數據的被引次數、訪問形式、規模、時間跨度等不同方面揭示了社會科學數據的引用特點。沈婷婷[17] 以《中國社會科學》為例, 研究了人文社會學科學者的數據來源、所用的數據類型、方法與工具等。楊寧等[18] 分別從計量分析與內容分析兩個視角出發, 分析了生物醫學領域數據集的使用強度、使用章節、使用位置等使用特征。戚景琳等[19] 、張瑩等[20] 探索了經濟學和管理學領域的科研人員數據使用行為特征。Park H[9] 通過科學數據集在不同學科之間的引用情況, 研究科學、技術、工程等理工科的科學數據集跨學科性。綜上可知, 學者們主要從使用和引用兩個視角出發, 分析了科學數據集的特征和科研人員的數據集復用行為。然而, 社會科學數據集的跨學科特性并未得到深入研究。

1.2跨學科性相關研究

跨學科研究, 也被稱為交叉學科研究, 已被認為是人類解決重大科研難題的重要研究范式[21] 。而跨學科性是跨學科研究的特征, 如研究的跨學科分布及跨學科的廣度、深度等[22] 。關于跨學科性的研究, 學者主要從跨學科理論研究、跨學科性測度、跨學科性的演化等方面展開。在跨學科性的理論研究方面, 步一等[23] 從知識重組的視角來解構跨學科性。關于跨學科性的測度, Stirling A[24] 提出可以從學科豐富性、學科均衡性以及學科差異性3 個維度對跨學科性進行測度, 學科豐富性表示學科的種類多少, 學科均衡性代表的是不同學科的數目是否均衡, 而學科的差異性反映不同學科之間的差異程度; 后續學者采用各種類型的指標來衡量這3 個維度, 如不同學科數[25] 、信息熵[26] 、基尼系數[27] 等。在此基礎上, 學者們通過跨學科性測度指標隨時間的變化來研究跨學科性的演化, 如Zhao Y 等[28] 分析了COVID-19 相關研究是否具有越來越高的跨學科性; 吳小蘭等[29] 從學科豐富度、均衡度和差異度3 個方面研究了國家自然科學基金項目發文的跨學科演變。

此外, 部分學者從學科共現網絡與跨學科引用的視角來研究特定學科領域的跨學科性。學科共現網絡通過不同學科在同一篇論文共現關系來構建,特定領域論文的學科共現網絡可以反映該領域的跨學科合作結構, 從而揭示該領域的跨學科特征。如Xu X 等[30] 構建了7 544篇論文的學科共現網絡,并對網絡進行分析以揭示精準醫學領域的跨學科性。Hu J 等[31] 采用大數據領域的論文學科共現網絡來分析該領域的跨學科性。跨學科引用視角, 通過分析不同學科之間的引用情況, 以揭示不同學科之間的跨學科性以及不同學科之間的知識流動, 如徐璐等[32] 分析了圖書情報領域期刊的跨學科引用,來研究期刊在跨學科交流中所起的作用。施順順[33] 采用Rao-Stirling 多樣性指標評估了公共管理學的跨學科性。

綜上可知, 當前學者關于跨學科性開展了大量的研究, 然而這些研究主要研究特定主題或學科領域的跨學科性, 鮮有研究分析基于特定數據集的相關研究的跨學科性, 因此, 本文擬借鑒以往的相關研究, 從學科多樣性和學科均衡性對數據集的跨學科性進行測度, 并從學科共現網絡的視角出發研究基于特定數據集的相關研究的跨學科合作網絡結構及其演化規律。

1.3知識實體擴散相關研究

科學知識擴散是指知識在不同學者與學科領域之間的流動, 科學知識的擴散可以促進知識的生產與傳播, 從而推動科學發展。學術論文作為科學知識的重要載體, 是科學知識擴散研究的重要對象。以往研究通常從引文分析的視角來探討論文的擴散模式與規律。如閔超等[34] 將引文視作知識擴散的過程, 并從多個維度分析了引文擴散的要素與過程。也有研究針對經典論文(如諾貝爾獎獲獎論文)[35]和著作(如《結構洞: 競爭的社會結構》)[36] 等, 揭示其引文擴散模式。同時, 部分學者關注引文擴散的影響因素[37-38] , 揭示知識擴散的內在機制。此外, 有研究從全文引文的視角出發, 研究跨學科知識擴散的特征[39] 。可見, 基于學術論文的引文分析, 可以深入了解知識擴散的模式和規律。

近年來, 隨著學術論文的全文開放獲取的增加以及自然語言處理技術的快速發展, 學者們開始深入研究全文內容, 采用深度學習等方法抽取論文中的知識實體, 如問題、算法、理論、數據集和軟件等[40] , 使細粒度知識實體的擴散研究得以實現。如有研究者分析了論文中LDA 算法的擴散渠道及其模式[41] 。也有學者研究了CiteSpace 等科學計量相關軟件在不同學科的使用情況[42-43] 。此外, 部分學者探究了數據集實體的擴散和使用情況, 如楊寧等[8] 抽取了PubMed Central 全文中使用的基因表達相關數據集, 并從科學數據集擴散廣度和強度等方面揭示了擴散特征。Hou J 等[44] 研究了數據集在Twitter 上的傳播方式, 以及學者和大眾在傳播過程中扮演的角色。此外, Jiao C 等[45] 探究了PLOS ONE論文中用于分享研究數據的機制和存儲庫。綜上所述, 已有部分學者研究了各種類型知識實體, 如科學數據集、算法等的擴散特征與規律。然而, 當前關于高質量社會科學數據集在不同學科的擴散規律尚未得到深入研究。因此, 本研究將從社會科學數據集的跨學科視角出發, 探究其在不同學科的擴散。

2數據與方法

本文提出的社會科學數據集跨學科性研究框架如圖1 所示。該研究框架一共包含3 個模塊, 分別是數據收集與跨學科性測度分析、數據集跨學科合作社區結構與主題識別以及數據集跨學科合作演化研究。首先, 采集使用特定數據集的文獻集, 提取發表時間、標題、摘要、學科分類等字段, 采用信息熵、不同學科數等指標對跨學科性進行測度; 其次, 構建跨學科合作網絡, 并采用Louvain 算法對網絡進行聚類, 識別數據集跨學科合作社區, 采用BERTopic 主題模型, 提取不同學科潛在的合作研究主題; 最后, 劃分不同的時間窗口, 構建不同時間窗口的數據集跨學科合作網絡, 觀測網絡結構特征指標變化, 分析網絡演化特征。

2.1數據來源

本文以中國健康與養老追蹤調查(CHARLS)和中國綜合社會調查(CGSS)兩個數據集為例, 中國健康與養老追蹤調查數據集是由北京大學牽頭采集的關于中國45 歲及以上中老年個人及家庭的微觀數據, 廣泛應用于人口老齡化等跨學科研究; 中國綜合社會調查是我國最早的全國性、綜合性學術調查項目, 全面采集了個人、家庭、社區和社會各個層面的數據, 是研究中國社會的最重要數據來源之一。因此, CHARLS 和CGSS 數據集均具有較好的代表性。CHARLS 數據和CGSS 數據在社會科學領域得到了廣泛地使用, 產生了許多在國際期刊發表的高質量成果; 本研究擬以使用CHARLS 數據和CGSS 數據的英文論文為研究對象, 分析社會科學數據集的跨學科性。

為了獲取使用CHARLS 數據和CGSS 數據的英文論文, 本文分別采用數據集的英文全稱與簡寫等構造檢索式TS=(“China Health and Retirement Lon?gitudinal Study” OR “ China Health and RetirementLongitudinal Studies” OR “Chinese Health and Retire?ment Longitudinal Study” OR “ Chinese Health andRetirement Longitudinal Studies” OR CHARLS)和TS=(“Chinese General Social Survey” OR “China GeneralSocial Survey” OR “Chinese Social Survey” OR “ChinaSocial Survey” OR (CGSS AND Survey)), 在Web ofScience 核心合集中進行檢索, 時間限制為2013—2021 年, 文獻類型限制為Article, 檢索時間為2022年7 月16 日, 剔除少數非目標文獻, 最終得到使用CHARLS 數據集的論文數為790 篇, 使用CGSS 數據集的論文數為328 篇, 論文的時間分布如圖2(a)所示, 可知使用CHARLS 數據集和CGSS 數據集的英文論文在2013—2016 年較為穩定, 而在2016—2021年呈現較快的增長趨勢, 表明以中國數據集為基礎的研究在國際期刊上得到了廣泛的認可。

2.2研究方法

2.2.1跨學科性測度

本文的學科分類采用Web of Science 學科分類體系, 該分類體系一共包含252 個不同的學科[46] ,一篇論文可屬于1 個或多個不同的學科。借鑒以往的相關研究, 本文從多樣性和平衡性兩個方面對社會科學數據集的跨學科性進行測度。多樣性指的是使用數據集的學科的數量, 本文采用不同的學科數表示使用CHARLS 和CGSS 數據集的學科多樣性;平衡性指的是使用數據集的學科數量的均衡程度,本文采用信息熵來計算使用CHARLS 和CGSS 數據集的學科平衡性。

2.2.2社會網絡分析

社會網絡分析已被廣泛應用于揭示特定學科領域的知識結構[47] 。本文借鑒以往的研究, 采用社會網絡分析揭示CHARLS 和CGSS 數據集的跨學科合作網絡結構及其演化特征。首先, 基于論文所屬的學科共現關系, 構建學科共現網絡, 其中, 學科共現網絡的節點代表特定學科, 邊代表兩個學科在一篇論文中同時出現, 邊的粗細代表兩個學科的共現強度。網絡的節點數可以反映使用特定數據集的不同學科數; 網絡的邊數代表不同學科對數; 網絡的密度為當前邊數與理論最大邊數的比值, 反映網絡的稀疏程度。Louvain 社區發現算法是社會網絡常用的聚類方法[48] , 本文采用Louvain 算法[49] 對CHARLS 和CGSS 數據集的跨學科合作網絡進行社區探測, 以發現CHARLS 和CGSS 數據集的跨學科合作社群。

2.2.3 BERTopic

BERTopic 是由Grootendorst M[50] 于2022 年提出的一種基于Transformer 語言模型的主題建模方法, 該方法基于預訓練語言模型進行動態的嵌入表示, 可以更好地對文檔進行語義表示, 還可以自動生成特定的主題, 避免了主題數的設定, 相對以往的LDA 主題建模和Top2vec 方法均具有更好的效果。因此, 本文擬采用BERTopic 對使用CHARLS 和CGSS 數據集的論文進行主題識別, 以揭示潛在的跨學科合作主題。

BERTopic 算法包含4 個主要模塊, 首先采用預訓練語言模型對每個文檔進行嵌入表示, 然后對獲取的文檔向量表示進行降維處理, 接著采用聚類算法對文檔進行聚類, 最后對同類的文檔進行合并, 并采用基于類別的c-TF-IDF 算法提取同類別中的重要關鍵詞以表征該類別的主題。其中, 各個模塊是相對獨立的, 不同的模塊可以選取不同的算法進行組合, 本文使用官方推薦的組合方案, 選取Sentence-transformer 的All-MiniLM-L6-v2 版本作為文檔的詞嵌入模型, 首先采用UMAP 對高維向量進行降維, 然后采取HDBSCAN 聚類算法[51] 對文檔進行聚類, 最后采取c-TF-IDF 算法進行主題提取。

3結果與分析

3.1 CHARLS 和CGSS數據集的學科分布

CHARLS 數據和CGSS 數據作為跨學科的數據集, 分別被74 個和58 個不同的學科所使用, 論文篇均學科數分別為1.54 和1. 53 個。學科頻次和不同學科數隨時間的變化如圖2(b)和圖2(c)所示,可知使用CHARLS 和CGSS 數據集的學科不斷增加。進一步, 采用信息熵度量學科的均衡性, 由圖2(d)可知, 隨著時間的推移, 信息熵不斷增大, 使用CHARLS 和CGSS 數據集的學科分布越來越均衡。

根據各個學科使用數據集的頻次, 可將使用CHARLS 和CGSS 數據集的學科分為核心、主要和邊緣3 類。核心學科為使用數據集的論文數30 篇以上, 主要學科為使用數據集的論文數10 篇以上,邊緣學科為使用數據集的論文數小于10 篇。基于此, 可得使用CHARLS 數據集的核心學科有11 個,主要學科有14 個, 邊緣學科有49 個; 使用CGSS 數據集的核心學科有6 個, 主要學科有8 個, 邊緣學科有44 個。CHARLS 數據集涉及的3 類學科數多于CGSS 數據集涉及的學科數。具體而言, 使用CHARLS 數據集和CGSS 數據集的核心學科如表1所示, CHARLS 數據的核心學科主要與公共衛生、老年學、環境科學、經濟學、健康政策與服務等相關。而CGSS 數據的核心學科主要與社會學、經濟學、公共衛生以及環境研究相關。

3.2 CHARLS 和CGSS 數據集的跨學科合作社區探測

跨學科合作網絡可以刻畫出使用數據集的相關學科以及學科之間的合作關系。圖3(a)和圖3(b)分別是CHARLS 和CGSS 數據集的跨學科合作網絡, 節點代表學科, 邊代表學科的共現關系, 邊的粗細代表學科共現的頻次。具體而言, CHARLS 數據集跨學科合作網絡包含64 個節點, 107 條不同的邊, 平均度為3.344, 網絡密度為0. 053; CGSS數據集學科合作網絡的節點包含54 個節點, 形成76 條不同的邊, 平均度為2.815, 網絡密度為0.053。CHARLS 和CGSS 數據集跨學科合作網絡度排名前十的學科如表2 所示, 通過學科的度的大小可以揭示學科的重要程度。

在此基礎上, 本研究采用Louvain 算法分別對CHARLS 和CGSS 數據集的跨學科合作網絡進行聚類分析, 如圖3 所示, 節點大小表示節點的度, 相同顏色的節點屬于同一個社區; 可以發現, 使用CHARLS 數據集存在7 個跨學科協作社區, 形成了以老年醫學、環境衛生與職業健康以及健康經濟與衛生服務為主的三大研究社區; 使用CGSS 數據集的研究社區較為分散, 存在10 個不同的跨學科協作社區, 形成了以經濟學、社會學以及環境科學為主的三大研究社區。

3.3 CHARLS 和CGSS 數據集的跨學科合作主題識別

識別基于CHARLS 和CGSS 數據集的研究主題, 可以發現不同學科潛在的合作方向。本文采用BERTopic 模型分別對使用CHARLS 和CGSS 數據集的論文主題進行識別, 共識別出使用CHARLS數據集的論文研究主題19 個, 圖4 表示了其中的8 個主題排名前5 的特征詞, 結合相關文獻可知,CHARLS 數據集是關于中國老年的微觀調查數據,使用CHARLS 數據集的研究主要圍繞老年人的抑郁狀況、醫療保險、睡眠狀況、高血壓狀況、家庭經濟支出、空氣污染、吸煙行為、能源消費等影響因素及其之間的相互作用機制等展開, 受到社會學、經濟學、環境科學、公共衛生等學科領域學者的關注, 也是后續可以進一步合作的學科交叉點。

基于同樣的方法, 共識別出使用CGSS 數據集的論文研究主題10 個, 圖5 展示了其中8 個主題排名前5 的特征詞, 結合使用CGSS 數據集的相關論文, 可得研究主題主要包含環境行為與能源消費、員工工作滿意度、居民幸福感、婚姻與家庭、互聯網使用、政治民主與信任、教育支出與回報、區域差異等, 主要涉及的學科有社會學、經濟學、政治學、教育學、環境科學等, 不同學科領域的學者可以基于CGSS 數據集, 同時引入外部數據集等, 開展更多的跨學科合作研究。

對基于CHARLS和CGSS數據集研究的主題進行可視化, 圖6為研究主題的可視化圖譜, 每個圓圈代表一個研究主題, 圓圈的大小代表該主題相關文檔的出現頻率, 越大代表出現的頻率越高, 不同圓圈的距離代表主題之間的相似度, 通過對不同主題及其之間的關系進行可視化, 可以揭示主題的結構特征。由圖6可知, 使用CHARLS 數據集的研究主題可以分為6 個不同的簇, 不同學科合作或關注的主題較為集中; 而基于CGSS 數據集的相關研究主題的結構較為分散; 造成兩者差異的可能原因是, CHARLS 數據集的主要調查對象為中老年, 數據收集的范圍以及所包含的信息量較為有限, 而CGSS 是一個綜合性的數據集, 數據包含的范圍較為廣泛, 可以開展關于中國社會不同方面與層面的研究。

3.4 CHARLS 和CGSS數據集的跨學科研究演化分析

使用CHARLS 和CGSS 數據集的論文數在2013—2015 年較為穩定, 在2016—2018 年實現了一定程度的增長, 2019—2021 年呈現快速增長的趨勢, 基于此將時間窗口劃分為3 段。本文首先統計了2013—2015 年、2016—2018 年以及2019—2021年3 個時間段使用CHARLS 和CGSS 數據集的相關學科頻次的變化以反映學科的演化情況。其中, 3個階段使用CHARLS 數據集學科頻次前5 的學科如表3所示。第二階段即2016—2018 年使用CHARLS 數據集的學科除了社會與醫學相關的學科, 經濟學和環境科學等學科使用該數據集的頻次不斷增加, 并進入前5; 到第三個時間段, 環境科學使用該數據集的頻次進一步提升, 其他學科相對穩定。

3 個階段使用CGSS 數據集學科頻次前5 的學科如表4 所示, 在第一階段使用CGSS 數據集的學科主要有社會學、政治學、教育學以及經濟學; 第二階段經濟學使用CGSS 數據集的頻次快速提升,位居第一, 公共衛生與環境相關學科亦較多使用該數據集; 第三階段則以環境科學相關學者使用該數據集居多。

分別構建CHARLS 和CGSS 數據集在3 個時間窗口的跨學科合作網絡, 以揭示跨學科合作網絡的演化特征。CHARLS 和CGSS 數據集3 個不同階段的跨學科合作網絡節點數、邊數、密度以及社區數等指標的變化如圖7 所示。由圖7 可知, 3 個階段的跨學科合作網絡的節點數和邊數都在不斷增長,反映了使用CHARLS 和CGSS 數據集的相關學科以及不同學科之間的合作不斷加強; 由于網絡節點數增長較快, 導致跨學科合作網絡的密度有所下降,表明不同學科之間的合作存在較大的空間; 此外,相關的研究社區數也呈現增長的趨勢, 表明CHARLS 和CGSS 數據集的研究社區不斷興起。

CHARLS 和CGSS 數據集3 個階段的跨學科合作網絡結構如圖8 和圖9 所示, 采用Louvain 算法分別對不同階段的網絡進行聚類分析。對比圖8(a) ~(c)可知, CHARLS 數據集的跨學科合作網絡不斷擴張, 2013—2015 年以老年學相關學科為研究主導; 2016—2018 年, 形成了經濟學、老年學以及公共衛生與職業健康三足鼎立的學科格局;2019—2021 年, 延續了上一階段的學科格局, 且3個不同學科主導的網絡不斷充實, 越來越多學科參與合作。對比圖9(a) ~ (c), 可知, CGSS 數據集的跨學科合作網絡不斷擴張, 在第一階段以社會學和政治學相關學科為主; 第二階段, 則以社會學、經濟學和環境科學相關學科為主; 第三階段, 仍以社會學、經濟學和環境科學等學科為主, 且計算機科學、健康政策與服務等一批新的學科不斷加入。

4結論與討論

隨著數據驅動的研究范式在社會科學中不斷盛行, 數據集已成為社會科學研究的重要戰略資源。社會科學數據集為社會科學領域各個學科的實證研究提供了重要基礎。同一社會科學數據集可被不同學科用于相關領域的研究問題, 不同的學科也可基于特定的數據集進行合作研究, 社會科學數據集已成為學科交叉的重要載體和機制之一。通過分析社會科學數據集的跨學科性, 可以促進數據集在不同學科間的開放共享, 并推動基于數據集的跨學科研究。

本文提出了一個針對社會科學數據集的跨學科性研究框架, 并以社會科學領域具有代表性的CHARLS 和CGSS 數據集為例。首先, 采用信息熵和不同學科數等指標對數據集的跨學科多樣性和平衡性進行測度, 以揭示使用CHARLS 和CGSS 數據集的學科分布及其變化趨勢。其次, 構建了數據集的跨學科合作網絡, 并采用Louvain 算法和BER?Topic 模型對網絡結構和主題進行了分析, 發現不同學科之間的合作社區和潛在的研究主題。最后,通過劃分不同時間窗口, 可以觀察數據集跨學科合作網絡的演化特征, 從而揭示不同階段的主導學科和合作模式。

在數據集跨學科性特征方面,研究發現CHARLS和CGSS 分別在74 個和58 個不同學科得到了廣泛的應用, 其學科多樣性和平衡性在不斷增長。除社會學外, 還在公共衛生、環境科學、經濟學等不同學科被使用, 表明這兩個數據集在各學科之間具有較強的擴散能力和影響力。因此, 學者在選擇數據集時, 不應局限于本學科領域, 可以根據研究問題的需求, 從其他學科獲取相應的數據集。關于數據集跨學科合作社區的分布,結果表明使用CHARLS和CGSS 數據集均呈現以少數跨學科合作社區為主導的格局, 使用CHARLS 數據集的學科形成了以老年醫學、環境衛生與職業健康以及健康經濟與衛生服務為主的三大研究社區; 使用CGSS 數據集的研究社區較為分散, 形成了以經濟學、社會學以及環境科學為主的三大研究社區。可見, 除了以研究問題為中心構建跨學科合作社區, 還可以研究數據集為紐帶, 促進多個學科之間的合作。

在數據集跨學科合作主題方面, 使用CHARLS的研究主題達到19 個, 圍繞老年人的抑郁狀況、醫療保險、睡眠狀況、高血壓狀況、家庭經濟支出等多個主題展開。采用CGSS 數據集進行的研究主題有10 個, 包含環境行為與能源消費、員工工作滿意度、教育支出與回報等多個主題。然而, CHARLS的研究主題相對較為集中, CGSS 的則較為分散,可能由于CGSS 作為綜合性數據集, 調查對象更為多樣化, 數據項更加豐富, 從而研究問題分布較為廣泛。關于跨學科演化分析, 研究發現CHARLS 和CGSS 數據集跨學科合作網絡的節點數、邊數、社區數隨著時間在不斷增長, 表明不斷有學科使用這兩個數據集, 且形成了新的跨學科合作社區。

本文從新的視角探討了社會科學數據集的跨學科性, 為理解數據集在不同學科間的開放共享和高效利用提供了新的思路和方法, 對于促進社會科學數據集在各學科間的擴散以及數據集的評價具有一定的理論與實踐意義。在理論意義方面, 本文為數據集的跨學科研究提供了一個較為完整的框架, 后續可以在此基礎上研究不同數據集的跨學科性。此外, 還為評價社會科學數據集的質量和影響力提供了新的指標和方法, 有助于后續從數據集的跨學科性視角對數據集進行評價; 在實踐意義方面, 本文揭示了CHARLS 和CGSS 數據集的使用學科分布、潛在的研究主題以及潛在的合作學科, 為相關研究人員提供了啟示和借鑒。同時, 也為數據集建設者和管理者如何促進數據集在不同學科之間的擴散提供參考依據。

本研究存在一定的不足之處。首先, 本文的數據集來源于Web of Science 核心合集, 主要分析了使用CHARLS 和CGSS 數據集的英文文獻集。在后續研究中, 可以納入使用CHARLS 和CGSS 數據集的中文文獻集作為研究數據源的補充, 并對使用CHARLS 和CGSS 數據集的中英文文獻集的跨學科性進行對比分析。其次, 未來的研究可以進一步探索社會科學數據集和自然科學數據集在擴散特征和模式方面的差異, 以期更好地理解數據在不同學科間的擴散和應用規律, 為各領域數據集的開放共享與利用提供有益的啟示。

主站蜘蛛池模板: 亚洲一区波多野结衣二区三区| 国产人在线成免费视频| 亚洲资源在线视频| 国产丝袜啪啪| 91精品国产一区| 亚洲小视频网站| 久久五月视频| 久久精品国产亚洲麻豆| 国产亚洲精品自在久久不卡| 国产精品无码久久久久AV| 欧美精品成人一区二区在线观看| 免费不卡视频| 亚洲综合九九| V一区无码内射国产| 久久99蜜桃精品久久久久小说| 国产极品美女在线观看| 欧美在线视频不卡第一页| 国产在线91在线电影| 免费va国产在线观看| 日韩高清欧美| 国产精品对白刺激| 无码人中文字幕| 91偷拍一区| 成人精品视频一区二区在线| 精品国产aⅴ一区二区三区| 亚洲日韩国产精品综合在线观看| 精品国产免费观看一区| 波多野结衣第一页| 亚洲AV电影不卡在线观看| 亚洲国产欧美国产综合久久 | 国模粉嫩小泬视频在线观看| 欧美日本视频在线观看| 欧美色香蕉| 国产一区在线视频观看| 美女一区二区在线观看| 奇米精品一区二区三区在线观看| 伊人蕉久影院| 四虎影视库国产精品一区| 一级一毛片a级毛片| 91亚洲视频下载| 婷婷六月综合网| 国产精品九九视频| 91探花在线观看国产最新| 午夜三级在线| 国产三级毛片| 久久精品国产精品国产一区| 久久99久久无码毛片一区二区| 久久精品视频亚洲| 亚洲色图欧美在线| 国产精品妖精视频| 国产成年女人特黄特色大片免费| 亚洲区视频在线观看| 国产亚洲精品在天天在线麻豆| 人妻少妇久久久久久97人妻| 人人91人人澡人人妻人人爽 | 亚洲美女AV免费一区| 99视频国产精品| 波多野结衣一区二区三视频 | 亚洲成aⅴ人在线观看| 精品亚洲麻豆1区2区3区| 亚洲国产精品日韩av专区| 免费高清a毛片| 亚洲精品无码在线播放网站| 尤物午夜福利视频| 国产内射一区亚洲| 欧洲熟妇精品视频| 国产香蕉国产精品偷在线观看| 亚洲天堂久久新| 四虎永久免费在线| 欧美亚洲日韩中文| 午夜视频在线观看免费网站 | 国产精品第页| 91九色最新地址| 国产欧美日韩18| 久久精品丝袜高跟鞋| AV天堂资源福利在线观看| 国产精品福利尤物youwu| 美女一区二区在线观看| 亚洲精品动漫在线观看| 宅男噜噜噜66国产在线观看| 波多野结衣视频一区二区| 免费xxxxx在线观看网站|