999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多指標融合的引文網絡仿真及領域知識擴散影響因素識別*
——以知識管理領域為例

2022-03-06 03:15:06毅,2
圖書與情報 2022年5期
關鍵詞:模型

汪 舒 韓 毅,2

(1.西南大學計算機與信息科學學院 重慶 400715)

(2.西南大學商貿學院 重慶 402460)

隨著社會經濟的新發展及知識創新速度的快速增長,社會知識總量不斷擴增。知識是信息與人進行交互后形成的一種認知元素[1],需要經過人的經驗轉化而成,具有共享和傳遞等特征,因而知識的價值不僅在于其內容意義,更應體現在交流過程中。科學研究過程中,知識單元通過引證方式得以傳播與繼承,通過科研成果共享,知識得以不斷傳遞和擴散[2]。 知識擴散與流動實質上是主體基于相關性的不斷選擇過程,客觀上表現為以引文網絡為載體的知識單元聚集到領域知識擴散路徑上,并基于選擇機制形成領域的知識硬核[3]。知識擴散與流動包含知識主體、知識內容、流動方向三大要素[4],而引文網絡作為科學文獻交流和共享網絡,它以文獻作為知識載體,以文獻內容為知識內容,基于引用關系實現知識內容的傳遞與擴散,其引用動機、引用特征與引用模式可高效衡量知識擴散和知識演化機制。

那么,引文關系網絡形成受到哪些因素的影響?基于這些影響因素是否可有效預測引文關系網絡的發展趨勢?基于此,本文以知識管理領域引文網絡為對象,聚焦樣本領域的知識擴散特征與演化機制,嘗試通過系統仿真方式,構建多角度細粒度的知識擴散模型,旨在為創建特定領域知識擴散的預測方法與工具研究提供參考。

1 相關研究

不同粒度層面下,知識擴散形式及其表征意義有一定差異,其基本單元可劃分為:微觀粒度的知識模因、關鍵詞(或主題詞)和作者,中觀粒度的學術論文(包括專利文獻),宏觀粒度的學術期刊和學科領域。

1.1 微觀粒度的知識擴散研究

情報學界在20 世紀80 年代提出“知識模因”概念。知識模因又稱為知識基因,是知識遺傳和變異的最小功能單元,典型方法是從摘要視角研究知識模因。作為單篇文獻的價值表征,摘要是知識基因的靜態表達,擁有文獻的主要信息,因而只要將摘要細粒度化、結構化便能分析文獻所包含的知識基因[5]。 梁鎮濤等通過提取醫學信息學領域文獻題錄信息來研究知識模因擴散特征,總結出四種典型的知識模因擴散模式[6]。

另外,關鍵詞、主題詞也能較好表征引文內容。畢崇武等基于知識主題、知識勢差指標構建演化模型,揭示了引文內容視角下的知識流動特征[4];彭澤等利用主題詞衡量引證過程中的知識流量,基于此構建網絡模型并揭示知識流動主路徑機制[7];許鑫等、岳增慧和許海云分別提取數字人文領域、社會網絡領域的引文關鍵詞構建知識圖譜以研究知識內容擴散 的 演 化 過 程[8-9]。

作為知識創造者的論文著者也能在一定程度上反映領域知識的擴散趨勢,因此,學者嘗試從引文網絡視角分析作者知識擴散特征[10-12],還有通過構建作者群體-關鍵詞-引文[13-14]、作者-內容-方法[15]、詞條-作者[16]等超模網絡揭示領域中核心作者的知識交流現狀。

1.2 中觀粒度的知識擴散研究

基于文獻整體的中觀粒度知識擴散研究包括靜態和動態兩種形式。 靜態知識網絡結構通常以學術論文、專利文獻[17]作為網絡節點,通過構建主題演化網絡[18]、共引網絡[19]等模型,利用社會網絡分析[20-22]、H 指數[23]等方法與指標來揭示領域知識擴散機制。為更好預測和探索演化機制,學者逐漸從動態視角構建網絡演化模型。其中,Barabási Albert 模型作為科學網絡演化的理論基礎,揭示了引證關系中的馬太效應現象。因此,劉向等在此基礎上提出以核心知識與專業領域定位為主的知識網絡模型[24],但其僅以節點度為核心,指標過于單一。 隨后,有學者嘗試在BA 模型基礎上融合新機制以彌補單一指標的缺陷,如強調新文獻被引概率更高的時間優先機制[25-26]等。在知識單元層面,僅少數學者引入知識內容相似性機制,趙偉艇和單冬紅提出基于內容相似性的單一機制模型,認為相似文獻間引證概率更高[27]。 關鵬等從知識溢出和知識勢差角度構建多Agent 系統仿真模型,發現科研合作網絡結構對知識擴散有重要影響[28]。 此外,也有學者從網絡結構入手提出基于三角引證關系的拓撲模型[29]、基于隨機游走算法的擴散模型[30]。 綜上可知,為彌補靜態研究的不足,學者們從不同維度構建動態仿真模型,但大部分僅包含單一機制,鮮有多維融合模型,同時,已有研究尚未揭示不同機制下知識網絡擴散的演化特征以及模型對真實網絡演化的解釋程度,因此優化動態仿真模型為科學知識演化特征揭示與預測有重要意義。

1.3 宏觀粒度的知識擴散研究

以期刊為單元的知識擴散研究不僅能分析期刊在學科范圍內的地位與影響力[31],還能測度學科間的知識交流與學科交叉等特征[32]。 尹麗春和劉則淵以Scientometrics 刊載文獻為研究單元,計算期刊節點度分布和平均度等指標并揭示領域引文網絡特征[33];張慧等利用期刊與學科的對應關系,從學科引證視角分析我國人文社科領域的知識流動[34]。 此外,期刊的影響因子通常會影響文獻的引證概率,研究表明核心期刊的文獻更容易被引用[35],這也是引文網絡呈現冪律分布的原因之一。

通過梳理不同層次的研究可知,在對象層面,多數以學術論文為主,常用社會網絡分析來揭示知識網絡密度、節點位勢等特征,較少考慮微觀層面的知識主體所包含的知識內容對知識擴散的影響;在方法層面,盡管社會網絡分析等靜態方法可以有效表征網絡結構,但對于網絡隨時間變化形成的動態特征難以解釋。同時,簡單的回歸分析無法檢驗非線性且復雜的知識網絡演化進程中的影響因素,為彌補靜態方法的缺陷,動態網絡仿真為知識網絡演化提供了較好的方法基礎,隨后有學者利用BA 模型,從系統仿真角度揭示知識網絡演化機制。 但現有動態模型中,指標因素單一,連接機制尚未完善,缺少對微觀層面的知識內容、作者及團隊和宏觀層面的期刊因素的融合分析,也未提出仿真模型對真實網絡擴散的揭示程度,難以有效解釋引文網絡形成機制的具體細節與特征。 因此,把引文分析、復雜網絡和社會網絡三種理論與方法統一起來,多維度動態性地考察知識主體、知識內容對擴散的影響,才有可能將科學引文網絡趨勢預測提高到一個新的水平。

鑒于此,本文在BA 模型基礎上優化連接機制,彌補單一機制模型的缺陷,融入多維指標,構建適于領域引文網絡演化的仿真模型,并探索不同維度指標對引文網絡知識擴散的貢獻度,揭示不同指標貢獻度下的知識擴散特征。

2 研究設計

2.1 研究思路與方法

蒙特卡洛模擬也稱隨機模擬、統計試驗,其實質是利用服從某種分布的隨機數來模擬現實系統中可能出現的隨機現象,通過大量的模擬試驗后,根據概率論中心極限定理和大數定理,得出有價值的統計結論[36],是解決復雜問題的有效方法,常用于計量經濟學、風險決策分析等領域。本文遵循蒙特卡洛模擬的思想,在先驗理論的基礎上,分析領域引文網絡的知識主體、知識內容維度的數據分布特征,以BA 模型為基準,構建融合多維度細粒度的知識擴散模型,通過建立模型誤差函數判別真實網絡與仿真網絡的結構特征差異,以此衡量仿真模型對真實領域網絡的揭示程度與效度,并模擬不同指標貢獻度下網絡的擴散特征,探尋模型誤差最小區間內的各維度指標最優貢獻度分布,為知識擴散在各因素影響下所展示的特征及演化機制提供分析依據。 以上實驗主要借助Python、Pajek、Origin 及相關開源軟件,并以模擬仿真與統計分析方法為主。

2.2 領域引文網絡構建

本文以知識管理領域的樣本數據進行引文網絡的構建,選擇中國引文數據庫為數據來源。為篩選文獻間的引證關系,按照被引文獻檢索中的主題檢索途徑,以“知識管理”為主題詞,被引文獻來源期刊選擇核心期刊與CSSCI 收錄期刊,時間范圍為2010-2020 年,共檢索到3327 篇文獻,其中每篇文獻的題目、關鍵詞、摘要至少一項字段包含“知識管理”主題詞,檢索時間為2020 年12 月28 日。 將文獻的題名、作者、第一責任人、關鍵詞、摘要、來源、年份、被引頻次、參考文獻、引證文獻等字段導入Excel 中存儲。

為確保主題領域的相關性、期刊來源的統一性、時間范圍的一致性,本文以3327 篇文獻為網絡節點,提取“引證文獻”字段數據,構建上述文獻間的引證網絡模型。 由于原始網絡中存在孤立節點和小型子網絡(節點數≤10),這類網絡由于樣本量過小,無法有效探索知識網絡擴散特征。同時,知識擴散模型以連通子圖構建而來,隨著時間的增長網絡規模不斷擴大,符合真實網絡演化的特征,因此,從原始網絡特征和網絡模型構建的角度來看,本文結合已有研究[24],選擇最大連通子圖為主要分析對象具有一定合理性,該子圖共1036 個節點(占比31.14%),1239條引證邊(占比80.04%),隨后本文將基于此網絡分析知識主體、知識內容對擴散的影響。

2.3 指標遴選

為揭示真實領域引文網絡擴散的影響因素,本文在已有研究基礎上,篩選適用于“知識管理”引文網絡的指標,采用統計分析與數據可視化方法呈現真實領域網絡的數據分布特點,為后續模擬仿真奠定數據基礎。

(1)內容相似性:表示文獻間文本內容的相似程度。科學交流過程中,學者引用文獻時往往參考的是文獻內容,內容的貼合度與相似性至關重要。Menczer 和Amancio 等均認為引文網絡演化過程中,作者引用方式與文獻內容相似性顯著相關[37-38];趙偉艇和單冬紅建立基于相似度特性的復雜網絡演化算法驗證了相似度大的節點間更容易產生連接[27]。

本文采用余弦相似性(見式1)計算領域網絡各節點間內容相似性,提取文獻標題、摘要、關鍵詞,以搜狗細胞詞庫作為分詞詞典,融合百度停用詞表等經典停用詞庫作為停用詞詞典,剔除高低頻詞匯,記錄文獻詞頻并向量化,計算余弦相似性,得到緊鄰文獻間內容相似性分布、任意文獻間內容相似性分布以及各文獻與其緊鄰文獻間平均相似性分布(見圖1)。

ρab表明文獻A 與文獻B 之間的內容相似性,Ai與Bi代表文獻A 與文獻B 的詞頻向量各分量。

由圖1 可知,知識管理領域引文網絡中非緊鄰文獻、緊鄰文獻間的內容相似性指標滿足正態分布,但與后者相比,前者峰值左偏且有長尾現象,指標均值僅為0.26,顯著低于后者(0.48),表明內容相似性對引用關系具有影響,高相似度的文獻間引證概率越大。 為方便仿真實驗,計算最大連通圖中1036 篇文獻間平均內容相似性分布,得到均值為0.48、標準差為0.16 的特征值。

(2)時間新穎性:表示被引文獻相對于引證文獻具有的新穎性程度,在仿真模型中表現為時間優先機制[26],即新穎文獻被引概率越高。 具有引證關系的文獻,其引文時滯可表示知識擴散速度,同時能反映領 域 科 研 進 程[39];Kamalika 和Sen 驗 證 發 現 引 文 時滯超過一定閾值時,與被引頻率滿足指數約為-2 的冪律分布[40]。

本文采用引文時滯指標計算領域引文網絡的新穎性程度(見式2),并進行曲線擬合,得出結果(見圖2)。

△t 為引文時滯,由引證文獻B 的發表時間Tb減去被引文獻A 的發表時間Ta,Nab表示被引文獻A 相對于引證文獻B 的新穎性,指數-2 選擇Kamalika 等的結論。

由圖2 可知,引文時滯與頻率近似滿足-2 的冪律分布(γt=-1.74,p=0.046<0.05),表明領域引文網絡中,相對新穎的文獻越容易被引證。

圖2 引文時滯分布

(3)位置核心性:表示文獻在領域引文網絡中核心性程度。 Price 發現引文網絡的連接度滿足指數絕對值為2.5-3.0 的冪律分布[41],該現象由節點的“累積優勢”演變而來。 隨后,以度優先為核心的BA 模型正式提出,其基本假設為網絡節點度越大,其被再次連接的概率則越大[42]。

本文利用絕對點度中心性衡量文獻的核心性,由于節點度存在量綱差異,為消除指標間的異方差性,對其進行對數運算和極大值歸一化處理(見式3),節點度與頻率的對數曲線擬合結果(見圖3)。

Ci表示節點的位置核心性,Di代表文獻i 的度值,Dmax代表當前網絡中的最大度值。

由圖3 可知,度和入度核心性與頻率分別滿足-2.27 與-2.68 的冪律分布, 說明領域中文獻引證關系存在明顯的累積優勢,趨近網絡中心的文獻被再次引證的概率相對于邊緣文獻來說更大。

圖3 位置核心性分布

(4)作者及團隊聲譽:表示文獻的作者團隊在領域中具備的聲譽度。 Bornmann 等通過文獻梳理發現高被引作者會吸引更多的引文[43],經分析得到作者團隊在ISIHighlyCited.com 網站中出現比例與文獻被引量顯著正相關。

本文結合現有引文數據,提取每篇文獻的作者集合,統計每位作者以第一作者身份在領域中發布論文的總篇數與總被引量,并計算作者集合平均被引量,該指標用于表征文獻作者團隊在領域中的平均擴散廣度。由于作者同名因素影響,本文對數據進行了簡單的標識,發現同名作者文獻僅占2.34%,對指標整體影響可忽略不計,同時,由于數據具有量綱差異容易產生指標間的異方差性,因此參考位置核心性的處理方式(見式4),得出結果(見圖4)。

圖4 作者及團隊聲譽分布

其中,Gi表示文獻i 的作者及團隊聲譽,Gmax代表網絡中作者及團隊聲譽指標的最大值,Ak代表節點文獻中第k 作者以第一作者身份發文的總被引量,Nk表示第k 作者以第一作者身份的總發文量,n代表文獻i 的作者總數。

由圖4 可知,作者及團隊聲譽近似服從均值為0.35、標準差為0.17 的正態分布,且與文獻被引量的斯皮爾曼相關性達到0.79(p=0.00<0.01)。

(5)期刊影響因子:常用于衡量期刊的聲譽與影響力。 Yao 等利用期刊影響因子構建引文連接機制,所得仿真網絡節點度仍然滿足冪律分布[35];劉璇等研究發現期刊影響力對文獻的知識擴散發揮正向影響[20]。

本文提取各文獻期刊2010-2018 年的綜合影響因子(檢索時數據庫期刊影響因子年份范圍僅至2018 年),為去除期刊老化、被引量爆發等因素,以2010 年至2018 年的平均影響因子作為測度指標,經極大值歸一化處理后,該指標近似滿足均值為0.25、標準差為0.14 的正態分布(見圖5),且與文獻被引量的斯皮爾曼相關性為0.37(p=0.00<0.01)。

圖5 期刊影響因子分布

經總結發現上述五個指標均對知識管理領域引文連接產生影響,為后續融合模型的建立,對上述五個指標進行統計分析(見表1),以檢驗各指標是否存在多重共線性與量綱差異。

表1 描述性統計及多重共線性分析

統計可知,各指標相關性系數均小于0.4,同時,指標容差趨近于1 且VIF 小于10,表明通過多重共線性檢驗,最后,由均值分布(0.2-0.4)可知,指標量綱差異較小。

綜上所述,多種因素會導致文獻引證關系的形成,但關于這些因素如何影響領域知識擴散的研究還并未完善。 鑒于此,本文選擇從內容相似性、時間新穎性、位置核心性、作者及團隊聲譽、期刊影響因子五個特征指標構建引文視角下領域知識擴散演化模型(見圖6)。 其中“文獻被引勢”表示領域引文網絡中文獻被新文獻引用的相對能力,同時表征文獻的知識擴散能力,如果文獻的被引勢較高,則被新節點連接的概率就越高。

圖6 引文視角下領域知識擴散演化模型

3 仿真實驗及結果分析

3.1 模型變量及公式定義

根據各指標的數值分布特征,以引文視角下領域知識擴散演化模型為基礎構建仿真公式(模型變量見表2)。

表2 模型變量與定義

按照蒙特卡洛模擬的思想,各節點的內容相似性、作者及團隊聲譽、期刊影響因子在網絡初始化階段與節點進入階段由系統模擬生成,為更貼近真實網絡,3 項指標均選取真實網絡的數據分布。設內容相似性、時間新穎性、位置核心性、作者及團隊聲譽、期刊影響因子5 個指標的貢獻度分別為α、β、γ、δ、ε,可得到文獻被引勢計算公式(見式5):

根據公式5 即可計算第i 節點的文獻被引勢,則第i 文獻被引概率滿足(見式6):

其中,Fi越大則表明第i 節點的文獻被引勢越高,對于新節點來說,在目前已有的n 個節點中,其被引證的概率則相對越高。

3.2 仿真模型算法

(1)建立初始網絡:構建有m0個節點的初始連通網絡,以正態分布隨機初始化每個節點的作者及團隊聲譽指標、期刊影響因子指標,各項數值參考表2。據已有研究發現不同初始網絡對最終結果沒有太大的影響[24],且由于學術網絡本身符合無標度網絡特征,故選用BA 模型建立初始網絡。

(3)節點連接:以正態分布隨機初始化新增節點與網絡現有節點的內容相似性;以公式2 計算新增節點與網絡現有節點的時間新穎性;以公式3 計算現有網絡中各節點的核心性;以均勻分布隨機化5 個指標的貢獻度;以公式5 計算新加入節點與現有節點間的文獻被引勢Fi,最后依據公式6 隨機擇優連接。

3.3 模型誤差公式建立

為檢驗仿真網絡與真實網絡的差異,采用網絡密度、點度中心勢、節點入度分布系數、平均最短路徑長度4 項網絡基本特征作為測度指標,并構建模型誤差計算公式(見式7)。 據此得到知識管理領域引文網絡特征指標計算結果(見表3)。

表3 知識管理領域引文網絡基本特征

3.4 仿真結果與分析

為探索指標對引文網絡的擴散影響,尋求適合真實領域網絡的最優指標貢獻度,本文采用蒙特卡洛模擬思想,以模型誤差為篩選機制,提取誤差值最小區間范圍和指標貢獻度,具體步驟如下:

(1)基本參數設置:依據領域引文網絡規模,設置初始節點數據m0=5,總迭代時間tz=1031,以(0,1)均勻分布隨機生成指標貢獻度,得到不同指標貢獻度下的仿真網絡特征值,以求和歸一化方式計算指標間相對貢獻度,并記錄1000 次實驗結果。

(2)最優解組遴選:1000 次實驗中,異常值僅占0.2%,其余所有實驗誤差均小于0.2,均值為0.0483。將異常值劃為第20 組,其余實驗按照模型誤差遞增排序,以0.01 區間單位劃分誤差范圍(0.009,0.20)為19 組并統計各組平均模型誤差和各指標平均貢獻度(見圖7)。其中,第1 組實驗的模型誤差最小,范圍為0.009-0.02,均值為0.0157,因此本文將第一組視為最優解組(占比為13.2%),并以該組為基準對比分析其他各組的指標均值,以探索不同貢獻度分布下的網絡擴散特征。

圖7 各組指標貢獻度分布

(3)各組指標貢獻度對比:據圖7 可知,最優解組的內容相似性貢獻度均值與其他組相比最高;時間新穎性中,前8 組實驗貢獻度均值較為平緩,達到穩定狀態;位置核心性貢獻度均值呈現遞增趨勢,最優解組為最低;作者及團隊聲譽貢獻度均值呈現遞減趨勢,最優解組為最高;期刊影響因子前8 組分布均衡,整體呈現下降趨勢。最后,13-20 組在5 個指標貢獻度分布上與最優解組相比波動較大,模型誤差不理想,因而選擇第1 組為最優解組具有可靠性。

(4)最優解組內部分析:對最優解組中132 個子實驗的各項指標最優解貢獻度分布進行分析(見圖8),其中內容相似性貢獻度均值和箱體整體較高(均值為26.22%),其次是作者及團隊聲譽(均值為22.72%)、時間新穎性(均值為22.29%)與期刊影響因子(均值為20.66%),最后是位置核心性(均值為8.11%),即使最優解組誤差均值優化達到0.0157,各項指標仍然存在誤差波動,因此可以推斷出最優解具有多種模式。

圖8 最優解組指標貢獻度分布

(5)最優解組指標聚類分析:為深入研究最優解模式,本文利用K-Means 聚類方法對最優解組中貢獻度進行聚類,以k=3 進行聚類分析,得到個案數分別為43、42、47 的3 個類別,各類別個案分布均勻且模型誤差無明顯差異,證明聚類結果合適,繼而提取3 個類別的指標貢獻度與網絡指標均值(具體見表4中6-8 項)。

表4 仿真結果

(6)最優解組與現有模型對比分析:為驗證融合多角度細粒度的模型能更好揭示真實網絡擴散特征,本文分別對“時間優先機制”(id1)、“度優先機制”(id2)、融合“度優先機制”與“時間優先機制”(id3)、融合前兩者機制與“內容相似性”(id4)的模型進行30 次實驗,計算其平均誤差值與網絡基本特征,并與最優解組(id5)、最優解組聚類結果(id6-8)、真實網絡(id9)對比,研究發現前4 組實驗的模型誤差均大于后4 組。

由貢獻度可知,最優解組(id5)中內容相似性具有最高貢獻度,其次是作者及團隊聲譽、時間新穎性、期刊影響因子;聚類結果1(id6)中期刊影響因子、作者及團隊聲譽與內容相似性三者貢獻度相對較高;聚類結果2(id7)以時間新穎性、內容相似性和期刊影響因子為重;聚類結果3(id8)則以內容相似性與作者及團隊聲譽為重。四組實驗中內容相似性和作者及團隊聲譽貢獻度均較高,而位置核心性均較低。

綜上,內容相似性連接機制在真實領域網絡中發揮了較大的作用,貢獻度為20%-35%,表明學者在科研活動中,往往會選擇與自己研究主題和內容相近的文獻。其次,作者及團隊聲譽、時間新穎性、期刊影響因子,三者貢獻度相近,約為15%-30%,這表明學者會主動選擇引證時間新穎的文獻,對領域中重要期刊和核心作者團隊的文獻有更多的引用偏好。此外,研究發現,位置核心性貢獻度僅占7%-9%,表明學者更傾向于引證新穎的文獻,而較少選擇發布時間較早的核心文獻,同時也說明文獻在引文網絡中的位置核心性并非被引的決定性因素,這與傳統BA 模型的基本假設有較大差異。

實驗組間的網絡特征具有明顯差異,這是由不同連接機制所致。其中,id1 僅考慮時間新穎性,即時滯越短的文獻,被引證的概率越大,而id2 只考慮文獻位置核心性,即節點度值越高,被再次引證的概率越大,是典型的BA 模型。兩組實驗的連接機制分別表征的是對新文獻的偏好和對傳統核心文獻的偏好,但前者顯示連接路徑較長、網絡較稀疏的特征,與后者相反。id3 中時間新穎性與位置核心性貢獻度均占50%,其點度中心勢、最短路徑長度均處于id1 和id2的值之間且模型誤差小于前2 組實驗,說明融合時間新穎性與位置核心性具有更好的可解釋性,二者不可或缺,都在領域知識擴散過程中發揮重要作用。id4 在id3 的基礎上融入內容相似性,模型誤差大幅降低,可知內容相似性指標具有更大貢獻,但其模型誤差仍高于最優解組,說明還存在其他影響因素。

與前四組相比,五維指標融合模型的誤差降低至0.015 左右,說明仿真網絡不能僅依據單一指標,內容、時間、作者團隊、期刊、核心性等都會影響文獻的引證關系。從最優解組聚類結果可知,指標最優解存在一定模式,但內容相似性的貢獻度仍較高而位置核心性的貢獻度最低,其余三個指標在15%-30%波動。 即便是最優解組,其結果仍然具有一定誤差,說明還有其余因素影響引證關系,如文獻語言、作者數目、期刊語言、學科領域等[43]。

4 結論與討論

本文從多粒度視角構建引文網絡仿真模型,融合內容相似性、時間新穎性、位置核心性、作者及團隊聲譽、期刊影響因子5 個維度,建立“文獻被引勢”仿真機制,利用模型誤差公式計算仿真模型對真實網絡的擬合程度,基于蒙特卡洛模擬思想,實現不同貢獻度條件下各維指標對引文網絡知識擴散的影響分析,同時應用K-Means 聚類尋找指標貢獻度最優解模式。在指標上,彌補了傳統BA 模型在引文知識內容、新穎性、作者團隊與期刊聲譽維度的缺陷問題,實現多指標融合仿真;在分析上,探索了不同影響因素對引文網絡擴散的影響程度。

從最優解組指標貢獻度分析可知內容相似性、時間新穎性、位置核心性、作者及團隊、期刊因素均會影響引文網絡的形成:(1)內容相似機制最大程度影響知識節點的連接,相似節點間的連接概率更高;(2)時間優先機制使得引文網絡的平均最短連接路徑增加、點度中心勢降低,表現為對新知識的偏好;(3)度優先機制與時間優先機制的作用方式與效果不同,其更強調領域核心知識的繼承,有利于保持學科領域內核知識的穩定性;(4)作者及團隊與期刊擇優機制則體現在高指標值節點的可見度與連接概率的提升;(5)模擬發現近11 年“知識管理”領域引文網絡中,內容相似性指標的貢獻度最高,位置核心性指標的貢獻度最低。

不同學科領域中各影響因素的貢獻度可能會有所不同。本文僅搜集中文“知識管理”領域11 年內核心期刊的引文數據,由于該領域具備較強的交叉學科屬性,所得貢獻度并不能完全適用于其他學科。其次,模型也僅參考題錄、作者等顯性特征,缺乏更深層的指標,在作者及團隊聲譽計算過程也存在同名作者的影響。未來研究中,將不斷優化現有模型并分析更多領域的引文網絡,一方面檢驗現在模型的普適性,另一方面通過指標的貢獻度排序可為學科差異發展態勢識別提供精確的衡量指標。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 日本午夜影院| 四虎永久免费在线| 国产人在线成免费视频| 波多野结衣久久精品| 国内精自视频品线一二区| 91久久夜色精品国产网站| 亚洲小视频网站| 99草精品视频| 国产欧美成人不卡视频| 18禁色诱爆乳网站| 2020亚洲精品无码| 久久青青草原亚洲av无码| 亚洲免费毛片| 2020最新国产精品视频| 伊伊人成亚洲综合人网7777| 在线另类稀缺国产呦| 日本亚洲成高清一区二区三区| 人妻丝袜无码视频| 亚洲v日韩v欧美在线观看| 国产无码性爱一区二区三区| 亚洲精品无码AV电影在线播放| 精品无码一区二区在线观看| 国产成人精品优优av| 国产黄色视频综合| 色丁丁毛片在线观看| 99视频精品全国免费品| 国产真实乱人视频| 亚洲va在线∨a天堂va欧美va| 国产日韩欧美一区二区三区在线| 原味小视频在线www国产| 久久久久免费看成人影片| 91精品专区| 日韩人妻少妇一区二区| 亚洲中文无码av永久伊人| 一级一级特黄女人精品毛片| 欧美亚洲中文精品三区| 尤物精品国产福利网站| 视频国产精品丝袜第一页| 在线无码av一区二区三区| 国产黑丝视频在线观看| 67194亚洲无码| 亚洲精品免费网站| 亚洲最猛黑人xxxx黑人猛交 | 亚洲欧洲自拍拍偷午夜色无码| 久久综合激情网| 国产精品无码AV片在线观看播放| 中文字幕第4页| 亚洲精品人成网线在线| 国产人人乐人人爱| 中文国产成人精品久久一| 女人av社区男人的天堂| 色婷婷在线播放| 亚洲色成人www在线观看| 欧美精品成人| 亚洲欧美一区二区三区麻豆| 天天综合网色| 91在线精品麻豆欧美在线| 亚洲高清资源| 国产成人精品亚洲日本对白优播| 久久亚洲国产最新网站| h视频在线观看网站| 亚洲人成网18禁| 四虎国产精品永久一区| 四虎影视无码永久免费观看| 欧美午夜视频在线| 久久特级毛片| 一区二区理伦视频| 欧美日韩精品综合在线一区| 久久久久亚洲AV成人人电影软件| 久久精品国产精品国产一区| 2021天堂在线亚洲精品专区| 91精品国产一区| 国产区精品高清在线观看| 2019年国产精品自拍不卡| 试看120秒男女啪啪免费| 国产精品所毛片视频| 91精品国产综合久久香蕉922| 草草线在成年免费视频2| 成人综合在线观看| 四虎影视永久在线精品| 精品视频免费在线| 国产欧美高清|