999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識結構突變的學科新興主題識別研究

2023-11-01 03:48:18段慶鋒陳紅閆緒嫻劉東霞
情報學報 2023年9期

段慶鋒,陳紅,閆緒嫻,劉東霞

(山西財經大學管理科學與工程學院,太原 030006)

0 引 言

學科新興主題是科技競爭的關注焦點,對國家、企業及研發人員獲取科技優勢至關重要[1]。然而,相比于其他一般主題,新興主題涌現時間短、數量稀少,從快速增長的海量文獻中快速、準確地發現具有科技決策價值的新興主題并非易事[2-3]。這種挑戰性主要源于學科知識的復雜動態性,跨學科知識交叉融合,知識更迭日益加速,均增加了把握學科趨勢規律難度。由此,學科新興主題發現的根本在于深刻認知知識演化規律,尤其是通過知識之間的關聯模式揭示主題涌現的關鍵特征。

學科主題分析通常可以建立在某種網絡形式之上[4]。共詞分析是常見的知識網絡工具,將涌現的關鍵詞聚類視為新興主題[5],這些關鍵詞集合通過共現關系形成緊密聯系結構,并指向相同的主題范疇[6]。共詞網絡背景下,主題探測建立在連接模式上,新穎獨特的知識嵌入成為學科新興主題的發現邏輯。另外,建立在引用關系之上的多種類型網絡(常見有共引網絡、耦合網絡、引用網絡)也被用于新興主題探測[7],具有相同主題內容的學術文獻通過連接關系形成聚集結構,文獻間引用關系模式成為主題發現的關鍵依據[8-9]。由此可見,不論何種形式的主題建模,網絡拓撲都是揭示學科格局不可缺少的工具,而知識結構層面的動態變化更是識別新興主題的關鍵。

然而,從復雜多變的知識結構演化中發現新興主題并非易事。挑戰性很大程度上源于準確捕捉拓撲動態:一是龐大的知識網絡規模帶來的計算成本,二是拓撲動態比較的困難。知識網絡演化不但是要素節點的增減,更是網絡關系的變化,兩者共同影響形成復雜的網絡演化與結構動態。主題分析需要考慮大范圍的知識嵌入特征,新興主題更強調動態變化[10],結構動態成為亟須有效揭示的關鍵環節。

反映網絡拓撲的方法及模型在新興主題研究領域得到了廣泛應用。面對網絡結構,社會網絡分析與復雜網絡理論方法被引入科技情報分析[11-12]。多種基于結構嵌入的特征指標被用于探索新興主題,如反映微觀嵌入的度中心性、反映中觀結構的社區特征、反映宏觀特征的網絡密度[13]。這些面向網絡的指標或模型能夠揭示主題格局分布,但基本是靜態反映,對于網絡拓撲的動態刻畫不足。動態成長性是新興主題區別于其他類型主題的最重要特征[14],只有通過知識拓撲動態才能從根本上捕捉主題涌現。值得注意的是,近年來,鏈路預測被用于新興主題趨勢分析,通過對知識關系的預測反映主題動態趨勢[15-16]。這種面向未來的刻畫能力具有較大應用潛力,但眾多指標差異較大,面臨指標選取及場景優化問題。另外,以LDA(latent Dirichlet allocation)為代表的統計模型在主題分析中取得了良好效果[17],尤其是考慮時間的動態模型能夠刻畫主題知識的分布演化過程[18],但是文本表示的“詞袋”模型忽視了主題之間的關聯性,無法揭示主題知識結構特征。上述定量指標及方法在一定程度上揭示了主題涌現過程的某些側面,但面對大規模的學科知識網絡演化的復雜動態性,仍存在諸多局限性,尤其是在拓撲動態比較方面對人工經驗及觀察判斷的依賴程度依然較高,能夠有效反映知識網絡拓撲動態特征的研究不夠充分。

本文旨在通過知識結構突變的探討,形成具有知識結構動態感知能力的學科新興主題識別方案。針對主題涌現過程的結構特征,構建基于知識網絡拓撲的主題結構突變率指標與主題影響力增長指標,基于此,形成學科新興主題的二維識別框架,并通過綜合性識別方案,發現具有戰略價值的學科新興主題。

1 研究設計

1.1 分析框架

主題是凝練與抽象的特定內容,可以表現為知識要素的某種組合或分布[19],且這些要素存在廣泛關聯,并形成知識網絡[20]。主題知識網絡不斷動態演化,如知識元素的生滅重組、關系模式的重構以及知識群落的融合分裂[21],動態變化之中蘊藏了影響學科未來的新興主題。新興主題的價值在于巨大的潛在影響力,如理論突破可以引發科學范式的顛覆,重大科學發現能夠引發技術革命進而推動人類社會的進步。科學范式的變化在知識層面更大程度地體現為結構突變,不僅涉及元素與關系的數量增減,更是知識結構的重組重構[22]。因此,知識結構突變成為嵌入視角下新興主題的重要特征,更成為刻畫新興主題的有效手段。基于此,可以將發生結構突變或新穎結構涌現的知識網絡界定為學科新興主題,其拓撲結構的改變不但程度劇烈,而且時間短促,即知識結構突變越迅猛,越可能預示著高影響力、高價值新興主題的涌現。

結構觀視角下,知識結構突變成為新興主題識別過程中的關鍵環節,需要對結構突變性開展有效度量。網絡結構是學科探測與知識發現領域關注的內容,如節點中心性、最短路徑、社區探測等[23],已有大量文獻說明網絡分析指標及算法在結構揭示方面的有效性。然而,這些常用指標及方法大多基于靜態分析,并不善于揭示網絡結構在多大程度上發生了改變,或者缺乏對拓撲差異性給出有效度量。網絡拓撲的動態比較是較為困難的任務,制約了知識結構突變的探測與新興主題的發現能力。

圖同構(graph isomorphism)是判斷兩個圖(網絡)是否具有相同拓撲結構的研究領域[24],是可以揭示主題知識網絡拓撲動態的有效方法。主題知識網絡在不同時期的同構性越低,則結構變化的程度越大,即結構突變的可能性越大;反之,亦然。借助圖同構分析,可以有效刻畫知識網絡的結構突變性。雖然已有大量文獻采用網絡嵌入指標及模型對知識網絡演化開展研究,但鮮有針對知識網絡動態場景開展的圖同構分析及應用解決方案[25]。據此,非常有必要采用圖同構方法,通過知識網絡的同構性分析刻畫結構突變,進而捕捉新興主題涌現的結構特征,以推動對新興主題的探測能力。

具體地,從知識網絡的微觀和宏觀兩個層面分析新興主題的結構特征,如圖1所示。以關鍵詞為節點、共現關系為邊構建的共詞網絡能夠反映知識分布模式[26]。主題詞i的知識網絡嵌入體現在兩個層面:一是由焦點主題詞i和其鄰居節點(與焦點主題存在共現關系的主題詞)共同構成的個體知識網(Egoi),反映了主題i的局部嵌入;二是包含所有主題詞的整體知識網(Net),反映了主題的全局嵌入。個體知識網和整體知識網體現不同層級結構,前者針對某個主題個體,通過存在鄰居關系的主題詞集合,反映焦點主題的知識嵌入;后者面向學科整體,反映學科主題的全局知識體系。另外,兩者的用途不同,個體知識網旨在通過知識嵌入刻畫焦點主題的結構性涌現特征;整體知識網反映學科知識的全局嵌入,旨在揭示主題在學科整體層面的影響力。

圖1 局部和全局的主題知識網絡嵌入

本文基于知識網絡拓撲動態特征,構建識別框架,如圖2所示。具體地,分別從知識網絡的局部和全局視角出發,構建主題結構突變指標和影響力增長指標;綜合兩個指標特征,形成知識結構動態視角下新興主題的二維識別方案。在動態演化視角下,個體知識網隨時間的改變反映了焦點主題的知識嵌入變化,這種變化越急促、越劇烈,意味著新穎知識的結構性涌現越強烈。因此,基于個體知識網拓撲改變程度,構建主題結構突變指標,度量主題知識的結構涌現。另外,基于主題在整體知識網的嵌入地位,構建主題影響力增長指數,反映主題對學科的貢獻與影響。這兩個指標均基于知識網絡拓撲動態形成度量,但分別從知識嵌入和外在影響力兩個層面揭示新興主題在知識網絡演化過程的結構性特征。基于這兩個指標,構建二維識別方法,通過知識結構涌現的局部和全局視角綜合,形成較為平衡的探測結果。

圖2 基于知識結構突變的學科新興主題識別框架

1.2 基于圖核的主題結構突變

1.2.1 WL子樹圖核

圖核(graph kernel)是旨在解決圖同構問題的核方法,將圖對象映射至Hilbert空間,通過內積運算度量圖的拓撲結構相似性[27]。具體地,圖核是定義在圖空間上的對稱正定函數,表示為Hilbert空間的內積運算。給定圖集合上G的映射函數k:G×G→R,若存在從圖空間到Hilbert空間的特征映射?:G→Hk,滿足條件其中代表內積運算,則稱函數k為圖核。

WL(Weisfeiler-Lehman)子樹核是經典的圖核算法,主要思想是將圖分解為多個不同的子樹,通過比較子樹之間的相似程度反映圖的相似性[28]。WL子樹圖核算法主要過程如下:對于給定節點標簽的圖,首先,對每個節點鄰居進行聚合并排序,節點標簽與完成排序后的鄰居標簽共同構成多重集合(multiset);其次,將每個節點的多重集合映射至一個新的未曾出現的標簽,這些標簽成為節點的新標簽,節點標簽的更新意味著一次迭代完成;最后,據此進行節點標簽的多輪迭代,直至結束。節點標簽的更新映射關系在所有圖之間是共享的,若兩個圖的所有節點標簽數量相同,則認為兩者同構;否則,標簽數量差異越大,同構性越低。定量地,將迭代h次的WL子樹核定義為

其中,ci(G,σij)表示第i次迭代中標簽j出現的次數。

1.2.2 主題結構突變指標

由上文所述的知識結構觀定義可知,新穎知識結構的涌現是學科新興主題的體現,這種結構性改變的程度與快慢直接反映主題新興涌現的強烈程度。個體知識網體現了焦點主題的嵌入分布,通過比較不同時期個體知識網的結構差異,構建主題結構突變指標。因網絡演化既有節點也有網絡連接的增減,故網絡結構的比較是具有挑戰性的任務。知識網絡拓撲結構差異程度可以通過圖同構加以刻畫。圖核方法主要有3大類:基于路徑圖核、基于子圖圖核以及基于子樹圖核。其中,作為子樹圖核經典算法的WL子樹核應用廣泛,獲得了學界主流的共識,在圖分類及比較的文獻中表現不俗[29]。因此,本文采用WL子樹核度量知識網絡的結構突變程度,并基于此構建主題結構突變性指標。

值得注意的是,WL子樹核算法一般流程中并沒有明確如何確定節點標簽,需要在實際應用中給節點賦予標簽。考慮到網絡結構是關注點,采用Louvain社區算法對個體知識網探測社區結構,并將反映結構嵌入的社區編號作為節點標簽,用于WL子樹核算法。個體知識網除了以焦點主題詞為核心的星型連接之外,其鄰居節點之間可能存在相互語義依賴并形成連接,由此形成相對連接稠密的不同知識社區,每個社區代表特定的內涵語義,通過社區結構可以揭示焦點主題的微觀知識結構。新興主題是知識嵌入不斷深化的過程,也是向日益復雜的社區結構演化的過程,如圖3所示。可以看出,稠密、規模化的知識社區動態呈現是新興主題成長過程的重要特征。Louvain算法是主流的社區探測方法,通過啟發式算法尋找最優的網絡社區劃分,以實現模塊度的最大化目標,模塊度已經被證實是衡量社區劃分合理性的有效度量,基于模塊度尋優的算法能夠有效揭示主題的知識社區分布[30]。

圖3 個體知識網社區結構演化示意圖

首先,基于WL子樹核算法,定義主題i相鄰兩期個體知識網的結構相似性S為

其中,t為時間;kWL(Gi,t-1,Gi,t)為采用WL子樹核度量的網絡Gi,t-1和Gi,t的結構相似性,由式(1)計算獲得,事實上為通過子樹核將知識網絡Gi,t-1和Gi,t映射為Hilbert空間向量后的內積結果。為了比較方便,對相似性進行歸一化處理,式(3)采用了余弦公式形式,其中分母部分的計算與分子部分同理。指標Si度量了主題i個體知識網的鄰期同構性,即知識結構相似性。

其次,基于指標Si,構建反映主題i涌現程度的結構突變度指標Di,即

該指標刻畫了知識網絡拓撲的跨期差異性,反映了主題i發生的結構變化強烈程度,反映個體知識網結構變化強度。指標D數值區間為[0,1],D=0,說明主題的知識結構保持不變;D=1,說明發生了完全的結構變化。

最后,以結構突變度D為基礎,通過差分運算,構建指標主題結構突變率ΔDi,即

指標ΔD度量了主題結構突變度的變化率,反映了主題知識結構變化的加速度,取值為正,說明結構突變呈加速狀態;反之,則呈減速狀態。結構突變度D和結構突變率ΔD分別度量了結構變化的不同側面,前者刻畫拓撲變化程度,而后者是拓撲變化的更高階度量,通過結構突變度D的差分運算進一步提升甄別能力,能夠更敏銳地揭示結構動態的加減速態勢,進而反映主題未來趨勢。

1.3 基于PageRank的主題影響力增長

具有決策價值的學科新興主題不但體現為新穎知識,更要對學科發展具有潛在的重大影響力。主題嵌入整體知識網,通過相互語義依賴,形成學科知識影響力。隨著知識網絡演化,外部影響力的快速增長是新興主題的重要特征。基于以上分析邏輯,采用PageRank算法度量主題在整體知識網的影響力,通過影響力的變化構建新興主題影響力增長指標。PageRank算法依據網絡連接拓撲度量節點的相對重要性,在科技情報領域獲得廣泛應用,是揭示節點網絡影響力的經典方法,其分析思想為,若節點連接重要的鄰居,則其重要性亦較高[31]。以整體知識網絡為背景,主題i在第t期的影響力PR定義為

其中,j為主題i的鄰居Γ(i);Dj表示主題j的度中心性;α為取值區間[0,1]的阻尼系數,本文設定為常見的0.85。

基于靜態指標PR,構建影響力動態指標-主題影響力增長率ΔPR,即

其中,Nit和Ni,t-1分別是在t期和t-1期包含主題i的學術文獻數量;為權重,表示主題出現文獻年均數量的對數值。指標的加權設計旨在形成更加平衡的識別能力,期望識別出的新興主題既呈現較高水平的影響力增長率,又具有一定水平的影響力規模。因為影響力增長率是相對指標,可能會過度傾向于鄰居節點稀少的主題,不利于發現真正具有高潛力影響力的新興主題。通過權重的調節,有助于增強識別分析的魯棒性。

1.4 基于拓撲動態的學科新興主題綜合識別方法

主題結構突變率和影響力增長率分別從內在結構和外在影響力兩個層面揭示了新興主題涌現動態特征,由此形成學科新興主題識別的綜合研判。以上述兩個指標為維度,構建坐標體系,形成二維識別空間,如圖4所示。按照維度水平的兩兩組合,大致形成4種主題類型,即新興型、增長型、穩定型和演變型。其中,新興型主題具有結構突變率和影響力增長率的雙高特征,是新興主題的高發集聚區域;增長型主題表現為穩定知識結構和高增長影響力,是新興主題的備選區域;穩定型主題具有二維特征的雙低表現,內在結構與外在影響力呈現雙穩定,該區域出現新興主題的概率低;演變型主題表現為穩定影響力和較高結構變化率,這類主題通常反映傳統主題穩定發展態勢下仍蘊藏著持續創新潛力,對于這種具有旺盛生命力的重要主題應給與長期關注。總之,通過二維組合特征的綜合考量,能夠區分衡量不同主題類型,為研判學科前沿動態提供決策支撐。

圖4 新興主題二維識別模型

2 實證研究

2.1 數據來源及處理

實證以情報學為學科領域,以Web of Science(WoS)文獻數據庫為數據來源。情報學是典型復合應用導向學科,尤其是最新信息技術在情報領域深度融合,驅動新興議題不斷涌現。WoS數據庫收錄學術文獻質量高且覆蓋面廣,是捕捉學科動態的常用數據源。檢索策略為,通過代表性期刊獲得學科領域文獻,包含Journal of the Association for In‐formation Science and Technology、Scientometrics、Journal of Informetrics、Information & Management、Information Processing & Management、Journal of In‐formation Science,這些期刊學科認可度高,所刊載學術文獻基本能夠代表情報學領域前沿。檢索上述期刊在2018—2020年發表的文獻,從中篩選出類型為article的文獻,得到查詢結果2508條;從中抽取指標構建及識別分析需要的主要元數據,包括DOI(digital object unique identifier)號(DI)、作者關鍵詞(DE)、補充關鍵詞(ID)、標題(TI)、摘要(AB)、年份(PY)。

主題詞抽取是研究的基礎,獲取代表性強且覆蓋率高的備選主題詞集是關鍵。主題詞來源有3個途徑,包括作者關鍵詞、補充關鍵詞和非結構化文本。作者關鍵詞質量最高,是主題詞的首選;補充關鍵詞是數據庫的后續補充,準確性不如前者,刪除代表性低的詞語后,加入主題詞集合;為了提高主題詞的覆蓋率,采用NLP(natural language pro‐cessing)方法從文獻標題和摘要中抽取命名實體,從中挑出遺漏的重要詞語加入主題詞集。從2135個備選主題詞中,經過多輪篩選及處理(包括刪除偶發性低頻主題詞、明顯高頻傳統主題詞,同類合并),最終獲得250個主題詞作為重點識別對象。

學科知識網絡以主題詞為節點,共現關系為邊,形成無向非加權網絡。從整體和個體層面分別得到全局知識網和個體知識網,前者包含所有主題詞節點,而后者節點由焦點主題詞和其存在共現關系的主題詞共同組成。以年份為時間單位構造知識網絡時間序列,每年可以得到250個個體知識網與1個全局知識網。選取典型網絡指標分析知識網絡結構動態,如表1所示。節點數和邊數反映網絡規模,不論是整體還是個體層面均呈現先降后升的波動。網絡密度(density)反映了知識網絡連接緊密程度,個體知識網密度基本保持相當,而全局知識網網絡密度在2020年呈現小幅度上升。集聚系數(clustering coefficient)刻畫了三角關系嵌入傾向,是社區結構的反映,可以發現兩種網絡均呈現先升后降的模式。從整體上看,規模性指標(節點數、邊數)與結構性指標(集聚系數)呈現相反變化態勢,反映知識網絡的演化過程復雜性、規模性與結構性特征存在較大差異。值得注意的是,相較于2019年,2020年主題詞與外部產生了更多的語義關聯,而社區結構嵌入卻明顯下降,說明穩定的知識語義社區聚集還未形成,新的知識結構耦合在不斷嘗試,很大程度上是新興主題蘊藏涌動的體現。

表1 主題知識網絡描述性統計

2.2 指標相關性分析

采用知識網絡序列數據,依據式(4)、式(5)和式(7)分別構建面向主題的指標——結構突變度D、結構突變率ΔD和影響力增長率ΔPR。厘清這些指標之間關系及表征能力是構建識別方案的基礎。由此,通過相關性分析揭示指標特征,表2給出了指標間的Pearson相關系數。為了全面性,表2還考慮了非加權的影響力增長率ΔPR′和指標文獻增長率ΔA。文獻增長率ΔA反映主題的呈現規模變化,其定義為焦點主題的文獻數量增長率,并將關鍵詞包含焦點主題的文獻界定為主題文獻。

表2 指標相關性分析

通過相關性分析,可以發現以下基本特征:①主題知識結構變化與文獻增長負向相關。結構突變度D與文獻增長率ΔA在5%水平下顯著負相關,兩者反映不同層面特征,主題文獻增長越多,個體知識網結構變化則越少;反之,亦然。新興主題出現初期,少數引領文獻引發知識結構發生顯著變化,隨著學界共識加大,主題內涵趨向穩定,后續大量衍生應用文獻出現。②主題影響力增長與文獻增長呈正向相關。主題影響力增長率ΔPR與文獻增長率在1%水平下顯著正相關,說明兩者形成正反饋,主題文獻增多,意味著更多領域曝光與學界認可,進而產生更多語義聯系的可能,形成廣泛影響力。③主題知識結構變化與影響力增長具有一定程度正向相關。結構突變率ΔD雖然與影響力增長率ΔPR的相關性并不顯著,但是與非加權指標ΔPR′在5%水平下顯著正相關。④結構突變度D和結構突變率ΔD的刻畫能力存在明顯差異性。雖然兩個指標都以刻畫知識結構變化為目的,但相關分析結果——相關性并不顯著,說明兩者事實上反映了知識結構動態的不同側面,反映了主題的不同動態趨勢,這種差異是不同指標內涵定義的體現。

綜上所述,得到以下基本結論:①主題知識結構變化與影響力增長具有一定程度正相關,同時呈現高水平狀態的主題應是探測關注重點。②結構突變率ΔD是反映主題涌現的新型指標,刻畫了主題知識涌現過程的結構動態,與反映主題文獻增長的指標具有互補性,豐富拓展了新興主題的認知途徑。③結構突變度D和結構突變率ΔD是不同的知識結構動態度量指標,從不同角度反映主題結構變化。

為了細粒度地展示指標識別能力,表3給出了按照各個指標逆序排名前15位的主題。表中指標整體上均展現出對新興主題的敏感性,尤其是以covid-19和bolckchain為代表的近期新穎主題都排名前列。從指標排序結果比較可以看出不同指標識別偏好的差異性。例如,主題結構突變度D與主題結構突變率ΔD的排序結果差異大,反映了其對主題動態捕捉能力的差異,結構突變率更利于反映主題知識結構變化的態勢。另外,主題影響力增長率的加權與非加權指標結果差異不大,說明權重的設置只是對指標結果進行了微調,在捕捉影響力增長的同時對數量增長特征給與適度兼顧。例如,通過加權指標,以deep learning、interdisciplinarity為代表的文獻較多且影響力快速增長的主題得到更高排名,該結果具有合理性。

表3 各指標排名前15位主題列表

2.3 識別分析

以結構突變率為橫軸,影響力增長率為縱軸,構建新興主題識別二維空間,如圖5所示。為了更直觀、清晰地展示主題分布模式,坐標軸采用對數形式。本文選擇結構突變率作為反映主題結構變化的橫軸,而非結構突變度,主要原因在于:①結構突變率是在結構突變度基礎上的差分計算,對于拓撲結構的細微變動更加敏銳,這對發現處于涌現初期而增長幅度不明顯的新興主題十分重要;②新興主題的戰略價值在于未來可能性,不但期望知識結構的新穎變動(結構突變度),更加看重知識結構內涵創新的未來態勢,而能夠反映突變加減速態勢的結構變動率更適于挖掘發展潛力巨大的新興主題。

圖5 基于二維空間的識別結果

由圖5可知,開展識別分析得到以下主題識別結果:①第一象限。顯而易見,分布于右上角的主題deep learning、covid-19、blockchain遠離主題群落,指標組合呈現雙高特征,是當前學科發展潛力巨大的新興主題。另外,第一象限的其他主題雖然不如上述3個主題的新興趨勢顯著,但大多呈現高增長狀態,也是新興主題探測的重要區域。例如,以convolutional neural network、interdisciplinarity、link prediction為代表的主題具有較高新穎性,發展勢頭迅猛,也是重要的新興主題。②第二象限。該區域為增長型熱門主題,以熱門的模型及方法為主,以complex networks、research assessment、text classification為代表的模型及方法雖然日益成熟、穩定,但是其探討及應用日益深入熱烈,學科影響力亦不斷增長。③第三象限。該區域為穩定型主題,指標組合呈現雙低模式,這些主題表現不夠活躍,出現新興主題的概率較低,屬于低關注區域。④第四象限。該區域為演變型主題,大多為情報學領域傳統主題,如journal impact factor、citation network、PageRank,雖然其相關研究已非常成熟深入,但仍占據學科核心地位,而且隨著學科演化其亦不斷發展,衍生出新問題、新場景、新方法驅動下的不斷創新。例如,g-index已被提出約15年,不再是熱門議題,但對其方法改進優化的探討研究依然持續,這種主題演化在指標上體現為較高的結構突變率。

在大范圍篩選基礎之上,對重點主題開展深入討論,以進一步檢驗識別結果。①新型冠狀病毒肺炎(COVID-19)是出現于2019年的全球性重大公共衛生事件,情報學界響應及時,最早于2020年出現4篇相關文獻采用科技情報工具對疫情進行了分析及預測,與research quality、healthcare policy、forecasting、diffusion models等主題嵌入形成個體知識網。主題covid-19是2020年突然涌現的學科議題,表現出最高水平的結構突變率,劇烈的新穎知識結構涌現是識別該新興主題的重要特征。雖然相關文獻不多且個體知識網稀疏單薄,尚處于萌芽階段,但可以預期該主題會成為近幾年科技情報領域的重要議題。②區塊鏈(blockchain)技術雖然2008年就已應用于比特幣,但最近幾年其應用價值才得到廣泛共識,情報學領域發表相關文獻1篇(2019年)和5篇(2020年),主要對不同場景下采用區塊鏈架構的信息處理機制及架構開展深入探討,該主題經過兩年發展,圍繞fake news、trust management、game theory、decentralization等關聯內容形成獨特研究范疇,反映出該技術在情報領域的重要應用前景。③深度學習(deep learning)是近年來人工智能領域的重大突破性技術,在情報學領域的應用熱度火爆,從2019年的5篇猛增至2020年的29篇,結合情報學問題場景形成深入融合創新發展,形成bert、word embedding、transfer learning、graph neural network等相關議題嵌入的知識網。作為科技情報領域的重要方法工具型議題,主題deep learning表現出最高水平的影響力增長率,廣泛深入的學科應用不斷提升其學科影響力。

值得注意的是,新興主題呈現不同程度的知識結構突變。圖6給出了3個最具代表性新興主題的知識嵌入演化過程,通過2019—2020年的個體知識網對比,可揭示主題涌現的知識結構動態機制。為了便于清晰展示拓撲形態,圖6中知識網絡為刪減低頻連接的結果。①主題covid-19從無到有,短期突然涌現,形成初具社區特征的知識嵌入結構。這種突然的知識網絡涌現對學科知識體系形成最為強烈的結構性影響,應給予最高的結構突變率評分,通過結構突變率可以及時敏感地發現這種規模小但新穎度高的學科主題。②主題blockchain處于知識嵌入的快速演化階段,從2019年的5個節點構成簡單網絡快速演化為2020年的26個節點嵌入的多社區結構知識網絡,反映內涵的不斷豐富與語義清晰化。③主題deep learning的知識網絡由社區聚集向生態化演進,顯著表現就是規模猛增,從簡單網絡向復雜網絡演化,主題生態群落的逐步形成意味著該主題知識網絡趨向穩定,且通過復雜的外部耦合形成日益廣泛的學科影響力。總之,上述3個主題呈現了處于不同涌現階段的知識嵌入特征,均展現出強烈的知識結構改變,這種動態特征為揭示新興主題內在動力機制提供了有力佐證,更為識別新興主題形成客觀依據。

當然,除了上述令人矚目的新興主題之外,也存在其他值得關注主題。例如,第一象限中的con‐volution neural network、information security、inter‐disciplinarity、twitter等也表現不俗,其內在結構突變與外在影響力都呈明顯上升勢頭,也是不可忽視的學科新興主題。總之,基于知識結構動態的指標展現了良好的識別效果,能夠從結構層面為學科趨勢提供獨特視角。

3 結 論

學科新興主題是新穎知識的涌現,體現為知識網絡結構的根本性改變,并成為新興主題的識別特征。針對已有研究在知識結構動態定量化方面的研究缺口,本文借助圖同構分析刻畫主題知識演化,采用WL子樹核度量知識網絡的拓撲突變,并基于此構建主題結構突變率指標,并采用PageRank算法構建主題影響力增長率指標,由此通過指標組合構建學科新興主題二維識別方案。實證研究有效檢驗了基于知識結構動態識別方法的有效性,不論整體分析還是個體解析,均反映出通過知識拓撲識別學科新興主題的邏輯合理性,檢驗了所設計指標的知識拓撲動態刻畫能力及對學科新興主題的捕捉能力。該方法以知識拓撲特征為切入點,透視學科新興主題的涌現動力機制,通過圖同構分析深化了主題知識網絡動態刻畫能力,彌補了新興主題結構動態分析方面的不足。

本文識別方法具有以下特點:①提出旨在刻畫知識結構變動程度的指標——主題結構突變率。該指標反映了知識網絡的拓撲變動,采用WL子樹核度量不同時期的知識網絡結構差異程度,這種拓撲比較算法建立在網絡社區結構基礎之上。一般來說,網絡拓撲比較很大程度上依賴于人工觀察,而該指標提供了拓撲動態的定量分析,為理解新興主題形成機理提供結構視角,具有良好應用價值和潛力。②提出基于主題知識拓撲的學科新興主題識別方案。從結構突變和影響力增長兩個方面特征構建識別空間,前者反映主題的知識嵌入變化,后者反映主題的外部影響力增長,形成知識網絡動態視角的新興主題識別能力。③借助知識網絡刻畫學科新興主題,個體知識網絡嵌入反映焦點主題內涵范疇,知識網絡動態反映新興主題涌現過程,從知識拓撲突變視角捕捉新興主題關鍵特征,有助于深化學科主題動態演化規律的認知和把握。

結構突變度和結構突變率是本文提出的主題結構動態指標,兩者既有緊密聯系,又存在明顯差異。這兩個指標均是基于WL子樹核算法,旨在反映主題知識的結構動態性。兩者的區別主要體現為:①內涵差異。結構突變度度量知識拓撲的變化程度,旨在反映主題結構突變強度,結構突變率是對知識拓撲變化的更高階度量,通過知識突變度的差分計算揭示主題突變的加減速態勢,更能體現未來趨勢規律。②適用性差異。結構突變度揭示拓撲改變的大小程度,結構突變率則更強調拓撲的改變態勢,相對而言,前者可以探測具有規模優勢的熱門主題,而后者更善于發現尚處萌發初期,且未來發展潛力大的新興主題。研究結果亦初步說明結構突變率在新興主題識別場景的良好適用性。知識結構探測是科技情報領域的重要研究問題,基于拓撲比較的指標及算法在該領域具有重要應用前景。

本文得到了實證檢驗支撐,但仍存在一定局限性。圖同構問題具有挑戰性,面對主題知識涌現的拓撲結構識別,需要進一步深入探索包括WL子樹核在內的多種圖同構方法比較。另外,主題涌現是復雜多因素過程,將知識結構指標與文獻計量指標相結合應用是未來可探討的方向之一。

主站蜘蛛池模板: 黄色网址手机国内免费在线观看| 亚洲无线视频| 无码中字出轨中文人妻中文中| 日本道综合一本久久久88| 亚洲日韩久久综合中文字幕| 美女内射视频WWW网站午夜| 亚洲αv毛片| 亚洲黄色激情网站| 波多野吉衣一区二区三区av| 国产亚洲高清在线精品99| 国产无码精品在线播放| 97视频在线精品国自产拍| 亚洲香蕉在线| 亚洲精品大秀视频| 日韩免费毛片视频| 幺女国产一级毛片| 午夜啪啪福利| 国内毛片视频| 久久公开视频| 亚洲国产午夜精华无码福利| 国产理论一区| 无码精品国产dvd在线观看9久| 在线亚洲精品自拍| 国产第一页第二页| 国产黑丝视频在线观看| 亚洲国产第一区二区香蕉| 亚洲日韩精品伊甸| 精品亚洲麻豆1区2区3区| a级毛片免费在线观看| 欧美色99| 国产在线欧美| 亚洲侵犯无码网址在线观看| 一区二区三区四区精品视频| 色综合婷婷| 亚洲高清日韩heyzo| 亚洲一级毛片免费观看| 欧美日韩导航| 丁香五月激情图片| 国产香蕉97碰碰视频VA碰碰看| 成年人福利视频| 手机在线国产精品| 午夜久久影院| 色婷婷综合激情视频免费看| 亚洲国产精品无码AV| 99热亚洲精品6码| 日韩欧美综合在线制服| 潮喷在线无码白浆| 亚洲欧美不卡视频| 曰韩人妻一区二区三区| 亚洲综合色在线| 亚洲精品无码抽插日韩| 午夜啪啪福利| 日韩欧美色综合| 日韩高清无码免费| 超碰精品无码一区二区| 六月婷婷激情综合| 日韩国产亚洲一区二区在线观看 | 91综合色区亚洲熟妇p| a毛片在线播放| 成AV人片一区二区三区久久| 一级片免费网站| 国产高清在线精品一区二区三区| 国产噜噜在线视频观看| 911亚洲精品| 色屁屁一区二区三区视频国产| 99热这里只有精品久久免费| 国产欧美亚洲精品第3页在线| 亚洲成人福利网站| 国产精品无码AV片在线观看播放| 亚洲成a人片77777在线播放| 国产一二视频| 中文天堂在线视频| 亚洲精品视频免费观看| 91精品久久久无码中文字幕vr| 91久久青青草原精品国产| 日韩av无码DVD| 欧美激情第一欧美在线| 情侣午夜国产在线一区无码| 欧美日韩亚洲国产主播第一区| 亚洲视频免费在线| 狠狠综合久久久久综| 国产h视频在线观看视频|