999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的石斛研究可視化分析與構建①

2022-06-28 10:06:36李石榮符茂勝周先存王成佘德勇
關鍵詞:可視化分析研究

李石榮, 符茂勝, 周先存, 王成, 佘德勇

1.皖西學院 電子與信息工程學院,安徽 六安 237012; 2.霍山縣天下澤雨生物科技發(fā)展有限公司,安徽 六安 237200; 3.皖西學院 生物與制藥工程學院,安徽 六安 237012

特色植物資源以其獨特的藥用價值和商用價值而備受政府的關注,在國民經(jīng)濟中具有重要的作用.十九屆四中全會《決定》提出: 要強化提高人民健康水平的制度保障,堅持以基層為重點、預防為主、防治結合、中西醫(yī)并重[1].山區(qū)作為中藥材產(chǎn)業(yè)的重要基地,因其獨特的地理位置而擁有豐富的石斛、天麻等多種特色植物資源[2].特色植物資源的研究與開發(fā)可促進山區(qū)的經(jīng)濟發(fā)展、增加就業(yè)崗位和提高國民收入.目前,對特色植物的研究成果較多,任剛等[3]對鐵皮石斛的葉子中所含的主要化學成分進行了研究,并首次提取了若干化合物; 袁青松等[4]針對環(huán)境溫度、種子品種對天麻抽薹特性的影響進行了相關的研究,得出烏天麻和紅天麻的種子在發(fā)育過程中抽薹生產(chǎn)的最佳溫度; 張宗源等[5]主要研究了組蛋白乙酰化成分對靈芝的生長、多糖和酸生物合成等方面的影響,得出可通過人為調控靈芝生長發(fā)育過程進而影響靈芝酸生物合成組蛋白乙酰化.

石斛作為特色植物資源中一種名貴的中藥材而受到研究學者和機構的廣泛關注.當前對石斛的研究大部分僅限于氣候、土壤、地理位置或成分分析等內(nèi)容[6-8],在信息化建設發(fā)展上相對滯后,如何利用智能化手段挖掘石斛資源潛在的數(shù)據(jù)信息,構建“一張圖”綜合服務平臺,有利于優(yōu)化產(chǎn)業(yè)結構,便于政府和企業(yè)對石斛資源進行優(yōu)化整合和決策管理,有利于促進新時期地區(qū)產(chǎn)業(yè)的經(jīng)濟發(fā)展.隨著計算機網(wǎng)絡和大數(shù)據(jù)處理技術的不斷發(fā)展,近些年來,基于大數(shù)據(jù)的知識圖譜可視化分析得到了廣泛的研究和應用[9-15].將知識圖譜應用于日常生活和行業(yè)發(fā)展是未來的發(fā)展趨勢.目前,知識圖譜可視化在智慧教育、智能醫(yī)療和智慧農(nóng)業(yè)等多個領域已經(jīng)實現(xiàn)了成功的應用[16-22].侯夢薇等[16]指出醫(yī)學知識圖譜在臨床決策知識、語義檢索等醫(yī)療服務中具有重要的意義,通過集成術語構建大規(guī)模的知識圖譜可解決醫(yī)療中存在的資源不足和需求矛盾等重要問題.Chen等[18]提出了一種KnowEdu系統(tǒng),利用神經(jīng)序列標記算法提取教學概念,通過概率關聯(lián)規(guī)則挖掘教育領域的重要信息.陳曦等[19]指出基于課程知識圖譜的預測算法可降低預測誤差,獲得更好的學生成績預測效果.侯麗等[20]對我國農(nóng)業(yè)重金屬污染現(xiàn)狀進行了知識圖譜可視化研究,為農(nóng)田污染的治理提供了智慧決策.杜師博等[21]對國內(nèi)景觀評價方法進行了可視化分析,直觀地揭示了國內(nèi)景觀評價方法的發(fā)展現(xiàn)狀、研究熱點和動態(tài)方向,為政府和商家提供了智慧性決策方案.王友發(fā)等[22]總結了近20年智能制造研究的熱點并對前沿進行挖掘,提出了未來智能制造的可能發(fā)展方向.

目前知識圖譜已經(jīng)在多個行業(yè)中實現(xiàn)了成功的研究和應用,然而關于特色植物資源的圖譜應用卻很少,尤其是關于石斛的知識圖譜可視化分析的研究文獻更少.石斛作為一種特色植物資源在國民經(jīng)濟和社會發(fā)展中具有重要的作用,本文基于CNKI數(shù)據(jù)庫中有關石斛的文獻,利用大數(shù)據(jù)技術對獲取的數(shù)據(jù)進行知識抽取和融合,實現(xiàn)面向石斛的大數(shù)據(jù)知識圖譜可視化分析,可直觀地描述石斛資源政策、產(chǎn)業(yè)和研究方向的相關信息.實驗選取了與石斛研究相關的作者、機構和關鍵詞等內(nèi)容進行了相應的知識圖譜可視化分析,根據(jù)分析的結果并通過分詞和詞性標注來進行針對性的信息抽取,通過半監(jiān)督訓練實現(xiàn)經(jīng)驗數(shù)據(jù)打標簽,最后將打標整理好的數(shù)據(jù)存入數(shù)據(jù)庫并導入Neo4j平臺實現(xiàn)知識圖譜的構建.實驗結果表明: 近20年來有關石斛的文獻研究經(jīng)歷了“緩慢增長、快速增長和穩(wěn)定波動”3個階段; 作者與機構的聚類網(wǎng)呈現(xiàn)“一主網(wǎng)集中、多小網(wǎng)分散”的關系,有關石斛研究的大部分作者和機構之間存在合作關系,石斛研究的科研單位主要與石斛生長的地理位置有關,石斛研究的作者和機構隨著時間的變化也會有所變動; 關鍵詞共現(xiàn)和聚類分析結果顯示: 有關石斛研究的聚類關鍵詞可主要聚集為5大類,即糖尿病、多糖、石斛、遺傳穩(wěn)定性和數(shù)據(jù)挖掘.聚類糖尿病主要側重于石斛的中醫(yī)療效、免疫功能等內(nèi)容; 聚類多糖主要側重于石斛主要成分、采收期、提取工藝等內(nèi)容; 聚類石斛主要側重于石斛的種類、栽培技術、產(chǎn)業(yè)推廣等內(nèi)容; 聚類遺傳穩(wěn)定性主要側重于石斛的組織培養(yǎng)、遺傳基因、光合作用等內(nèi)容; 聚類數(shù)據(jù)挖掘主要側重于石斛的中醫(yī)傳承輔助平臺、用藥規(guī)律、關聯(lián)規(guī)則等內(nèi)容.關鍵詞聚類圖譜可視化結果分別從石斛的藥用、成分、屬性、遺傳性和智能數(shù)據(jù)分析方面對石斛研究進行系統(tǒng)性的分析和展示,對熱點的分析也反映了近20年來研究機構對石斛研究重點的遷移變化.根據(jù)石斛研究知識圖譜可視化分析的結果,利用Python網(wǎng)絡爬蟲抓取知網(wǎng)摘要關鍵詞,根據(jù)分詞和詞性標注建立信息抽取訓練模型,通過經(jīng)驗分析和半監(jiān)督訓練對數(shù)據(jù)進行打標簽,最后將整理好的打標數(shù)據(jù)存入數(shù)據(jù)庫并導入Noe4j平臺,實現(xiàn)具有石斛研究針對性的知識圖譜結果.本文不僅基于Citespace軟件實現(xiàn)了石斛研究知識圖譜可視化分析,而且根據(jù)分析的結果建立半監(jiān)督訓練信息抽取模型,最終構建了針對石斛研究的知識圖譜.

本文利用CNKI數(shù)據(jù)庫關于石斛研究的數(shù)據(jù)資源,結合Citespace軟件對石斛的研究動態(tài)、機構合作、摘要關鍵詞與熱點等內(nèi)容做圖譜分析,構建了面向石斛資源研究的“一張圖”.得到的圖譜可以為有關石斛研究人員和機構的研究方向提供參考性建議,為有關地方政府和商戶提供重要的決策信息和指導,對促進石斛研究、提高石斛的產(chǎn)業(yè)化、帶動地方經(jīng)濟的發(fā)展和提高國民收入具有重要的意義.

1 知識圖譜可視化分析與構建原理

1.1 可視化分析

本文利用Citespace軟件對知網(wǎng)數(shù)據(jù)進行可視化處理,流程圖如圖1所示.可視化過程主要分為4個步驟: 數(shù)據(jù)準備、參數(shù)設置、聚類分析與圖譜分析.

圖1 可視化分析流程圖

1.1.1 數(shù)據(jù)準備

從CNKI數(shù)據(jù)庫下載的數(shù)據(jù)并不能直接應用于Citespace軟件進行分析,可通過軟件自帶數(shù)據(jù)轉換功能,對數(shù)據(jù)進行格式轉換.建立兩個文件夾,分別用于存儲原始數(shù)據(jù)和轉換數(shù)據(jù).

1.1.2 參數(shù)設置

Citespace軟件在建立項目過程中需要對參數(shù)進行設置,主要參數(shù)為時間分割、節(jié)點閾值篩選、網(wǎng)絡精簡、強度關聯(lián).

1.1.2.1 時間分割

時間分割的主要功能是對分析的數(shù)據(jù)在時間段上進行分割,確定時間跨度,分析石斛在各個時間段的主要研究熱度和變化趨勢.

1.1.2.2 節(jié)點閾值篩選

節(jié)點閾值篩選主要用于在設定的時間段內(nèi)提取所需對象的個數(shù).閾值篩選包括在增加規(guī)模因子k的基礎上,通過g指數(shù)進行排名修正實現(xiàn)對知識單元的抽取.公式為

(1)

其中k為規(guī)模因子,分別取10,20,30,…依次進行嘗試;ci為第i文獻被引用次數(shù).

1.1.2.3 網(wǎng)絡精簡

Citespace軟件中主要提供了兩種網(wǎng)絡精簡算法,尋徑網(wǎng)絡(pathfinder network,PFNET)算法和最小生成樹(minimum spanning tree,MST)算法.

1.1.2.3.1 PFNET算法

PFNET網(wǎng)絡算法的主要結構由兩個參數(shù)確定,基于閔氏距離的網(wǎng)絡節(jié)點路徑長度r和滿足三角不等式的連接數(shù)量最大值q.當r=2時,距離測度為歐氏距離.測度空間確定時,三角不等式的關系可定義為

(2)

式中,wij表示第i和j節(jié)點之間的連接權重,wnknk+1表示第nk和nk+1節(jié)點之間的連接權重,k=1,2,3,….當?shù)趇=n1和j=nk時,備選路徑將經(jīng)過所有節(jié)點,該網(wǎng)絡包含所有中間連線.若備選路線權重小于wij的值,那么等式不成立,第i和j節(jié)點之間的連接線將被刪除.q參數(shù)主要用于備選路線,取[2,N-1]內(nèi)任意整數(shù),N為節(jié)點的個數(shù).當r→∞時,q=N-1,網(wǎng)絡可實現(xiàn)最大裁剪能力.

1.1.2.3.2 MST算法

最小生成樹算法的構造是利用連通網(wǎng)構造實現(xiàn)代價最小的生成樹.給定一個無向圖G=(V,E),V和E分別表示數(shù)字頂點集和邊集,若存在邊集T為E的子集并且為無循環(huán)圖,同時滿足等式(2)且值最小,則T為滿足該條件的最小生成樹.

(3)

式中(i,j)表示頂點i和j連接的邊,w(i,j)表示(i,j)的權重.

無論是采用MST算法還是PFNET算法,目的都是希望對生成的網(wǎng)絡進行裁剪,降低網(wǎng)絡的復雜性和提高圖譜的可讀性.與PFNET算法相比,MST算法得到的圖譜會更加簡潔清晰,但丟失的節(jié)點信息更多.對于圖譜過于龐大和混亂時,需要選擇PFNET算法得到的修剪效果會更好.

1.1.2.4 強度關聯(lián)

Citespace軟件提供了網(wǎng)絡分布中用于計算連接強度的cosine算法,如公式(4):

(4)

標準化后的數(shù)值在0~1之間,其中cij表示節(jié)點i和j共現(xiàn)次數(shù),si表示節(jié)點i共現(xiàn)的頻次,sj表示節(jié)點j共現(xiàn)的頻次.

1.1.3 聚類分析

Citespace主要利用最大期望(EM)聚類算法對網(wǎng)絡節(jié)點進行聚類處理.首先,將所有節(jié)點隨機地分配到K個聚類簇中; 其次,統(tǒng)計每個節(jié)點在K個聚類簇中的分布比例; 再次,求出模型所需的參數(shù).輸入m個樣本觀察數(shù)據(jù)x=(x(1),x(2),…,x(m)),找到樣本的模型參數(shù)θ,極大化模型的對數(shù)似然函數(shù)為

(5)

由于觀察數(shù)據(jù)中存在未觀察到的隱含數(shù)據(jù)z=(z(1),z(2),…,z(m)),此時極大化模型的似然函數(shù)可變?yōu)?/p>

(6)

為求出模型參數(shù),對式子進行縮放可得

(7)

Qi(z(i))為未知的分布,根據(jù)詹森不等式,由上式可以得到

(8)

公式(6)中包含隱含數(shù)據(jù)的對數(shù)似然下界,通過去掉常數(shù)部分,可將極大化對數(shù)似然下界表示為

(9)

最后,將得到的每個詞分別分配給K聚類簇的概率,選取K個數(shù)值中最大值作為該詞所屬的聚類簇.

Citespace提供了從標題、關鍵詞和摘要中提取聚類命名,提供的算法主要有潛語義索引算法、假設檢驗算法和互信息算法,可提取研究術語并強調研究特征.

1.1.4 圖譜分析

選擇合適的研究術語、時間分割跨度、閾值、精簡算法進行可視化顯示,借助軟件提供的可視化工具選項對圖譜進行美化,也可以利用提供的網(wǎng)絡計算功能對圖譜網(wǎng)絡進行深度分析,最后對分析的結果進行驗證.

1.2 知識圖譜構建

本文利用信息抽取技術、半監(jiān)督學習算法和Neo4j平臺等相結合方法對知網(wǎng)數(shù)據(jù)庫近20年的文獻作者、機構、年份和關鍵詞等進行處理,構建針對石斛研究領域的知識圖譜.

1.2.1 信息抽取

知識圖譜的構建離不開對實體進行識別,借助詞性標簽,從有關石斛的摘要內(nèi)容中提取重要詞語.當需要的關鍵詞語跨越多個詞語時,僅僅利用詞性標簽是不夠的,需要解析句子中的詞語之間的依賴關系即依賴解析.如提取關鍵詞和修飾詞、提取復合詞、提取詞語之間的標點符號等.圖譜實體之間的關系抽取也需要使用依賴解析,提取實體關系需要構建實體與關系之間的架構.

1.2.2 半監(jiān)督學習算法

半監(jiān)督學習充分將監(jiān)督學習和無監(jiān)督學習的優(yōu)勢相結合,通過少量的數(shù)據(jù)樣本對總體數(shù)據(jù)進行訓練,降低人工成本和提高工作效率.本文利用Bootstrapping算法對石斛研究關鍵詞語進行關系抽取,對數(shù)據(jù)進行訓練后實現(xiàn)標簽設置.主要步驟有:

1) 人工標記少量石斛研究相關數(shù)據(jù)作為種子集并訓練一個初始實體識別模型;

2) 設定條件概率閾值,將實體識別模型對未標記數(shù)據(jù)進行預測處理獲取數(shù)據(jù)關系標簽和概率大小,當輸出概率大于閾值時,將數(shù)據(jù)標記為可靠數(shù)據(jù)并組成一個可靠集;

3) 當該可靠集數(shù)據(jù)大于500條時,將可靠集與種子集合并成一個新的標注數(shù)據(jù)集,重新訓練獲取實體識別模型;

4) 重復上述步驟,直至結束.

1.2.3 Neo4j平臺顯示

選擇Neo4j作為知識圖譜構建平臺,將提取的實體和關系進行打標簽并整理好,導入數(shù)據(jù)庫并在Neo4j平臺中顯示.

2 實驗結果與分析

由于Citespace軟件對CNKI的數(shù)據(jù)分析功能有限,本實驗就文獻的概況、作者與機構分析、關鍵詞與熱點分析等幾個部分內(nèi)容作重點分析,最后利用半監(jiān)督模型訓練后在Neo4j平臺構建知識圖譜.

2.1 數(shù)據(jù)收集和處理

本文在中國知網(wǎng)下載了有關石斛的文獻,選取主體為“石斛”進行檢索,時間、作者、單位等條件不限,初步統(tǒng)計文獻有9 024篇,刪除檢索結果中的新聞、會議通知和重復等內(nèi)容,最終獲得文獻共計5 729篇作為本次實驗的基礎數(shù)據(jù).

本文是基于石斛的知識圖譜可視化分析,主要就研究領域的作者、機構、關鍵詞等核心內(nèi)容進行分析與篩選,展示石斛在不同階段研究關注的熱點、發(fā)展動態(tài)等,揭示未來的石斛發(fā)展趨勢.

2.2 文獻基礎分析

不同年份關于石斛研究的文獻數(shù)量可以反映出該領域研究的熱點和趨勢,從圖2中可以看出有關石斛近20年研究文獻的變化趨勢,有關石斛的研究經(jīng)歷了3個階段: 緩慢增長、快速增長和穩(wěn)定波動.

緩慢增長階段: 2001-2011年,有關石斛的研究文獻在10年內(nèi)從約100篇穩(wěn)步增長到約400篇,石斛瀕危問題得到了較好的解決,關于石斛的商業(yè)化生產(chǎn)仍處于起步階段,關于石斛的研究、種植和銷售等方面引起了廣大研究學者和政府部門人員的關注[23].

快速增長階段: 2012-2015年,石斛的研究文獻在這個時間段內(nèi)實現(xiàn)了快速增長,2015年達到了約800篇,關于石斛的研究和商業(yè)化處于快速發(fā)展時期,期間如鐵皮石斛、霍山石斛等品種在中藥研究、品種培育和商業(yè)推廣等方面取得了眾多成果[24-25].

穩(wěn)定波動階段: 2016-2019年,石斛的研究文獻在這個期間處于緩慢增長和波動階段,關于石斛的研究和商業(yè)化基本上處于成熟階段,石斛未來的研究朝向多元化和智能化發(fā)展[26].

文獻的來源期刊可直接反映石斛研究的熱點,如圖3所示,有關石斛研究的文獻期刊主要為與中藥材和農(nóng)業(yè)發(fā)展相關的期刊.

圖2 石斛相關文獻發(fā)表量年度趨勢

圖3 石斛研究文獻期刊分布

2.3 作者與研究機構分析

作者是研究石斛的主體,作者之間的聯(lián)系可以觀察出在石斛研究過程中的合作交流情況,運用Citespace軟件可以獲得關于石斛研究的作者圖譜原圖、MST圖譜和PFNET圖譜.如圖4-圖6所示,原圖譜、MST圖譜和PFNET圖譜的節(jié)點均為799個,連線分別為1 419,710和1 105個,網(wǎng)絡密度分別為0.004 5,0.002 2和0.003 5.與原圖譜相比,MST圖譜和PFNET圖譜更加清晰簡捷,但部分節(jié)點信息會被省略,與PFNET圖譜相比,MST圖譜丟失了更多的結構信息.

圖4 作者圖譜原圖

圖5 MST作者圖譜

圖6 PFNET作者圖譜

統(tǒng)計核心作者的發(fā)文數(shù)量,有關石斛研究的發(fā)文量大于20篇的作者共有42人,從圖5-圖6中可以看出作者之間的關系主要分為幾大聚類關系,大部分作者之間存在一種合作研究關系.表1展示了石斛研究的主要作者,從圖5-圖6圖譜中可以發(fā)現(xiàn),這些作者在整個石斛的研究過程中起到重要的作用.其中陳乃富、魏剛、郭順星等作者組成了一張較大的研究關系網(wǎng),而宋希強、李澤生等作者各自組成了較小的研究關系網(wǎng),石斛研究領域作者關系網(wǎng)呈現(xiàn)的是“大網(wǎng)集中,多網(wǎng)分散”的趨勢.表2給出的是作者在不同時間段對石斛研究的主要內(nèi)容變化,體現(xiàn)石斛研究演變趨勢.

表1 石斛研究部分核心作者發(fā)文量統(tǒng)計表

表2 作者石斛研究主要內(nèi)容變化

機構是石斛研究的主要平臺,石斛研究的主要機構包括科研院校、研究所和企業(yè)等.圖7為MST算法處理的機構知識圖譜,可以發(fā)現(xiàn)有關石斛的研究基本上為科研院校和研究所,其中郭順星研究員所在的中國醫(yī)學科學院北京協(xié)和醫(yī)學院藥用植物研究所、魏剛研究員所在的廣州中醫(yī)藥大學和陳乃富教授所在的皖西學院生物與制藥工程學院等單位均為石斛主要的研究和發(fā)文機構,圖譜結果可以看出研究機構之間的合作關系強度.從圖譜結果的側面分析可以得出,廣州中醫(yī)藥大學發(fā)文數(shù)量最高達到了189篇,其余包括皖西學院在內(nèi)的9家研究機構發(fā)文量也突破了100篇,體現(xiàn)了這些高校和科研院所對石斛研究的深度.

圖7 研究機構知識圖譜

由于作者是研究機構的主體,基于時序的作者知識圖譜可視化分析可直接反映出研究機構在石斛領域的變化情況.圖8給出的是通過聚類得到的近20年來機構基于時序的知識圖譜可視化圖.聚類結果主要是通過對關鍵詞進行聚類分析獲取,每個聚類結果中包含多個關鍵詞,不影響作者的時序圖譜.時序圖譜可以看出研究機構對石斛研究的參考文獻從什么時間開始出現(xiàn)、聚類結果對應的研究機構所出成果從哪些年份開始增多以及聚類結果在哪些年份關注度開始降低等內(nèi)容.從圖8中可以看出,郭順星、陳曉梅等所在的中國醫(yī)學科學院北京協(xié)和醫(yī)學院藥用植物研究所從2000年開始就已對石斛的栽培生長、主要成分和基因分析等內(nèi)容進行了研究并持續(xù)至今,在石斛研究領域具有一定的廣度和深度; 羅建平、劉詠等所在的合肥工業(yè)大學生物與食品工程學院主要從2005年開始對霍山石斛的原球莖、多糖等進行了研究; 陳乃富、韓邦興等所在的皖西學院主要從2009年開始對霍山石斛的生長栽培、遺傳性和藥用性等進行了研究; 李澤生、李桂琳等所在的云南省德宏熱帶農(nóng)業(yè)科學研究所主要從2011年開始對石斛的生長、產(chǎn)業(yè)化等內(nèi)容進行了研究.

圖8 研究機構主體知識圖譜時序圖

圖9展示了近20年來根據(jù)時間段對石斛研究的主要研究院所關聯(lián)強度顯示圖.可以發(fā)現(xiàn)廣西壯族自治區(qū)農(nóng)科院花卉研究所和云南農(nóng)業(yè)大學園林園藝學院是最早開始研究石斛的研究所和高校,這與廣西、云南地理環(huán)境和盛產(chǎn)石斛有關,但持續(xù)時間僅到2007年.聯(lián)系最強的前三個單位是安徽農(nóng)業(yè)大學生命科學學院、貴州師范大學生命科學學院和皖西學院生物與制藥工程學院,這與貴州金釵石斛和安徽霍山石斛的藥用價值高和近些年得到政府和科研院所的重視有關.時間最近的兩個單位為皖西學院生物與制藥工程學院和浙江工業(yè)大學,這也體現(xiàn)了近幾年來這兩個單位對石斛的研究成果較多.

圖9 石斛研究機構關聯(lián)強度圖

多數(shù)石斛的生長與地理位置具有較強的關系.表3為我國主要的幾種石斛與地理位置、生長環(huán)境關系統(tǒng)計表.表3中可以看出球花石斛、霍山石斛和鐵皮石斛等不同品種所在的生長地區(qū)有所差異,主要與不同品種石斛對生長環(huán)境的要求各不相同有關,這與圖7、圖9所示的研究機構知識圖譜和關聯(lián)強度圖相契合.石斛研究機構主要以云南、安徽、廣西、四川和貴州等少數(shù)省份為主,部分經(jīng)濟發(fā)達地區(qū)如北京、廣州等城市的少數(shù)研究機構在石斛研究領域也有所涉及.

表3 石斛種類與地理位置統(tǒng)計表

2.4 關鍵詞與熱點分析

2.4.1 關鍵詞共現(xiàn)分析

圖10 石斛研究關鍵詞共現(xiàn)圖譜原圖

關鍵詞是表達文獻核心內(nèi)容的重要信息,也是研究該領域重點的提煉,在一定程度上可以反映該領域的研究發(fā)展方向和研究的方法技術.運用Citespace軟件可以生成有關石斛研究的關鍵詞共現(xiàn)知識圖譜,如圖10-圖12所示,分別為圖譜原圖、MST圖譜和PFNET圖譜.由于圖譜中的關鍵詞較多,得到的原圖圖譜比較龐大和混亂,MST算法和PFNET算法可解決這個問題.如圖11所示,MST圖譜可以展示有關石斛研究的核心關鍵詞,其中鐵皮石斛、多糖、組織培養(yǎng)等是石斛研究的重要關鍵詞,關鍵詞部分主要涉及到石斛的品種、培育生長、成分提取與分析、藥用價值和產(chǎn)業(yè)化等內(nèi)容.石斛的品種主要分為鐵皮石斛、霍山石斛和金釵石斛等,其中鐵皮石斛需要生長在海拔較高的山谷和樹木上,霍山石斛需要生長在海拔較高的懸崖峭壁石縫中或古樹上; 鐵皮石斛的花、莖、葉均可入藥,而金釵石斛只有莖可以入藥; 石斛中的多糖可用于治療糖尿病,其中霍山石斛的藥用滋陰功能較其他兩種石斛更強; 霍山石斛由于需要野生栽培,故其產(chǎn)業(yè)化推廣應用最差.

圖11 石斛研究關鍵詞共現(xiàn)MST圖譜

圖12 石斛研究關鍵詞共現(xiàn)PFNET圖譜

2.4.2 關鍵詞聚類分析

Citespace軟件中關于關鍵詞聚類時間線的可視化視圖可用于描繪聚類時間的關系以及聚類中文獻的歷史跨度.如圖13所示,有關石斛研究的關鍵詞聚類大體分為11類,本文重點分析糖尿病、多糖、石斛、遺傳穩(wěn)定性和數(shù)據(jù)挖掘5大聚類.

從聚類結果來看,聚類結構較顯著(聚類模塊值為0.58),聚類較合理(聚類平均輪廓值為0.52).下面著重分析實驗得到的5個聚類.

圖13 關鍵詞知識圖譜時序圖

1) 糖尿病.主要內(nèi)容有作用機制、降糖降脂、大鼠模型、免疫、脂多糖、抗炎等.可以看出從2000年開始研究石斛中所含的重要成分對糖尿病的作用機制,到2004年左右開始通過對糖尿病模型大鼠進行實驗,2007年開始提出了中醫(yī)藥療法,2012年開始研究石斛對降低人體血糖、抗炎和提高免疫力均有一定的療效,2017年開始提出西洋參、靈芝等中藥對改善糖尿病具有一定的效果.

2) 多糖.主要內(nèi)容有含量測定、采收期、提取工藝、原球莖等.2000年開始研究石斛多糖含量測定技術和成分提取方法,2005年開始研究石斛多糖抗氧化性能對抗衰老的作用,2015年開始研究石斛活性多糖對提高人體白細胞數(shù)量和提高免疫力等功效,2018年開始研究并提出鐵皮石斛花中含有的多糖具有抗脂質過氧化作用和提高人體免疫力.

3) 石斛.主要內(nèi)容有鐵皮石斛、產(chǎn)品質量、栽培技術、采收加工、產(chǎn)業(yè)開發(fā)等.該部分為類別涵蓋最多的一類聚類,該聚類合并了鐵皮石斛和霍山石斛等聚類關鍵詞,并首先對石斛的品種進行分類,對比不同品種石斛的品質質量; 其次對不同石斛的栽培技術進行研究,實現(xiàn)人工產(chǎn)業(yè)化栽培并進行專業(yè)的采收加工; 最后實現(xiàn)石斛產(chǎn)品的產(chǎn)業(yè)化推廣,推動地方經(jīng)濟建設的發(fā)展.

4) 遺傳穩(wěn)定性.主要內(nèi)容有組織培養(yǎng)、可控環(huán)境、遺傳多樣性、光合作用、篩選、適應性等內(nèi)容.主要研究石斛在不同條件下遺傳穩(wěn)定性及蒴果之間的差異及有關遺傳穩(wěn)定性的問題.

5) 數(shù)據(jù)挖掘.主要內(nèi)容有中醫(yī)傳承輔助平臺、用藥規(guī)律、關聯(lián)規(guī)則、因子分析等.關于石斛數(shù)據(jù)挖掘的主要時間節(jié)點在2016年國務院發(fā)布《中國的中醫(yī)藥》白皮書后,強調要著力推動中醫(yī)藥發(fā)展,實現(xiàn)中醫(yī)藥健康養(yǎng)生文化的創(chuàng)新性.主要利用臨床數(shù)據(jù)信息的基礎數(shù)據(jù)庫對石斛在藥物進行描述性分析和系統(tǒng)聚類分析時,分析石斛在臨床治療上的療效.

圖13所示的關鍵詞共現(xiàn)時間線聚類圖譜中包含1 500多個節(jié)點和3 500多條連接線,圖譜可視性較弱,為提高圖譜可視性,可通過提高(c,cc,ccv)參數(shù),得到如圖14所示的圖譜.

圖14 關鍵詞知識圖譜簡化時序圖

簡化圖譜的節(jié)點和連接線降低為237個和462條,簡化后的圖譜聚類結果與原圖譜相似,可以看出聚類的結果重點圍繞石斛的品種、成分、生長、癥狀治療、遺傳特性和數(shù)據(jù)挖掘等重點內(nèi)容.與圖13相比,圖14中可以更清晰地看出每個聚類開始出現(xiàn)的時間、哪些年份聚類成果開始增多以及哪些年份關注度開始降低等內(nèi)容,圖譜隱藏的信息更多.

2.4.3 熱點分析

熱點可以反映出一段時間內(nèi)科研院所對該領域研究的動態(tài)變化過程.如圖15所示,運用Citespace軟件可以生成有關石斛研究的熱點可視化圖,共有26個突變型關鍵詞,強度在5.124 5到18.254 4之間,年度在2000-2019年.

從圖15中可以看出,石斛研究的起點較早、時間的跨度較長,有關石斛的研究熱點數(shù)量較多、強度較突出,雖然部分核心研究熱點未能展示出來,但從側面可以看出石斛領域研究和產(chǎn)業(yè)化的發(fā)展歷程.首先,有關石斛研究出現(xiàn)最早的熱點為DNA指紋圖譜和多糖,主要研究石斛的特征和所含主要成分; 其次是石斛的品種和培育,主要是對石斛進行更深層次的研究,將石斛納入中醫(yī)藥領域; 再次是石斛產(chǎn)業(yè)的需求分析,將石斛進一步推廣應用,帶動就業(yè)和經(jīng)濟發(fā)展; 最后著重就市場上研究和應用價值較高的鐵皮石斛進行深度研究,提取的多糖可以用于提高人體免疫力和降低血糖.

2.5 知識圖譜構建結果

基于半監(jiān)督訓練的知識圖譜構建可以彌補Citespace軟件的缺點,它可以根據(jù)石斛研究的特點構建針對性的實體關系抽取模型.圖16為基于半監(jiān)督學習訓練模型并在Neo4j平臺中構建的知識圖譜顯示結果.圖中選取了作者、發(fā)表期刊、關鍵詞、研究單位、2018年5種實體進行訓練,可以清晰地看出5種實體之間的關系.鐵皮石斛、多糖、免疫調節(jié)等關鍵詞內(nèi)容是2018年的主要研究對象,每個研究對象對應的作者、期刊和研究單位可以在圖中清晰地顯示.通過可視化結果分析、半監(jiān)督訓練模型來進行實體識別和數(shù)據(jù)打標,構建的圖譜可以較好地展示石斛領域的研究關系網(wǎng).

圖16 基于半監(jiān)督訓練的知識圖譜構建圖

3 總結

本文主要通過Citespace軟件對知網(wǎng)有關石斛文獻的摘要和關鍵詞數(shù)據(jù)進行知識圖譜可視化分析,并基于半監(jiān)督訓練實現(xiàn)石斛領域的知識圖譜構建.結果表明,有關石斛的研究呈現(xiàn)了“緩慢增長、快速增長和緩慢波動”的過程,有關石斛的研究趨于成熟化并傾向于專業(yè)化; 研究文獻來源分布廣泛,具有較強的專業(yè)性和地方性特色; 通過作者與機構的聚類圖譜可以發(fā)現(xiàn),有關石斛研究的大部分作者和機構具有相互合作關系,呈現(xiàn)較強關聯(lián)性,研究的科研單位更多與地理位置有關,少數(shù)發(fā)達地區(qū)城市有關研究機構在石斛領域也有所涉及; 通過關鍵詞和熱點的聚類分析發(fā)現(xiàn)整個石斛產(chǎn)業(yè)的發(fā)展變化趨勢,分別從石斛的醫(yī)療效果、成分分析與提取、產(chǎn)業(yè)化推廣、遺傳分析和數(shù)據(jù)挖掘等聚類部分較好地看出了石斛研究的核心方向.構建的知識圖譜可以通過半監(jiān)督學習對實體進行知識抽取和打標,實現(xiàn)針對性的石斛研究知識圖譜可視化.由于訓練和打標過程中需要人工選取實體和確定關系,工作量較大,下一步研究將嘗試結合自然語言處理、神經(jīng)網(wǎng)絡和深度學習等算法實現(xiàn)實體抽取和圖譜構建.

猜你喜歡
可視化分析研究
基于CiteSpace的足三里穴研究可視化分析
FMS與YBT相關性的實證研究
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
基于CGAL和OpenGL的海底地形三維可視化
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
EMA伺服控制系統(tǒng)研究
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
主站蜘蛛池模板: 丁香亚洲综合五月天婷婷| 国产成人亚洲欧美激情| 国产极品美女在线| 亚洲性网站| 国产乱子伦精品视频| 国产日本欧美亚洲精品视| 亚洲人成日本在线观看| 亚洲国产成人综合精品2020 | 孕妇高潮太爽了在线观看免费| 亚洲色图另类| 综合久久五月天| 国产黄在线观看| 成人午夜视频网站| 天天操天天噜| 久热中文字幕在线| 欧美成人综合在线| av尤物免费在线观看| 久久精品人人做人人爽| 欧美性猛交一区二区三区| 最新国产成人剧情在线播放| 五月丁香伊人啪啪手机免费观看| 亚洲性影院| 国产精品大白天新婚身材| 91精品国产一区| 久久人与动人物A级毛片| 日韩福利视频导航| 国产一区二区网站| 亚洲国产精品无码AV| 97视频精品全国在线观看| 国产xx在线观看| 黄色网址免费在线| 亚洲天堂视频在线免费观看| 无码一区二区波多野结衣播放搜索| 99热这里只有精品免费| 国产第八页| 激情视频综合网| 国产视频一区二区在线观看 | 国产9191精品免费观看| 高清久久精品亚洲日韩Av| 久久久国产精品无码专区| 免费国产好深啊好涨好硬视频| 欧美在线三级| 亚洲黄网在线| 国产欧美日韩另类| 国产成人亚洲精品无码电影| 自慰高潮喷白浆在线观看| 国产91九色在线播放| 亚洲成a人在线播放www| 国产精品部在线观看| 五月婷婷欧美| 在线国产91| 亚洲Av激情网五月天| 亚洲第一精品福利| a毛片在线| 波多野结衣中文字幕久久| 青青青伊人色综合久久| julia中文字幕久久亚洲| 97无码免费人妻超级碰碰碰| 91九色国产porny| 亚洲香蕉久久| 91九色国产porny| 亚洲综合久久成人AV| 欧美日韩国产在线播放| 国产精品偷伦视频免费观看国产 | 国产精品人成在线播放| 中文字幕av一区二区三区欲色| 亚洲第一区在线| 欧美日韩午夜| 国产精品深爱在线| 国产精品一区在线麻豆| 国产日韩欧美黄色片免费观看| 精品久久高清| 国产精品对白刺激| 日a本亚洲中文在线观看| 欧美日韩国产在线观看一区二区三区| 国产欧美日韩综合一区在线播放| 欧美精品在线免费| 在线视频精品一区| 99这里只有精品免费视频| 国产成人高精品免费视频| 美女被操91视频| 大陆国产精品视频|