999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中國管理科學領域熱點主題識別與趨勢預測

2021-08-21 10:57:14梁鎮濤張羽帆武漢大學信息資源研究中心湖北武漢430072
中國科技論壇 2021年8期
關鍵詞:分析研究

余 輝,梁鎮濤,張羽帆 (武漢大學信息資源研究中心,湖北 武漢 430072)

0 引言

隨著國內外對科學知識的重視以及網絡設施的進一步發展,科學文獻總量愈發龐大并以指數級的速度增長,各領域的研究熱點和前沿也隨時代更迭發生變化。因此,從大量非結構化的學術文本中識別和預測學科研究熱點的生命周期,特別是熱點主題的浮現點,有助于學者把握當前領域研究方向、規劃未來職業生涯,同時也有利于科研管理機構更精準、更合理地進行科研資金分配,從而更有效地提高國家的軟實力。學科研究熱點的走勢和演化,是一個對研究主題生命周期中熱度進行測度并量化的研究,直接對主題進行研究熱點統計分析,忽略了研究熱點本身的動態發展過程。而研究熱點的生命周期曲線,有助于找到研究熱點的浮現點、最高點和衰落點等重要轉折點。學術論文是重要的正式學術研究成果展現形式,對學術論文研究方向的把握是呈現研究熱點和分析研究趨勢的重要方法。對文獻或研究主題進行分類也有助于科學文獻的檢索,并且能更好地呈現學科和研究主題的走勢及演化[1]。

目前學科熱點識別有基于全文文本、主題、引文和關鍵詞等粒度的方法,考慮到文獻往往包含多個主題,采用更細粒度的分析方法能夠更好地表達文獻中主題的語義關系。其中,關鍵詞是文獻核心內容的高度凝練,能直觀反映文獻主題內容,目前已被廣泛應用于學術文本的主題發現研究中[2]。為了識別國內管理科學領域中的熱點主題并預測其發展趨勢,本研究以國內管理科學重要學術期刊為數據來源,對作者關鍵詞聚類形成研究主題,并根據聚類形成主題的熱度,分別計算并比較以熱度排序、達到一半頻次年份以及達到主題浮現點年份3種排序下的主題研究熱度增長判斷,驗證一半頻次和睡美人主題浮現點 (d值)在研究趨勢預測上的合理性,結合睡美人特征 (一半頻次)和主題熱度對主題進行分類,最后通過熱點浮現點的識別,找出當前學科研究熱點,以及熱點發展趨勢分析。

1 相關研究及理論

1.1 學科研究熱點發現方法

早期研究通過分析單篇文獻本身的影響力大小來對學科熱點進行識別,如蘇新寧基于CSSCI文獻數據,通過文獻的參考文獻數量和被引頻次等傳統引文指標,對研究領域的影響力進行討論[3]。此外,引用分析還包括共引分析 (同時被其他文獻引用)[4]、耦合分析 (共同引用一篇或多篇相同文獻)[5]和直接引用分析[6]等,通過多元統計分析方法把文獻或期刊、作者、機構等研究對象的引用關系網處理后用便于分析的方式進行呈現[7],這是輔助科學發展過程和構建知識圖譜的重要方法[8]。這3種方法都通過引用關系來對文獻進行聚類,并以聚類中最關鍵的文獻主題來確定這一類的研究主題[9]。黃文彬等借鑒傳統引文分析方法,把關鍵詞作為對象進行共引分析,并用網絡分析和多維尺度分析方法進行檢驗,結果表明關鍵詞共引分析聚類效果較好[10]。

共詞分析是較為經典的內容分析方法之一,根據不同關鍵詞同時出現在一篇文章中的情況建立其聯系,目前被廣泛用于領域主題之間以及主題內的研究發展與演化分析中[11]。唐果媛等在研究國內外共詞分析時指出,在共詞分析中關鍵詞是主要的研究對象[11]。李海林等通過把共詞矩陣轉換為相似矩陣,結合時間序列分析方法對主題發現和演化規律進行探究[12]。高繼平等人用詞共現方法實現關鍵詞的抽取并發掘熱點主題[13]。吳健等參考Donohue[14]和孫清蘭[15]對高低頻關鍵詞臨界值的計算,對高頻關鍵詞進行共現聚類分析,得出深閱讀領域的研究熱點[16]。隨著自然語言處理相關技術的發展,共詞分析在社交網絡和商業上也得到較為廣泛的研究與應用[17]。

以引文為基礎研究科學文獻之間的關系網絡、進展和演變可以有一個較好的時序繼承依據,而在熱點主題的發現上,用共現或引用的方法聚類時,沒有考慮語義信息,在總結一類研究熱點時,并不能很好地代表一類主題特征[18]。莊建昌等基于語義聚類方法,運用詞向量構建出領域熱點關鍵詞模型[18]。張長宏等結合內容分析方法和引用分析方法,形成一個新的語義空間,得到了更準確的關鍵詞聚類主題[9]。章成志等用TF-IDF算法進行主題詞提取并用K-Means聚類對學科熱點和趨勢進行研究,減少了監測成本并提高了監測的時效性[19]。基于語義的聚類根據語義相似度來控制類別大小及主題相關性,提高了聚類結果的可解釋性。

1.2 學科熱點主題分類

早期研究熱點主題方法大多都存在時滯問題,并且無法預測研究趨勢。針對這一問題,學者嘗試使用多種方法和判別指標對研究文獻或研究主題進行分類,以預見可能出現的新興熱點主題。杜建等在研究睡美人和王子文獻時基于被引速率把文獻分為3類,即快速突破型、延遲承認型和被引速率低且總次數也低的文獻[20];張靖雯等在此基礎上以被引速率 (CS)為單指標,從小到大把文獻分為延遲承認型、厚積薄發型、領先優勢型和曇花一現型[21],如圖1所示。

圖1 單指標文獻類型劃分

根據 “鬼域”在主題發展研究中的應用[22],HU等依據近年來關鍵詞出現頻次和總出現頻次雙指標組合將熱點劃分為4類,即新熱點、持續熱點、非熱點和鬼域[23],如圖2所示。

圖2 雙指標關鍵詞熱度劃分

1.3 睡美人現象

引文分析是論文質量和學術影響力評估的一個重要方法[24],但學者在研究中發現被引數量和論文的質量、影響力并不是簡單的正相關關系,高被引并非是論文高質量的保證,反之亦然[25]。這一問題與論文被引的動態過程相關,而被引的頻次動態可以映射出文獻在一系列引文中所對應的角色。

睡美人指的是科學中那些開始被忽視后來被大量引用的文獻,Raan給出了最早的主觀定義,即年均引用量小于等于2的時間大于5年,在被大量引用后,4年累計被引用超過20次[26]。該方法隨后被學界廣泛使用并加以改進,如Ke等基于被引時間和次數提出的客觀指標方法,該方法不需要設置時間和引用次數等主觀閾值[27]。此外,有學者提出曲線擬合法,基于年度引文次數構造時間序列數據,識別文獻的引用軌跡[28]。上述研究的核心思路是識別早期被引次數較少、但在某個時間節點后突然大量增加的文獻。這類文獻的價值在早期沒有得到重視,但往往在一段時間后被發現具有重要科學意義[29]。

在睡美人文獻的被引變化過程中最重要的是被引量激增的時間點,即被引次數突變點。在該時間節點之后,文獻的價值和熱度開始快速增加,并很快成為高引論文。本研究借鑒睡美人文獻及其被引次數突變點的識別方法,嘗試識別研究主題成為研究熱點的浮現點,即表明研究熱點會有一個增長的趨勢。睡美人現象中,強調了兩個特征:①對 “沉睡”時間長度的要求,文獻需要保持較長時間的低關注度狀態;②對 “蘇醒”的要求,需要有較大的蘇醒強度,即在短時間內熱度呈現陡峭上升趨勢。在滿足以上要求后,即認為該文獻屬于睡美人文獻,且在將來會有一個熱度增長。從睡美人引言曲線可知,滿足睡美人特征的文獻在蘇醒點后的一段時間內會有一個熱度快速上升的過程。本文認為,當主題滿足睡美人的特征時,也會呈現這樣一種熱度上升的趨勢。

三指標識別法分別從沉睡時長、沉睡次數和蘇醒強度3個方面對睡美人特征做出要求[26],這在學界得到廣泛認可。其中,主題熱度在過去幾年可能有過上升和下降,稱為全要素睡美人[30],這一點不影響本文的主題識別研究,即重點從沉睡時長和蘇醒強度來對具有睡美人特征的主題進行識別和預測。

本研究中,總關鍵詞頻次可以作為蘇醒強度指標,達到總頻次一半所需的時長可以作沉睡時長指標,結合這二者對聚類主題進行劃分,識別主題熱度較大并且達到總頻次一半耗時較長的主題為具有睡美人特征的主題,并認為此類主題未來有一個上升趨勢。從這一思路出發,本研究首先對收集的文獻進行聚類以表示研究主題,在驗證達到一半總頻次時間在趨勢預測中的作用后,通過對這些主題聚類的睡美人特征的強度計算劃分主題為4個類別,再對4個主題類別的發展趨勢進行分析,找出未來熱度會上升的主題類。

2 研究方法

2.1 研究思路

本文研究思路可以分為數據準備、研究過程和研究結果3個部分。在數據準備部分,主要介紹文獻數據的來源以及關鍵詞的選取方法和理由,并對關鍵詞進行聚類,聚類結果是本文研究的熱點對象;在研究過程部分,首先分析聚類識別熱點主題與關鍵詞分析主題兩種方法的特點,并說明本文選取聚類方法的原因;然后對數據集進行拆分,判斷主題類別是否增長,根據熱點熱度、一半頻次年份以及最大d值年份降序排序畫出累計增長數折線圖進行對比分析,驗證一半頻次年份和最大d值在主題增長趨勢預測上的準確性;在研究結果部分,結合睡美人指數對統計信息進行分析,找到聚類熱點主題整體特征、熱度以及睡美人特征強度 (即一半頻次年份)等,并通過熱點主題的總頻次和睡美人沉睡時長來進行熱點主題的分類。熱點發現研究流程如圖3所示。

圖3 熱點發現研究流程

2.2 數據準備

本研究對國家自然基金委指定的30個管理科學重要學術期刊做熱點發現分析,對以下30個期刊進行檢索,以期刊近20年收錄的文獻為研究原始數據來源,檢索時間為2019年7月15日,具體期刊列表及類別見表1。

表1 NSFC管理科學重要學術期刊表

為了使研究更具現實意義,核心期刊應該是文獻的主要對象,而中國知網的核心期刊收錄率為99%[31],并且在劉振華的實證研究中,數字資源使用排名第1位的也是中國知網[32]。據此對所選文獻進行篩選,去掉少量英文文獻及一些不適合處理的文獻,最終選取文獻61509篇。相較于從篇名和摘要中抽取的關鍵詞,作者關鍵詞能夠反映研究者對文章研究主題的歸納,在表達核心主題上的效果更好。因此,本研究選取作者關鍵詞為研究對象,處理后以95165個不同的關鍵詞為聚類分析的初始數據。

2.3 關鍵詞聚類

本文通過對關鍵詞進行語義聚類來提取研究主題,即把所有關鍵詞聚類并提取主題關鍵詞或主題詞,認為這一類關鍵詞所涉及的研究屬于同一個主題,同時聚類形成的主題用于下文對比直接用關鍵詞進行熱點分析。基于語義特征的聚類體現了主題中的語義信息,其結果具有更好的可讀性,有利于對研究方向的理解。聚類訓練集選取騰訊AI Lab公開數據集,具有權威性,應用詞向量方法進行詞相似度計算,避免文獻之間的共引或共現等方法無法對聚類結果進行解釋以及熱點主題提取[33]。對關鍵詞聚類的效果會直接影響熱點發現方法的適用性,在聚類方法中DBScan不需要指定類別數,從而類別數與類成員都具有一定的隨機性;AP計算耗時長,有其他參數要調整,不適合擴展到其他領域或更大數據量的運算中。所以聚類選擇K-means方法,結合改進的手肘法,并進行多次聚類對比來選取恰當的聚類數k,以便睡美人指數能應用于聚類后的結果進行熱點浮現點的識別,如圖4所示。

圖4 改進手肘法求k值

由圖4可見,由于k值較大,曲線整體上比較平滑,手肘法并不能直接得出一個合適的k值。吳廣建等在研究K-means自動獲取k值方法中把手肘圖的起點和終點相連,計算這條線到SSE曲線的的縱向距離,并以距離最大點的橫坐標為k的最終取值,提高了k值的選取效率[34]。

3 研究過程

3.1 關鍵詞分析熱點主題

為了更直觀地觀察對比20年間的熱點主題強度,本文繪制關鍵詞的詞頻云圖,詞的字體大小即詞頻高低,篩選出詞頻最高的100個詞后,生成的詞頻云如圖5所示。

圖5 Top100關鍵詞云圖

由圖5可見,影響因素、創新、經濟增長等相關領域在20年間熱度較高,這些與聚類主題熱度排名基本吻合,因素分析 (影響因素)和創新能力 (創新)在主題熱度上分別排在第5位和第6位。供應鏈在圖5中是熱度最高的,但從對主題的熱度排序來看供應鏈排在第16位,即直接用關鍵詞進行熱度分析的結果與聚類后主題進行熱點分析有一定差別。直接用關鍵詞作為主題,會使主題數量過多且冗余,多個意義相近的關鍵詞作為獨立的主題存在,并且個別關鍵詞的使用頻率遠超其他詞,也使進一步分析更加困難。在當前研究中關鍵詞詞頻超過700的僅3個,超過100的僅161個,不到總關鍵詞95165的千分之二,這些關鍵詞并不足以代表整體研究方向。

主題聚類中可能存在長尾效應,即那些與主題相關的單個關鍵詞詞頻較低,但是數量極大,這影響了直接用關鍵詞進行熱點分析的結果準確性,如主題類 “人才企業”,關鍵詞進前40的僅有2個,超過100詞頻的關鍵詞僅有6個,但有463個關鍵詞屬于這一類別,主題類別熱度排第1位;關鍵詞 “供應鏈” (單個關鍵詞詞頻為792個),代表的主題類包含385個關鍵詞,熱度排名16; “經濟增長”關鍵詞詞頻排名第6 (單詞頻506),但在主題聚類中,包含94個關鍵詞,總詞頻排名為121,在260個聚類結果中處于中間位置。

綜上,直接用關鍵詞作為研究熱點的分析可找出熱點關鍵詞,在較為成熟和規范的研究主題上有一定效果,但無法完全代表熱點主題方向。此外,當新熱點主題并沒有形成較為統一的用語時,該方法容易忽略掉這一類研究主題方向。

3.2 聚類識別熱點主題

用聚類結果進行熱點主題識別就是把主題聚類按熱度降序排序,可以說明當前時間這類主題是研究的熱點,而隨文獻量增長使期刊文獻的遲滯性現象更加普遍,此方法得出的熱點主題只能代表當前時間點的前一段時間,無法預測未來研究熱度的趨勢。人才企業、因素分析和創新能力3個主題熱度排名靠前的主題類隨時間的頻次變化,如圖6所示。

圖6 熱點主題頻次變化

由圖6可見,在聚類后主題中排名第1位的主題類 “人才企業”,在2010年達到最大熱度后,在整體論文基數不斷增長的環境中,研究熱度一直在下降;主題類 “因素分析”和 “創新能力”總熱度相近,但 “創新能力”呈現出不斷增長的趨勢,而 “因素分析”處于平穩期。總頻次較高的主題可能是較早的研究熱點,隨著研究的成熟或是技術的更迭,此主題類已經不再是研究的熱點;總頻次較低的研究點可能是剛浮現的研究點,正處于快速上升時期,未來可能成為研究熱點,所以不考慮時間因素的聚類總頻次代表的熱度也并不能很好的說明熱點主題的現狀或者是將來的發展趨勢。通過以上分析,本文考慮了單個關鍵詞作為研究對象的不足,在主題劃分中加入時間因素,能較好地對主題發展趨勢進行識別和預測。

3.3 睡美人特征主題浮現點計算

主題浮現點的計算有利于對研究熱度增長趨勢的分析,根據睡美人指數的意義,引文蘇醒后,會有一個強勢上升期,即本文得到熱點蘇醒后認為本主題會有一個上升期,但目前處于自身生命周期的哪個階段需要進一步判斷。在對睡美人特征主題進行識別后,可以精準地用睡美人指數處理方法尋找熱點的浮現點,即睡美人的蘇醒點,有助于更精準地分析和預測睡美人特征主題的發展趨勢。目前公認最科學的方法是美麗系數識別法[35],它不依賴于主觀判斷,只和實驗時間點有關,即最大值是否因時間發生變化,如果當前時間點為最大值則可能該主題熱度仍在持續增長,如果熱度基值較大,則可以直接判斷該主題為未來有一個熱度持續期。如果當前時間不是最大值,則需要進行下一步計算熱點浮現點。先把識別出來的睡美人特征主題按年份變化列出頻次變化表,以時間為橫坐標,頻次為縱坐標把該主題的散點圖,連成折線圖,如圖7所示。找出最大值即圖的頂點和起點的坐標,并將這兩個點用線段連接起來,并計算出各點到此線段的距離,找出最大距離d值,此點即為要尋找的主題浮現點。設當年主題詞定位點坐標為P (x0,y0),起點和頂點的連線L如公式 (1),P到L的距離如公式 (2)所示:

圖7 美麗系數求浮現點示意

L:Ax+By+C=0

(1)

(2)

從數學特性可知,當橫坐標以連續年份 (2010、2011、2012)為數軸標簽時,d值結果與橫坐標為連續自然數 (0、1、2)沒有區別,即可看作是圖形在橫坐標方向進行的整體平移,如圖8所示。以一年或者兩年,或者是每個月為橫坐標間距,會使得橫坐標等比變化,d值大小會發生變化,但相對大小不會改變,即橫坐標的起始值大小以及間距大小不會影響d值的相對大小。這使得該方法在計算距離尋找熱點主題浮現點時不受主觀時間劃分參數的影響,提高了方法的準確性。

圖8 橫坐標不同大小及間隔比較

3.4 主題類增長趨勢預測

由于詞頻形成的熱度缺少時間因素,無法對趨勢進行預測,本文借鑒睡美人理論思想,分別用各主題類達到總詞頻一半詞頻的年份以及睡美人中美麗系數產生的距離d值來預測主題類研究熱度是否會在未來增長。本研究把數據集分為前15年和后5年,用前15年的數據進行分析預測,并取每個類別對應的后5年的熱度均值作為是否增長的比較標準,由于文獻數據整體數量變化,所以最終實際比較的是單個類別占總體類別的比例大小變化。用前15年的數據的熱度、一半頻次年份、最大d值年份3種方式的倒序排序,3種排序下增長的主題類別累計計數如圖9所示。其中,橫軸為主題類數,縱軸為累計增加主題類數,本數據中總增長主題類數為117類。

圖9 累計增長類別數變化

由圖9可見,在以熱度降序排序中,累計增長總體分布較為均勻,所形成的累計曲線近似直線,即表明之前的累計熱度無法對熱度增長趨勢進行預測,研究熱度增長與之前研究總熱度無明顯相關性。一半頻次曲線和d值曲線在前20個類別中,基本是全部增長,預測較為準確;在0到60類別之間,以一半頻次為降序排序的預測準確,并且在112個類時達到80% (93個主題類)的增長類別覆蓋。從3條曲線對比可知,在預測主題熱度是否增長上,以一半頻次降序排序效果明顯優于直接用熱度和d值。而從原理上分析也不難得出一半頻次是中時間是主要的依據,而d值綜合考慮的時間和增長幅度,在前幾名中預測效果較好,后期可以用來對增長程度進行比較分析,也驗證了本文以達到一半頻次時間排序劃分主題類的正確性,并計算靠前類別的d值來分析增長程度的研究思路的可行性。

4 研究結果

實驗過程的可行性得到驗證后,本文對采集的20年所有數據進行研究熱點主題分析,以及一半頻次和d值計算,找出國內管理科學領域研究熱點并對發展趨勢進行預測。

4.1 主題識別結果

對聚類結果進行基本信息分析包括對結果進行主題熱度變化圖的繪制分析來幫助呈現文獻主題的總體發展趨勢以及一般生命周期變化;并把結果以表格形式展示出來,方便查看聚類結果的好壞;把聚類結果以云圖形式呈現出來,能更直觀地呈現熱點主題。本研究聚類先取k值為260,聚類結果260個類,由人工檢驗聚類效果,并選取類名或者以單個或多個詞作為類名,部分主題以及關鍵詞輸出結果見表2。

表2 部分主題及關鍵詞頻次結果

由表2可見,各類都有一個較集中的主題,聚類效果較好。各主題類可以根據總詞頻來判斷本類主題在研究中的熱度,前20主題按熱度 (總頻次)排序結果見表3。

表3 Top20聚類主題熱度排序

4.2 熱點主題趨勢分類預測

(1)主題整體研究熱度變化。所有聚類結果的總頻次年份變化和以當年總主題頻次標準化后的年份變化如圖10所示。由圖10可見,研究整體趨勢是不斷增長的,與標準化的圖進行對比可知,這與文獻數量有直接關系,即每年基礎文獻量的增長并不能說明所有主題的熱度都在增加。從標準化后變化可以看到各種特征的折線都是存在的,大多數主題在20年間都處于低熱度分區,少量主題出現大起大落,個別主題熱度呈不斷增長趨勢,對各個不同主題進行分析和歸類可以識別出熱點主題和睡美人特征主題。

圖10 聚類主題熱度年份變化

(2)四分位數法劃分主題。四分位數分布劃分法在2010年被用于睡美人文獻的識別,通過分析文獻達到一半自身總被引次數的時長來找出那些 “沉睡”時間較長的文獻[36]。本文借鑒此思想,在已經驗證一半頻次在趨勢預測有效的基礎上,先計算出各聚類主題累積頻次達到總頻次的一半時的年份,并以年份從小到大排序,即所需時長從小到大排序,并以后四分之一的時間點為標準進行比較。晚于這個時間節點的主題獲得自身一半的頻次的時間晚于領域內75%的主題,自身為睡美人特征主題的可能性較高。四分位數法得出文獻主題可能較多,但可以鎖定睡美人特征主題的范圍[37],并且可以認為主題到達一半頻次所需要時長越長,則睡美人沉睡特征越強。

在關鍵詞分析中進行篩選高頻詞時,往往通過研究者經驗直接進行選擇,這樣能很好地區分那些超高熱度的關鍵詞與熱點,但是那些熱點也可能是目前學界都已經公認了的,對未來研究的指導意義有限。Vaughan根據同頻詞理論的假設,提出了高低頻詞之間的拐點可以當作這個分界點[38],即研究可以用這個拐點來進行熱點的篩選,但由于本文聚類結果較多,拐點并不明顯,所以本研究熱點熱度的劃分也采用四分位數法,把各聚類結果的總頻次作為主題的總熱度,并用這個熱度進行從大到小的排序,選取前四分之一的主題為熱點主題。

研究產生聚類主題260個,四分位數在65位上。根據計算到達主題一半頻次的時間排序后,四分位點上的時間為2013年,取比2013年更長的時間,即超過13年的才達到一半頻次的主題,一共有20條,并認為這20個主題都有足夠長的沉睡時間特征。主題總熱度頻次按從大到小的排序后,第65個主題總頻次為1272,即認為超過1272次的主題類別劃分為熱度較高的主題類。以熱點熱度 (總頻次)為橫坐標,沉睡時長 (蘇醒時間)為縱坐標,兩個四分位數的交點為原點 (1272,2013),以此建立坐標軸,將各個主題類劃分在坐標軸的4個象限內,如圖11所示。

注:數據標簽為聚類時自動生成類標號。圖11 研究熱點主題分布

由圖11可見,右上分區為睡美人特征區,即熱度較高和蘇醒時間較長的主題分區,這個分區的主題特點是同時具備睡美人潛力和較高的累積熱度,屬于高熱度的研究主題,且關注度可能會持續增長。右下方為成熟的研究熱點區,區域內的主題具有較高熱度,但其積累時間較早,在今后可能出現下降的趨勢。但考慮到該類主題熱度基數較大,并不會迅速失去研究關注度。左上方為潛在熱點區,處于該區域的主題熱度目前在領域內不高,但在近年來多處于熱度快速上升期,在未來可能成為高熱度的研究主題。左下方則是不存在睡美人特征且熱度較低的研究主題,屬于少數學者關注的研究范圍。

4.3 睡美人特征主題分析

借助熱點主題浮現點可以更準確地分析當前主題處于睡美人生命周期的具體階段,以預測主題未來熱度走勢。本文對睡美人特征較強20個主題類 (睡美人熱點和潛力熱點兩個分區內的主題類)進行浮現點的計算,結果見表4。

由表4可見,順序為四分位數法中達到一半總頻次所需時長降序排列,而這一結果與美麗系數法結果即表4中得出的年份并不吻合,可見進一步對睡美人特征主題進行蘇醒點的識別的必要性。其中起始年份為2000年或2001年,即為數據收集的前兩年,但由于數據量極小,在研究時間范圍之前的起點數量更小,對結果的影響較小。

表4 20個睡美人特征主題浮現點年份

在這20個聚類主題中,住房問題、創新能力、關系網絡、制度改革、行為意向、國際貿易、企業社區、工業汽車、創業人才和行為心理這10個主題在2018年達到最大值,即當前處于或未達到最大值點 (2019年數據未收錄完整),其中創業人才、國際貿易、工業汽車、創新能力和行為心理5個主題類浮現點較晚 (2012年后),并且還未到達頂點,屬于正在快速發展的研究主題,預測未來會有一個熱度增長的過程。競爭能力、自然災害、資源環保、情感認知、家庭教育和匹配模型6個主題類,主題浮點較早 (2011年前),并且也在2018年前達到自身熱度的最大值,根據睡美人曲線接下來會有一個熱度下降的趨勢。

4.4 結論

在了解聚類基本信息后,結合主題區域分類結果和熱點主題浮現點分析,對熱點主題類進行研究熱度發展趨勢分析和預測,研究結論如下。

(1)創新能力、關系網絡、行為意向和資源環保4個主題類屬于睡美人特征熱點主題,其中創新能力類主題類浮現點較晚,近年來增長速度較快,未來極有可能成為超高熱度的研究主題。

(2)醫療健康、住房問題、補貼政策、社交網絡、家庭教育、制度改革、國際貿易、企業社區、競爭能力、社會治理、自然災害、工業汽車、創業人才、匹配模型、行為心理和情感認知這16個主題屬于潛力熱點主題,其中創業人才、國際貿易、工業汽車和行為心理4個主題類浮現點較晚,近年來增長速度較快,研究人員可以對這些主題方向進行研究,未來可能會有一個熱度持續上升的過程,并很可能成為新興熱點。

(3)人才企業、模型方法、實驗方法、技術研發、因素分析、推理學習、團隊激勵、回歸邏輯、匹配調節、服務變革、參數估計、信任理論、產業集群、運籌統計、供應鏈、效應理論、公共治理、經濟理論和函數模型等61個主題屬于成熟熱點主題,擁有領域類超過四分之三主題的熱度。因此,要選定這些主題為研究方向的學者需要考慮到研究已經成熟或處于熱度衰退期,是否還有研究的意義;正在從事此研究的學者要考慮研究方向是否需要轉型。

5 結束語

熱點主題的識別與趨勢預測可以為相關研究者和機構提供研究方向的參考,本文將睡美人特征引入主題識別中,以關鍵詞聚類為主題的構建基礎,對國內管理科學重要期刊上的主題進行劃分,識別出睡美人特征熱點主題。對比關鍵詞分析和主題聚類的研究熱點識別結果,驗證了睡美人特征 (一半頻次以及d值浮現點)在預測研究增長趨勢上的有效性,以及在預測主題未來發展趨勢上的優勢。

本研究也存在一定局限性。首先,本文未考慮多個關鍵詞是否出自同一篇文獻的情況,這可能導致直接統計頻次時權重不均衡;其次,聚類認為一個研究主題包含多個關鍵詞,但并未考慮同一關鍵詞屬于多個研究主題的情況。后續研究可對同主題下關鍵詞是否來自同一篇文獻進行判斷并進行權重賦值,并考慮關鍵詞同時屬于不同研究主題的情況,綜合分析主題的研究熱度趨勢。

猜你喜歡
分析研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
新版C-NCAP側面碰撞假人損傷研究
電力系統及其自動化發展趨勢分析
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 福利在线不卡一区| 国产美女精品一区二区| 911亚洲精品| 免费看av在线网站网址| 超清无码一区二区三区| 97成人在线视频| 天天躁狠狠躁| 国产情精品嫩草影院88av| 天天摸夜夜操| 欧美日本在线播放| 日韩中文精品亚洲第三区| 福利在线不卡| 国产精品香蕉在线| 国产高清在线观看| 色综合天天综合中文网| 欧美特级AAAAAA视频免费观看| 精品少妇人妻无码久久| 在线观看免费人成视频色快速| 一本综合久久| 午夜色综合| 国产乱人乱偷精品视频a人人澡| 无码福利视频| 久久国产av麻豆| 中文字幕在线一区二区在线| 亚洲男人的天堂视频| 久久国产高清视频| 中文字幕天无码久久精品视频免费| 国产在线拍偷自揄拍精品| 毛片久久网站小视频| 日本国产精品一区久久久| 国产男女免费完整版视频| 澳门av无码| 亚洲欧美精品日韩欧美| 综合色在线| 综合久久久久久久综合网| 天天做天天爱天天爽综合区| 亚洲成人精品久久| 天堂中文在线资源| 91成人在线观看视频| 国产精品永久在线| 日韩毛片视频| 丝袜无码一区二区三区| 美女被操黄色视频网站| 中文字幕 欧美日韩| 久久黄色免费电影| www精品久久| 亚洲日韩久久综合中文字幕| 91久久青青草原精品国产| 国产精品太粉嫩高中在线观看 | 宅男噜噜噜66国产在线观看| 91九色视频网| 欧美三级日韩三级| 原味小视频在线www国产| 精品色综合| 有专无码视频| 久久婷婷国产综合尤物精品| 国产一级精品毛片基地| 精品成人一区二区三区电影| 中文精品久久久久国产网址| 熟女日韩精品2区| 中文成人在线| 国产哺乳奶水91在线播放| 亚洲精品成人福利在线电影| 久久国产精品影院| 在线观看国产小视频| 多人乱p欧美在线观看| 久久精品人人做人人综合试看| 中文字幕在线观| 亚洲综合色婷婷中文字幕| a毛片在线| 精品国产www| 久久久四虎成人永久免费网站| 亚洲人成网7777777国产| 久久精品国产精品青草app| 国产乱子伦视频三区| 国产精品七七在线播放| 97久久人人超碰国产精品| 黄色污网站在线观看| 无码日韩精品91超碰| 日韩人妻无码制服丝袜视频| 2021国产乱人伦在线播放| 亚洲第一香蕉视频|