



[摘 要]通過識別高校創新創業領域的研究內容,梳理近年來高校在創新創業主題的演化路徑,本文針對高校創新創業主題識別語義雜亂等問題,以知網2015—2024年創新創業教育的核心期刊文獻作為數據源,利用LDA模型抽取研究主題,以主題一致性和主題強度為主要的計量指標,聚合分析近年高校創新創業的主題分類。實證分析結果表明,本文方法可從宏微觀全面梳理創新創業研究主題的演化路徑,有利于探究高校創新創業研究的前沿。
[關鍵詞]LDA模型;高校創新創業;熱點主題;研究導向
doi:10.3969/j.issn.1673-0194.2025.07.070
[中圖分類號]G642 [文獻標識碼]A [文章編號]1673-0194(2025)07-0230-03
0" " "引 言
黨的十八大以來,國家對高校創新創業問題愈加重視,指出應以創新引領創業、創業帶動就業,進而提高高校學生的人力資源素質。同時創新創業作為高校教育近年來關注的重點內容,已逐步由橫向發展走向縱深發展,滲透到各個學科領域。教育主體、教育背景及教育內容的不同,對創新創業方法的選取亦有所差異。因此,需要厘清高校創新創業研究過程中的前瞻問題,深入挖掘專業領域高校創新創業的重點,梳理創新創業改革發展過程中的研究成果,以實現創新創業教育和各類學科門類的交叉融合,發揮高校教書育人的價值。
1" " "研究思路與方法
1.1" "研究思路
首先,利用知網數據庫檢索近十年關于創新創業教育的研究文獻,并進一步篩選出核心期刊作為原始數據。一般而言,核心期刊能有效反映學科的具體動向,代表著學科研究發展前沿。利用Python中jieba分詞模塊對研究對象進行分詞,加載哈工大停用詞表進行停用詞處理,在此基礎上通過LDA主題模型實現主題抽取。
1.2" "研究方法
主題模型可以自動將文本語料庫編碼為一組具有實質性意義的類別,其中最為典型的代表為隱含狄利克雷分布,即LDA主題模型,其可以采用數據挖掘進行文檔的主題分類,避免主題劃分過程中的人為干預。在LDA主題模型優化過程中,可以使用一致性指標來確定主題數量[1]。一致性的大小與模型質量成正比,即一致性越高則說明被評估的主題模型可解釋性越強。其中主題強度是用來判定提取主題是否為熱門研究內容的關鍵指標,具體計算公式如(1)所示。
(1)
公式(1)中M表示設定時間窗口中總文檔數,θhi表示主題h在第i篇文檔中出現的概率,Th為主題h在時間窗口中的平均概率,即主題h的強度值。
2" " "實證研究
2.1" "數據獲取及預處理
數據采集時間段為2015—2024年,數據檢索截止時間為2024年6月1日。利用知網數據庫設定檢索式為“SU=高校+創新創業”,選擇文獻來源SCI、EI、核心期刊及CSSCI/CSCD,選取文獻類型為期刊,共獲取學術期刊3 485篇。對重復論文、征稿啟事、新聞、書評等文獻進行剔除,實現初始數據清洗,得到研究數據集2 560篇期刊。根據哈工大停用詞表,利用jieba分詞將前期檢索清洗的文獻數據中的摘要語料進行切分,去除與主題無關的詞匯,并將詞典語料轉化為LDA主題模型可處理的輸入格式。
2.2" "LDA主題建模
在建立LDA主題模型之前,需要確定最優主題數目,其不同主題下的一致性變化幅度反映了主題模型的穩定性和合理性。主題一致性是指主題內部單詞之間的聯系程度,也被稱為主題連貫度。在大多數的主題建模研究中,常用主題連貫度或主題連貫度指標來表示整體主題的可解釋性,用于評估主題的質量[2]。通常情況下,主題一致性越高,表示主題的連貫性越好,主題的可解釋性也更高。利用Python計算出各主題所對應的一致性值,顯示K=5時處于折線的最高區域,說明主題之間的聚類效果較好,可以反映出高校創新創業研究的主題聚類效果。具體可視化結果如圖1所示。
3" " "數據結果分析
3.1" "高校創新創業主題歸納分析
利用LDA主題分類得到高校創新創業內容的5個主題以及每個主題的詞匯分布,對每個主題排名前十的高頻詞語進行總結歸納,匯總為高頻特征詞匯的主題詞,如表1所示。在對高概率主題關鍵詞進行主題分類命名的過程中,比如大眾創業、萬眾創業及創業型大學等均與創新創業改革主題相關,因此將Topic0主題特征詞確定為“創新創業政策”。
3.2" "高校創新創業主題強度分析
高校創新創業主題強度分布如表2所示,Num表示高校創新創業期刊語料的序號,Topic0~Topic4指代五大主題的強度數據,max_idx表示語料數據所屬的主題分類。在第1條數據中,丁月華等人認為高校創新創業教育存在資源分散化、制度碎片化、人員信息孤島化等問題,需要從橫、縱、跨界三個維度進行整體性治理[3]。第2條數據指出在創新創業人才培養過程中的行動路線,需要說明的是數據2未納入Topic1主題是由于其指出了在人才培養過程中,需要推進科學范式向工程范式變遷,本質上明確了人才培養過程中的制度變遷理論[4]。第2 559條數據針對創新創業過程中存在的諸多難題,采用多元驅動的舉措來提質增效,歸入Topic1主題分類(培養舉措)[5]。第2 560條數據研究了高校畢業生在創業過程中的創業動機及困難需求,納入Topic3主題(產學融合)[6]。
4" " "研究結論
通過對高校創新創業教育主題詞的聚類分析,并結合各主題中概率值較高的文獻,分析得出國內高校創新創業研究主要集中在以下幾個方面。
4.1" "高校創新創業現狀研究對象泛化
圍繞高校創新創業現狀的研究主要包含教育政策、教育現狀及教育困難點等?,F今,其研究對象逐步寬泛化,如袁海濤等人以海外華僑為研究對象,指出高校以績效為導向的政策支持體系與科技管理效能限制海外華僑創新創業轉化速度[7]。
4.2" "單一學科創新創業對策逐步走向交叉融合
在創新創業對策研究過程中,分為實踐舉措、理論優化與技術支撐。創新創業的對策研究,一般注重管理學科門類,同時加入學科競賽,以此解決理論教育與人才體系培養的匹配問題。近年來在高校創新創業研究過程中,引入了課程思政等內容,從文化自信、制度自信及道路自信等方面來培養學生的創新創業思維。同時將以往窄化的創新創業教育學科逐步向高校的交叉學科及業務部門拓展,以此深化人才培養體系,促進理論和實踐融合,解決“教”“學”與“用”之間的矛盾。
4.3" "獨立運用主體轉向生態共同體
在高校創新創業教育轉型發展階段(2015年至今)[8],原有的院校教育螺旋發展為校企合作、政校合作。政府發揮組織、監督和管理作用,以頂層設計來把控創新創業教育建設內容。企業、科研機構及高校等則分工協作,確保創新創業教育在各主體之間進行協調作用。由此,創新創業運用研究既有科技創業、互聯網+、創客空間,同時融合了相應的信息技術和政府政策來保障教育理論的實施。
主要參考文獻
[1]阮光冊,黃韻瑩.融合Sentence-BERT和LDA的評論文本主題識別[J].現代情報,2023,43(5):46-53.
[2]呂璐成,周健,王學昭,等.基于雙層主題模型的技術演化分析框架及其應用[J].數據分析與知識發現,2022,6(Z1):18-32.
[3]丁月華,張明麗.高校創新創業教育體系的整體性治理[J].思想理論教育,2022(2):101-106.
[4]楊冬.從科學范式到工程范式:高質量新工科人才培養的邏輯向度與行動路徑[J].大學教育科學,2022(1):19-27.
[5]閻秋鳳.多元驅動—助推地方高校創新創業教育提質增效[J].實驗室研究與探索,2016,35(10):228-232.
[6]劉鑫鑫.高校畢業生在創業中的動機、困難與需求[J].中國高等教育,2016(19):57-59.
[7]袁海濤,謝佳鑫.珠海橫琴的澳門青年創新創業現狀及發展對策[J].科技管理研究,2022,42(24):9-16.
[8]楊冬.我國高校創新創業教育政策變遷的軌跡、機制與省思[J].高校教育管理,2021,15(5):90-104.
[收稿日期]2024-11-10