摘要:隨著人工智能技術的快速發展,大語言模型(LLMs) 在教育領域的應用日益廣泛。該研究著眼于探索大語言模型在中醫藥研究生科研能力提升中的作用與應用策略,全面審視了中醫藥研究生在科研能力方面的現狀,并據此提出了一系列創新策略,包括運用大語言模型優化知識檢索、輔助實驗設計、增強數據分析能力以及提升論文撰寫質量。大語言模型的引入顯著提高中醫藥研究生的科研能力,同時為其現代化進程提供強有力的技術支撐。
關鍵詞:大語言模型;中醫藥;研究生;科研能力;教育技術;自然語言處理
中圖分類號:TP391" " " 文獻標識碼:A
文章編號:1009-3044(2025)19-0115-03
開放科學(資源服務) 標識碼(OSID)
0 引言
中醫藥作為中國傳統文化瑰寶,擁有獨特理論體系和豐富臨床經驗,對全球健康事業影響深遠[1]。現代醫學快速發展,中醫藥傳承與發展面臨挑戰。研究生教育是培養中醫藥科研人才的關鍵階段,其科研能力直接關系學科創新與進步[2]。為滿足現代科研需求,中醫藥學科亟須與現代科技融合,推動現代化和國際化[3]。因此,提升中醫藥研究生科研能力是亟待解決的問題。
人工智能技術是模擬和擴展人類智能的先進手段,已成為推動社會進步的重要力量。在中醫藥領域,人工智能技術的應用已經滲透到中醫診斷、健康管理、名老中醫經驗傳承、藥物配方創新等多個方面[4-5]。我們曾使用卷積神經網絡進行乳腺癌預測[6],基于視覺變壓器適配器的雙曲嵌入實現糖尿病視網膜病變的多病變分割[7]。近年來,以生成式人工智能(AIGC) 為代表的新一代人工智能技術,極大地促進了人機交互的發展。在這一領域,大語言模型(LLMs) 以其在自然語言處理任務上的顯著成果和出色的知識涌現能力,成為研究的熱點。
教育領域,大語言模型在輔助教學、個性化學習資源、優化學習路徑等方面潛力巨大[8-9]。將大語言模型應用于中醫藥研究生教育,有望通過智能化手段提升科研能力,推動學科現代化。例如,中國科學院文獻情報中心與科大訊飛股份有限公司聯合研發的科技文獻大模型-星火科研助手,就是一個成功案例。該模型基于豐富的科技文獻資源,提供成果調研、論文研讀和學術寫作等科研助手功能,為科研工作者提供了一個高效、精準的科技文獻服務平臺,極大地助力了科研工作的開展[10-11]。
盡管大語言模型在研究生科研能力提升方面有成效,但在中醫藥專業仍面臨挑戰。首先,提示詞(Prompt) 設計不合理是突出問題。提示詞直接影響大語言模型對問題的理解和回答的準確性。中醫藥研究生調研古典書籍時,合理提示詞可獲得更清晰的回答。然而,不熟悉人工智能的研究生難以設計有效提示詞,可能無法充分利用大模型潛力。其次,數據整理和分析能力欠缺是重要問題。中醫藥研究生可能缺乏數據清洗、預處理和分析技能,而這些技能對利用大語言模型至關重要。
本文旨在探討大語言模型在中醫藥研究生科研能力培養中的應用潛力,分析其在文獻檢索、實驗設計、數據分析和論文寫作中的作用,為中醫藥教育和科研提供新思路。具體策略如圖1所示。
1 中醫藥研究生科研能力現狀
1.1 文獻檢索效率的挑戰
中醫藥研究生科研工作首先面臨知識檢索難題。中醫藥古典文獻(如《黃帝內經》《傷寒雜病論》) 蘊含豐富理論和實踐,但古文晦澀和非標準化數據結構給信息檢索帶來障礙。學生需投入大量時間閱讀理解古籍,且缺乏高效檢索工具,難以快速定位信息。這一現狀嚴重制約了中醫藥研究生科研工作的效率和深度。
1.2 實驗設計能力的不足
實驗設計是科研核心,但其復雜性對中醫藥研究生是挑戰。由于基礎理論不扎實和復雜知識整合能力缺乏,研究生面對新方向時難以有效實驗設計。此外,團隊合作中發散思維和創新意識不足,限制了提出創新問題和設計思路的能力。
1.3 數據分析能力的薄弱
臨床研究中,數據分析至關重要。中醫藥研究生統計學和數據科學基礎薄弱,面對復雜數據分析任務可能力不從心。此不足影響數據有效解讀,制約數據標準化能力,以及利用大語言模型提升分析效率的潛力。
1.4 論文撰寫能力的待提升
論文撰寫是科研成果傳播關鍵,但中醫藥研究生面臨挑戰。英語水平不足、論述不深入、框架條理欠缺,影響準確表達研究思路和結果。這些問題降低論文質量,影響發表機會。研究生對英文寫作的畏難情緒,降低了寫作積極性。
中醫藥研究生在科研能力上的現狀亟須改進。提升文獻檢索效率、加強實驗設計能力、強化數據分析技能以及提高論文撰寫水平,是當前教育和科研工作中需要重點關注和解決的問題。通過這些方面的提升,可以有效地增強中醫藥研究生的科研能力,進而推動中醫藥學科的發展和創新。
2 大語言模型提升中醫藥研究生科研能力策略
近年來,大語言模型的快速發展正在重塑研究生教育和科研的各個方面。目前常見的大語言模型如表1所示。大語言模型通過深度學習和數據訓練,能夠執行復雜的語言任務,在理解和生成自然語言方面展現出了前所未有的能力。當前的教育和科研背景下,大語言模型在中醫藥研究生科研能力提升上扮演著越來越重要的角色。本文主要闡述大語言模型在優化文獻檢索、輔助實驗設計、提升數據分析能力和優化論文撰寫這四個方面的策略。
2.1 利用大語言模型優化知識檢索
快速提取中醫藥文本信息是提升研究生科研能力的關鍵。利用檢索增強生成(RAG) 技術,從海量文獻中精準提取信息并生成回答,有助于發現中醫藥隱性知識。提示詞設計對提升大模型處理復雜任務的準確性和效率至關重要。提示詞通常由指令和輸入數據組成,指令應明確、清晰,上下文內容越精確,生成效果越好。如圖2所示,提示詞優化通過增設背景提示、角色設定、示例引導及輸出規范等策略,有效提升了大模型輸出效果。
因此,本文將研究開發適用于中醫藥領域的提示詞庫,深入分析專業術語和研究問題,確保準確性和實用性。首先,通過文獻綜述和需求分析,了解中醫藥研究生使用大語言模型的具體需求和問題,為提示詞庫開發和培訓課程設計提供指導。其次,基于文獻綜述和需求分析設計初步提示詞庫。再次,通過互動和反饋,優化調整提示詞庫,確保有效性和適用性。最后,通過工作坊和在線教程,教育研究生設計和使用有效提示詞,提高與大模型科研助手互動效率。此外,通過構建包含中醫典籍、古籍和文獻的核心數據基礎(需引用數據來源) ,大語言模型可實現中醫藥領域知識智能問答。
2.2 利用大語言模型輔助實驗設計
大語言模型可模擬專家思維,提供實驗設計參考和建議。如圖3所示,用戶輸入提示詞,大語言模型(如Kimi) 分析歷史數據和文獻,自動生成初步實驗方案,包括目的、方法、材料和預期結果。研究生可根據建議,結合自身情況優化實驗設計。此外,中醫藥LLM中,混合專家系統(MoE) 整合規則推理、神經網絡、機器學習和模糊邏輯等技術,形成處理復雜和不確定問題的系統。MoE可處理診斷和治療中的不確定性,吸納新臨床結果和反饋,優化更新治療策略。
2.3 利用大語言模型提升數據分析能力
通過開設數據科學基礎課程(結合大語言模型應用) ,采用理論與實踐結合的教學方法(如講座、實踐、案例研究) ,提升研究生數據技能。課程內容根據中醫藥領域需求定制。利用大語言模型整合統計和數據分析工具,提供智能化分析服務。通過自然語言指令(舉例) ,研究生可進行數據清洗、統計分析和結果解釋。大語言模型自動化處理分析大量數據,減少數據整理工作量,使研究生專注于創新和深入分析。大語言模型可作為輔助決策工具,推薦統計方法和模型,提高數據分析準確性和效率。大語言模型可整合數據挖掘技術,從大量中醫藥數據中提取信息。例如,使用聚類分析、因子分析、關聯規則等方法發現方劑配伍規律和癥狀分析。
2.4 利用大語言模型優化論文撰寫
大語言模型可輔助研究生撰寫高質量學術論文。通過自然語言生成技術,模型可生成論文各部分(如摘要、引言、方法、結果和討論) 研究生可在此基礎上修改完善,提高論文質量和發表可能性。大語言模型可通過語言校對和潤色,改進論文語言和表達。
3 結論
本研究探討了大語言模型在中醫藥研究生科研能力提升中的作用和潛力。分析發現,大語言模型在文獻檢索優化、實驗設計輔助、數據分析能力增強、論文撰寫優化等方面為中醫藥研究生提供助力。
總之,大語言模型在中醫藥研究生科研能力提升上價值顯著,為學科發展和現代化注入活力。未來,隨著人工智能技術進步,大語言模型在中醫藥教育和科研領域前景廣闊,期待其推動學科創新,培養更多具備現代科研能力的中醫藥人才。同時,大語言模型的應用還面臨著一些挑戰,如模型的準確性、數據的安全性和倫理問題等。因此,未來的研究需要在確保技術可靠性和安全性的基礎上,進一步探索大語言模型在中醫藥領域的深度應用。同時,我們也需要加強跨學科的合作,整合資源,共同推動大語言模型在中醫藥教育和科研中的健康發展。
參考文獻:
[1] 張伯禮.加強中醫藥臨床基礎研究 推動中醫藥科技創新發展[J].中國科學基金,2024,38(3):377.
[2] 鄧穎,胡淑娟,彭清華.湖南中醫藥大學學位與研究生教育的探索與實踐[J].湖南中醫藥大學學報,2024,44(10):1739-1744.
[3] 李玲,張彤. 現代科技賦能中藥全產業鏈的傳承與創新[J].中成藥,2024,46(10):3540-3544.
[4] 江如藍,雷結語,陳文禮,等.基于人工智能感官技術的中藥質量控制方法研究進展[J].藥學前沿,2024,28(11):550-556.
[5] 楊青,黃壯壯,許剛,等.人工智能在中藥研究中的應用進展[J].中成藥,2024,46(10):3529-3532.
[6] XU H Q,SHAO X,HUI S J,et al.Supervised breast cancer prediction using integrated dimensionality reduction convolutional neural network[J].PLoS One,2023,18(5):e0282350.
[7] WANG Z J,LU H M,YAN H X,et al.Vison transformer adapter-based hyperbolic embeddings for multi-lesion segmentation in diabetic retinopathy[J].Scientific Reports,2023,13(1):11178.
[8] 康來,謝毓湘,郭金林,等.大語言模型時代工科實踐教學的機遇、挑戰與應對初探[J].大學教育,2024(22):11-16.
[9] 劉明,楊閩,吳忠明,等.教育大模型智能體的開發、應用現狀與未來展望[J].現代教育技術,2024,34(11):5-14.
[10] 劉慶峰.星火大模型技術最新進展及產業應用[J].中國經濟報告,2024(4):131-133.
[11] 徐文博,周曉平.類ChatGPT大語言模型在護理課程考核中的應用探索:基于ChatGPT、文心一言、訊飛星火測試[J].中國醫學教育技術,2024,38 (5):567-571.
【通聯編輯:李雅琪】