999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大語言模型在圖書情報領域中的應用

2025-07-29 00:00:00徐爽付怡許丹
江蘇科技信息 2025年12期
關鍵詞:指令圖書文本

中圖分類號:G356 文獻標志碼:A

0 引言

人工智能(AI)技術的迅猛發展對人們的生活產生了深遠影響。作為一種自然語言處理的前沿技術,大語言模型(LargeLanguageModel,LLM)正為各領域帶來一種全新的信息處理和服務方式,如OpenAI的GPT系列等已經引起廣泛關注。這些模型的誕生,不僅革新了我們對語言和創造的理解,還為眾多領域開啟了創新應用的大門。ChatGPT作為大型模型領域的首個熱門應用,在發布后的短短5天內,用戶數量就突破了百萬大關,并且在兩個月的時間內,其活躍用戶量飆升至1億。這一現象成功激發了業界對大型模型及其各類應用的開發熱潮。大語言模型在圖書情報領域中也具有巨大的應用潛力,但同時也面臨著諸多問題和挑戰。

1大語言模型在圖書情報領域應用中存在的問題

大語言模型的訓練是一個復雜且資源密集的過程。它不僅需要大量的計算資源作為支撐,還依賴海量的數據進行學習和優化。這些數據的獲取、處理和存儲都構成了不小的挑戰。同時,數據的質量對于模型的訓練效果至關重要。如果數據存在偏差或噪聲,那么模型的性能將會受到影響,甚至可能導致輸出錯誤,從而影響圖書情報服務的質量。

盡管大語言模型在某些方面已經展現出了強大的能力,但其泛化能力和健壯性仍有待進一步提升。在實際應用中,模型可能會遇到各種各樣未曾在訓練數據中見過的情境和輸人,這就要求模型具備強大的泛化能力,以應對各種不確定性。同時,模型的健壯性也是確保服務質量的關鍵因素,需要避免因為輸入的小幅變化而導致模型輸出的劇烈波動或錯誤。

2大語言模型的產生與應用

大語言模型是運用深度學習技術,借助海量的語言數據進行訓練而成的自然語言處理模型,其參數規模達數十億至上萬億。隨著技術的發展,現在的大型語言模型不再局限于處理文本信息,它們已經進化到可以處理和理解圖像、聲音、視頻等多種類型的媒體內容。正因為這種跨媒體的處理能力,這些模型現在通常被統稱為“大模型”[]。大模型的訓練主要經過兩個階段。

階段一:無監督預訓練(UnsupervisedPretraining)。這一階段會收集海量無標注數據,如互聯網上的文本、新聞、博客、論壇等,并進行一定的清理和處置,去除噪聲、無關信息以及涉及個人隱私的內容,最后以詞元(token)粒度輸入到語言模型中,由模型預測某段文本后可能跟隨的文本。通過這種預訓練方式,模型能夠學習到詞匯的使用、句子結構以及語義的規則,并理解不同詞之間的上下文關系。當參與預訓練的文本數據量(經過向量化處理)達到近千億詞元級別時,模型會產生“涌現”現象[2],此時模型在大量的預訓練學習后神奇般地獲取了泛化和推理能力,能夠在沒有或僅有少量訓練樣本的情況下進行學習。

階段二:指令微調(InstructionTuning)。這可以被視為一種特定類型的有監督微調方法,旨在讓模型更好地理解并執行人類指令。在此過程中,需要設計多種自然語言處理任務,并將每個任務轉化為具體的指令形式。這些指令詳細描述了模型應完成的任務以及預期的輸出結果。通過使用這些具體指令對預訓練的大語言模型進行進一步訓練,可以讓模型學習如何準確響應這些指令,從而在執行特定任務時表現得更為出色[3]

將大語言模型應用于具體任務有兩種主要方法:微調和提示工程[4]。微調是基于已有的大語言模型,在特定任務的數據集上進一步訓練,以調整模型參數,使其更貼合任務需求。這種方式能有效利用模型已掌握的語言和常識信息,僅需少量額外訓練即可適應新任務,并且通常需要一些標注數據幫助模型識別任務特有的模式和特點。相比之下,提示工程不需要修改模型參數,而是通過精心設計的輸入提示(即指令或問題的形式)來指導模型產生合適的輸出。這種方法非常適合于那些缺乏大量訓練數據或希望避免大規模再訓練的情景,因為它減少了對額外訓練的需求,同時也能達到預期的任務效果。

3提示工程的類型與特征

提示工程是一種通過設計和優化輸入提示語來引導大型模型產生預期輸出的方法,而無需修改模型本身的參數。其關鍵在于通過細致打磨的提示語,既能夠提升模型對用戶真實意圖的理解精度,也能更好地適配特定任務的需求,從而生成更加精準、高質量的內容[5]。在構建提示詞的過程中,提示優化的技巧包括:明確問題、使用關鍵詞、提供上下文、提供示例、使用正確的語言風格、反饋循環、指定角色、逐步引導和限定范圍等[6]

3.1零樣本提示和小樣本提示

在提示工程中,根據所使用的樣本數量,可以將其分為零樣本提示(Zero-shot Prompting)和小樣本提示(Few-shotPrompting)2種方式。零樣本提示不需要提供任何具體任務的例子,而是依靠精心設計的提示語來引導模型完成任務。這種方法高度依賴于模型預訓練期間學到的知識,所以在設計提示語時要非常注重其清晰度和準確性,以確保模型能正確理解任務并作出適當反應。

相反,小樣本提示會在提示中包含少量與任務相關的真實例子,以此為模型提供額外的背景信息和具體的任務指導。這些例子就像給模型提供了幾個示范案例,幫助它學習如何處理相似的任務,從而提高任務執行的準確性和效率。這種方式尤其適用于那些需要更多上下文或指導才能有效完成的任務。

3.2思維鏈

思維鏈(ChainofThought,CoT)又分為零樣本思維鏈(Zero-shotCoT)和小樣本思維鏈(Few-shotCoT)2種形式。零樣本思維鏈依賴于模型本身的能力和清晰的指令來完成任務,而小樣本思維鏈則是通過提供有限數量的具體例子來增強模型的理解和推理能力。兩者都旨在提升模型的表現,但后者要求更為細致的提示設計,以實現更高的效率和準確性。這種方法展示了如何通過優化輸入提示而不是修改模型本身,來顯著提高模型解決問題的能力[7]

3.3 自動思維鏈

人工構建思維鏈示例不僅費時費力,而且效果并不理想。相比之下,自動思維鏈(AutomaticChainofThought,Auto-CoT)則是一種自動化的過程,能夠高效地創建包含問題和相應推理鏈的示例。自動思維鏈方法主要分為兩大階段:首要階段是對數據集中的問題進行聚類,以此形成多個問題類別群組;隨后,從每個群組中挑選出一個具有代表性的問題,并借助零樣本思維鏈技術與簡單的啟發式規則,為該問題生成推理鏈。與其他方法相比,自動思維鏈展現出了顯著的自動化優勢、強大的可擴展性,并且能夠生成精確且信息豐富的問題示例及推理鏈路。

3.4思維樹提示

Yao 等[8]提出了思維樹框架(Tree of Thoughts,ToT),以增強鏈式思維在需要探索和前瞻性推理的復雜任務中的提示能力。在解決復雜問題時,ToT方法通過創建一個樹形圖來追蹤不同的推理步驟,這種方式超越了傳統的鏈式思考方法。每一個“思維”節點都包含了一系列邏輯上相連的步驟,這些步驟共同指向問題的最終答案。通過這個樹狀結構,LLM可以評估每一步推理的質量以及它距離最終解決方案還有多遠,并決定是否繼續沿著這條路徑前進。此外,ToT整合了模型生成與評估各種思維路徑的能力,以及應用搜索策略(例如廣度優先或深度優先搜索)來尋找最佳解決方案。這樣做的好處是,模型不僅能探索多個潛在的解決方案路徑,還能分析并比較這些路徑的效果,從而更智能地選擇出最有希望成功的路徑進行進一步探究。這種方法大大提高了解決復雜問題的效率和準確性[5]

3.5 自洽性

與思維鏈相比,自洽性(SelfConsistency,SC)可以生成多樣化的推理鏈路。這些推理鏈路保持內部邏輯一致性,可能指向不同的結論或答案,最終采用多數投票的策略來確定最終的答案[9]。這種方法無需額外人工標注,利用了集體智慧的思想,通過多條推理鏈路的相互驗證和補充,提高了答案的準確性和可靠性,適用于那些需要從不同角度進行推理的復雜問題和不確定性問題解答等場景。

3.6生成知識提示

知識提示生成(GeneratedKnowledgePrompting,GKP)利用模型內部已經學習到的廣泛知識,通過精心設計的提示將這些知識引導出來,用以支持和增強模型的回答能力。這種方法的優勢在于它可以直接利用模型預訓練階段積累的知識,而無需外部數據源或對模型進行額外調整。這樣不僅可以簡化流程,還能在不增加復雜性的前提下提高回答的準確性和相關性。這種方法特別適用于那些依賴于廣泛背景知識而非特定領域數據的任務。一些提示工程插件能夠通過分析用戶的輸入并根據上下文自動生成相應的輸出,從而大大減輕用戶編寫復雜提示的負擔。這些插件幫助LLM更準確地理解用戶的意圖,使得用戶無需手動設計詳細的提示語句[7]

3.7 自動提示工程

Zhou等[結合了經典程序合成與人類提示工程方法,創造了自動提示工程技術(AutomaticPromptEngineering,APE),其能夠自動生成多個指令并進行篩選。APE的核心思想是認為指令即“程序”,通過搜索LLM提出的指令候選池來優化這一過程,并對LLM生成的候選項進行評估,從中選出得分最高的指令。APE就像一個高效的自動化設計師,它能夠迅速地構思并確定最優的指令方案,極大地降低了人為干預的需求,節省了寶貴的時間和資源。然而,這種方法需要處理復雜的算法邏輯,并且運行過程會消耗相當多的計算資源。盡管存在上述挑戰,APE在提升任務執行效率和模型表現上展現了顯著的能力,預示著其在未來應用中的廣闊前景[7]。

3.8檢索增強生成

雖然LLM在文本生成方面帶來了革命性的變化,但由于它依賴于固定時間點之前的訓練數據,并且有時會在面對未知或最新信息時給出不準確的回答,因此存在一定的局限性。而RAG[11](RetrievalAugmentedGeneration,檢索增強生成)技術則不同,它不僅利用了LLM強大的文本生成能力,還加入了實時檢索的步驟,從一個持續更新的知識庫中提取最新、最相關的資料,確保輸出的內容既準確又具有時效性。這種方法有效地彌補了純LLM方法的不足,提高了信息處理的可靠性和實用性。這項技術特別適合需要引用權威知識庫或私有數據的場景,通過引入額外的信息來源,它顯著提高了LLM生成答案的準確性和可靠性。但值得注意的是,如果所構建的知識庫文檔質量不高,可能會直接影響到生成回答的精確度。

4大語言模型在圖書情報領域中的應用

作為一種自然語言處理的前沿技術,大語言模型正為包括圖書情報在內的各領域帶來一種全新的信息處理和服務方式[2]。在圖書情報管理中,大語言模型開辟了一條新的路徑來提升工作效率。面對涵蓋廣泛學科的信息資源,傳統的手動分類和檢索方式已經顯得力不從心,特別是在信息爆炸的時代背景下。大語言模型憑借其對大量文本的學習能力,可以智能地理解和組織信息,實現自動化分類和精準檢索。因此,大語言模型不僅能大幅提高信息管理的效率,還能更好地適應信息量不斷增長的需求,使得圖書情報工作更加科學、高效[13]

4.1圖書分類與標引

在圖情領域,圖書分類與標引是基礎且重要的工作內容。大語言模型憑借其強大的語言理解和文本分析能力,可以對圖書內容進行深度剖析,依據既定的分類體系和標引規則,更為準確、高效地為圖書確定合適的類別以及提取關鍵的標引詞等。姜鵬等[14]設計了一款Prompt輔助主題分類模型,旨在幫助標引人員迅速把握文章核心內容,從而減輕他們的閱讀負擔,探索了大語言模型輔助人員閱讀、直接分類以及輔助標引系統和參與結果優化等試驗,設計了

ACBKSY自動標引模型,實現大語言模型的準確率和非拒絕準確率都有所提高。戎璐[15]針對傳統圖書分類方法需要大規模數據樣本與大量訓練時間的缺陷,構建“詢問大語言模型-提示-生成”圖書分類范式,在廣州圖書館和鄭州圖書館的圖書數據集上進行實驗,驗證此范式在多項指標上獲得最優分類結果。

4.2圖書館信息服務

大語言模型可以融到圖書館信息服務中,優化多個環節。比如充當智能咨詢助手[16],實時解答讀者關于館藏查詢、借閱規則、文獻推薦等方面的疑問;還可以基于讀者的閱讀歷史等數據,進行個性化的圖書推薦、學習資源推送等,極大地提升圖書館服務讀者的質量和體驗。劉勇等[17]指出AIGC和LDA主題分析模型相結合在智慧圖書館知識服務中的應用場景可以實現對大規模圖書資源的智能化管理和分析,將圖書館的文獻信息資源、用戶行為數據和用戶偏好信息,結合數據治理等技術手段,通過AI大語言模型進行訓練后可向讀者提供定制化的知識解決方案,并為圖書館的決策提供依據。陳艷艷[通過測試國內外多個大語言模型在執行圖書館信息咨詢服務時的全面性和準確性,為大語言模型賦能圖書館精準化智慧服務提供參考。

4.3文本挖掘

陸偉等[18]構建了一個全面的大模型學術文本挖掘專業能力評測框架,該框架涵蓋了文本分類、信息抽取、文本推理和文本生成四大能力維度,共包含6項具體任務。為了驗證這一框架的有效性,在多個國內外主流的指令調優模型進行試驗,對比分析了上下文學習、思維鏈推理等不同指令策略的應用場景以及不同參數模型在專業能力上的表現。孟旭陽[提出利用基于深度學習的文本自動生成技術,構建科技文獻數據集,訓練并優化文本摘要模型,在此基礎上利用大語言模型技術實現結構化的綜述文本生成。石棲等[20]利用大語言模型提升科學實驗知識圖譜數據層知識抽取效率,其步驟是首先采用本地化部署ChatGLM-6B模型,基于人工標注數據和P-Tuningv2技術微調模型,再利用MOT機制構建prompt并注入本體中蘊含的語義知識,通過與ChatGLM-6B的多輪問答實現專業領域復雜知識抽取。

5結語

總體來看,大語言模型為圖書情報服務帶來了新的思路,但也存在一些問題。盡管如此,通過深入研究其產生與應用機制、提示工程的類型與特征以及在圖書情報領域中的具體應用情況,我們可以更好地理解其優勢與不足,并積極探索合理有效的應用方案,以充分發揮大語言模型在圖書情報服務中的作用,同時有效應對各種挑戰,推動圖書情報服務的高質量發展。

參考文獻

[1]劉倩倩,劉圣嬰,劉煒.圖書情報領域大模型的應用模式和數據治理[J].圖書館雜志,2023(12):22-35.

[2]BROWN T,MANN B,RYDER N,et al. Languagemodels are few-shot learners[J]. Advances in NeuralInformation Processing Systems,2020,33:1877-1901.

[3]數據派THU.大模型掃盲系列:初識大模型[EB/OL].(2023-11-22)[2025-03-06]. htps://cloud.tencent.cn/developer/article/2362076.

[4]馬君錫,王小剛.大語言模型在社交媒體文本生成領域的應用研究:以小紅書平臺為例[J].新媒體研究,2024(6) :16-20.

[5]黃峻,林飛,楊靜,等.生成式AI的大模型提示工程:方法、現狀與展望[J].智能科學與技術學報,2024(2) :115-133.

[6]FENG Y C,WANG X B,WONG K K,et al. Promptmagician : interactive prompt engineering for text - to -image creation. IEEE Transactions on Visualization andComputer Graphics[J].2024(1) :295-305.

[7]王東清,蘆飛,張炳會,等.大語言模型中提示詞工程綜述[J].計算機系統應用,2025(1):1-10.

[8]YAO S Y,YU D,ZHAO J,et al. Tree of thoughts :deliberate problem solving with large language models[EB/OL].(2023-03-17)[2024-12-01]. https://arxiv. org/abs/2305.10601.

[9]CHOWDHERY A,NARANG S, DEVLIN J,et al.PaLM: scaling language modeling with pathways. TheJournal of Machine Learning Research[J]. 2024(1):11324-11436.

[10] ZHOU Y C,MURESANU A L,HAN Z W,et al.Large language models are human - level promptengineers [EB/0L]. (2022-11-03)[2024-12-10].https ://arxiv. org/abs/2211. 01910.

[11]何釗.一種基于語言大模型的強度智能化知識管理的應用[J].無線互聯科技,2024(9):46-48.

[12]陳艷艷.大語言模型賦能圖書館服務的測評及其應對策略[J].江蘇科技信息,2024(12):78-82,96.

[13]洪贊,葉鷹,佟彤.國內外大語言模型的圖書情報應用探討[J].圖書館理論與實踐,2024(2):72-80.

[14]姜鵬,任龔,朱蓓琳.大語言模型在分類標引工作中的應用探索[J].農業圖書情報學報,2024(5):32-42.

[15]戎璐.面向圖書自動分類的大語言模型提示學習研究[J].圖書館學研究,2024(1):86-103.

[16]PANDA S,KAUR N. Exploring the viability ofChatGPT as an alternative to traditional chatbot systemsinlibraryandinformationcenters[J].LibraryHi TechNews,2023(3):22-25.

[17]劉勇,柴靖.AIGC在智慧圖書館文本挖掘與知識服務中的應用研究[J].圖書情報導刊,2024(6):26-36.

[18]陸偉,劉寅鵬,石湘,等.大模型驅動的學術文本挖掘:推理端指令策略構建及能力評測[J].情報學報,2024(8) :946-959.

[19]孟旭陽,陳陽,白海燕.面向檢索結果集的結構化綜述智能生成研究[J].圖書情報工作,2024(6):129-141.

[20]石棲,陳文杰,胡正銀,等.面向知識發現的科學實驗知識圖譜構建研究[J].數據分析與知識發現,2025(3):1-15.

(編輯 張碧雪)

Application of large language models in the field of library and information science

XU Shuang',FU Yi2,XU Dan1* (1.Library of China Medical University,Shenyang 11O122, China; 2.School of Health Management, China Medical University,Shenyang 110122,China)

Abstract:This article explored the significance of large language models in modern information processng and their potential application value inthe fieldoflibraryand informationscience.This paper introducedthe backgroundofthe emergence of large language modelsand their wide applications inmultiple fields,especially inthe abilityto process large scale text dataand understand natural language.The article delved into prompt enginering techniques, including how to guide largelanguage models to generate more accurate and relevant outputs through carefull designed prompt words,providing guidance for optimizing prompt engineering techniques; and discussd in detail how to use large language models for tasks suchas extracting,classifying,and generating abstracts of book information,as wellas howto uselarge language models to improve the eficiencyand qualityof inteligenceanalysis.Thisarticleaimd to provide theoretical support and practical gudance for the applicationoflarge language models inthe fieldoflibraryand information science,and promote the intelligent development of the field.

Key words: large language model; prompt engineering; prompt; library and information

猜你喜歡
指令圖書文本
開卷少兒類暢銷書排行榜(2025年6月)
出版人(2025年8期)2025-08-23 00:00:00
醫學高校圖書館專業中文圖書采訪質量及其策略優化分析
科技資訊(2025年13期)2025-08-18 00:00:00
聽我指令:大催眠術
在808DA上文本顯示的改善
ARINC661顯控指令快速驗證方法
測控技術(2018年5期)2018-12-09 09:04:26
LED照明產品歐盟ErP指令要求解讀
電子測試(2018年18期)2018-11-14 02:30:34
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
坐標系旋轉指令數控編程應用
機電信息(2014年27期)2014-02-27 15:53:56
主站蜘蛛池模板: 无遮挡国产高潮视频免费观看| 欧美精品H在线播放| 激情国产精品一区| 国产十八禁在线观看免费| 国产网站免费看| 亚洲视频色图| 熟妇丰满人妻| 国产精品第一区在线观看| 成人午夜网址| 国产成人欧美| 亚洲黄色片免费看| 性网站在线观看| 欧美激情第一区| 亚洲国产看片基地久久1024| 97国内精品久久久久不卡| jizz国产视频| 国产精品无码AV中文| 国模极品一区二区三区| 国产制服丝袜91在线| 国产视频久久久久| 日本道综合一本久久久88| 就去色综合| 天天躁狠狠躁| 成人国产一区二区三区| 午夜福利视频一区| 日韩a级毛片| 97国产在线视频| 全午夜免费一级毛片| 国产毛片高清一级国语| 久久大香伊蕉在人线观看热2 | 国产成人狂喷潮在线观看2345| 国产精品不卡永久免费| 国产区在线看| 久久国产av麻豆| 毛片手机在线看| 欧美日韩一区二区在线播放| www.亚洲一区| 亚洲男人天堂久久| 一本久道久久综合多人| 99er这里只有精品| 91综合色区亚洲熟妇p| 91成人在线免费观看| 久久狠狠色噜噜狠狠狠狠97视色| 国产精品浪潮Av| 欧美一级高清视频在线播放| 99久久亚洲综合精品TS| 亚洲日本中文字幕乱码中文| 熟妇丰满人妻av无码区| 狠狠色成人综合首页| 国产女同自拍视频| 人妻少妇久久久久久97人妻| 女人毛片a级大学毛片免费| 99视频在线精品免费观看6| 欧美区在线播放| 中文字幕在线永久在线视频2020| 国产成人调教在线视频| 高清色本在线www| 国产高清自拍视频| 制服丝袜一区二区三区在线| 欧美97色| 99国产精品一区二区| 欧美日韩一区二区在线播放| 97国产在线观看| 成人国产精品一级毛片天堂| 国产视频你懂得| 国禁国产you女视频网站| 狠狠色婷婷丁香综合久久韩国| 亚洲欧美不卡| 色偷偷综合网| 人妻夜夜爽天天爽| 91人妻日韩人妻无码专区精品| 人人看人人鲁狠狠高清| 欧美精品一区在线看| 喷潮白浆直流在线播放| 国产区精品高清在线观看| 国产女同自拍视频| 波多野结衣第一页| 欧美在线中文字幕| 日本少妇又色又爽又高潮| 免费在线一区| 日韩少妇激情一区二区| 成年网址网站在线观看|