大語言模型賦能圖書館服務(wù)的測評及其應(yīng)對策略

2024-06-29 12:24:33陳艷艷

江蘇科技信息 2024年12期

摘要：大語言模型為圖書館智慧服務(wù)、精準(zhǔn)服務(wù)的進(jìn)步提供了巨大可能。文章通過測試國內(nèi)外多個大語言模型在執(zhí)行圖書館信息咨詢服務(wù)時的全面性和準(zhǔn)確性，為大語言模型賦能圖書館精準(zhǔn)化智慧服務(wù)提供參考。以圖書館信息服務(wù)中的問題提示語為例，運(yùn)用語言學(xué)方法，在詞匯、句子及其關(guān)系的層次上分析、比較、統(tǒng)計(jì)這些輸出結(jié)果的全面性和準(zhǔn)確性及其原因。從詞匯、句子及其關(guān)系的角度來看，大語言模型在圖書館精準(zhǔn)服務(wù)方面的全面性和準(zhǔn)確性程度來源于對其詞匯、短語、句子、段落等實(shí)體及其關(guān)系標(biāo)注的完善性以及算法的先進(jìn)性與否。圖書館運(yùn)用大語言模型賦能精準(zhǔn)化、智慧化信息服務(wù)，建議參照多個大模型的輸出結(jié)果以互補(bǔ)，再進(jìn)一步配合相關(guān)文獻(xiàn)資料予以分析、佐證，以力求所獲知識的準(zhǔn)確性和全面性，同時還應(yīng)注重提示語的使用技巧。

關(guān)鍵詞：大語言模型；ChatGPT；圖書館賦能；信息服務(wù)；精準(zhǔn)化服務(wù)

中圖分類號：G252文獻(xiàn)標(biāo)志碼：A

0 引言

2022年11月，Open AI公司推出了里程碑式的大語音模型——ChatGPT-3，5天獲得100萬用戶［1］，2023年4月Chat GPT-4發(fā)布，周活躍用戶超1億。國內(nèi)的互聯(lián)網(wǎng)巨頭、人工智能企業(yè)也紛紛推出各自的大語言模型，比如百度的文心一言、阿里的通義千問、科大訊飛的星火、字節(jié)的豆包等［2-3］。大語言模型（Large Language Model）通過對海量文本數(shù)據(jù)進(jìn)行多層深度網(wǎng)絡(luò)的訓(xùn)練，利用創(chuàng)新的Transformer算法學(xué)習(xí)語言的結(jié)構(gòu)、規(guī)則和語義，從而可以生成具有自然語言風(fēng)格的文本或回答自然語言的問題。人工智能生成內(nèi)容（Artificial Intelligence Generated Content，AIGC）作為大語言模型的應(yīng)用，為智能問答系統(tǒng)帶來了顛覆性變革，使其可以高度智能化地理解人類語言，并生成連貫、自然的對話內(nèi)容［4］。

圖書館正處于由傳統(tǒng)服務(wù)向智慧化服務(wù)轉(zhuǎn)型升級的階段，尤其是各高校圖書館正著力提升圖書館服務(wù)的智慧化、精準(zhǔn)化，以期為教學(xué)和科研提供更及時可靠的信息支撐。無論是為讀者改善閱讀體驗(yàn)、提供個性化服務(wù)、智能問答和輔導(dǎo)、提高檢索效率和準(zhǔn)確性，還是為圖書館員提供學(xué)習(xí)培訓(xùn)支持、數(shù)據(jù)分析與決策支持［5］，大語言模型都將發(fā)揮積極作用。對大語言模型賦能圖書館服務(wù)中的全面性和準(zhǔn)確性進(jìn)行研究，將有助于這一智能技術(shù)在未來的圖書館精準(zhǔn)化、智慧化服務(wù)中發(fā)揮更有力的作用。

1 大語言模型賦能圖書館服務(wù)研究現(xiàn)狀

目前，大語言模型與圖書館服務(wù)相關(guān)的研究大多集中在歸納總結(jié)大語言模型在圖書館中適用的不同應(yīng)用場景［6-9］和大語言模型為圖書館行業(yè)帶來的機(jī)遇與挑戰(zhàn)［10-12］等方面。在大語言模型與圖書館服務(wù)中應(yīng)用的研究方面，符榮鑫等［6］從理論著手，應(yīng)用概念的分析、比較、綜合、抽象的方法，歸納總結(jié)出AIGC的6個共同特征和9個差異特征。王翼虎等［4］通過大語言模型微調(diào)+langchain本地知識庫的聯(lián)合應(yīng)用方案，驗(yàn)證了其在圖書館參考咨詢服務(wù)中的可行性。趙浜等［13］應(yīng)用實(shí)證的方法，在兩個大語言模型GPT-3.5-Turbo和ChatGLM-6B上進(jìn)行測試，從宏觀角度出發(fā)對其總結(jié)、拓展、分類、對比、推理、計(jì)算、檢索、轉(zhuǎn)換、編程等能力水平進(jìn)行分析評價，得出大語言模型在執(zhí)行多數(shù)典型情報任務(wù)上都展現(xiàn)出了較強(qiáng)能力的結(jié)論。雖然已有文獻(xiàn)對大語言模型在賦能圖書館各項(xiàng)任務(wù)以及從思維方法兩個角度對大語言模型的表現(xiàn)進(jìn)行了測試，但從圖書館某項(xiàng)任務(wù)的完成度，并不能解釋大語言模型生成內(nèi)容全面性和準(zhǔn)確性與否的原因，從思維（分析、概括等）的角度也無法理解其處于目前水平的根本原因。因此，大語言模型能否為圖書館很好地賦能，應(yīng)先對其進(jìn)行較為客觀的、全面的了解，而不能滿足于根據(jù)大模型目前顯現(xiàn)的能力而進(jìn)行簡單地“暢想”［14］。實(shí)際上，大語言模型性能高低的原因主要取決于兩個方面：一是知識圖譜的完整性，二是算法的有效性。知識圖譜的完整性決定大語言模型提供答案的全面性、準(zhǔn)確性。算法的有效性決定知識（詞、句等）之間關(guān)系識別的正確性。圖書館各項(xiàng)任務(wù)賦能的水平歸根結(jié)底是模型理解語言底層邏輯的水平。目前還沒有文獻(xiàn)從語言學(xué)中詞、句及其關(guān)系的角度來總結(jié)大語言模型的性能現(xiàn)狀及其原因。本文從語言學(xué)角度，以圖書館信息服務(wù)中的問題提示語為例，對10多個大語言模型的輸出結(jié)果進(jìn)行統(tǒng)計(jì)分析，歸納出大語言模型當(dāng)前性能現(xiàn)狀及其原因，并提出相應(yīng)的應(yīng)對策略。

2 研究設(shè)計(jì)

目前，具有代表性的AIGC包括文心一言、通義千問、訊飛星火、豆包、百川大模型、天工AI、面壁露卡、智譜清言［15］、ChatGPT等。而圖書館作為知識寶庫和信息中心、學(xué)習(xí)中心，需要被賦能的工作往往要求知識的全面性、準(zhǔn)確性，因此，主要通過測試這些大模型在信息服務(wù)場景中輸出結(jié)果的全面性和準(zhǔn)確性來驗(yàn)證這一指標(biāo)是否達(dá)到。圖書館服務(wù)包括讀者服務(wù)、信息檢索、參考咨詢、智能推介、科技情報分析、學(xué)科服務(wù)、培訓(xùn)教育等多個應(yīng)用場景，無論是將大語言模型嵌入哪種服務(wù)場景，都離不開用戶與大語言模型之間進(jìn)行文本交互，以文字（或?qū)⒄Z音識別為文字）的形式提出需求其輸出結(jié)果的必要環(huán)節(jié)。探究大語言模型賦能圖書館精準(zhǔn)化信息服務(wù)的準(zhǔn)確性、全面性問題，歸根到底仍要從語言學(xué)底層本質(zhì)邏輯上進(jìn)行分析。本文模擬不同信息服務(wù)場景中用戶與大模型之間的問答環(huán)節(jié)，從幾個問題提示語的輸出結(jié)果中發(fā)現(xiàn)問題并分析原因。

3 研究方法/過程

包括ChatGPT在內(nèi)的11個模型參與測試，對模型回答出現(xiàn)的問題進(jìn)行提煉并分析原因。

實(shí)例1：（提示語）游泳誘發(fā)的心臟病有哪幾種？

問題1：回答的全面性不足。各種模型分別給出了游泳可能誘發(fā)的心臟病類型中的某幾個種類，而通過人工檢索文獻(xiàn)數(shù)據(jù)庫和開放的搜索引擎，歸納總結(jié)，可得出冠心病、心肌缺血、心律失常、心律不齊、心力衰竭、心肌炎、冠狀動脈性心臟病等患者都有被游泳誘發(fā)心臟病的潛在危險［16-17］，任何患有或有心臟病風(fēng)險的人在潛水前一定要咨詢醫(yī)生［18］。這個結(jié)論，說明各模型給出的答案全面性方面都存在不足。

問題2：回答的準(zhǔn)確性不足。表現(xiàn)在以下兩個方面：（1）錯誤的上下位關(guān)系。比如面壁露卡給出的答案中包括“高血壓”，智譜清言的答案中包括“腦供血不足”。“高血壓”“腦供血不足”均屬于心腦血管疾病，但不屬于心臟病，可見面壁露卡將“心血管疾病”與“心臟病”概念混淆，智譜清言將“腦血管疾病”與“心臟病”混淆。（2）錯誤的對應(yīng)關(guān)系。百川大模型給出的答案中第4條將“靜止?fàn)顟B(tài)”與“游泳”形成錯誤的對應(yīng)關(guān)系（見圖1）。

原因分析：

首先，參與測試的大語言模型中沒有建立字、詞等細(xì)顆粒度概念的正確上下位關(guān)系。在大語言模型的前期標(biāo)注中，沒有將作為上位概念的“心臟病”與其所有下位概念建立準(zhǔn)確、完整的關(guān)系，或在模型的知識圖譜中缺少“心臟病”患者和參與某些運(yùn)動項(xiàng)目時存在禁忌事項(xiàng)的關(guān)系。

其次，參與測試的大語言模型的算法出現(xiàn)問題。大語言模型在回答問題的同時，時間上不允許識別已有訓(xùn)練數(shù)據(jù)或歷史文獻(xiàn)中“心臟病”與其下位疾病之間關(guān)系這一過程。或者正是由于有天文級的訓(xùn)練文本量來作“訓(xùn)練數(shù)據(jù)庫”，而其算力不足，根本無法支持這種即時搜索和識別功能的準(zhǔn)確性和全面性。

最后，參與測試的大語言模型只對其“訓(xùn)練數(shù)據(jù)庫”中某些文獻(xiàn)或某篇文章進(jìn)行知識抽取，而該篇文章中涉及“心臟病”的下位概念不全。從輸出結(jié)果看，每個大模型給出心臟病的下位概念都不同。甚至針對同一問題，同一個模型多次給出的下位概念也會存在差異。因此，該推測具有一定合理性。

實(shí)例2（提示語）：如何智能地識別句子之間的各種關(guān)系？

通義千問給出的答案如圖2所示。

問題及原因分析：

首先，提示語中句子的省略部分識別錯誤。在上例提示語中，“智能”這一關(guān)鍵詞具有潛在含義，表示被省略的主語是“機(jī)器”或“計(jì)算機(jī)”，而通義千問給出的答案對應(yīng)的主語是“人”。究其原因，除了以大語言模型現(xiàn)階段的能力還無法達(dá)到與人類的思維能力高度一致，提示語表述不夠清晰明了也是出現(xiàn)錯誤的重要因素。

其次，大模型答案全面性不足。除通義千問外的其他9個模型，雖然正確識別出該提示語的主語是“機(jī)器”，但從每個模型給出的識別方法來看，有重復(fù)、有不同，卻都不夠完整。例如，文心一言給出的方法是依存句法分析、語義角色標(biāo)注、關(guān)系抽取；智普清言給出的方法是句法分析、語義分析、實(shí)體識別、機(jī)器學(xué)習(xí)。其中，ChatGPT給出的方法是較為全面的，包括詞向量和嵌入表示、句子向量化、神經(jīng)網(wǎng)絡(luò)、注意力機(jī)制、語義角色標(biāo)注、圖神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)、知識圖譜、監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)9種，盡管如此，也沒有形成完整的答案體系。其原因應(yīng)該是這些模型都沒有建立“識別句子間關(guān)系”與各種技術(shù)（人工智能、機(jī)器學(xué)習(xí)、自然語言處理）之間完整全面的對應(yīng)關(guān)系。

最后，同位關(guān)系與上下位關(guān)系出現(xiàn)混亂。根據(jù)提示語的提問，各模型列出的多種方法之間應(yīng)該是并列的同位關(guān)系。而在ChatGPT給出的方法中，同時出現(xiàn)了“監(jiān)督學(xué)習(xí)”和“神經(jīng)網(wǎng)絡(luò)”，而“神經(jīng)網(wǎng)絡(luò)”是有監(jiān)督學(xué)習(xí)的方法之一，二者應(yīng)是上下位關(guān)系，而非同位關(guān)系。從該問題可看出，大語言模型還沒有清晰地建立起詞與詞之間準(zhǔn)確的同位關(guān)系和上下位關(guān)系。

實(shí)例3（提示語）：大語言模型輸出的結(jié)果對應(yīng)與圖書情報中哪些任務(wù)？

問題及原因分析：由于在提示語中將“于”錯寫成了“與”，通義千問模型將“大語言模型輸出的結(jié)果對應(yīng)了圖書館情報中哪些任務(wù)”理解為“大語言模型與圖書情報的關(guān)系”（見圖3）。

將提示語中的“于”字改正過來后，則給出了相對合理的結(jié)果。可見，提示語的表達(dá)是否準(zhǔn)確、清晰、具體，也會直接影響大語言模型輸出結(jié)果的準(zhǔn)確性。究其原因，一是該模型缺少容錯機(jī)制，二是沒有模糊匹配的算法。

4 結(jié)果/結(jié)論

4.1 大語言模型輸出內(nèi)容的準(zhǔn)確性和全面性不足

主要體現(xiàn)在以下4個方面。

（1）實(shí)體詞之間的上下位出現(xiàn)錯誤，如將“高血壓”“腦供血不足”識別為“心臟病”的下位概念。

（2）實(shí)體詞之間的對應(yīng)關(guān)系出現(xiàn)錯誤或?qū)?yīng)關(guān)系不全，如將“游泳”與“靜止”狀態(tài)形成錯誤的對應(yīng)關(guān)系。

（3）實(shí)體詞之間的同位關(guān)系不全，如“監(jiān)督學(xué)習(xí)”和“神經(jīng)網(wǎng)絡(luò)”這對上下位關(guān)系詞被當(dāng)作同位關(guān)系詞使用等。

（4）某些模型沒有容錯機(jī)制和模糊匹配算法，如提示語中省略主語便無法正確識別句子意思；如提示語中的“對應(yīng)于”錯寫成“對應(yīng)與”，便無法根據(jù)其他關(guān)鍵詞來識別信息等。

4.2 大語言模型對準(zhǔn)確性要求高的學(xué)科領(lǐng)域賦能程度有待提高

從本文實(shí)例1可見，在醫(yī)療信息領(lǐng)域，大語言模型答案的全面性有時低至1/2或1/3。美國學(xué)者Nehal等［19］測試了GPT-4對皮膚科患者常見問題的回答，該科醫(yī)生認(rèn)為ChatGPT的測試結(jié)論中存在2/3的不恰當(dāng)回答。其中某些答案不完整，某些存在錯誤信息。這一觀點(diǎn)與本文實(shí)例1的數(shù)據(jù)分析結(jié)論不謀而合。而Naoki等［20］對GPT-4在診斷健康狀況中的準(zhǔn)確性進(jìn)行了評估，得出GPT-4和醫(yī)生之間診斷準(zhǔn)確性相當(dāng)?shù)慕Y(jié)論，但不可回避的是，醫(yī)生的診斷也存在誤診問題。

另外，基于信息安全性的考慮，大語言模型的信息獲取源只能是存在于開放網(wǎng)絡(luò)上的信息，這些信息可能來自政治組織、非營利組織、公司和個人的文本。而大量有版權(quán)保護(hù)的發(fā)明專利、權(quán)威性文獻(xiàn)和最新的科研成果是它無法輕易獲取的。這也導(dǎo)致了大語言模型輸出的結(jié)果在準(zhǔn)確性和權(quán)威性上大打折扣。

4.3 提示語的表述對大語言模型輸出結(jié)果的影響

實(shí)例2提示語中主語的省略和實(shí)例3提示語中的錯別字，都影響到了大模型輸出結(jié)果的準(zhǔn)確性。除了大語言模型缺乏有效的容錯機(jī)制和模糊匹配算法，還涉及提示語工程問題。

5 建議/策略

5.1 大語言模型的開發(fā)者還需完善大語言模型的知識圖譜，并提高其算法

如果訓(xùn)練樣本之間沒有建立完善的知識圖譜，在語言底層邏輯混亂的情況下，便無法正確學(xué)習(xí)出諸如上下位關(guān)系和同位關(guān)系、同義關(guān)系和反義關(guān)系等細(xì)顆粒度語義之間的關(guān)系。這些因語法、詞匯、語義和上下文混淆造成的錯誤回答，對有相關(guān)專業(yè)知識儲備的用戶而言，可利用已有知識對其進(jìn)行雜質(zhì)過濾、數(shù)據(jù)清洗的干擾排除，但會對大量非專業(yè)的用戶造成極大困擾。因此，訓(xùn)練模型學(xué)習(xí)出各種概念詞匯之間的關(guān)系，建立完整的知識圖譜仍是解決問題不可缺少的一環(huán)。

大語言模型的開發(fā)者需繼續(xù)完善預(yù)訓(xùn)練數(shù)據(jù)文本的知識圖譜，并在識別概念之間關(guān)系的算法上進(jìn)一步提高性能。只有增強(qiáng)其輸出內(nèi)容的全面性和準(zhǔn)確性，才能達(dá)到賦能圖書館精準(zhǔn)化信息服務(wù)的要求。

5.2 大語言模型與現(xiàn)有的信息檢索方式并存，用戶可各采其長，避其不足

圖書館作為信息服務(wù)中心服務(wù)于全學(xué)科領(lǐng)域，其用戶對信息服務(wù)的要求更突出準(zhǔn)確性和全面性。而大語言模型發(fā)展至目前階段，所提供的信息服務(wù)在此方面仍存在不足。此外，由實(shí)例還可看出，依據(jù)各個模型預(yù)訓(xùn)練時所擁有的“訓(xùn)練數(shù)據(jù)庫”數(shù)據(jù)量及算力的不同，各個模型之間檢索出的答案也存在較大差異，如單獨(dú)使用，則答案的精準(zhǔn)性得不到保障。

圖書館已有的數(shù)據(jù)庫文獻(xiàn)檢索功能和現(xiàn)有的開放式搜索引擎恰好可以與大語言模型實(shí)現(xiàn)很好地結(jié)合。用戶可以多管齊下，既要盡可能多個模型同時應(yīng)用，又要與搜索引擎、數(shù)據(jù)庫文獻(xiàn)檢索功能相互配合使用。例如，若想獲得某學(xué)科或某研究方向較全面準(zhǔn)確的知識點(diǎn)提示，可同時參照多個大模型的輸出結(jié)果，或求其并集，或互相驗(yàn)證，在多個輸出結(jié)果的知識要點(diǎn)引導(dǎo)下進(jìn)行綜合考量。再進(jìn)一步配合相關(guān)文獻(xiàn)資料予以分析、佐證，以力求所獲知識的準(zhǔn)確性和全面性。

5.3 注重提示語工程，提高與大語言模型之間交流的有效性

大語言模型任何功能的使用，實(shí)質(zhì)上均可概括為“我問你答”的過程。如何使這種“人”“機(jī)”交互的結(jié)果達(dá)到使用者的預(yù)期，則提示語的使用顯得尤為重要。從本文實(shí)例中可總結(jié)提高提示語有效性的方法，以供參考：其一，語境完整。提示語中盡量不出現(xiàn)錯字、不省略句子結(jié)構(gòu)，提供盡可能完整的上下文信息。必要時，可采用舉例說明、類比的方式，先“教”再“問”，讓大模型根據(jù)使用者的前情提示來回答。其二，拆分問題，將邏輯復(fù)雜的問題拆分為多個簡單的小問題，通過引導(dǎo)，由低階到高階逐步解決問題。此外，還可配合使用“還有呢？”“請繼續(xù)！”“可以補(bǔ)充說明嗎？”等引導(dǎo)語，促使模型給出更多更全面的答案。

參考文獻(xiàn)

［1］文繼榮.2023年大模型行業(yè)深度研究報告（系統(tǒng)了解“ChatGPT”）［EB/OL］.（2023-10-16）［2023-10-20］.https：//m.toutiao.com/is/idQyGyf7/.

［2］白首窮經(jīng)之杰.主流AI大模型對比：ChatGPT、訊飛星火、文心一言和豆包［EB/OL］.（2023-09-26）［2023-10-20］.https：//m.toutiao.com/is/idQD3Ygf/.

［3］劉言飛語.字節(jié)的豆包，與文心一言、通義千問、ChatGPT在9個問題上的對比［EB/OL］.（2023-08-19）［2023-10-20］.https：//m.toutiao.com/is/idQyESmq/.

［4］王翼虎，白海燕，孟旭陽.大語言模型在圖書館參考咨詢服務(wù)中的智能化實(shí)踐探索［J］.情報理論與實(shí)踐，2023（8）：96-103.

［5］DANIEL G， SOPHIA N， CARINA W， et al. A SWOT （strengths， weaknesses， opportunities， and threats） analysis of ChatGPT in the medical literature： concise review［J］. Journal of Medical Internet Research，2023（16）： e49368.

［6］符榮鑫，楊小華.AIGC語言模型分析及其高校圖書館應(yīng)用場景研究［J］.農(nóng)業(yè)圖書情報學(xué)報，2023（7）：27-38.

［7］壽建琪.走向“已知之未知”：GPT大語言模型助力實(shí)現(xiàn)以人為本的信息檢索［J］.農(nóng)業(yè)圖書情報學(xué)報，2023（5）：16-26.

［8］張慧，佟彤，葉鷹.AI2.0時代智慧圖書館的GPT技術(shù)驅(qū)動創(chuàng)新［J］.圖書館雜志，2023（5）：4-8.

［9］吳進(jìn)，馮劭華，昝棟.ChatGPT與高校圖書館參考咨詢服務(wù)［J］.大學(xué)圖書情報學(xué)刊，2023（5）：25-29.

［10］施志唐.ChatGPT對圖書館的影響與應(yīng)對措施［J］．圖書情報導(dǎo)刊，2023（4）：1-6.

［11］李書寧，劉一鳴.ChatGPT類智能對話工具興起對圖書館行業(yè)的機(jī)遇與挑戰(zhàn)［J］.圖書館論壇，2023（5）：104-110.

［12］張強(qiáng)，高穎，趙逸淳，等．ChatGPT在智慧圖書館建設(shè)中的機(jī)遇與挑戰(zhàn)［J］．圖書館理論與實(shí)踐，2023（6）：116-122.

［13］趙浜，曹樹金．國內(nèi)外生成式AI大模型執(zhí)行情報領(lǐng)域典型任務(wù)的測試分析［J］．情報資料工作，2023（5）：6-17.

［14］劉倩倩，劉圣嬰，劉煒．圖書情報領(lǐng)域大模型的應(yīng)用模式和數(shù)據(jù)治理［J］．圖書館雜志，2023（12）：22-35.

［15］IT之家.百度字節(jié)等8家公司大模型產(chǎn)品通過生成式人工智能備案，可上線向公眾提供服務(wù)［EB/OL］.（2023-08-31）［2023-10-20］.https：//www.ithome.com/0/715/938.htm.

［16］鄭劍暉.這些人不宜參加游泳［J］.游泳，2005（4）：18.

［17］唐春生.心臟病患者到底能不能游泳［J］.人人健康，2018（17）：19.

［18］葉子明.試試水：嘗試水上鍛煉［J］.心血管病防治知識（科普版），2019（4）：54-56.

［19］NEHAL L， LEELAKRISHNA C， CHRISTIAN G， et al. Assessing the accuracy and comprehensiveness of ChatGPT in offering clinical guidance for atopic dermatitis and acne vulgaris［J］. JMIR Dermatology， 2023（6）：1-4.

［20］NAOKI I， SAKINA K， MINETO F， et al. The accuracy and potential racial and ethnic biases of GPT-4 in the diagnosis and triage of health conditions： evaluation study［J］. JMIR Medical Education，2023（9）： 47532.

（編輯何琳編輯）

Evaluation and response strategies of empowering library services with the big language model

CHEN? Yanyan

（Library， Henan University， Kaifeng 475004， China）

Abstract：? The big language model provides great potential for the advancement of intelligent and precise services in libraries. The article tests the comprehensiveness and accuracy of multiple large language models at home and abroad in executing library information consulting services， providing reference for empowering libraries with precise and intelligent services through large language models. Taking the problem prompts in library information services as an example， using linguistic methods， analyze， compare， and statistically analyze the comprehensiveness， accuracy， and reasons of these output results at the level of vocabulary， sentences， and their relationships. From the perspective of vocabulary， sentences and their relationships， the comprehensiveness and accuracy of the big language model in the precise service of the library comes from the perfection of the annotation of its words， phrases， sentences， paragraphs and other entities and their relationships， as well as the progressiveness of the algorithm. The library utilizes a large language model to empower precise and intelligent information services. It is recommended to refer to the output results of multiple large models for complementarity， and further analyze and support them with relevant literature to strive for the accuracy and comprehensiveness of the knowledge obtained. At the same time， attention should also be paid to the use of language prompts.

Key words： big language model; ChatGPT; library empowerment; information service; precision service

基金項(xiàng)目：河南省圖書情報研究項(xiàng)目；項(xiàng)目名稱：智慧服務(wù)情景下文獻(xiàn)資源的精細(xì)化組織與精準(zhǔn)化服務(wù)研究；項(xiàng)目編號：HNTQL-2023-008。

作者簡介：陳艷艷（1979— ），女，館員，碩士；研究方向：圖書館智慧服務(wù)、信息服務(wù)等。

江蘇科技信息2024年12期

江蘇科技信息的其它文章: 新文科背景下應(yīng)用型會計(jì)人才培養(yǎng)模式的創(chuàng)新研究; 科研事業(yè)單位員工職業(yè)發(fā)展通道建設(shè)研究; 基于COSO-ERM框架的高校政府采購風(fēng)險管理研究; 基于流程分析的研究型醫(yī)院科研經(jīng)費(fèi)管理優(yōu)化對策探究; 山西省大型科研設(shè)施與儀器開放共享評價考核分析; 民辦高校基于有組織科研背景下科研管理制度的創(chuàng)新研究