ChatGPT在圖書館參考咨詢服務中的智慧化應用與研究

2023-11-21 08:09:36邱茹林陳玉鳳李素萍

江蘇科技信息 2023年26期

邱茹林,陳玉鳳,李素萍

(青島科技大學圖書館,山東青島 266042)

0 引言

隨著信息技術的快速發展,當前已進入人工智能時代。ChatGPT的出現為智能問答系統帶來了顛覆性的革命,它不僅具備強大的語義理解和自然語言處理功能,而且還能與用戶進行友好交互與溝通,在塑造智慧化人機交互方式和改善用戶體驗方面發揮著重要的作用。參考咨詢服務是圖書館最重要的工作之一,其數字化和智能化水平是衡量現代圖書館整體服務水平的重要標志。ChatGPT的出現將為圖書館參考咨詢服務智慧化發展提供新的思路和方法。

1 ChatGPT介紹

ChatGPT是由OpenAI公司開發的一種基于生成式預訓練模型的對話生成系統,它以深度學習中的Transformer為架構,并通過在大規模文本數據上進行預訓練來生成學習語言模型。2018年,OpenAI首次發布了GPT(Generative Pre-trained Transformer)模型。2019年推出了GPT-2模型,它是GPT模型的改進版本,擁有更多的參數和更強的生成能力,可以生成更長、更連貫的文本。2020年,OpenAI發布了GPT-3模型,它是GPT系列中規模最大的模型,擁有1 750億個參數。GPT-3在多項自然語言處理任務上展現了出色的性能,包括文本生成、翻譯和問答等。2021年,GPT-3.5 Turbo模型誕生,它不僅保持了與GPT-3模型相似的性能,而且開發成本更低,使更多的用戶能夠訪問和使用該技術。目前,ChatGPT已經發展到第四代產品,GPT-4具有模型量更大、解決問題能力更強的優點[1]。

ChatGPT的目標是生成與用戶進行自然、連貫對話的問答響應。為了實現此目標,ChatGPT首先在大規模預訓練的基礎上,通過上下文理解,生成對話式方式,然后通過使用正確的語法和詞匯,以一定的語言表達能力生成流暢的文本,最后通過處理復雜的句子結構和語義關系,生成相對準確和自然的回答。

2 ChatGPT在圖書館參考咨詢服務中的實踐過程與方法

2.1 數據準備

(1)常用問題和答案:指圖書館用戶經常提出的問題和相應的準確答案。這些問題通常包括圖書館概況介紹、規章制度、開放時間、聯系方式等方面的內容。例如:如何查詢館藏書籍?如何借閱和歸還書籍?借閱書籍的期限是多久等。這些問題和答案可以作為ChatGPT的常用訓練數據。

(2)圖書館資源和服務:主要指圖書館館藏信息及服務信息方面的問題和答案。這些問題通常包括圖書館館藏資源和圖書館利用這些資源為用戶提供的服務等方面的內容。例如:圖書館有CNKI數據庫嗎?圖書館的特色館藏是什么?圖書館可以提供SCI檢索服務嗎?這些信息可以作為參考咨詢的基礎,幫助用戶了解圖書館的資源和服務。

(3)圖書館使用和收費:使用問題主要指與圖書館使用相關的檢索技巧、技術方法和學術寫作指導等,這些內容可以包括如何進行文獻檢索、如何引用參考文獻和如何評估信息質量等。收費問題主要指圖書館提供的有償服務項目的收費標準和支付方式等方面的內容。

(4)用戶評價和反饋:主要收集用戶對圖書館服務的反饋和評價,包括他們的滿意度、意見、建議和改進需求。收集的途徑可以是建議箱或反饋表、在線反饋表單、用戶滿意度調查、社交媒體和在線評論,以及用戶反饋會議或工作坊等。這些反饋可以幫助圖書館了解用戶需求,優化參考咨詢服務,并對ChatGPT的性能和效果進行改進。

2.2 數據處理與模型訓練

2.2.1 數據預處理

數據預處理通常是在龐大的計算資源和大規模數據集的基礎上進行的,涉及復雜的數據處理、模型架構和優化算法。數據預處理一般包括數據清洗和過濾、去除噪聲、標準化格式、分詞和標記化、對原始數據進行增強或變換、限制輸入序列的最大長度等工作[2]。數據預先處理是為了確保數據的一致性和準確性,是模型訓練的重要基礎工作。

2.2.2 數據標注

數據標注主要是對參考咨詢數據集中的每個問題和答案對進行標注,標注的目的是讓模型能夠理解并學習數據的特征。數據標注通常涉及兩方面內容:一方面是輸入提示,另一方面是對生成回答的評分[3]。輸入提示通常會為每個訓練樣本提供一個提示,該提示是用戶的問題描述或對話系統中的一部分歷史對話。對于每個輸入提示,標注員會提供一個或多個合適的參考答案。模型在生成回答后,標注員會根據生成回答與參考答案的相似度或質量進行評分,這有助于模型學習生成更接近參考答案的回答。評分通常使用啟發式方法,如BLEU、ROUGE等自然語言處理中的常用指標。標注工作對GPT系統能否準確給出參考咨詢回答至關重要。

2.2.3 模型訓練

使用預處理和標注后的數據,圖書館員可以選擇合適的機器學習或深度學習框架來訓練模型。訓練通常分為兩個階段,分別是預先訓練和微調。訓練算法可以是基于傳統機器學習算法的模型,也可以是基于神經網絡的深度學習模型。圖書館員可以使用開源工具如TensorFlow、PyTorch等進行模型訓練[4]。在訓練模型時,圖書館員可能需要進行超參數調優,以找到最佳的模型性能。超參數包括學習率、批量大小、網絡結構等。通過嘗試不同的超參數組合,可以找到最適合圖書館員數據集的模型配置。在訓練模型后,圖書館員需要評估模型的性能和效果。使用一些評估指標如準確率、召回率、F1分數等來評估模型的預測能力。根據評估結果,圖書館員可以決定是否需要進一步調整和改進模型,通過參數最終迭代出符合要求的模型數據。

2.3 部署和集成

訓練好的ChatGPT模型可以部署到圖書館的在線平臺、網站、聊天窗口或App等應用環境中,以方便用戶與其進行交互。在部署過程中,圖書館員要考慮ChatGPT的接口和用戶界面是否友好易用,并在此基礎上與圖書館的現有系統和服務進行深度集成。

首先,圖書館員根據選擇的機器學習或深度學習框架,將訓練好的模型導出為適當的格式。常見的格式包括TensorFlow SavedModel、ONNX(Open Neural Network Exchange)或PyTorch模型文件等。接下來,圖書館員搭建一個模型服務器來測試模型的服務能力,可以采用獨立的服務器或云平臺上的虛擬機,圖書館員可以使用現有的框架來搭建模型服務器,如TensorFlow Serving、Flask、Django等[5]。為了能將ChatGPT與圖書館的應用系統有效集成,圖書館員需要創建一系列API接口,通過HTTP或其他協議與模型服務器進行通信,這樣,圖書館的應用程序可以向模型服務器發送請求,并接收模型的測試結果來驗證測試結果的正確性。技術人員也可以使用框架如Flask、FastAPI、Node.js等來創建API接口。在部署和集成模型完成后,需要考慮系統的安全性和性能優化,這包括對輸入數據進行驗證和過濾,保護模型服務器免受惡意攻擊,以及優化模型的推理速度和資源利用率。

模型部署完成后,圖書館員需要設置監測和維護機制來跟蹤模型的性能和運行狀況,可以通過日志記錄、錯誤處理、性能監控等信息進行監測,也可以收集用戶的反饋及建議優化模型。定期的模型性能監測,依據結果進行模型迭代和改進的方式,能確保模型的持續性和有效性。

2.4 監測和更新

ChatGPT在實際使用過程中還需要不斷地進行監測和更新。監測和更新的具體措施包括:建立有效的監測機制、錯誤分析和處理、數據監控和替換,以及模型的定期更新和迭代,這些措施都可以確保模型的有效性和模型性能的持續改進。同時,為了進一步提高參考咨詢的質量和用戶的滿意度,ChatGPT還需要圖書館員的參與和監督。圖書館員可以通過監控ChatGPT的運行情況,提出支持策略和反饋意見,并及時處理ChatGPT無法解決或需要人工干預的復雜問題,圖書館員的專業知識和經驗仍然是不可替代的。

3 ChatGPT給圖書館參考咨詢服務帶來的優勢

3.1 提供實時咨詢

ChatGPT能夠提供24/7全天候實時咨詢服務,用戶可以隨時通過圖書館網站或App聯系到客服人員,得到快速準確的答復和建議。這對于緊急情況下的求助、夜間咨詢等都非常有幫助。ChatGPT使參考咨詢服務不再受圖書館開放時間的限制,圖書館能夠隨時處理大規模并發的咨詢請求。

3.2 多語言支持

ChatGPT的語言處理能力非常強大,可以處理多種語言,這意味著它可以為使用不同語言的用戶提供咨詢服務。這一特性為圖書館咨詢服務提供了極大的便利,用戶可以使用自己最熟悉和舒適的語言與ChatGPT進行對話,并獲得所需要的咨詢服務。這對于那些母語不是英語或其他主流語言的人來說尤為重要,他們可以毫無障礙地獲取圖書館的支持和幫助。

3.3 提供個性化咨詢

隨著信息技術和信息環境的改變,用戶的信息需求也呈現出多元化和個性化等特征。ChatGPT能夠通過人工智能技術和對話式交互模式,理解用戶的意圖并為其提供相應的信息和建議,滿足用戶特定的信息檢索、學科發展和知識內容等需求,使咨詢服務更加個性化。

3.4 整合資源服務

ChatGPT在整合資源服務方面也具有很大的優勢。它能夠整合各種類型的圖書館資源,如圖書館的紙質資源、電子資源、特色資源、自建資源和免費網絡資源等,為用戶提供全方位的信息服務和支持。通過ChatGPT,用戶在獲取信息時可以享受既高效又高質的參考咨詢服務,這對于助力科研和教學都具有極大的意義和價值。

4 ChatGPT的局限性

ChatGPT帶來了一場前所未有的語言交互盛宴,大大提升了圖書館參考咨詢服務的質量和效率。但同時也應該認識到,ChatGPT并沒有真正的理解和推理能力,它主要是通過模式匹配和統計規律來生成回答,而并非真正意義上理解問題含義。一般情況下,ChatGPT對于常見問題或常用領域的回答通常會表現良好,但當涉及較為復雜或專業性領域的問題時,它的回答就可能會出現不準確、不合適或缺乏深度的情況。因此,當使用ChatGPT時,還要對ChatGPT的回答進行適度的篩選和判斷,確保最終得到的信息是正確的、可靠的,且能適用于特定的情境,避免對其盲目依賴。只有通過理性使用和輔助驗證,才能最大程度地發揮ChatGPT在提供信息咨詢服務上的優勢,確保所獲取信息的真實性和可信性。

5 結語

ChatGPT給學習和生活的各個領域都帶來了重大的變革,ChatGPT咨詢服務模式未來也將逐步融入圖書館參考咨詢工作,并最終取代傳統咨詢服務模式。為了適應時代發展,應加快ChatGPT在圖書館參考咨詢服務中的建設,提升ChatGPT參考咨詢服務的質量和安全性,從而減輕圖書館員繁重的參考咨詢工作。相信ChatGPT將對圖書館產生深遠的影響,它在圖書館中的地位是不可或缺的。