[摘 要]論述ChatGPT-4在圖書館應用過程中可能出現的各種網絡信息安全風險,包括入侵風險、系統及平臺運行風險、數據內容安全風險、信息泄露、網絡輿情風險及版權糾紛和超量下載等法律風險。提出完善網絡信息安全制度、充分利用網絡安全技術、用戶權限控制、限制ChatGPT-4應用范圍、利用ChatGP-4本身優勢、做好數據備份工作等提高網絡信息安全程度的措施。
[關鍵詞]ChatGPT-4 人工智能 圖書館 網絡信息安全 對策
[分類號]G250.7;TP393
1 引言
隨著互聯網技術的不斷發展,圖書館各項業務工作也發生著翻天覆地的變化。物聯網、云計算、大數據、人工智能、5G、區塊鏈等技術的廣泛應用,無一不給圖書館帶來全新的發展機遇,但同時也讓圖書館面臨著各種挑戰。ChatGPT-4的橫空出世,引起了全世界的高度關注,各行各業都在積極探討ChatGPT-4帶來的應用前景及潛在風險。圖書館作為新技術應用非常活躍的領域,不可避免地將會在ChatGPT-4的推廣應用過程中得到全新發展,但也將面臨許多不可預測的風險。圖書館界應未雨綢繆,做好接受新技術、迎接新挑戰的準備。
2 ChatGPT-4概述
ChatGPT是由人工智能研究實驗室OpenAI在2022年11月30日發布的全新聊天機器人模型,也是人工智能技術驅動的自然語言處理工具。這是一種用于處理序列數據的模型,擁有語言理解和文本生成能力,尤其是會通過連接大量的語料庫來訓練模型,這些語料庫包含了真實世界中的對話,使得ChatGPT-4能根據聊天的上下文進行互動,實現與人類幾乎無異的場景進行交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務[1]。2023年3月15日,OpenAI正式推出ChatGPT-4。ChatGPT-4是多模態大模型,即支持圖像和文本的輸入輸出,擁有強大的圖像識別能力,文字輸入上限提高到了2.5萬字[2]。簡單來說,ChatGPT-4是一個聊天機器人程序,可以理解人類輸入的文字,并根據人們的提問和指令以文字的方式輸出答案,從而實現借助自然語言的人機對話。
但到目前為止,ChatGPT-4的功能還并不完美,由于算法缺陷和訓練過程的偏差,其存在諸多局限性,比如無法分辨錯誤信息、經常給出錯誤回答等。因此,模型還需要通過持續訓練來逐步優化。
3 ChatGPT-4對圖書館網絡信息安全的挑戰
網絡信息安全主要是指網絡系統的硬件、軟件及其系統中的數據受到保護,不受偶然的或者惡意的原因而遭到破壞、更改、泄露,系統能夠連續、可靠、正常地運行,網絡服務不中斷。信息安全特性包括保密性、完整性、可用性和認證安全性。由于ChatGPT-4的出現,增加了網絡信息安全的不確定因素,給網絡信息安全的防御帶來了新的挑戰。
3.1 入侵風險
病毒、黑客和木馬的入侵是網絡安全中最常見的威脅,各種入侵事件層出不窮,嚴重危害網絡安全。在ChatGPT-4即將廣泛應用的今天,這種入侵行為更加令人擔憂。ChatGPT-4具有自動編寫代碼的功能,使黑客編寫代碼更高效、簡單,代碼功能更完善,并將大幅度降低網絡攻擊的成本,更有利于黑客發動大規模、全方位的網絡攻擊,使網絡安全防護更加困難[3]。其通過訓練過程中積累的知識和后期的不斷訓練,生產或優化出大量智能化更高、隱蔽性更強的釣魚郵件和惡意軟件,對圖書館的網絡安全造成嚴重威脅。另外,ChatGPT-4憑借其強大的學習和運算能力快速、高效地分析硬件或系統的漏洞,為不法分子或病毒入侵提供便利。ChatGPT-4自動編寫代碼的功能還會降低網絡攻擊的門檻,今后網絡攻擊者可能不再限于技術水平高超的黑客,普通網民也能充當黑客,使網絡安全面臨更加嚴峻的挑戰。
3.2 系統及平臺運行風險
各圖書館都運行著各種各樣的應用系統和服務平臺,除了常見的計算機操作系統和辦公軟件之外,還有各種商業軟件系統(集成書目管理、自助借還、座位空間預約、學位論文、自助打印、門禁、人臉識別、RFID管理平臺、郵件、視頻監控等系統)、外包定制化開發系統(微信公眾號服務后臺、多媒體資源、特色資源數據庫、支持業務開展需要的定制化開發系統等)及自行開發的軟件[4]。除了一些關鍵的系統和平臺有較為完善的網絡防護功能外,一般的系統或平臺在網絡安全方面的隱患較大。而且這些系統和平臺采用的技術不同、開發年代不一、安全防護能力各異,難以進行統一的網絡安全部署,也難以統一實現系統的升級迭代,容易遭到來自各個方面的攻擊,網絡安全形勢不容樂觀。
ChatGPT-4可能憑借其強大的學習和記憶功能,收集鍵盤等外部輸入設備的信息,從而獲取用戶賬號和密碼,并通過對圖像驗證碼的自動識別奪取系統訪問權限,使系統管理員無法對系統進行控制和管理。不法分子可以通過ChatGPT-4獲得的系統管理權限,任意修改系統參數設置,篡改或竊取系統數據,使系統運行陷入混亂、數據安全遭受威脅,帶來不可預知的風險或損失。不法分子也可能通過在ChatGPT-4中植入可執行命令或病毒程序,暗中對系統、數據、用戶信息進行破壞,給系統、數據及網絡安全帶來極大挑戰。
3.3 輸出數據內容安全風險
數據內容的安全是圖書館順利開展各項服務工作的基礎。圖書館依托各種各樣的數據資源來開展讀者服務工作,包括館藏書目信息、讀者信息及數量龐大的電子資源數據庫等。其安全性主要表現為信息的保密性、真實性、完整性、可用性和可控性,避免攻擊者利用系統的安全漏洞進行竊聽、冒充、詐騙等有損于合法用戶的行為[5]。ChatGPT-4能輔助圖書館員進行數據加工、整合和傳輸等工作,有利于提高工作效率。但其在功能上還存在局限性,模型仍有待優化,依然具有偏見、歧視、捏造事實、對自身錯誤拒不改正等問題。因此,在數據處理過程中可能摻雜一些虛假信息,從而影響數據資源的真實性和完整性。另外,在用戶訪問和信息傳輸過程中疊加的不確定因素,使數據內容的安全性風險進一步提高。
3.4 信息泄漏
圖書館存儲著大量讀者個人信息、館員信息、科技成果信息及其他各種各樣的信息。信息的泄露不但會損害讀者或館員的權益,還會影響圖書館服務工作的正常開展。國外已經發生了多起因為使用ChatGPT-4導致信息泄露的事件,應該引起高度警惕。
信息泄露的風險可能來自以下幾個方面。一是解析圖片視頻竊取隱私,利用ChatGPT-4解析圖片,不法分子可以迅速竊取地理位置、生物特征和個人隱私;二是可能挑戰圖像驗證碼機制,圖像驗證碼是一種防止機器人賬戶濫用的常用驗證措施,ChatGPT-4通過學習可自動識別圖像驗證碼,讓圖像驗證機制失效;三是增加漏洞威脅,因為ChatGPT-4尚不具備自己發現錯誤的能力,在其生成的代碼中可能引入安全漏洞,帶來新的網絡攻擊風險[6]。
綜合多家媒體報道,自2023年3月11日韓國三星電子允許部分半導體業務部門員工使用ChatGPT-4開始至4月4日,在20天內便爆出了3起機密資料外泄事件,其中兩起與半導體設備有關,另一起與內部會議有關[7]。
3.5 網絡輿情風險
圖書館在為讀者提供信息服務的過程中,會不斷發布各種各樣的信息,如新書推介、網絡推文、新聞發布、通知公告等。采用ChatGPT-4之后,可利用其自動生成文本及文獻推送等功能,高效快速發布各種信息,在最短時間內把各種信息傳遞給讀者,極大提高工作效率,為工作帶來便利。但ChatGPT-4通過大量的訓練數據預先學習了語言和語法知識,如果訓練數據中存在錯誤或偏差,則可能影響ChatGPT-4的邏輯思考,若語境不足或者語境信息有誤,再加上算法本身的缺陷,也可能影響ChatGPT-4的辨析能力。除此之外,由于現實應用場景的開放性,以大數據訓練和經驗性規則為基礎的深度學習面臨著環境的動態變化、輸入的不確定性,甚至惡意攻擊等問題,導致虛假信息、不良信息的產生和傳播。而讀者也難以辨別信息的真偽,易造成輿情失控,給圖書館與外界及讀者之間的交流帶來諸多麻煩、困擾甚至誤解,從而影響圖書館的聲譽和信用[2]。
3.6 法律風險
圖書館擁有數量眾多的文獻信息資源,并通過這些文獻信息資源為讀者提供服務。因此,圖書館本身承擔著一定的法律風險,而隨著ChatGPT-4的應用,這種風險有可能會進一步擴大。
一是版權糾紛。文獻信息資源的數字化為讀者利用圖書館提供了極大便利,使數據的交換和傳輸變得相對簡單而快捷。讀者借助于現代網絡可以將數字化信息傳輸到世界各地,尤其在ChatGPT-4的輔助下,數據傳播和交換變得更加廣泛和頻繁,可能會出現未經許可非法使用、解密、傳播有版權保護作品的情況,或者被不法分子利用文獻數據資源進行營利,從而產生版權糾紛[8]。事實上,ChatGPT-4對版權的威脅已經引起人們的關注,如由于ChatGPT-4對版權構成了威脅,代表14多萬名作家和表演者的42家德國協會和工會敦促歐盟強化人工智能(AI)規則草案[9]。
二是超量下載。圖書館訂購的所有數據庫都有限制超量下載的規定,有些數據庫平臺本身也對下載數量進行了限定。但ChatGPT-4具有自動檢索、自動下載的功能,并且有可能憑借自身功能繞開平臺限制,根據用戶需要進行超量下載,從而損害數據庫供應商的利益,引發違約風險。
4 應對措施
4.1 完善網絡信息安全制度,規范網絡信息安全管理
人工智能是人類生產活動的輔助工具,最終依靠人的思想和行為來實現各種功能。ChatGPT-4依靠人工設置模型、算法,并通過提問進行訓練才能得以應用。因此,完善制度有利于引導ChatGPT-4朝人們預想的方向發展。在網絡信息安全方面,我國頒布了《中華人民共和國網絡安全法》《信息安全技術 個人信息安全規范》等一系列法律法規,較好地保證了網絡安全,部分圖書館也制訂了自己的網絡信息安全制度。但隨著ChatGPT-4等新技術的不斷應用,這些制度可能已經滯后,圖書館應根據自身的實際情況,制訂或進一步完善相應的網絡安全制度,尤其需要針對ChatGPT-4這類全新技術的應用進行規范。如嚴格規定ChatGPT-4的操作人員,未經授權不得對其進行操作;嚴格執行每個工作環節的操作流程,確保把風險控制在最小范圍;嚴格劃分ChatGPT-4可訪問的數據資源,尤其是重要的數據資源,同時限制其只能訪問備份數據,以保證原數據的安全;實時監控ChatGPT-4的自動回復和互動信息,發現異常情況立即查找原因,并采取相應措施;保存ChatGPT-4運行日志,以便在出現問題后追根溯源。
通過制度的完善,對網絡信息安全控制的各個環節進行規范化、專業化管理,嚴格規范網絡信息管理者、使用者、傳播者的行為,使各崗位的工作人員自覺按照規定的程序發布、管理、使用和傳遞網絡信息資源,減少ChatGPT-4帶來的安全風險。
4.2 充分利用網絡安全技術,保證網絡信息安全
圖書館網絡信息安全有賴于網絡安全技術的進步。盡管ChatGPT-4功能強大,但網絡技術也在不斷地升級換代,能在較短時間內研究出相對成熟的防范技術。應對ChatGPT-4可能帶來的網絡安全風險,同樣可以根據現有的網絡安全技術,通過如下幾個方面加以防范。一是針對ChatGPT-4的特征升級防火墻,防止來自被保護區域外部的攻擊,保護易受攻擊的網絡服務資源和客戶資源;二是優化入侵檢測系統,提高系統管理員的安全管理能力,加強信息安全基礎結構的完整性,為網絡安全設置第二道防線,對可能由ChatGPT-4帶來的內外部攻擊進行實時保護;三是采用多重加密技術,增加外部入侵難度。另外,加強網絡監測、經常性開展網絡安全評估、提前做好應急預案,也是必不可少的安全防護措施。
4.3 用戶權限控制
對用戶權限進行控制是保證網絡安全的重要措施之一。ChatGPT-4的各項應用都是在默認授權的情況下完成的,需要考慮防止ChatGPT-4在權限范圍之外發揮作用,即防止其非法獲得網絡或系統權限。因此,利用身份認證技術和權限分配設置,可以對網絡信息起到有效的保護作用。而對于眾多的應用平臺和應用軟件,可根據不同的工作職責設置不同的訪問權限,只有獲得系統授權的用戶才能訪問相應系統數據,以防非法用戶入侵,將網絡信息安全的風險降到最低[10]。也可對同一系統的權限進行合理劃分,使每個系統操作員只能擁有其中的一部分權限,相互制約、相互監督,共同維護信息系統的安全。尤其是負責ChatGPT-4應用場景的技術人員,其權限應該進行更加嚴格的限制和分配,在確保網絡信息安全的情況下發揮ChatGPT-4的作用。
4.4 限制ChatGPT-4的應用范圍
目前,圖書館界對ChatGPT-4存在的風險還沒有足夠清晰地認識,因此需要對其可能帶來的風險進行充分評估,并限制其訪問權限和應用范圍,尤其是對于圖書館的核心系統、重要平臺及關鍵數據應保持謹慎態度,原則上不允許ChatGPT-4在這些場景中應用。在引入ChatGPT-4之前,宜事先制定科學合理的技術方案,經過反復論證和試驗,在確保安全的情況下投入使用。同時,還要制訂科學合理的規章制度、工作方案,開展網絡信息安全應急演練,使ChatGPT-4的應用在可控范圍內穩步推進。這樣既能充分發揮ChatGPT-4的智能作用,又能確保網絡、系統、數據的安全。
4.5 利用ChatGPT-4本身優勢來提高網絡信息安全
ChatGPT-4作為一種人工智能,既然可為攻擊者用作進攻武器,也必定可以為網絡管理者用作防守工具。只要應用得當,可以利用ChatGPT-4的強大功能,為網絡信息安全帶來幫助。由于ChatGPT-4會通過大量的語料庫來訓練模型,這些語料庫包含了真實世界中的對話,使得ChatGPT-4擁有海量的知識儲備。因此,網絡管理者可以借助ChatGPT-4來評估網絡安全、檢測系統漏洞、識別非法用戶、辨別病毒、記錄和報告非法侵入、生成網絡安全報告,甚至提交安全防護建議,讓網絡管理員適時掌握網絡安全狀況,及時采取應對策略,從而把風險轉化為機遇。
4.6 做好數據備份工作
數據備份是圖書館網絡信息安全中最基本的常規工作,也是系統和數據安全的最后一道屏障。在應對ChatGPT-4風險的過程當中,完善的備份工作可以確保在其他網絡安全措施失效的情況下快速恢復數據原狀,繼續有序開展各項業務工作。圖書館可以根據自身的實際情況選擇本地備份、遠程鏡像等不同的備份方式來加強數據安全。對于重要的系統或應用,如果條件允許,也可對整個系統或應用進行備份,保證網絡和系統遭到攻擊或破壞后能在最短時間內得以恢復,從而將損失降到最低。
5 結語
ChatGPT-4的問世和推廣,給圖書館的網絡信息服務帶來了良好機遇的同時,也給網絡信息安全帶來了諸多不確定因素。圖書館在大膽嘗試ChatGPT-4帶來的高效、智能應用之時,務必也要時刻關注其潛在的安全風險,做到揚長避短、因勢利導,充分發揮人工智能在圖書館創新服務中的優勢。
參考文獻:
[1] 竇爾翔,段玉聰.升維超越:中國應對GPT-AGI的戰略選擇[J].海南大學學報:人文社會科學版,2023(4):61-73.
[2] 許林艷,李萬晨曦.OpenAI正式推出GPT-4 AI產業變革迎更多機會[N].證券日報,2023-03-16(B02).
[3] 趙精武,等.ChatGPT:挑戰、發展與治理[J].北京航空航天大學學報:社會科學版,2023(2):188-192.
[4] 張元俊.高校圖書館網絡信息安全體系建設[C]//中國高科技產業化研究會智能信息處理產業化分會.第十五屆全國信號和智能信息處理與應用學術會議論文集.北京大學圖書館,2022.
[5] 王國才,施榮華.計算機通信網絡安全[M].北京:中國鐵道出版社,2016.
[6] 貴重,李云翔,王光濤.GPT-4帶來的變化與挑戰[J].電信工程技術與標準化,2023(4):17-19.
[7] 蓋世汽車資訊速遞.三星被曝引入ChatGPT致半導體機密泄漏[EB/OL].[2023-04-03].https://mr.baidu.com/r/1nlgSu10/O7u?F=opamp;rs=2177093816amp;ruk=s_f9Z0Zz/cz
UUKS2Piy71wamp;u=0f26ec7co/2a5c/21a.
[8] 李文淵.談數字圖書館的網絡信息安全[J].圖書館論壇,2003(1):54-56.
[9] 和訊網.AI哨所|ChatGPT威脅版權 42家德國組織要求歐盟加強AI監管[EB/OL].[2023-04-21].https://mr.baidu.com/r/1nlhUYgFOg?F=cpamp;rs=411773amp;ruk=s_f9Z
0Zz/czUUKS2Piy71wamp;u=f81190/9ffccb69ef.
[10] 胡延軍,林嘉祥.高校數字圖書館現狀及網絡信息安全問題和解決方案[J].科技資訊,2022(7):204-206.
張軍雄 男,1972年生。碩士,副研究館員。研究方向:數字化圖書館。
(收稿日期:2023-08-08;責編:鄧鈺。)