吳進 馮劭華 張展 昝棟
摘 要:海洋科技名詞規范化工作對于海洋科學研究具有重要意義。文章通過將海洋科技名詞規范化的工作方面與ChatGPT的技術要點進行結合分析,探討ChatGPT在海洋科技名詞規范化工作中的應用前景,探究應用困境,并給出應用建議。
關鍵詞:海洋科技名詞規范化 ChatGPT 應用
中圖分類號:H083;TP391.1? 文獻標識碼:A
文章編號:1004-4914(2023)06-227-02
一、引言
2022年11月30日,美國OpenAI公司發布了一款聊天機器人程序ChatGPT。ChatGPT作為AIGC人工智能生成內容技術突破式發展的產物,憑借技術優勢迅速風靡全球。2023年3月15日,基于GPT-4的最新版ChatGPT正式推出,性能進一步提升。面對高科技發展成果,國家有關部門于2023年7月10日聯合發布了《生成式人工智能服務管理暫行辦法》[1](以下簡稱《暫行辦法》),《暫行辦法》第五條明確指出:“鼓勵生成式人工智能技術在各行業、各領域的創新應用,生成積極健康、向上向善的優質內容,探索優化應用場景,構建應用生態體系。”各行業領域積極響應政策號召,紛紛開展學習研究,探討ChatGPT如何影響自身發展。
按照學科門類進行科技名詞的規范化建設和推廣,對相關學科的建設發展具有重要意義。科技名詞反映著科學研究的成果,且具有很強的時代性特征。近些年,隨著經濟的發展、科技的進步和研究的開展,海洋科學研究的深度和廣度都在不斷拓展,相關科技成果不斷涌現,出現了大量新的海洋科技名詞。習近平總書記強調:“發展海洋經濟、海洋科研是推動我們強國戰略很重要的一個方面,一定要抓好。”2007年出版發行的《海洋科技名詞》(第二版)亟需進行補充修訂工作,以適應海洋科學學科建設發展工作,這也是服務海洋強國建設的應有之義。本文旨在探討海洋科技名詞規范化工作應用ChatGPT的前景和困境,并給出應用建議,以期利用科技發展成果賦能海洋科技名詞規范化工作,促進科技名詞規范化工作在新時代、新征程不斷高質量發展。
二、海洋科技名詞規范化應用ChatGPT的前景
作為人工智能生成內容技術突破式發展的代表性成果,ChatGPT自身具備諸多技術優點,結合海洋科技名詞規范化工作特點進行分析,ChatGPT可在如下兩大方面賦能科技名詞規范化工作。
(一)ChatGPT賦能海洋科技名詞提取
1.協助處理海量文獻。“自然科學的成果是概念”[2]“科學認識的成果都是通過制定各種概念來加以總結和概括的。”[2]自2007年《海洋科技名詞》(第二版)出版發行以來,海洋科技領域的科學研究迅速發展,大量新技術、新設備和新研究方法不斷涌現并被應用于科研過程中,科研成果大量出版發表,其中,海洋科學領域的SCI發文量逐年攀升。科學家、學者通過科學抽象和創造性思維,不斷總結形成新的科學理論。海洋科技名詞規范化的一項重要基礎性工作就是對相關科研論文進行大量收集,根據文獻內容提取主要主題詞。高質量的海洋科技名詞規范化工作需要做好文獻的深度閱讀工作,文獻閱讀質量的高低與工作人員的學科知識背景和閱讀精細度密切相關。海量的文獻與有限的人力之間的矛盾成為科技名詞規范化工作無法回避的主要矛盾之一。
ChatGPT作為一款聊天機器人程序,在自然語言處理技術上實現了突破式發展運用,實現了自然語言處理的技術飛躍[3],用戶與ChatGPT進行交流時甚至覺察不到正在與機器對話[4]。同時,經過良好預訓練的ChatGPT具備優秀的總結生成能力,且GPT-4模型的文字處理能力較GPT-3.5大幅提升,上述兩大技術優勢可以極大賦能文獻閱讀工作。工作人員只需將收集好的海洋科技類文獻輸入ChatGPT,ChatGPT即可對海洋科技領域的專業術語進行識別,并通過學習和分析大量的海洋科技文獻,理解海洋科技主題詞的使用方式和語境,從而生成并輸出相關規范化的主題詞信息。
2.ChatGPT賦能多語種文獻信息處理。目前OpenAI尚未明確公布ChatGPT掌握的語種數量。但是,通過OpenAI官方網站公開的相關信息可以確認ChatGPT至少掌握了26種語言[5]。高質量的海洋科技文獻以SCI收錄文獻為主,輔之部分中文、德語、法語等其他語種文獻。多語種文獻的人工處理嚴重依賴于工作人員的第二語言素養,語言不通的情形下,無法有效提取文獻主題詞信息。ChatGPT具備的多語種優勢可以有效賦能多語種的海洋科技文獻處理工作,使海洋科技名詞規范化工作無需受制于工作人員的第二語言素養。
(二)ChatGPT賦能海洋科技名詞推廣宣傳
海洋科技名詞規范化的一個重要作用是統一學術詞匯表達,避免各科研人員使用不同的學術表述,從而利于學術交流。如何做好海洋科技名詞的推廣宣傳工作,確保科研人員了解、掌握并使用規范化的海洋科技名詞具有重要的現實意義。ChatGPT可以從兩大方面助力海洋科技名詞推廣宣傳工作。一是可以借助ChatGPT生成推廣宣傳文案。海洋科技名詞規范化工作完成后,工作成果不能束之高閣,面向廣大科研工作者的推廣宣傳工作隨即成為工作重點。基于高質量預訓練的ChatGPT具備出色的文字生成能力,可以幫助相關管理部門生成行之有效、特色鮮明的推廣文案,助力海洋科技名詞規范化工作成果的宣傳推廣。二是助力海洋科技名詞普及。將規范化的海洋科技名詞輸入ChatGPT進行針對性訓練,可以讓ChatGPT掌握最新的海洋科技名詞。基于ChatGPT龐大的用戶數量,ChatGPT在回答用戶海洋科技領域的提問時使用標準有效的主題詞進行信息組織輸出的過程也是將主題詞廣泛推廣普及的過程。同時,ChatGPT還可以對用戶輸入的信息進行非標準術語的識別和糾正,從而幫助科研人員避免使用不準確或非標準的術語,這也是將最新的海洋科技名詞進行有效宣傳推廣的途徑。
三、海洋科技名詞規范化應用ChatGPT的困境
ChatGPT在憑借技術優勢賦能海洋科技名詞規范化的同時,還因自身存在的技術缺陷給海洋科技名詞規范化工作應用ChatGPT帶來一定的挑戰。
(一)信息安全與保護問題
2023年4月28日,中共中央政治局召開會議,會議提出要重視通用人工智能技術的發展,并防范風險[6]。海洋科技名詞規范化工作應用ChatGPT也存在信息安全與保護的風險。相關管理部門將新版海洋科技名詞輸入ChatGPT后,基于ChatGPT的RLHF人類反饋強化學習訓練方式,仍存在用戶惡意調試、誤導ChatGPT的可能。被誤導后的ChatGPT會給海洋科技名詞的推廣、普及工作帶來負面消極影響。應用ChatGPT進行海量文獻處理的過程中亦存在不合理提取不特定組織或個人信息,并在后續信息生成過程中被不合理使用的問題。
(二)信息準確性
有學者指出,“人的難題對于人工智能來說很容易,人的簡單問題對人工智能來說很難。”莫拉維克悖論在ChatGPT上依然成立[7]。對于1000是否大于1062這樣的簡單數理邏輯問題,ChatGPT仍會給出錯誤回答[7]。這一技術缺陷存在投射到海洋科技名詞規范化工作中的可能性,造成ChatGPT在生成海洋科技名詞時出現錯誤或不準確的情況。
四、海洋科技名詞規范化應用ChatGPT的建議
(一)打造定制化的海洋科技名詞規范化ChatGPT
定制化的用于海洋科技名詞規范化工作的ChatGPT可以從兩方面著手,一是構建海洋科技名詞專題語料庫。《海洋科技名詞》已發行2版,目前已積累了大量標準化的海洋科技主題詞,將現有的海洋科技名詞匯集成專題訓練語料庫在技術上是可行的。專業化的語料庫可以對大語言模型進行針對性訓練。二是進行定制化預訓練。定制化預訓練需要聯手研發企業,各自發揮專長進行訓練模型的設計和研發。基于專題語料庫和專業預訓練的ChatGPT會更加適合處理海洋科技領域的大規模數據和信息,用于生成海洋科技名詞時具備更高的可靠性。
(二)結合專家審核,提高海洋科技名詞規范化質量
ChatGPT可以提供自動化處理海洋科技信息和生成海洋科技名詞功能,將ChatGPT應用到海洋科技名詞提取工作中可以顯著提高主題詞規范化工作效率。但是目前的ChatGPT仍存在一定的技術不足,在處理一些復雜語境,識別用戶隱含意圖方面,仍存在一定誤差和不準確的可能。將專家復審融入海洋科技名詞規范化工作體系,可以糾正人工智能的錯誤,提高海洋科技名詞規范化工作質量。
(三)構造合理的監管體系
2023年8月15日之前,我國尚未出臺監管人工智能生成內容技術的法律法規,對于人工智能生成內容的監管更多依靠行業自律及參照現行的法律法規規定。8月15日之后,《暫行辦法》正式生效,《暫行辦法》對生成式人工智能服務提出了分類分級監管的要求,并對提供和使用生成式人工智能服務應遵守的方面給出了五條具體規定。多元化的監管體系除了政策和法規外,還應考慮其他方面:一是開發和使用先進的技術手段和算法監控工具,對人工智能生成內容的過程進行實施跟蹤,以及時發現和糾正生成內容中可能存在的問題和錯誤。二是加強公眾教育。《暫行辦法》明確鼓勵生成式人工智能技術在各行業領域的創新應用,探索優化應用場景,構建應用生態體系。未來生成式人工智能會更加融入生活場景,公眾是否具備良好的信息素養成為生成式人工智能能否有效發揮效用的關鍵。通過多種手段加強公眾信息素養,提高公眾對人工智能生成內容的判斷、評價能力,可以讓生成式人工智能技術更好地為人民所用。三是加強合作。企業、行業組織、教育和科研機構、公共文化機構、有關專業機構等應在生成式人工智能風險防范方面開展密切協作,發揮各自優勢,將應用風險降到最低。
五、結語
科技浪潮呼嘯而至,科學技術是第一生產力。面對新科技發展成果,可取的做法是積極加強研究,深入探討新技術是否可以融入并賦能各自的業務領域。海洋科技名詞規范化作為眾多業務領域之一,面對ChatGPT這一生成式人工智能技術最新發展成果,無疑也需要加強融合研究,以期在新時代利用新技術發展成果賦能海洋科技名詞規范化工作高質量發展,為中國式現代化新征程上我國海洋科技事業發展貢獻力量。
參考文獻:
[1] 生成式人工智能服務管理暫行辦法.[EB/OL].[2023-8-1].https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm.
[2] 吳篤卿.科技名詞規范化的重要意義[J].中國科技術語.
[3] 朱光輝,王喜文.ChatGPT的運行模式、關鍵技術及未來圖景[J].新疆師范大學學報(哲學社會科學版),2023,44(04).
[4] 徐繼敏,嚴若冰.論大語言模型材料的證據屬性——以ChatGPT和文心一言為例[J].四川師范大學學報(社會科學版)
[5] OPENAI.GPT-4[EB/OL].[2023-8-1].https://openai.com/resea
rch/gpt-4.
[6] 新華社.中共中央政治局召開會議分析研究當前經濟形勢和經濟工作,中共中央總書記習近平主持會議[EB/OL].[2023-8-1].https://www.gov.cn/yaowen/2023-04/28/content_5753652.htm.
[7] ZHOU J, KE P, QIU X, et al. ChatGPT: potential, prospects, and limitations[J].Frontiers of information technology & electronic engineering,2023.
[基金項目:中央高校基本科研業務經費“基于科技論文的海洋科技名詞整理與篩選研究”(項目號:202364012)]
(責編:若佳)