付永華 張文欣 司俊勇
關鍵詞:ChatGPT;人工智能;生成技術;多模態;跨模態;自然語言;信息繭房;檔案服務
ChatGPT自2022年11 月30日發布以來,以其“高級智能+普式應用”的科技姿態和應用場景,迅速被業界關注,引發各行試用,獲得全球熱議。作為一款自然語言的處理工具,ChatGPT充分展示了人們想象中的人工智能交互的基本期望:能夠真正地理解人們的語言,給出專業的建議和參考,以自然、易懂且流暢的交互方式進行表達,甚至以專業和規范的形式展示。綜合各試用人員發布的試用報告,匯集了ChatGPT的49種應用,涉及文本處理、自由交互與專業研討、圖音視頻處理與創建、代碼和數據庫的管理與設計、論文撰寫與報告生成,甚至包括情感分析。
有研究者,也與ChatGPT,在檔案領域,針對檔案基本術語的了解、管理制度的熟悉、具體業務的操作、專業研究的觀念、行業領域的發展等問題,進行了較為全面的探討,發現與其他熱門領域一樣,ChatGPT對檔案也有著深入的認知,并且隨著交互人數的增加,這種認知在深度和廣度上,都在不斷地拓展。這種技術優勢,令檔案管理人員興奮不已——可以從本質上提高檔案管理和服務的智能化水平,提高效率,提供最滿意的服務;但也引發不少人的擔憂——檔案服務人員,是否不再有用武之地。
《“十四五”全國檔案事業發展規劃》中,明確指出:人民對檔案信息、檔案文化的需求日益增長,迫切要求加快檔案開放、擴大檔案利用、提供優質高效服務。要求加快全面數字轉型和智能升級。規劃清晰地給出了檔案服務創新的背景緣由、美好愿景和迫切期望,也給出了人工智能驅動下,檔案服務的發展方向和具體措施。論文也將以規劃為核心,剖析ChatGPT技術對檔案服務的支撐與驅動,結合人工智能在檔案服務中的進展,提出ChatGPT影響下檔案服務的突破,梳理ChatGPT等人工智能技術給檔案服務帶來的風險,為檔案智能化服務提供參考。
1 人工智能驅動的檔案服務現狀
1.1 人工智能驅動的檔案服務研究現狀。以“創新+檔案服務”“信息技術+檔案服務”“人工智能+檔案服務”分別為主題詞,在中國知網數據庫分別檢索出3436篇、748篇、72篇相關文獻。經過梳理,可以得知最近檔案服務結合一些技術,包括一些大數據、區塊鏈、機器學習等技術,都為檔案服務工作帶來很多便捷,也為檔案用戶和檔案工作人員帶來諸多便利。
人工智能在檔案信息服務領域的應用,趙湘渝[1]提出檔案服務結合人工智能,不僅可以幫助檔案用戶打破空間、時間的限制,更加快捷獲取所需要的檔案信息資源,并且可以根據用戶的檔案,分析其特點,為用戶推送相關信息。
人工智能的技術應用于檔案館中,使得傳統檔案館轉型數字檔案館,相關學者胡國強[2]等人提出檔案館依托人工智能技術,既保證了傳統檔案服務的高效準確,同時也將改革傳統的檔案館服務工作。楊靖[3]提出人工智能的技術為智慧檔案館的檔案管理、檔案服務、用戶服務等方面提供了相關技術,這也正是智慧檔案館“智”的所在之處,同時提出用更多信息技術助力檔案館的建設與發展。
人工智能在檔案管理服務的應用中,利用機器學習可以模仿人類的學習行為,深度學習可以通過概念組成結構來表達相關內容,學者張宇[4]提出,基于傳統的檢索方式,利用機器學習、深度學習等技術可以更快捷地檢索音視頻檔案。
顧偉[5]提出利用神經網絡等人工智能的相關技術與算法實現對大量檔案數據的管理,可以提出檔案的數據特點,實現自動化輸入到輸出的檢索過程。
人工智能在檔案開發服務的應用中,學者李霞和馮佳[6]提出目前我國的檔案開發服務效率不高,將開發服務引進人工智能技術,通過模塊識別、自然語言處理可以更好地開發檔案資源,提高檔案資源的利用率,提升智慧檔案服務建設水平,改變檔案開發服務模式,推進檔案開發服務工作。
通過以上研究得知,人工智能技術已經逐步進入檔案服務工作中,但還是需要結合新技術、新思路,緊密結合時代發展的需要與社會的進步,加深研究方向,用新技術打破傳統,實現檔案服務新突破。
1.2人工智能驅動的檔案服務應用現狀。智能整理服務應用。2020年9月,浙江省檔案館與科大訊飛公司,聯合開展《人工智能技術在音視頻檔案整理利用中的應用研究》,利用語音技術和人臉識別技術,對音視頻檔案進行智能整理。
某地銀行開發了金融行業智能檔案管理信息系統,可實現智能化數據采集、快速掃描、數據處理等功能。
智能管理服務應用。中國移動通信集團江蘇有限公司利用人工智能技術,對檔案的保管期限進行自動鑒定;無獨有偶,安徽省檔案局也利用人工智能技術,開展了此類工作。
智能密集架的廣泛運用,推動了無人檔案館的建設,促進了網絡檔案信息資源智能收集、分類與檢索,以及安全管理。
智能審核服務方面。福建省檔案館將人工智能技術,運用到檔案開放審核中,設計訓練了深度神經網絡算法,構建了自動審核模型,實現了自動化審核檔案開放工作,提高了審核效率和準確程度。寧波市鄞州區檔案館啟用了“可信認證+人臉識別”系統,不用身份證就可以驗證用戶身份,開啟檔案服務流程,提升工作效能。
智能安全服務方面。態勢感知、人臉識別、步態識別、特征識別等技術,已廣泛應用于數字檔案館和檔案智慧庫房的建設中。利用人工智能技術,對缺損檔案、失真檔案進行修復優化,也在圖像、音視頻檔案的應用中得到推廣,促進了檔案的完整性。
2 檔案服務視角下的ChatGPT技術剖析
2.1 交互性檔案服務技術:自然語言交流。充分、順暢、和諧的交互,是檔案服務質量優良的基礎,人工交互對檔案服務人員的能力和精力,都提出了極大的要求。傳統的聊天交互,通過擷取關鍵詞、拓展關聯詞、從資料庫中尋找應答的方式,進行交互,也有的搭載自然語言處理系統,但受到處理算法的限制,使得當前的智能問答交互,因服務內容的千篇一律和“驢唇不對馬嘴”,總是遭受用戶的詬病。
ChatGPT首先是一款聊天機器人程序,核心是快速、準確的自然語言處理(NLP)模型,其基本服務是“像人一樣自然地聊天”,而目前經測試,基本上做到了這一點,被認為是“有史以來面向公眾發布的最好的聊天機器人”
[7]。之所以具備這么優秀的能力,在于基于GPT架構。2018年推出的GPT-1,就具備了基本的泛化能力,可從專業交互拓展的普遍交互;2019年推出的GPT-2,則將重心放到文本生成方面,除涵蓋摘要、總結、故事撰寫外,在交互上,甚至可以做到多角色扮演,交互內容因用戶而異;2020年的GPT-3,參數發生了巨大變化,從之前的十數億級猛增到千數億級,在模仿人類交互方面,取得質的突破;2022年1月的Instruct GPT,關注了自然語言交流中的有害、虛假和偏差信息;2022年推出的ChatGPT,則重點關注自然語言交流的輸入,能夠和用戶的意圖一致。
2.2 創新性檔案服務技術:開放場域的生成技術。提供創新性開放場域的咨詢服務,向來是檔案服務的核心和努力的方向,也是檔案服務的短板。這需要檔案服務人員,對專業知識具備較高的專業水準,對生成內容的文本要求,也要達到易懂且流暢。因此,這往往不是檔案服務人員的專長。
中國信息通信研究院聯合中國人工智能產業發展聯盟,對ChatGPT的生成能力展開新一輪評測,包括開放任務和約束任務。經測試發現,在創意寫作方面,評分最高,尤其是學術類創意,生成內容的可讀性、創造性、專業性、連貫性較強;在格式擬定命題寫作中,對設定字數、修辭、體裁等約束表現優秀;在學術類摘要生成中,對相關性、創造性、專業性等約束表現優異。
之所以具備這樣的能力, 在于C h a t G P T 采用了Transformer模型[8]。傳統的算法模型,一般采取人工標注數據的方式,雖然準確率比較高,但導致數據量比較少,無法面對龐大的檔案數據處理,更使得學習訓練的周期太長,智能成長太慢。Transformer模型重點關注了人腦的學習過程,將人類的反饋信息作為學習對象,不需要累積和重復,可以面對大量數據,從而提高學習速度和質量,尤其是拓展到其他任務中。
2.3 呈現性檔案服務技術:多模態跨模態。檔案服務的最終結果,還是要呈現給用戶。ChatGPT構建了多模態模型,可以呈現給用戶不同的模態,甚至可以實現模態的轉化,體現在具體的技術上,則面向三個方面:數字孿生、智能編輯和智能創作[9]。
ChatGPT的數字孿生,重點體現在效果增強和形式呈現方面,效果增強可以實現模態在呈現過程中產生的信息損失和偏差[10],讓效果盡可能達到用戶滿意,形式呈現則負責溝通數字檔案和現實世界,因此,ChatGPT以“寫實力”,改變了“元宇宙”的虛擬構境,讓虛擬現實變得更加務實。編輯能力則允許用戶繼續創作,讓結果更符合用戶的要求,而這種繼續將被保留下來,作為用戶偏好采集和柔性改進的依據。創作能力則保障呈現的內容,不僅僅是文字的原創,更是概念性的創作,給人們以啟發。
2.4 開放性檔案服務技術:涵蓋廣支持多。早在二十世紀八十年代,就開展了關于檔案開放性服務的探討,也有不少檔案管理部門,相繼出臺了開放性的服務,紅色檔案、歷史檔案、精神挖掘、城市傳承……各種開放服務模式和方式相繼涌現,取得了一定的成果,但整體上依然處于“曲高和寡”的狀態,感興趣者不多。
ChatGPT構建了涵蓋廣的框架,包括GPU(英偉達)和TPU(谷歌)等加速芯片的支持的基礎硬件層,還有涵蓋云計算平臺層、模型層和應用層。另外,在應用層面,上中下游均呈現強力支持局面:數據、算法、底層工具,形成良好創新生態;文字、圖像、音視頻動畫處理企業如雨后春筍涌現;各內容創作、發布和服務平臺林立。這些均為開放性檔案服務提供了良好且廣泛的基礎。
3 人工智能驅動的檔案服務突破
ChatGPT只是人工智能眾多產品之一。實際上,作為二十世末到現在,穩坐三大尖端技術之一的人工智能,涉及的技術非常多,主要包括智能視覺技術、機器學習技術、自然語言處理技術、生物識別技術和機器人技術等。
3.1 檢索服務突破:所行所得、所想所得。檢索服務是檔案基本服務的基礎,但是,無論是通過樹狀結構以此精準“點開”,還是通過關鍵詞匹配,都需要一定的專業素養。事實上,對個人要檢索檔案的清醒認知、對檢索方式和檢索關鍵詞的準確表達、對檢索結果的反饋方式,往往很難統一,達到一致。
在自然語言處理、機器學習、智能識別驅動下,系統能夠充分地理解用戶輸入的檢索詞,所表達的含義,一方面,是因為系統熟悉了用戶的表達方式,對輸入的內容進行了規范的處理,另一方面,通過歷史記錄、操作行為、瀏覽痕跡和關聯業務等信息,對用戶的檢索目的進行了預期分析。因此,用戶使用系統的次數越多,時間越少,用戶的檢索目的就越清晰,檢索速度就越快,準確程度就越高。對于剛開始使用系統的用戶,也將通過用戶身份驗證和關聯系統操作等數據,共享其他用戶的“行為+想法”,使得初次啟動使用變成“溫啟動”甚至“熱啟動”。
3.2 交互服務突破:自然流暢、多模呈現。不管是何種檔案服務,最終都需要與用戶進行交互。當前檔案服務過程中,交互應用場景一般包括:檔案系統專業檢索交互場景、普式檔案平臺范式搜索交互場景、檔案內容瀏覽交互場景、檔案需求反饋交互場景、檔案決策咨詢交互場景、約束性檔案文本處理交互場景等。這些交互場景,目前整體略顯呆板,與用戶交互的流暢度不夠。
人工智能驅動的檔案交互服務,細分交互場景,充分考慮實時交互和非實時交互。實時交互可用于檔案客服問答、非專業性檔案咨詢方面,非實時交互則考慮結構化交互和開放性交互。在內容確定的情況下,除了以文本的形式展示之外,呈現多種模態:將文本轉化成音頻,同時可包含情感,甚至實現語音克隆,以用戶喜歡的聲音交互;將內容變成圖片,富含結構化和邏輯性,甚至還充分考慮美觀;生成多種檔案服務策略,可供用戶選擇最適合自己的服務策略;以虛擬人的形式出現,通過表情、聲音、肢體行為和語言,生動形象地與用戶進行交互。
3.3 知識服務突破:創新挖掘、千用千面。知識服務是深層次的檔案服務,綜述研究,主要內容包括:基于檔案,可提供何種知識服務;知識服務模式有哪些;可融合何種智能技術來提供知識服務。有兩個觀點值得認可:知識服務應該是一種創新性的服務;知識服務以用戶的需求為目標。當前的主要知識服務模式,還是充分依賴檔案工作者的智慧,當然,有眾多表現形式,例如構建檔案知識服務智庫等,均沒有充分意識到人工智能對知識服務的驅動作用。
在知識服務領域,人工智能的優勢體現在對原始檔案的深度挖掘方面,而且是創新性的挖掘。比如,利用知識圖譜可實現新知識的抽取,尤其是面對非結構化數據,更具有優勢。而即使是富有經驗的專家,在面對大量非結構化數據時,也將產生無力感。同時,基于檔案的知識服務,往往會提供一些較為準確規范條件和模板,這對善于學習的人工智能來說,更是易如反掌。而且,根據不同的需求,面對相同的檔案,可提供不同內容、形式的服務,實現千用千面。例如,面對一份人事檔案,研判其承擔某研究項目的能力和管理某部門的能力,將形成不同的建議報告。
3.4 組織服務突破:自組自調、動態融合。檔案分類是檔案組織的重要工作,層次清晰、結構合理的檔案分類體系,是檔案良好應用的基礎。但是,隨著檔案數字化、電子文件的快速推進,以及新載體、多媒體的出現,導致大量非結構化檔案本體數據快速涌現,這更對檔案的組織提出了挑戰。在人工智能的驅動下,檔案的組織問題,正向著自組自調模式發展,根據不同的需求,產生動態融合,減少大量的人工分類和標準,而且能夠發現、發掘各檔案之間的內在聯系,支撐更多智能應用。例如,在工程檔案方面,構建即時決策機制,動態調用歷史庫、問題庫,對當前施工效果進行預判,并給出優化建議。
3.5 安全服務突破:主體完整、使用保障。檔案安全作為國家安全體系的重要組成部分,是檔案工作的底線和紅線。檔案的安全其實主要包括兩個方面:主體的安全和使用的安全。在主體安全方面,主要是完整性,通過人工智能,分析主體的采集是否規范,是否有遺漏,充分體現其在真實性、有效性方面的作用;對檔案價值進行評估,及時準確更新安全防護等級;機器學習可分析安全漏洞,主動消除安全隱患,并進行預警。在使用安全方面,主要是保障,則充分運用生物識別技術,確保檔案在使用過程中,專人使用、按規使用,對有意或無意造成的檔案泄露,建立可追蹤機制。
3.6 情感服務突破:解憂除難、全程暖心。關于人機情感的發展,學者略有分歧,觀點有三:一、人機情感是人工智能的分支;二、人機情感和人工智能是發展的不同方向;三、人機情感是人工智能的下一個發展階段。但毋庸置疑,人機情感受到的關注程度越來越高。
人機情感技術驅動的檔案服務,將充分識別用戶的焦慮程度,優先將數據資源尤其是計算資源,分配給急迫程度更高的用戶,并且能夠跟蹤持續性問題,剖析真實需求。通過音視頻情感特征分析,分析用戶對檔案服務結果的理解現狀,主動優化呈現形式。例如,兩個大學生同時搜索鄭州某建筑的檔案,將根據操作行為和閱讀行為,分析結果匹配程度和理解能力,給出提示。對歷史檔案服務,也將隨著人工智能學習的不斷更新提升,在發現內容和以往服務不符合或有更新時,主動提供更正和追加。
4 人工智能驅動的檔案服務挑戰
4.1 性格泄露。簡單的用戶隱私主要是指用戶身份信息,這并不足為懼。然而,為了提高檔案服務質量,人工智能驅動下的檔案服務通過各種硬件軟件,全面記錄了用戶使用檔案時的物理空間和網絡空間,充溢于檔案工作全流程,并全面存檔用戶檔案服務的歷史記錄、操作行為、瀏覽痕跡和關聯業務,從而促使人工智能成為最“懂”用戶的角色,自然能夠洞悉用戶的行為、偏好、性格等?;诜墙Y構數據整合、未知關系分析的用戶“行為畫像”和“性格畫像”功能[11 ],研判用戶正在接受的檔案服務工作,分析用戶的喜好志趣,揭露用戶的性格缺陷,甚至有可能將某些保密工作毫無保留地展示在人工智能面前,實際上也是暴露在人工智能產品所屬企業眼前,這才是令人們心生擔憂的問題所在。
4.2 服務偏差。和人類一樣,人工智能提供的檔案服務,源于學習和訓練。通過模仿人類的持續學習和信息反饋,依靠龐大的數據,融合各種信息呈現技術,借助不同用戶長期使用的反饋調節,從而促使人工智能可以提供各種模態、形式多樣、內容豐富、具備原創的檔案服務。然而,人工智能在檔案服務過程中由于缺少主動性思考,因而無法避免錯誤的產生。根據目前的研究和應用,人工智能出現服務偏差甚至錯誤的情況屢見不鮮,例如:如果用戶缺少對人工智能所提供服務的慎重研判,忽略檔案服務建議的可行性思考與合理性分析,極有可能給工作帶來隱患甚至產生損失[12] ;人工智能在進行知識服務時,善于解答開放性的問題,而檔案服務工作在應用于不同的檔案類別時,需要面臨多領域的知識條件性約束,因此檔案服務是一項經驗趨向性強的工作,而這將會成為制約人工智能進行檔案服務的障礙之一。
4.3 技術崇拜。人工智能技術的快速發展,使其廣泛應用于各個領域并取得了令人矚目的成就。盡管人工智能提高了工作效率和準確度,但也容易導致人們盲目地推崇技術,產生唯技術論的思想,從而缺乏學習的進取心。在檔案服務工作中,由于人工智能缺少主觀能動性,只能實現簡單、重復的檔案工作,無法真正實現離開檔案工作人員的決策性服務。同時,人工智能在檔案領域的廣泛應用將會導致檔案教育無足輕重的錯誤理念,檔案教育對于檔案服務工作而言至關重要,其能夠啟發檔案開發利用的意識和能力,挖掘檔案服務利用價值,因此人們應當注重檔案服務中人工智能的合理運用。
4.4 信息繭房。按道理來說,人工智能可以促進人們對信息的了解,從而更加全面地獲取信息。但實際上,人工智能恰恰是信息繭房的最大制造者。通過記錄分析用戶的愛好,利用文本生成技術,大量生成和推送用戶喜好的信息,營造出一個用戶感興趣的虛擬世界,讓用戶覺得現實生活就是如此的假象;或者讓用戶認為自身的理解和認知果然是正確的,因為用戶的信息感知僅限于此。在檔案服務工作中,這將導致用戶的愛好不斷地受人工智能有限檔案服務的影響從而鞏固加深,而人工智能并不負責判斷這些信息的準確性,因為這是用戶所喜歡的信息內容。所以從這個方面來講,人工智能在有些時候限制了人們創造力的發展。
4.5 價值引導。某些檔案服務,可能對用戶的價值觀、世界觀認知存在一定的關聯和影響。例如,城市記憶檔案的歷史傳承、紅色檔案的革命精神挖掘、工程工藝檔案的工匠精神洗禮等,都能夠對人們的價值觀產生積極的影響。然而,人工智能無法很好地適用于此類檔案服務工作。同時,盡管技術是無國界的,但技術企業和掌握技術的人是有國界的。在檔案服務過程中,除了正確性因素之外,答案是否有一定的價值傾向引導,值得警惕。