


關鍵詞: 人工智能生成內容;知識;情報服務; 新質生產力;創新
DOI:10.3969 / j.issn.1008-0821.2024.12.001
〔中圖分類號〕G250.2 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2024) 12-0003-12
2023 年9 月, 習近平總書記在黑龍江考察調研期間首次提出“新質生產力” 的概念。2024 年全國兩會期間, “新質生產力” 也成為備受關注的熱詞之一。2024 年政府工作報告提出, 大力推進現代化產業體系建設, 加快發展新質生產力。以人工智能生成內容(Artificial Intelligence Generated Content,簡稱AIGC)為代表的AI 技術賦能新質生產力涌現多維價值意蘊, 可以更好地助力我國數字經濟實現高質量發展, 助推我國知識和情報服務創新。
ChatGPT 的橫空出世引發眾多國內外學者對AIGC 技術的創新應用展開討論。AIGC 技術的研究開始出現在智慧教育[1] 、智慧醫療[2] 、智慧法律[3]和智慧商務[4] 等場景。在信息資源管理領域, AIGC技術可以推動圖書館實現智慧轉型[5] 、科技情報智慧服務[6] 和數字人文相關智慧研究[7] 。AIGC 技術通過知識應答可以影響知識和情報服務模式[8] , 通過創新不斷優化和提高知識和情報服務水平[5], 一些研究基于知識和情報服務的時代特點構建了AIGC技術賦能情報智能服務框架[6] 。由于AIGC 技術具有強大的內容生成能力、簡單的信息交互方式和較低的平臺使用經濟成本, 極大推動了用戶與數字內容交互模式變革, 也對傳統知識與情報服務效率和服務質量提出新的要求[9] 。從國內外現有成果來看,針對AIGC 技術進行知識和情報服務創新的研究相對較少, 更缺乏從新質生產力國家戰略背景進行探討的研究成果, 而AIGC 技術深刻改變了用戶信息接收方式[10] 和行為習慣[11],進而影響了知識與情報服務創新方式。因此, 為促進新質生產力戰略下知識與情報服務的創新發展, 應對知識與情報服務中出現的新型人智共生關系, 亟需結合相關研究分析AIGC 技術賦能知識和情報服務創新過程中的關鍵問題, 這方面開展的綜述性研究相對較少。
在新質生產力戰略下, 以AIGC 為代表的先進技術能夠為傳統的知識和情報服務創新提供強大動力。本文圍繞新質生產力戰略下AIGC賦能知識和情報服務創新, 重點討論以下3 個研究問題: ①在新質生產力戰略下, AIGC 改變傳統的知識和情報服務并促進創新的作用機制是什么? ②AIGC 賦能知識和情報服務過程中會產生哪些新的安全風險,并如何進行更好的治理? ③AIGC 在賦能知識和情報服務創新的實踐路徑是什么? 通過本文的研究,在理論層面梳理新質生產力戰略下AIGC賦能知識和情報服務的創新機制, 豐富新質生產力理論在知識和情報服務創新中的應用,構建新質生產力戰略下知識和情報創新服務的理論體系。在實踐層面,結合典型案例和智能化技術, 識別AIGC技術賦能知識和情報創新服務中面臨的安全風險并提出治理策略, 提供AIGC 技術賦能知識和情報服務創新的實踐路徑, 為信息資源管理學科構建安全、可靠的知識和情報服務提供理論和實踐層面的指導。
1相關概念
1.1人工智能生成內容
人工智能生成內容(AIGC)是一種基于機器學習的人工智能技術, 其旨在使用計算機自主生成逼真和有創意的內容, 如圖像、音頻和視頻等[12] 。與傳統的判別性人工智能技術相比, AIGC 利用最先進的GAI 算法模型, 從隨機噪聲或一組輸入數據中生成新的內容。AIGC 具有學習能力強、數據規模巨大、數據處理高效以及人機智慧融合等顯著特征。目前, AIGC 已廣泛應用于科技情報服務、組織知識創造、藝術設計、企業創新、工業制造等相關領域[13] , 為產業服務創新和新質生產力發展的提質增效賦予新動力。
AIGC可提供自動且高效的信息處理能力, 深刻影響組織知識創造并推動內容生產的范式轉變。AIGC 在信息搜集、獲取[6] 及處理[14] 等關鍵環節提升內容生成的效率和質量, 支持多場景下的服務創新。用戶與AIGC 之間的優勢互補,使內容生產更加高效和高質[15] 。在開源情報領域,ChatGPT能夠幫助服務商更全面和便捷地獲取歷史數據,使情報預處理和分析過程更加智能[6],如圖書館可利用AIGC 技術改進用戶服務,不僅提高了服務質量,還滿足了用戶的個性化需求, 推動閱讀服務模式的創新[16];在設計領域,AIGC技術可幫助設計師整合不同學科知識, 以更好地解決復雜的設計問題。AIGC技術不僅革新了傳統信息處理方式, 還為組織如何高效管理和應用知識提供了智能解決方案。
1.2知識和情報服務
知識經濟和信息技術的快速發展催生出知識服務這一概念, 隨之更具智慧性的情報服務概念應運而生。知識服務是指以信息知識的搜尋、組織、分析、重組的知識和能力為基礎, 根據不同用戶的需求, 為其提供有效支持知識應用和創新的服務[17] 。情報服務則側重于提供更為具體和針對性的情報信息, 幫助用戶克服在搜集和選擇過程中的困難。在人工智能技術的影響下, 知識和情報服務向智慧化演變。AIGC 技術的出現更是滲透到知識和情報服務的關鍵環節, 帶來了新的創新范式。
大數據與人工智能等新技術的廣泛應用, 打破了傳統服務的時空界限,引發了知識和情報服務模式的革新。數智技術的出現實現了服務的去中介化[18],使決策者通過智能分析服務器制定深度個性化解決方案。AI 工具和大語言模型等數智技術使得傳統知識服務能力逐漸成為門檻低且效率高的普惠能力, 并有效緩解因知識、技能、工具和人才等鴻溝導致的發展不平衡問題。用戶主導的信息檢索和知識發現機制也發生了變化, 發展為集信息搜索、獲取、處理及情報信息生成于一體且智能化的新機制, 進而形成人智協同的新型生產關系[19]。因此,新質生產力戰略下AIGC賦能知識和情報服務, 展現出智慧化及人智協同的特征。
1.3新質生產力
新質生產力是以勞動者、勞動對象、勞動資料及其優化組合的躍升為基本內涵, 以全要素生產率大幅提升為核心指標的新型生產力, 特點是創新,關鍵在質優, 本質是先進生產力。新質生產力“新”在4個方面, 即新勞動者如新型人才, 新勞動對象如數據要素, 新勞動資料如AIGC、大模型和數據中心等, 新型生產關系如人機協作關系。“質” 可從兩方面理解, 一是質態, 新質生產力把數據作為驅動經濟運行的新質生產要素, 從而打破傳統生產要素的質態; 二是質效, 新質生產力使得生產工藝、品質大幅提升, 并以新產品驅動新的社會需求[20] 。
數智技術的引入使得傳統的知識與情報服務發生關鍵性轉變, 新型知識與情報服務通過優化生產力三要素的配置組合加速新質生產力發展[21] 。新型服務機制整合了用戶信息搜集、檢索、處理與利用, 使得數據、信息、知識與情報等勞動對象更易于勞動者獲取和應用[19];智慧化的服務機制可實現勞動對象對勞動資料的升級,助力數據要素優化服務大模型[22];人智協同的服務機制則重塑了勞動者與勞動資料之間的關系[23],使得服務需求者與智能體在“請求—反饋” 的迭代交互過程中生成高質量且個性化決策方案。通過上述生產關系改變與技術持續創新過程的循環往復, 促使生產力實現由“量” 到“質”的提升與轉變。
2新質生產力戰略下AIGC 賦能知識和情報服務創新的新機制
2.1以數據要素為基礎
AIGC通過數據要素價值的挖掘與應用, 推動知識和情報服務在更廣泛場景下, 實現科技和產業創新。AIGC賦能知識和情報服務創新過程中需要進行數據的采集、存儲、運算、標注和輸出, 通常需要具有百萬級的參數和復雜的底層架構, 從而擴展數據集在數據分析粒度上的深度和廣度, 形成先進的數據和大規模數據, 借助先進的數據資源和人工智能算法,AIGC能夠顯著提高生產工作效率并降低成本, 為知識生產和情報創新服務賦能。如在法律行業中,AIGC技術能夠從龐大的法律文件和案例數據庫中提取關鍵信息, 通過模式識別和預測分析助力法律專業人士高效準備案件[24] 。百度的Agent Builder智能體開發工具則通過數據循環優化智能體質量, 增強流量和收益[25] 。通過大規模且高質量的數據集, 進一步優化AIGC大語言模型中的算法模型和生成結果, 確保高質量和高效率的內容生成, 有效擴展服務范圍和提升服務質量[26] 。
多源異構的訓練數據能夠實現服務價值創新,并顯著提升新質生產力。先進的數據與大規模數據所構成的多源異構數據, 共同助推知識和情報服務實現高質量生產過程, 從而加速新質生產力科技要素賦能。多元異構的訓練數據有利于AIGC 以更全面和綜合的方式理解和生成信息, 最終實現知識和情報服務更為豐富的任務與應用。如2023 年西湖AIGC 文化論壇上, 無界AI 首次對外發布, 展示了由AIGC 技術重構的《新西湖繁勝全景圖》。通過AIGC 對現代西湖整個景觀地貌以及杭州市地表特色進行多角度描繪, 用新的方式和理念傳承并發展了西湖文化的世界遺產價值[27] 。2024 年世界人工智能大會暨人工智能全球治理高級別會議(WAIC2024)展覽現場, 一款AI 古籍修復模型向公眾展示了利用AIGC 技術進行數字化修復敦煌遺書章節殘缺破損的頁面和文字, 有千年歷史的《漢書·刑法志》節選章節的殘卷在AIGC 輔助下, 首次以完整的姿態展現在了大眾面前, 成為展覽大會的一大亮點[28] 。以數據要素為基礎的知識和情報服務創新機制具體如圖1所示。
2.2以基礎模型為支撐
依托強大的基礎模型,AIGC技術根據不同場景下用戶的不同需求不斷豐富和優化基礎模型, 有效促進了知識和情報服務創新的自主性和適應性。在知識和情報服務轉化過程中, 得益于基礎模型強大的學習能力與自主能力, 數據資源被AIGC技術更為準確且高效地分析為知識, 并構建起知識庫,從而后續不斷轉化為智慧。利用基礎模型的自主性與場景適應性, 進一步推動了技術創新, 為新質生產力的發展注入強大動力。大型語言模型如GPT系列的進步使得用戶與系統之間的交互變得更加自然和高效, 這不僅增強了對用戶查詢意圖的把握,還提升了知識和情報服務的精準度[29] 。如京東零售通過ChatBI基礎模型, 能夠靈活應對各種數據分析需求, 提高決策質量, 并將分析過程中的知識沉淀到知識庫中, 為業務人員提供持續支持[30] 。醫療大語言模型利用語義解析和關鍵詞提取技術, 能有效匹配用戶問題與模型場景, 若問題不匹配, 模型會通過意圖識別技術自動更新, 以確保場景與用戶需求一致, 展示知識和情報服務的高度適應性和自主性[31] 。中國一汽利用阿里云通義千問大模型,通過智能提問獲取數據結果和圖表。新京報運用NLP、機器學習和云計算技術構建的“融媒體報題系統”, 在新聞采編中實現自主性, 顯著提升了工作效率和稿件質量[32] 。
持續優化的基礎模型使AIGC技術實現了不斷的迭代更新。隨著人工智能模型規模和復雜度的不斷提升, 知識和情報分析生產能力進一步實現了技術躍遷。這些模型能夠深入加工和重組數據, 并注入系統智慧, 極大提升了知識和情報服務的智能水平。同方知網通過知識增強大模型響應機構的信息檢索需求, 提供智能知識組織和導航體系, 機構的細分服務需求又進一步推動知網技術的創新和優化[33] 。混元大模型作為騰訊云MAAS服務的底座,支持用戶自定義應用, 展示技術在不同場景中的靈活適應能力[34] 。這些持續的技術進步和優化, 不僅有效響應了用戶需求的變化, 還為知識和情報服務的創新發展提供了強有力的技術支撐, 推動各領域生產力進一步提升。以基礎模型為支撐的知識和情報服務創新機制, 如圖2 所示。
2.3以人智協作為核心
AIGC 將可能成為超越人類的先進勞動力, 這將引發新型的人機關系。目前, AIGC 技術的最新發展已具備模仿人類語言和情感的能力, 包括基于語言的邏輯表達與情感表達。人機關系也因此發生變化, 顯著體現在人與AI 團隊角色的轉變。現有人機關系已逐步擺脫人指示AI 的合作關系, 逐漸形成人指導AI, 并逐步使AI 成為具有合作自主性的人智協作關系。AI 更多地作為隊友身份, 而非輔助工具參與到團隊創新工作中。人智協作使得信息被更有效且合理地整合, 快速轉化為有益于團隊決策的知識與情報, 該機制有效提升了知識和情報服務效率與服務質量。如利歐數字LEO AIAD 平臺推出的AI Partner功能, 其基于AI Agent框架讓用戶通過自然語言與AI智能體進行深度和高頻交流,在提高服務響應速度的同時增強交流的準確性[35] 。同時, 多模態模型與具身模型應用, 賦予智能機器規劃和自適應交互能力, 使其能在復雜環境中操作工具執行任務。OpenAI 推出的GPT-4o 更是將人與機器的自然交互水平推向新高度, 展現出新的人智協作水平, 能在多人對話場景中實時理解人類的語音、姿態、情緒和意圖, 具備一定認知人類社會的能力[36] 。在此影響下, 人類的知識和情報生產方式發生重大轉變, 生產關系也逐漸從“人機交互” 演變為“人智協作”。
人智協作的生產關系加速了信息傳遞并降低內容生產的邊際成本, 為知識和情報產品與服務的高質量發展提供保障, 推動新質生產力的形成。Chat?GPT 通過代碼生成、文獻資料閱讀以及與人類協作, 大大加速了信息的傳遞, 顯著降低了人工服務成本, 使得內容生成更為高質、高效。如字節跳動中的Coze 平臺, 多個AI Agent通過任務分工和深度討論,能夠產生優于單一智能體的解決方案, 為企業決策注入智慧。知網的AI 智能寫作助手通過用戶與AI的協同編輯, 提升知識和情報服務質量[37],擴大該平臺在這一領域的吸引力和推廣性。以人智協作為核心的知識和情報服務創新機制具體如圖3所示。
2.4創新機制關系模型
上述分析表明, AIGC 技術逐漸成為知識和情報服務創新中形成新質生產力的核心力量。在新質生產力戰略下, 數據要素這一新型勞動對象成為知識和情報服務創新的基礎, 確保信息資源的廣泛性和精確性; 基礎模型作為新型勞動資料, 則提供必要的技術支撐, 加強知識和情報服務的數據分析和處理能力; 人智協作的新型勞動者關系作為核心機制, 通過人工與智能系統的互動優化創新流程。這三者相輔相成, 共同推動知識和服務創新的深化與拓展, 其作用機制關系如圖4所示。規模定律(Scal?ing Law)指出, 數據質量對于提升模型性能極為重要, 多元異構的訓練數據也被證實是提升AIGC 應對“未知” 服務場景能力的關鍵[38] 。在新型勞動者層面,AIGC 技術正在重塑勞動力的概念和生產力的結構, 數字與機器員工成為新型勞動者,其在可用性、可靠性與適應性方面都顯示出超越傳統人類勞動者的特性[39] 。人類勞動者與新型勞動者的技能互補,實現服務質量與效率的雙重提升。在新型勞動資料層面, 基礎模型即大模型采用新范式,通過預訓練適應不同的服務需求, 為知識和情報創新服務的多樣化應用提供關鍵技術基礎設施。
3新質生產力戰略下AIGC賦能知識和情報服務創新的風險
3.1數據隱私安全風險
AIGC賦能知識和情報服務創新過程中面臨嚴峻的數據隱私安全風險。多源多模態數據是大語言模型的重要訓練數據集, 數據資源的數量和豐富性顯著影響AIGC技術提供知識和情報服務的質量[13] 。多源數據資源中包括服務對象的敏感數據,在AIGC賦能知識和情報服務過程中, 對用戶隱私數據的不當使用, 輕視用戶隱私數據的保護機制建設,以及缺乏對大語言模型訓練透明度的控制, 會增加數據隱私泄露, 帶來數據安全風險, 影響潛在用戶選擇AIGC。ChatGPT上線以來, 相關的數據泄露事件時有發生, 如2023年OpenAI的首席執行官Sam Alt?man公開承認開源庫中出現錯誤, 導致部分用戶與ChatGPT 的聊天記錄被泄露[40] 。幾日后, 三星設備解決方案部門在使用ChatGPT 的20 天內發生了3 起數據泄漏事故, 涉及半導體設備測量、良品率/缺陷、內部會議內容等重要信息被上傳到ChatGPT的服務器中[41] 。2024年,微軟系統內置的AI 助手Copilot 被曝存在多個安全漏洞, 攻擊者可通過這些漏洞竊取企業敏感數據, 甚至利用Copilot 作為強大的釣魚攻擊工具。AIGC 技術相關的數據泄露事件報道引發用戶對AIGC 賦能的知識和情報服務數據隱私安全風險的擔憂。
大語言模型的無意錯誤和黑客的外部攻擊會導致訓練數據集泄露用戶隱私數據。如在醫學生物領域, 訓練數據集中包含患者的敏感數據和個人的健康信息等[42] 。由于大語言模型缺乏透明性和可解釋性, 在模型運行的過程中, 會出現訓練數據集中未被匿名化處理的信息出現在用戶交互界面的情況,這不僅損害被泄露者的利益, 也引發用戶對個人信息保護的擔憂。在企業管理領域, 訓練數據集包含企業核心技術和企業資產管理記錄等[43] , 除了AIGC技術開發公司自主準備的訓練數據集外, 為了獲得更加精準和有效的回答, AIGC 技術使用者會上傳個人或企業情況, AIGC技術開發公司使用、處理和保存這些信息過程中也存在數據隱私泄露和濫用風險[44] 。
3.2網絡空間安全風險
AIGC賦能知識和情報服務創新過程中面臨嚴峻的網絡空間安全風險。AIGC 的類人屬性和高效高能的優勢, 使人類對AIGC 賦能知識和情報服務創新產生信任, 并大幅提高用戶使用意向, 但也會有部分群體利用AIGC 技術生成虛假信息進行深度偽造, 帶來新的網絡空間安全風險。2023 年, 澳大利亞赫本郡市長指控ChatGPT 對其進行誹謗,因為ChatGPT 在回答問題時錯誤地聲稱他是賄賂丑聞的有罪方, 實際上他是檢舉方的重要證人[45] 。同年, 為獲取流量和吸引眼球, 有人利用ChatGPT生成不實信息并在社交媒體上發布杜撰的“鄭州雞排店驚現血案”, 這則虛假信息在網絡上引發大量關注, 嚴重擾亂網絡空間的正常秩序[46] 。
利用AIGC 進行虛假信息生成和深度偽造后,會導致用戶接收不實信息和擾亂用戶認知, 嚴重威脅網絡空間安全。大語言模型產生幻覺的根源是多樣化的, 包括訓練數據集的錯誤、有偏差的對齊數據和模型不準確的自我評估。惡性社交機器人是AIGC 時代虛假信息傳播的典型載體, 社交機器人通過轉發、評論、點贊行為和社交媒體用戶產生聯系, 影響公眾的情感、觀點和認知[47] 。AIGC 強大的內容生成能力使網絡空間中的虛假信息在數量、質量、內容類型和傳播速度上有極高的提升空間,增加公眾識別虛假信息的難度[48] , 特別是深度偽造視頻, 在電信詐騙和政治操縱方面對公眾的生活也帶來一定的影響[49] 。
3.3科技倫理安全風險
AIGC賦能知識和情報服務創新的過程中面臨嚴峻的科技倫理安全風險。AIGC 倫理問題包括社會公平與權利、對勞動力的影響、潛在的心理問題和道德決策等。2024 年, 北京互聯網法院發布服務保障新質生產力十大典型案例, 其中包括全國首例音頻AIGC 人格權侵權案[50] , 在音頻AIGC 人格權侵權案中, 配音師意外發現自己的聲音被AI 化后形成音頻類AIGC, 并被用于牟利, 法院對案件進行一審宣判, 認定被告方使用原告聲音, AI 文本轉語音產品未獲得合法授權。AIGC 在科學寫作、教育、醫學和社會工作等方面的科技倫理問題被廣泛研究, 其中科學寫作被重點關注[51] 。
結合知識和情報服務的場景, 認識問題和解決問題是回應AIGC驅動知識和情報服務創新引發科技倫理安全風險的最佳手段。對AIGC 的倫理展開有不同的視角, 包括從專家和公眾角度, 還有基于理論模型框架展開的研究。從專家角度, 43位專家就ChatGPT 是否重要和ChatGPT 的好壞展開激烈討論[4] ; 從公眾角度, 采集社交媒體平臺中公眾對ChatGPT 的討論并分析公眾對ChatGPT 的倫理問題觀點[52] ; 從理論模型角度, 結合前瞻性技術倫理、影響評估以及新興信息通信技術應用的倫理框架所確定的倫理問題, 對AI 特有的倫理問題進行綜述[53] 。
3.4風險問題治理對策
針對AIGC 存在的數據隱私安全風險問題, 本文從技術、制度、人工干預、用戶算法素質教育方面提出解決對策。在技術層面, 在信息存儲、傳輸的過程中引入區塊鏈等技術對用戶歷史數據、知識和情報服務產品加強信息安全保護[54] , 對敏感數據進行脫敏處理后再對模型進行訓練, 積極對大語言模型進行測試迭代, 邀請外部專業機構檢測和維護模型漏洞; 在制度建設層面, 明確提供AIGC 驅動的知識和情報服務機構能夠保存和使用用戶數據的類型及有效時間, 監督機構落實數據隱私保護工作, 維護用戶的合法權益; 在人工干預層面, 確保知識和情報服務產品的質量和準確性; 在用戶算法素質教育層面, 豐富用戶有關AIGC 驅動下的算法知識, 避免用戶形成數字鴻溝[55] , 引導用戶批判性地使用AIGC 產品, 減少敏感數據的輸入, 降低個人信息泄露風險。
針對AIGC給網絡空間帶來的安全風險問題, 從模型訓練、信息質量監控、虛假信息治理體系和職業培訓方面進行解決。在模型訓練層面, 數據集的質量和更新速度非常重要, 要以模型的準確性為核心, 逐步提高模型廣度; 在信息質量監控層面, 防止大模型生成的虛假信息向用戶傳播, 并承擔內容審核責任; 在虛假信息治理體系層面, 建立惡意機器人的識別模型和虛假信息監管機制, 對惡意使用AIGC 提供錯誤和虛假信息的用戶進行嚴肅處理[56] ,健全AIGC 驅動知識和情報服務創新的管理體系;在職業培訓層面, 定期組織知識和情報服務工作者學習AIGC 技術有關風險, 引導工作者以批判性的眼光和審慎的態度, 與AIGC 協同完成知識和情報服務[4] 。
針對AIGC 賦能科技倫理安全風險問題, 可從管理者、運營者和使用者3 個角度提出解決對策。管理者方面, AIGC 賦能知識和情報服務創新過程中應借鑒國內外AIGC 賦能其他領域的優秀經驗,在國家政策指導下[57] 完善相關產業、行業和組織管理制度, 做好AIGC 賦能知識和情報服務創新的頂層設計。運營者方面, 面對著作權、法律責任歸屬和算法偏見問題, 應主動向專業法律團隊和高新技術公司開展協作, 參考AIGC 侵權典型案例制定相應預警方案, 規范處理流程。使用者方面, 應提高自身信息素養, 明確AIGC 賦能知識和情報服務產品優缺點, 根據自身需求選擇是否接受AIGC 參與提供的產品[58] 。
4新質生產力戰略下AIGC賦能知識和情報服務創新的實踐路徑
4.1基于新勞動對象實現AIGC下知識與情報服務新模式
數據要素是擴展AIGC 技術服務能力的基礎,是新質生產力發展的重要驅動力。基于數據要素構建AIGC的知識與情報服務新模式, 正是新質生產力戰略下AIGC賦能知識和情報服務創新的重要實踐路徑。通過數據驅動的知識創造、模型開發以及知識更新與維護, 可以打造智能化、精準化的知識與情報服務新模式, 滿足用戶對高質量和個性化信息資源服務的需求。
第一, 數據驅動的知識創造是構建新模式的前提。AIGC 環境下, 用戶渴望獲得高質量、強個性化的信息資源, 以及其面臨問題的解決方案。以個性化新聞推送為例, “新聞內容+數據化精確制導”的生產方式, 正是數據要素驅動的新模式體現。這種模式能激活傳統資源和價值, 實現“以用戶為中心” 的地位轉變。跟蹤用戶所處環境變化也是推動有效知識創造的關鍵。在AIGC輔助下還可得到更多的用戶特征, 從而提供更精準的內容服務[13] 。Wolfram Alpha 知識服務平臺結合ChatGPT, 整合多領域高質量數據源進行分析和知識推理, 為用戶制作出“真正原創” 的內容, 這正是數據要素驅動下AIGC 知識創造能力的體現, 可實現特定事件的預測分析和復雜概念的解釋說明等, 實現個性化和多樣化的知識創造過程[59] 。
第二, 數據驅動的大模型是智能化服務的核心。利用數據要素構建領域知識圖譜和知識庫, 可為AIGC 提供結構化知識支撐并提升模型推理和知識生成能力。通過數據標注、參數調整[60] 等手段,可持續不斷地優化大語言模型性能, 提升知識檢索、內容生成和智能推薦等功能的準確性和效率, 并利用AIGC 對話式問答交互優勢實現用戶與知識庫的自然語言交互, 得到符合用戶請求的知識輸出。如金融巨頭彭博開發的BloombergGPT, 擁有迄今為止規模最大的金融數據集FinPile, 其由3 630億個Token 的金融領域數據集以及3 450億個Token 的通用數據構成。通過該數據集的訓練, 模型改進了金融的NLP任務, 如情感分析、命名實體識別等[61] 。現在BloombergGPT已在通用任務和金融領域任務中表現出更好的綜合性能, 有效提高了領域人員的工作效率。
第三, 數據驅動的知識更新與維護是保障服務質量的動力。設計知識更新機制, 利用AIGC 技術自動抓取、分析和整合最新數據與信息, 及時更新知識庫和AIGC 模型, 以確保知識和情報的時效性與準確性。定期對知識庫和AIGC 模型進行維護和升級, 對過時的知識進行刪除與修改, 或對模型參數進行調整等, 保障知識和情報服務知識的有效性。如維基百科通過志愿者編輯和機器人程序, 不斷更新和維護百科詞條內容, 以確保信息的時效性和準確性。今日頭條利用AIGC 技術實時抓取和分析新聞數據, 自動生成新聞摘要和關鍵詞標簽, 幫助用戶快速了解最新資訊。AIGC 技術還可用于知識庫的自動更新和維護, 為AIGC 技術基于數據要素賦能知識和情報服務創新提供保障。
4.2基于新勞動者組建AIGC下人智協同創新團隊
AIGC賦能的關鍵在于構建以人為中心和以AI為輔助的知識服務創新團隊, 從而實現效率和質量的雙重提升。將AIGC視為新型勞動力, 使其從“賦能者” 提升為“協作者”, 成為新質生產力背景下生產關系變化新趨勢。構建人智高度協同的人機關系, 強化人工智能與人類之間的溝通協作, 是AIGC 賦能知識和情報服務創新的新機遇。
第一, 人智協同團隊的核心是建立持續且雙向的反饋[62] 。人智協同團隊中的雙向反饋策略可分為“AI 輔助解決任務” “用AI 來學習和掌握AI”和“多AI 智能體協作” 3 種形式。“AI 輔助解決任務” 可理解為“人智協作, 即AIGC 增強人類能力”, 更加突出AIGC 在人智協作中的作用, 以及其對人類能力的增強作用; “用AI 來學習和掌握AI”可理解為“人智共生, 即AIGC 促進人類學習”,相比于人智協作更加突出AIGC 對人類學習的促進作用, 以及人類和機器智能實現共同學習、成長的關系。對于“多AI 智能體協作” 組織方式, 其基礎設施還不成熟和完備, 目前還難以稱為“人智協同”。基于此, AIGC 下人智協同的創新團隊組建可先從“人智協作” 與“人智共生” 兩個維度來實現。
第二, AIGC 通過人智協同創新團隊賦能知識和情報服務創新。“人智協作” 是指利用AIGC 工具自動化完成特定任務, 如數據分析、內容生成和代碼編寫等, 將人類從繁瑣重復的勞動中解放出來[63] , 使其專注于更具創造性和戰略性的工作。如GitHub Copilot Labs 可以根據開發者輸入的代碼片段, 自動補全代碼, 提供代碼建議, 極大地提高了開發效率; Slack 則可以利用AI 技術幫助團隊成員快速組織和共享團隊信息, 加速信息獲取和知識生成, 提高團隊協作效率; 研究者還可利用Elicit等AI 工具進行領域掃描, 快速地從大量文獻中篩選出最相關的幾篇論文進行綜合歸納, 從而提高科學研究的效率。
第三, AIGC 成為人智協同中重要的生產力。“人智共生” 是指利用AIGC 工具幫助用戶快速學習和掌握AIGC 技術, 打破“智能鴻溝”, 促進知識普惠[64] 。如Perplexity AI 可作為一個強大工具幫助用戶快速獲取特定AIGC 技術或應用的綜合信息。用戶只需提出問題, 就能得到來自網絡的各類相關信息, 為用戶提供全面的信息摘要, 幫助用戶迅速獲取到準確且全面的信息。AIGC 驅動下的知識和情報服務創新, 將加速知識創造、傳播和應用的過程, 推動各行業發展, 助力我國經濟社會各領域實現高質量發展。
4.3基于新勞動資料開發可靠可信的AIGC大模型
可靠與可信的AIGC大模型是基于新勞動資料賦能知識和情報服務創新的關鍵路徑。為提升AIGC技術的可靠性和可信度, 需要合規合理地利用用戶數據[43],以減輕用戶對隱私泄露的擔憂。
第一, 從用戶服務需求端開發具有面向用戶的提示詞工程的AIGC 模型能更好地獲得用戶信任。使用戶能夠更便捷地表達需求, 并獲得更精準的回應, 增強用戶對AIGC 大模型的使用頻率。如OpenAI明確告訴ChatGPT用戶, 只會收集用戶輸入的文本內容用于改進模型, 不會利用和出售用戶的個人信息或其他敏感數據[65] 。在服務交互過程中,增加AIGC工具的擬人性,如情感類人性和思維自主性等, 以降低用戶對AIGC 技術的警惕性, 提高用戶對AIGC的信任程度[66] 。如可汗學院推出的AI助教Khanmigo,通過交互式問答和個性化輔導等功能,將教學工作與AIGC 技術有效整合, 并憑借GPT 大模型良好聲譽獲得了學生的信任和認可,有效提升了學習效率[67] 。
第二,AIGC技術的可靠性和可信度需要客觀的評價體系作為支撐。如清華大學等機構研制的SuperBench 大模型綜合能力評測框架, 該框架包含了語義、代碼、對齊、智能體和安全5 個評測大類與28 個子類, 通過對模型語義理解能力、代碼能力、人類意圖對齊度、智能體能力與安全性等多個維度進行評估, 為用戶選擇可靠可信的AIGC 模型提供了權威參考。有學者還從AI 作為信息源、交互方式、社會行動者和用戶算法隱喻4 個方面建構人機交互體驗中AIGC 可信度評價研究框架, 為模型評估提供理論支持[62] 。一些國際組織和研究機構積極推動AIGC 技術評估標準, 旨在評估基礎模型在不同應用場景中可能帶來的風險, 并提出相應的緩解措施。
第三,數據安全是影響用戶對AIGC 技術信任度的重要因素。研究發現,數據安全仍是用戶不太信任和認可AIGC 技術與模型的原因[68] 。因此,必須建立強大的數據保護機制, 如采用數據加密和訪問控制等技術手段, 保障用戶隱私數據和模型參數數據的安全。另外,AIGC技術開發者應充分考慮文化背景、用戶責任歸因與用戶動機[69] 等因素,明確用戶隱私邊界, 在提供高質量知識和情報服務的同時, 保障用戶數據安全, 提高用戶對AIGC技術的信賴。
5結語
在新質生產力戰略下,AIGC作為知識和情報場景服務智慧化轉型創新的驅動力, 是科技創新實現高質量發展與培育新質生產力的核心力量。本文深入剖析AIGC賦能知識和情報服務創新中的新機制、新風險和新路徑, 回答了AIGC為什么可以賦能知識和情報服務創新、AIGC賦能知識和情報服務創新需要注意哪些事項, 以及如何實現AIGC賦能知識和情報服務創新3 個關鍵問題。本文從理論和實踐的雙重角度, 指明數智時代知識和情報服務的新方向, 有助于信息資源管理學科的學者聯合產業界更好地實現AIGC 賦能知識和情報服務創新,進而加速信息資源管理學科在新質生產力戰略下更好地體現學科價值和作用。
對AIGC 賦能知識和情報服務創新的內在機制展開后研究發現: 第一,數據要素是AIGC 賦能知識和情報服務創新的基礎, 對高質量、多模態的數據進行智能化的挖掘和知識發現能夠提高知識和情報服務的創新能力; 第二, 基礎模型是AIGC賦能知識和情報服務創新的支撐, 基礎模型快速學習領域知識, 不斷迭代和優化, 促進知識和情報服務創新的適應性和自主性; 第三, 人智協作是AIGC 賦能知識和情報服務創新的核心,人智協作這種新的生產關系加速信息傳遞并降低內容生產邊際成本,提高知識和情報服務的效率與質量。
對AIGC賦能知識和情報服務創新的風險分析研究發現: 第一,知識和情報服務的信息源包括用戶需求和歷史服務產品, 模型訓練集的高價值性和模型的脆弱性會增加AIGC賦能知識和情報服務創新中數據泄露風險; 第二, 知識和情報服務的信道是信息傳播的路徑, AIGC會促進虛假信息的生成,虛假信息在知識和情報服務的信道中傳播, 會對網絡空間生態治理帶來新的風險和治理難度; 第三,知識和情報服務的信息受體是用戶, AIGC驅動的知識和情報服務會面臨新的科技倫理安全風險。
對AIGC賦能知識和情報服務創新的實踐路徑分析研究發現: 第一,通過數據驅動的知識創造、模型開發以及知識更新與維護, 可實現智能化、精準化的知識與情報服務新模式, 滿足用戶對高質量、個性化信息資源服務需求; 第二, 構建以人為中心、AI為輔助的知識服務創新團隊, 可實現知識和情報服務效率、質量的雙重提升; 第三, 開發可靠與可信的AIGC技術和模型, 建立AIGC 賦能知識和情報服務的評價體系, 重視AIGC賦能知識和情報服務的數據安全, 可全方位促進AIGC賦能知識和情報服務創新。