【摘要】生成式AI與教育出版領域的融合發展已經是必然趨勢,兩者互為支撐、協同并進。生成式AI雖然為教育出版在AI時代的深融創新提供了諸多機遇,但也帶來技術本體危害、行業發展危機等問題。教育出版機構應通過新興技術的驅動與賦能,探索融合運用生成式AI的發展路徑:革新理念,立足時代趨勢推進技術融合新實踐;明確標準,建立科學規范強化行業融合實效;聯合共贏,通過跨界協作打造出版融合新生態,加速實現教育信息化甚至是智慧教育目標。
【關? 鍵? 詞】生成式AI;教育出版;融合;智慧教育
【作者信息】楊凡,人民教育出版社。
【中圖分類號】G230.7【文獻標識碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2023.16.005
近年來,AI技術發展迅速,并在《新一代人工智能發展規劃》《新一代人工智能治理原則——發展負責任的人工智能》《促進新一代人工智能產業發展三年行動計劃(2018—2020年)》等相關政策下向社會多個行業領域滲透,甚至成為產業變革和行業轉型升級的核心力量。在出版領域,基于AI技術賦能的智能出版或智慧出版已經是行業發展的重要方向之一,包括但不限于大數據選題規劃、機器內容生產、智能編審校對以及個性化智能服務等。其中,以江蘇鳳凰出版傳媒股份有限公司、中國科技出版傳媒股份有限公司、浙江出版傳媒股份有限公司、中信出版集團等為代表的業界機構已先后開啟“AI+教育+出版”的發展創新之旅,旨在利用AI技術的核心優勢重塑出版業態,為自身乃至行業的深融創新提供源源不斷的動能。
生成式AI與教育出版領域的融合發展已經是必然趨勢,兩者互為支撐、協同并進。一方面,生成式AI的應用為解決傳統教育出版領域的技術短板提供了更多可能,成為AI時代行業轉型升級與高質量發展的重要動力;另一方面,教育出版為生成式AI的創新應用提供了更多場景空間,是技術造福社會的直觀體現。當然,生成式AI雖然為教育出版在AI時代的深融創新提供諸多機遇,但也帶來挑戰。正因如此,在精準把握機遇的同時科學規避挑戰,無疑是教育出版融合生成式AI的首要問題。
一、教育出版融合生成式AI的機遇
1.國家重要政策引領
國家重要政策的出臺,為AI時代教育出版融合運用生成式AI提供了引領與支持。早在2018年4月,教育部印發《教育信息化2.0行動計劃》,要求以人工智能等新興技術為基礎,依托各類智能設備及網絡,積極開展智慧教育創新研究和示范,推動新技術支持下教育的模式變革和生態重構。教育出版橫跨教育和出版兩大行業,只有順應政策引領,加快對生成式AI的融合應用,以此賦能自身創新發展,才能為教育信息化和智慧化建設貢獻力量。隨后,教育部針對教育信息化和“互聯網+”教育陸續發布多個重要文件。2021年12月,國家新聞出版署印發《出版業“十四五”時期發展規劃》,要求突出科技創新在實現深度融合發展中的重要作用,大力推動5G、大數據、云計算、人工智能、區塊鏈、物聯網、虛擬現實和增強現實等技術在出版領域的應用。在此背景下,作為行業重要組成部分的教育出版,自然要順應趨勢,加快對生成式AI的融合運用。2023年7月,國家網信辦聯合國家發展改革委、教育部、科技部、工業和信息化部、公安部以及廣電總局聯合發布《生成式人工智能服務管理暫行辦法》,并明確自2023年8月15日起施行,這不僅對教育出版融合利用生成式AI提供了引領和支持,也對行業規范技術應用場景和用戶安全保護起到積極有效的作用。
2.教育產品迭代驅動
教育產品的迭代驅動,是教育出版融合生成式AI的重要動力。近年來,“互聯網+教育”、在線教育等發展趨勢日益鮮明。相對于傳統教材和教輔產品,人們更傾向于數字教材教輔產品或在線教育平臺。在此背景下,教育出版進入發展新階段,以AI技術為發展核心的著力點逐漸確立,旨在打造出更具迭代性、場景化、智能化的教育產品,加速自身的轉型升級。目前,無論是培生集團等國外出版商,還是人民教育出版社等國內教育出版機構,都在加速布局智能教材。人民教育出版社于2016年率先開啟二代數字教材開發之旅,又于2018年發布第三代教材。該教材主要利用互聯網、AI、數字媒體、大數據等技術,創造性實現人機交互目標,為信息化教育和個性化學習提供有效解決方案。從這個角度看,從紙質教材教輔產品到數字教材教輔產品,再到智能教材教輔產品的迭代升級,是教育出版的核心發展規律,而以AI為代表的新興技術,則是實現教育出版產品迭代升級目標的重要驅動力。
3.用戶市場需求刺激
龐大的用戶市場需求,為教育出版融合生成式AI提供了利好機遇。近幾年,我國圖書零售市場較為低迷,2022年累計碼洋871億元,同比減少11.8%,低于2018年同期水平。然而,教輔類碼洋比重則不降反升,占到全年的16.63%,達到140億元。另有數據預測,2023年在線教輔市場規模將超千億元大關。其中,數字教材、智能教輔等教育出版產品備受用戶市場青睞,這也導致大量在線教育企業紛紛入局,與傳統教育出版機構形成了激烈競爭態勢。相關數據顯示,僅2020年,我國新增在線教育企業9.4萬家,新增占比達到16%。在此背景下,傳統教育出版機構要想加快布局教育出版賽道,必然要基于龐大的用戶市場需求,利用新興技術打造契合度高、服務成效好的數字教育產品甚至智能教育產品,這對教育出版融合AI等新興技術起到了促進作用。
如人民教育出版社聯手中教云推出數字化教輔產品——智能教輔APP,該產品以社內專業優質資源為主體,以AI學習場景為依托,目前市場規模已達百萬量級。不僅如此,目前已有多家教育出版機構先后與科大訊飛、華為、方正電子等企業攜手開發百余種數字教材或智能教輔產品。隨著AI時代的到來,生成式AI有望成為教育出版乃至在線教育、智能教育領域的下一個技術風口,其強大的性能優勢和潛在用戶需求,必然會助力教育出版“再上一層樓”,加速實現智慧教育出版目標。
二、教育出版融合生成式AI面臨的挑戰
1.技術本體危害
當前,生成式AI還處于優化完善階段,其與教育出版的融合極可能因為技術本體的不確定性而產生諸多現實問題。
其一,生成式AI的專業性和創造力仍有限,引入教育出版領域很可能生成并傳播錯誤甚至有害的“知識”,這與教育出版的專業性背離。作為一個預訓練語言模型系統,生成式AI可能因為算法和語庫的偏差導致錯誤或缺乏事實來源內容的大肆傳播,甚至由此產生有害信息,從而對教育出版導向和教育目標追求產生負面影響。
其二,目前可供中文語境下使用的生成式AI水平有待提升,缺乏預訓練大規模語言模型,極易導致教育出版在技術融合過程中出現不可控風險,如用戶隱私泄露等。
2.行業發展危機
教育出版融合生成式AI可能造成行業發展危機。
一是融合技術的成本和要求較高,且短期內無法預見成效收益,這對行業機構是一項風險投資。生成式AI與各行各業融合發展的前提是高昂的人力、物力、財力成本。國盛證券曾估算,ChatGPT-3訓練的成本約140萬美元,而對于一些更大的LLM模型,其訓練成本介于200萬美元至1200萬美元之間。此外,生成式AI的通用模型構建、數據收集與分析、算法設計與運行等方面都離不開專業人才資源的支持。從這個角度來看,教育出版融合生成式AI首先需要投入大量資金和培養專業人才,這對普通出版機構尤其是中小型出版社無疑是一個現實挑戰。
二是教育出版融合生成式AI技術,需要廣泛爬取海量數據用于構建行業專業訓練模型。它們雖能自動生成有價值的內容,卻也可能引發內容侵權危機,危及行業健康生態。例如,通過生成式AI獲取的內容數據來源復雜且體量龐大,可能在教育出版過程中造成版權侵權等知識產權問題。此外,生成式AI介入教育出版全流程,可能造成大幅變動,與現有運行和管理機制產生矛盾。
三、教育出版融合生成式AI的優勢
教育、出版及技術本就是深度互嵌的關系。尤其在高質量發展的新階段,加快教育出版與AI等新興技術的深度融合與創新發展,已然是出版業乃至所有內容行業重要的轉型之路。在以生成式AI為代表的時代浪潮下,教育出版既要抓住新一輪發展機遇,也要采取合理策略有效規避危機挑戰。其中,厘清自身特殊優勢,構建一條技術融合可行路徑無疑是首要任務。
1.專業資源優勢
如果說技術是教育出版的短板,那么專業資源則是教育出版的主要優勢。目前已知的是,倘若缺乏大規模數據資源的飼喂和訓練,再好的強化算法技術也無法催生ChatGPT、Midjourney、DALL-E2等生成式AI。換句話說,海量數據資源是生成式AI應用于各行業的前提、基礎和底座。從這個角度看,教育出版機構積累至今的專業內容資源,無疑成為其融合生成式AI的核心優勢。教育出版機構若對自身發展史上的每一本書、每一位作者、每一位用戶進行數據化處理,從而獲得體量豐富的內容數據、用戶數據、交互數據,并以此作為融合生成式AI的基礎,加速構建出版大規模語言預訓練模型。不僅如此,現階段的教育出版業在數字化發展過程中已經有了一定基礎,如人民教育出版社的“數字資源管理平臺”、陜西人民教育出版社的“教育出版數字資源庫與電子書包”、北京交通大學出版社的“M+Book移動學習平臺”等各種專業內容數據庫和知識服務平臺等,能為生成式AI的技術落地實踐提供支撐。
隨著出版深度融合進程加速,教育出版機構的跨界合作趨勢日益明顯,通過數據交換、技術互補等手段可不斷擴充教育出版垂直領域的數據規模,為生成式AI的落地應用和教育出版領域的專業預訓練語言大模型建設提供便利,同時以“多方共贏”機制降低自身投資風險,為教育出版乃至整個出版業的生態體系建設保駕護航。
2.既有經驗優勢
目前,教育出版乃至整個出版業對AI技術的融合應用不斷涌現,這為其自身加速融合生成式AI提供了經驗。例如,人民教育出版社目前已初步結合AI技術打造第三代數字教材;湖南教育出版社依托人工智能、大數據等先進技術開發了綜合素質評價、智能測評云等產品;山東教育出版社正在建設的“分成自適應和教學測評云平臺”,也是通過大數據、AI等技術賦能,以期為教育市場提供精準、個性、多元的智能產品及服務。上述案例表明,現階段的教育出版機構在AI技術的實踐應用方面已經積累了一定經驗,這對生成式AI在教育出版領域的融合應用起到參考作用。
自ChatGPT出現后,國內外出版機構開啟生成式AI的融合創新之旅。除Snowfox Books和浙江文藝出版社外,中信出版集團也于2023年4月對外宣布,將以建立智慧閱讀新生態為目標,積極探索出版新模式,并設立“平行出版實驗室”,啟動“AIGC數智化出版項目”,加速生成式AI在出版全流程的應用。可見,出版機構創新利用或著眼布局生成式AI賽道,對教育出版領域的技術引進和深融創新具有引領示范作用。
四、教育出版融合生成式AI的可行路徑
1.革新理念,立足時代趨勢推進技術融合新實踐
隨著生成式AI的快速滲透和大規模普及,過去人與機器二元對立的替代思維正逐漸轉變為人機協同的共生思維,各行各業逐漸邁入人機協同的AI時代。參考以往互聯網、智能手機誕生和發展的過程,未來短時間內集中誕生更多生成式AI應用將是毋庸置疑的。正因如此,教育出版不能忽視或逃避新技術的發展前景,只有從理念層面徹底接受這種顛覆性技術帶來的更多可能,才能以理論指導實踐,成功實現自身轉型升級和高質量發展。
一方面,國家相關部門及行業組織應革新思維,厘清生成式AI作為未來行業發展基座的作用,并在此基礎上鼓勵教育出版機構主動擁抱新技術,不斷探索和優化實踐應用場景,在新的時代發展趨勢下重塑行業技術生態格局。具體來看,國家新聞出版署、教育部等部門應充分把握AI時代發展趨勢,貫徹落實《生成式人工智能服務管理暫行辦法》,明確鼓勵教育出版機構創新融合生成式AI,必要時提供資金、技術等支持,幫助出版機構更好落實政策要求。
另一方面,教育出版機構從業人員要樹立人機協同新思維。針對行業垂直領域的場景業務需求和內容生產工作加大技術培訓力度,幫助他們充分認知生成式AI的功能作用和風險挑戰,使他們在具體崗位上既能合理利用新技術,又能自主擺脫技術依賴,防止技術沉淪導致的內容偏失、價值觀異化和創新思考力消解等問題,在技術賦能的基礎上持續為用戶提供積極健康、向上向善的優質內容。
此外,學校等教育機構也要注重對用戶思維的重塑與優化。例如,學校在引進生成式AI教育出版產品及服務的同時,要加大對教師、學生等用戶主體的科學引導,讓他們既掌握智慧教育與學習產品的使用技能,又能不斷規范和提升自身的數字素養水平,在保障教育公平的同時,防止教育異化現象。
2.明確標準,建立科學規范強化行業融合實效
生成式AI不僅能改變教育出版活動中師生之間、校企之間的關系,催生更多元、個性、自主的行業發展模式,還能加速非專業內容的大范圍快速傳播,甚至導致版權糾紛等行業問題。因此,在教育出版融合運用生成式AI的過程中,我們必須始終堅持以人為本、科技向善的發展原則,高度重視生成式AI可能導致的倫理風險挑戰,從法律和技術等層面建立科學規范,提升行業融合發展實效。
一是國家立法機關和行業監管組織應在已有法律法規的基礎上進一步細化完善,以更有區分度的監管措施和技術規范為教育出版乃至整個出版業融合運用生成式AI提供標準指引,強化行業發展實效。立法機關可在《生成式人工智能服務管理暫行辦法》的基礎上進一步實現對生成式AI技術風險全面類型化和場景化的區分。如基于場景把監管做得更精細化,針對不同技術路線、應用模式和責任主體,在不同場景中分別設置對應的法律義務。國家新聞出版署等行業主管部門也可參考歐盟等國家和地區的人工智能法案,結合我國出版業實際制定鼓勵作用和監管效果兼具的行業技術規范或應用標準,為教育出版領域融合生成式AI可能產生的內容風險和現實挑戰提供有效遵循。
二是以技術規制技術,強化行業融合實效和技術應用規范。清華大學人工智能研究院視覺智能研究中心主任鄧志東教授指出,通過模型優化訓練的方式防止再次生成侵權內容雖在技術上難以實現,但利用價值對齊的算法采取內容過濾等措施或可實現。具體來看,教育出版機構和技術研發機構應針對生成式AI的融合應用環節采取有效手段。在內容抓取環節,打造更高級、更敏感的語言模型,并對內容數據進行技術標注,從源頭上杜絕侵權問題的發生;在內容輸出環節,利用更先進的技術矩陣強化監管,及時發現問題并解決問題,從而在避免技術濫用的同時,盡可能提升行業融合發展實效。
3.聯合共贏,通過跨界協作打造出版融合新生態
基于生成式AI的應用前景,構建通用大模型和建立行業專屬數據訓練庫已成為必然趨勢。目前,國內部分行業領域和先進企業已經初步形成涵蓋理論方法和軟硬件技術的體系化研發能力,這對解決長期困擾傳統教育出版業的技術短板以及加速教育出版與生成式AI的融合創新無疑具有促進作用。在此背景下,以“聯合共贏”為核心目標,推動教育出版與高新技術企業或行業先進企業的跨界協作,已然成為教育出版融合運用生成式AI的重要路徑,旨在通過優勢互補和強強聯合,打造出版融合新生態。
一是教育出版機構可通過與高新技術企業的跨界合作,達到融合運用生成式AI的初衷,加速構建行業發展新生態。目前,科大訊飛已于2023年5月首次推出訊飛星火認知大模型,隨后又升級發布V1.5和V2.0版本,實現了開放式回答的突破,進一步優化了多輪對話和教學能力。在此背景下,教育出版機構可與科大訊飛建立戰略合作關系,通過其先進的技術、設備和自身的專業資源優勢互補,實現融合發展目標。百度于2023年3月正式上線生成式AI技術應用——文心一言,目前合作伙伴已達650多家,其中不乏人民交通出版社等傳統出版機構,這也為教育出版融合運用生成式AI提供了有益參考。據不完全統計,截至2023年8月,百度的文心一言、抖音的云雀、百川大模型、清華的智譜華章、中科院的紫東太初等生成式AI大模型均已通過審批,可向全社會全面開放,這無疑為教育出版領域的技術融合和跨界協作提供了更多的路徑選擇。
二是教育出版機構可通過與在線教育企業的攜手合作,共建行業發展新生態。2023年上半年,好未來、網易有道、新東方、作業幫、世紀天鴻等一眾在線教育公司相繼接入或自主進行技術研發,在生成式AI賽道表現喜人,如好未來于2月在其學習機產品上線AI講題機器人小π,網易有道于5月發布子曰大模型等。在線教育企業在生成式AI技術賽道的突破性進展,為雙方的融合發展提供了更多可能。基于此,加強與在線教育企業或教育科技公司的深度合作,同樣是教育出版機構融合運用生成式AI共同探索智慧教育多元場景和個性服務,重構行業發展新生態的科學路徑。
|參考文獻|
[1]王涵,江靜怡,葉陽. 數字教育出版與人工智能融合發展研究[J]. 出版廣角,2022(16):71-75.
[2]代楊,裴永剛. 我國教育出版智能化知識服務轉型探析[J]. 出版廣角,2020(14):9-11.