2024年7月6日,2024世界人工智能大會語料主題論壇在上海市世博中心成功舉辦。上海市各相關部門代表、上海人工智能實驗室、人民網、上海報業、上海圖書館、上海信投、上海算法創新研究院、中國信通院、復旦大學、華東師范大學、國家開放大學以及科大訊飛股份有限公司、廣州視睿電子科技有限公司(希沃)等近1000家大模型語料生態企業參會。本次論壇以“語料筑基,智生時代”為主題,由上海庫帕思科技有限公司聯合大模型語料數據聯盟等單位共同承辦,圍繞高質量語料數據如何高效供給賦能大模型產業發展,向市場傳遞專業化、鏈接型、前瞻性的語料生態設計理念。
高質量語料庫是人工智能賦能新質生產力的關鍵。大模型賦能千行百業,需要構建與場景適配的語料體系,需要規則與實踐的“并跑”。論壇發布了教育、金融、生命健康三項行業技術白皮書,為行業未來的技術發展提供標準及參考。
人工智能技術的迅猛發展,作為新質生產力的AI及大模型在教育領域的應用日益廣泛,為教育領域的數字化轉型帶來了巨大的潛力和機遇。基于此,在教育部教育信息化技術標準委員會暨全國信息技術標準化技術委員會教育技術分技術委員會的指導下,由“教育通用人工智能大模型”系列標準工作組協調,華東師范大學牽頭,聯合上海交通大學、北京郵電大學、國家開放大學以及庫帕思、華為、阿里、百度、訊飛、新華三、廣州視睿(希沃)等企事業單位共同編撰了《教育人工智能大模型數據治理與共享技術標準白皮書》,并在論壇上正式發布。白皮書的發布,旨在推動各行各業加強教育人工智能大模型數據治理與共享,為教育人工智能大模型提供高質量的預訓練數據和測評數據,通過科學的策略,最大化挖掘教育數據價值,助力教育的創新。
白皮書的內容涵蓋了行業分析、標準分析和案例分析。首先,白皮書重點分析了教育AI大模型數據治理與共享技術的重要性及當前面臨的挑戰。其次,白皮書梳理了國內外教育AI大模型發展情況及教育數據治理與共享的政策、標準和相關機構,并詳細介紹了教育AI大模型的系列標準,包括已發布標準和在研標準。
白皮書提出,“建設一套合規有效、高質量的數據治理與共享技術標準,供教育機構和技術開發者參考借鑒。”
白皮書內容建議,“構建教育AI大模型數據治理與共享體系的整體架構、建設數據治理與共享聯盟、完善標準體系,同時需要考慮應對數據安全與倫理問題等。”
白皮書還展開介紹了相關的案例應用,涵蓋區域、學校、企業層面。例如。上海市寶山區通過搭建開放共享、技術集成、交互可視的技術架構,統籌建設區域教育管理及教學基礎應用服務平臺,打造一個惠及區域內所有學校的數字基座。
白皮書倡導,“應促進可控、可信、安全、綠色、好用、高效的教育通用人工智能大模型構建,實現有教育溫度、育人為本的人工智能及智能教育環境建設,探索數字教育新范式,實現教育的高質量發展。”