投石問路,果麥AI事業部率先在出版行業大模型上取得突破。
作為業內最早進軍AIGC(人工智能生成內容)領域的企業之一,果麥文化(以下簡稱“果麥”)AI(人工智能)事業部開發的大模型“金字塔”通過了上海市生成式人工智能服務備案,成為國內第一個出版公司開發且成功備案的AI大模型。果麥文化AI事業部開發的人工智能校對工具“AI校對王”和AI動漫智能創作平臺“愛漫閣”也于2024年投入商業化使用,奏響了出版行業向AIGC挺進的號角。
果麥是一家有互聯網基因的公司,其創始團隊核心成員大部分和互聯網行業有很深的淵源。自2022年AIGC應用大爆發以來,果麥文化在出版行業應用AI方面進行了一系列有益探索。
隨著行業對AIGC認識的深化,從業者對基礎大模型的需求也開始逐步被側重提供解決方案的行業大模型取代。果麥AI事業部抓住這一機會,率先在出版行業大模型上投石問路。2024年12月2日,由果麥開發的核心大模型“金字塔”通過了網信辦“生成式人工智能服務”備案(備案號:Shanghai-JinZiTa-202409230018)。截至目前,上海市完成備案的大模型僅60款,在AI校對領域通過備案的大模型,全國也僅有數款。
大模型“金字塔”是果麥在通用語言大模型開源框架的基礎上,結合自研算法調整和自采語料進行了二次開發,打造出的一款深度學習的自然語言處理(NLP)模型產品,廣泛應用于中文批改、文章潤色、文案生成等人工智能文字輔助處理任務。
開發大模型的機構很多,果麥何以對自己的大模型如此自信?他們表示,“金字塔”擁有堪稱“壁壘級”的訓練數據。為了搭建這一大模型,果麥在自身近20年出版事業所積累的海量校對文稿數據與編校經驗的基礎上,通過與30余家知名出版機構的深度授權合作,采購了海量真實圖書編校人員對圖書文本所做的編校流程。迄今為止,“金字塔”已深度學習了超過百億字的中文出版物“三審三校”的校對數據,涵蓋了各主流內容領域,并且處于持續更新狀態。這些數據均經過了專業的采集、清洗、標準化、規范化流程處理,在高精度的監督訓練下,大模型深度理解并更好地掌握了出版物校對的理念、技術、標準、范式,為實現高精度、低誤報、只校對、不亂改的“出版物質檢級”人工智能校對提供了可能性。
在中文處理上,其架構特別優化了中文的語言特性。首先,模型對漢字和詞組分別進行了嵌入標識,允許它在多義性高的中文環境中,更好地抓取上下文的細微差別。此外,模型還采用了多尺度的卷積層和自注意力層相結合的結構,使其在處理中文的復雜語法結構時表現尤為突出。
果麥推出的人工智能校對工具“Al校對王”,能在復雜多義的中文語境里更好地聚焦上下文的差異,理解有文化背景和歷史典故的文本,解析長句,分析復句,在字、詞、句的多層次上實現更精準的語義理解,對自然語言文本做出符合語言規范要求的修訂建議,以專業文字校對人員和資深編輯的標準和方法進行“語義級”內容糾錯。
與此同時,果麥還深度投資并直接參與研發、運營了AI動漫智能創作平臺“愛漫閣”。作為國內AIGC領域早期通過網信辦算法備案的AI平臺之一,“愛漫閣”主要面向漫畫師、動畫師、插畫師、設計師等專業用戶及動漫愛好者,支持文生圖、圖生圖、參考生圖、AI模型訓練等功能,重新定義漫畫創作流程,幫助所有人釋放創作超能力。
近期,“愛漫閣”已與上海電視臺東方衛視正式達成深度合作伙伴關系。果麥基于“愛漫閣”策劃、制作的系列圖書也即將面市。