2025年政府工作報告中明確指出:持續推進“人工智能 +,,, 行動,將數字技術與制造優勢、市場優勢更好結合起來,支持大模型廣泛應用。近年來,人工智能賦能各行各業蓬勃發展,成為推動經濟高質量增長的重要力量。在出版領域,校對作為耗時較長的一道生產工序,同時也是直接關系到出版物編校質量的一項必不可少的環節,亟須依靠人工智能技術提高工作效率。
人工智能技術在校對工作中的應用場景
通過搜索發現,目前市面上的人工智能校對工具,或是具有校對功能的智能軟件可謂琳瑯滿目,本文選取常見的4款展開說明。
1.AI校對王
果麥文化傳媒股份有限公司出品的AI校對王是目前唯一一款由出版企業研發且通過網信辦生成式人工智能服務備案的“出版審校級”人工智能校對工具。其憑借針對中文特性多重優化的“金字塔”大模型、壁壘級訓練數據“中文出版物校對全流程數據集”“校對經驗規則數據庫”,能夠在字、詞、句的多層次上實現更精準的語義理解,對文本做出符合規范要求的修改,實現高精度、低誤報、只校對、不亂改的“出版審校級”智能校對。該校對工具的單稿校對字數已升級至100萬,校對速度提升至600字/秒。
2.蜜度校對通
由上海蜜度科技股份有限公司自主研發,以文修智能校對大模型為技術底座,以《現代漢語詞典》《辭海》《中國成語大辭典》等專業工具書為指導,覆蓋對文字標點差錯、知識性差錯和內容導向風險識別三大類型的校對,同時支持《廣告法》禁用詞校對、多語言內容校對,對文本、圖片、音視頻的校對。目前,該軟件校對20萬字用時僅90秒。
3.愛校對
由交互未來(北京)科技有限公司研發的愛校對,源自清華大學人機交互實驗室的技術成果,通過深度學習技術在自然語言處理領域的創新應用,專注于提高校對效率和準確率,對于錯別字、常識錯誤、敏感詞和格式錯誤,均能提出精準的解決方案。
4.新華妙筆
由新華通訊社媒體融合生產技術與系統國家重點實驗室聯合北京信工博特智能科技有限公司研發的新華妙筆,采用生成式大模型技術,能提供靈活的自定義審核方案,除基礎的文字審核外,可根據用戶需求選擇對應的審核方案和白名單。
人工智能校對工具的優勢
本次測試選取往年韜奮杯編校大賽的校對試題和出版中級資格考試的校對試題各一篇作為樣本,兩個測試樣本中都涉及幾種常見的校對差錯,包括漢字差錯、漢語語言差錯、標點符號用法差錯、表格差錯、內容差錯等。分別導入以上4款人工智能校對工具中進行測試,同時也將測試樣本放入傳統黑馬校對軟件中做測試,統計出各工具校對結果的差異情況。測試結果如下表。
校對結果對比表

1.在校對用時上更勝一籌
通過圖表可以明顯看出,人工智能校對工具的校對用時相對較短,優于傳統校對方式。以蜜度校對通官方提供的數據為例,校對20萬字用時僅90秒,而黑馬校對需要1小時,人工則至少需要4天時間。
2.在漢字差錯識別上表現優異
4款人工智能校對工具在此方面均表現不俗,尤其是AI校對王和蜜度校對通在查找漢字差錯時可謂相當全面,準確識別出了典型錯誤如“銀河系中有數干(千)億顆恒星”“可以根據 (據)食物種類的多少”,不得不承認校對工具的火眼金睛。并且人工智能校對工具能精準找出繁簡體字混排錯誤,而黑馬軟件則有部分錯誤遺漏現象。
3.在標點符號差錯識別上有優勢
有2款人工智能校對工具對標點符號問題較敏感,能準確判斷出圓括號有一邊缺失的錯誤,章節標題中的標點應改為 *1.××30*2.××3 ,而黑馬軟件沒有識別出此類問題。
4.在整句子差錯識別上能發揮作用
部分人工智能校對工具在語義上實現了精準理解。如“零食的食用量不宜太少”,有2款工具準確將“少”改為“多”;“不能簡單地認為吃零食是一種不健康的”,有3款種工具能為句末加上“的行為”,將句子結構補充完整。對于復雜長難句,有人工智能校對工具找出了問題但并未改對,而黑馬軟件對此未檢出。
人工智能校對工具的局限
1.對表格差錯不敏感
表格差錯包括內容差錯和格式差錯,即表中的數據有誤、與正文不呼應以及各欄數據未對齊或位置不當等。測試樣本1中包含一張《推薦食物攝入量》表格,其中存在以上所有類型差錯,但4款人工智能校對工具對表格差錯問題均不敏感,未能檢測出錯誤。
2.對知識性錯誤無能為力
測試樣本1中有一處為“包括約100g谷類(可選擇饅頭、面包、麥片、面條、豆包、粥、紅薯等)”,此處紅薯并不屬于谷類,應刪去。面對這種依賴廣博知識才能識別出的差錯,人工智能校對工具同樣無法檢出。
3.對格式錯誤無法識別
兩個測試樣本中均存在段落、格式錯誤,包括各段落字體不一致、行距不統一、標題未統一縮進等,人工智能校對工具均沒有識別此類錯誤的能力。
4.誤報率較高
以測試樣本1為例,4款人工智能校對工具檢測出的差錯數與實際差錯數差距較大,最多時相差20處,最少時也有8處。這說明校對工具的誤報率偏高。比如,“早餐作為一天的第一餐,對膳食營養攝入、健康狀況和工作或學習效率至關重要。”被判有誤,其中“至關重要”誤改成“都有重要”;“糙米、全麥食物等”被誤改為“糙米、全谷物等”。這就給人工核查工作增加了工作量。
人工智能賦能校對工作的應用策略
人工智能技術賦能出版業的時間僅有短短幾年,但從以上校對效果來看,其在文稿校對領域的實際能力不輸傳統黑馬校對軟件。人工智能校對工具在處理速度上的優勢是人工所無法企及的,它可以精準發現稿件中的一些硬傷,如錯別字、標點符號錯誤、簡單語句差錯等,但也伴隨著誤報率高、在表格和格式統一等方面能力較弱等問題。基于以上測試結果,從校對實際工作出發,提出幾點應用策略。
1.“人工 + 智能”模式是未來發展趨勢
人工智能校對在短期內取代傳統校對方式是不現實的,人機結合將是未來的主流趨勢,且“三校一讀”流程缺一不可。校對工作者將大量繁復的機械勞動交給人工智能,轉而將專注力和創造力聚焦在知識判斷、思想洞察等人工智能無法替代的領域,將是更優的“人工 + 智能”模式。
2.加強大模型對國家標準的訓練學習
漢語拼音拼寫、數字用法、國際單位、量和單位都有其相對應的國家或國際標準,這些方面也一直都是校對的痛點和難點。建議對校對大模型進行大量的國家標準訓練,開發更貼近校對實際需求的功能模塊,以期能自動檢測并提示錯誤,幫助編校人員快速修正,從而彌補人工校對在此方面的不足。
3.豐富各專業領域詞庫
盡管有些智能校對工具標榜擁有超萬億字符的訓練,但書稿類型五花八門,數據庫與書稿完全適配在短期內很難實現。建議在校對前對不同類型稿件增設相對應的專業領域詞庫,如在校對化學類稿件之前,在詞庫中增加元素周期表中各種元素對應的化學式[;在校對哲學類稿件之前,先將高頻哲學專業詞匯添加到特定詞庫中。針對不同類型稿件定制詞庫,相信查全率會相應上升而誤報率會隨之下降,由此達到對每類書稿“對癥下藥”的即時療效。
4.加強用戶反饋機制的建立
由以上測試結果不難推斷出,各智能校對工具誤報率偏高,這就給校對后的人工篩查核對增加了工作量。建議依托人機交互的底層邏輯對每一個校對結果做出充分反饋,如“采納”“不采納”“誤報”“加入白名單”等,在人一機的雙向奔赴中促進校對工具對知識進行消化吸收[2],令其總結語言規律,自動提取隱性知識轉化為顯性知識,以降低今后工作的誤報率。
5.對數據與隱私安全應高度重視
以上測試除黑馬校對是使用了本地單機版本,在無網絡的狀態下依然能工作,其他幾款智能校對工具的測試均在開放的遠程網絡進行,倘若未經授權出版的書稿由此流入公用網絡,將引發數據安全與隱私泄露問題。自前,已知蜜度校對通開發了局域網、互聯網、無網絡環境3種校對模式,可對機密文檔進行全過程閉環管理,以降低數據泄密的風險;愛校對支持本地部署,實現文本內容、校對結果的物理隔離。出版人和智能校對工具開發者既要把握人工智能賦能的大好機遇,又要防范其伴隨而來的風險與隱患。要加強數據管理基礎設施建設,采用先進的加密技術、訪問控制機制以及數據備份恢復策略,確保稿件數據以及出版社內部數據的安全性和完整性[3]。
人工智能校對是強大的輔助工具,但絕非“藥到病除”的萬能解藥,其能力和局限性需要出版人理性看待一一它的價值在于如何被人類合理運用,而非獨自解決全部問題。人工智能正處于發展上升階段,我們應該把握住人工智能賦能出版的大好機遇,共創人工智能與出版校對“牽手共舞”的平臺,不斷優化和完善校對工作,將兩者優勢發揮到最大,助力更多高質量精品好書的出版。
參考文獻
[1]王三海,邵育潔,江潤宇,等.黑馬校對與方正審校在科技論文校對中的應用比較研究[J].新聞研究導刊,2024,15(24):205-209.
[2]蒲清平,漆鈺.DeepSeek類生成式人工智能對主流意識形態安全的機遇、挑戰與應對[J/OL].重慶大學學報(社會科學版),1-14[2025-04-24].https://link.cnki.net/urlid/50.1023.C.20250410.1029.004.
[3]王翠靜,馬國超.AI技術在高校圖書館的應用探索—以河北工程技術學院為例[J].采寫編,2024(7):99-100+118.
作者單位:商務印書館