譚雪靜
2017 年,國務院發布的《新一代人工智能發展規劃》明確指出:把人工智能發展放在國家戰略層面系統布局,推動我國經濟社會各領域從數字化、網絡化向智能化加速躍升[1],人工智能進入了迅猛發展階段,已滲透到各行各業,出版行業也置身于其中,面臨人工智能帶來的機遇和挑戰。“機器人”寫新聞在美國已成為常態,這個“機器人”實際上是一個寫作軟件,即計算機學會深度學習和分析大數據后在創作領域的應用。近年來國內多家媒體推出了人工智能新聞寫作,比如新華社的“快筆小新”和騰訊的新聞機器人[2]。《2016~2017 中國數字出版產業年度報告》指出人工智能技術將再造出版流程,出版流程將實現智能化。內容相對簡單的幼兒啟蒙教育書、書法、攝影作品、繪畫、教輔等類圖書的編輯工作較簡單,基本上可以由人工智能完成編輯[3]。目前大數據和人工智能的使用也已滲透到學術期刊的初審、審稿、選題、編輯、排版、校對等各個工作環節,傳統的期刊編輯模式已悄然發生了變化。
本文總結了現階段大數據與人工智能在綜合性學術期刊編輯工作中的實際應用情況,探討如何利用大數據和人工智能優化編輯工作,提高工作效率和出版質量。
大數據又稱巨量資料或大資料,人們把這些不能用傳統流程或工具進行處理、分析的信息數據和采集它們的工具、平臺、分析系統一起稱為“大數據”[4]。大數據具有“從海量數據中發現規律和趨勢”的功能。
人工智能亦稱機器智能,是計算機學科的一個重要分支,是指由人制造出來的機器所表現出來的智能,即使電腦或機器具有人的判斷、學習、推論等智慧行為,用以完成人的工作,通常所說的人工智能是指通過普通計算機程序來呈現人類智能的技術。
人工智能技術包括大數據、云計算和智能算法三大要素,現在主流的人工智能算法用的都是深度學習,深度學習就是從數據中提取知識(大數據+結構化+算法=人工智能)[5]。
筆者所在的《海洋科學》期刊屬于綜合性學術期刊,內容包羅萬象,涵蓋海洋的所有學科,簡單地分為生物和非生物學科。生物學科又細分為魚蝦貝藻等學科,其中的魚類學科又可再細分為遺傳育種、養殖、營養等分枝;非生物學科又分為物理、地質、化學等學科。知識是無限的,編輯的知識體系是不完整的,掌握的知識和信息是有限的,由于崗位設置限制,《海洋科學》的責任編輯一人分管多個學科,對不同學科中專業性強的學術成果的品鑒問題,以往是根據編輯多年積累的學識、經驗和直覺,隨著計算機與網絡的高速發展,現在可以利用數據庫、期刊采編系統中的大數據來完成對各個學科稿件學術價值的鑒定。
選題策劃是指針對學術熱點、難點、新點,結合讀者和社會的需要,對學科領域中的前瞻性、理論性、技術性難題進行篩選并制訂報道計劃,增加讀者關注度,提升刊物的影響力[6]。如何在各領域選擇適合自已刊物的稿件,是非常重要和有難度的。目前,我們可以依據數據庫中的大數據,提取高被引論文、零被引論文數據,歸納總結出熱點專業及領域,或者通過文獻計量分析法得知選題方向。大數據具有“從海量數據中發現規律和趨勢”的功能,有助于編輯進行選題策劃[7]。
2.1.1 分析高被引和零被引論文
被引率能科學地反映論文影響力和學科熱點,因此被引論文數量成為衡量學科影響力的重要指標之一,高被引論文代表論文學科影響力較高,零被引說明論文學科的影響力不高。筆者2017 年在中國知網中檢索了《海洋科學》1994~2013 年發表的論文源數據,對零被引論文做了統計和研究,發現論文的被引用率與選題有直接的關系。編輯部應依此判斷學科影響力,制定具有一定創新的選題,保證稿源的學術價值[6]。
2.1.2 文獻計量分析法
文獻計量法是利用數據庫檢索,通過客觀數據進行共詞分析、共被引分析、耦合分析等,再經過聚類分析研究熱點,了解學科發展動態和學科前沿、熱點,找到領域熱點做為選題范圍,為科技期刊專題提供精準的決策依據[8]。
此外,中國知網數據庫“大數據研究平臺”中的“學術熱點”模塊的檢索結果包括科研熱點的主題、相關國家課題數量、主要研究人員和研究機構數量等信息也可以用來把握選題方向[7]。
筆者所在的《海洋科學》屬于綜合性學術期刊,內容涵蓋幾十個學科,送審工作可以利用國內外海洋各學科審稿專家信息大數據進行精準送審。筆者目前分管多個學科的編輯加工工作,送審時對期刊采編系統內專家的信息進行搜索(圖1),找到目前正在該領域從事研究工作的專家進行審稿。如果遇到更細分的學科稿件,而采編系統內沒有合適的審稿專家,可以通過中國知網等數據庫(圖2)檢索文獻作者,找到通信作者,再到有關網站核實其研究領域及聯系方式等,最后再將其加入期刊采編系統審稿專家隊伍,完成精準的送審,從而保證刊物學術質量。
有了正確的選題,還需要合適的作者完成選題。作者是期刊發展的重要資源,因此穩定的、高水平的作者隊伍是期刊發展的支撐和關鍵。隨著期刊的連續出版,期刊會積累大量國內外作者信息,由此可以建立作者數據庫[9]。目前,國內各類科技期刊基本上都配備了采編系統,作者投稿必須通過采編系統才能完成,因此,采編系統在完成投稿工作的同時為期刊積累了龐大的作者隊伍信息數據,編輯部可以充分利用采編系統進行分析、挖掘,對適合自已刊物的作者進行精準組稿。
由圖2 可見,通過中國知網等各大數據庫也可以檢索到國內外科研人員情況及其研究動向,因此,編輯可以改變以往的組稿方式,主動通過大數據,有的放矢地選擇最合適的作者進行精準約稿[7]。

圖1 勤云采編系統

圖2 數據庫檢索
在投稿環節,編輯人員會根據自已的學科知識對稿件進行初步鑒定是否存在抄襲和具有發表價值。綜合性學術期刊內容覆蓋許多學科,比如《海洋科學》期刊涵蓋幾十個學科,只要涉及海洋都屬于投稿范圍,期刊主管對所有學科稿件進行第一次把關篩選,限于個人知識體系的不完整,會把握不準。大數據時代人工智能軟件可以完全替代人工鑒別,一定程度上弱化了人的作用,由“經驗判斷”向“數據分析”轉變[7],精準得對投稿進行自動查重,然后決定是否進入送專家外審環節。中國知網數據庫具備論文查重功能,編輯人員將論文上傳至中國知網數據庫,數據庫將會自動查重,給出重復率及重復處等數據。采編系統也具備人工智能查重功能。所以通過人工智能可防止科研論文的抄襲,促使科研人員提稿學術道德,從而保證期刊的學術質量。
近年來,數字化跨媒體技術的應用改變了排版環境,對專業排版軟件要求越來越高,提出了排版軟件智能化的要求[10],國內使用的智能排版軟件主要有Word,Latex,XML 等,筆者目前利用Word 軟件進行編排校一體化,此工作模式是使用模版及里面的樣式對版面進行人工智能操作,人機協同,在對論文進行編輯加工的同時,點擊智能化樣式就能完成排版工作,最后期刊再整體利用XML 軟件轉為HTML 文件,從而實現了各種網站及全媒體的全文閱讀,實現全流程的數字化出版。XML 也是一款智能化排版軟件,但其需要添加許多程序命令,需要專業人員進行排版工作,因此筆者認為利用Word 軟件進行編排校一體化的工作模式是目前最可行的,可以避免重復勞動,不用被動得排隊等待出版社安排自已刊物的排版工作,從而減少出版環節,縮短出版時間[11]。
在科技期刊校對工作中,參考文獻的校對工作是非常繁瑣的。中國知網研發的騰云期刊協同采編系統將大量數據帶入參考文獻對比庫,系統可以自動對比參考文獻信息,審核參考文獻的準確性和格式的完整性,并能發現引文序號的錯誤,極大地提高了校對工作效率[7]。
目前三才科技研發了參考文獻輔助編校系統(NoteFirst 參考文獻編校系統),該系統能自動發現、修改參考文獻中的格式和數據錯誤,該系統在Word 中使用、一健操作、使用便捷[12]。
周麗在編輯Word 稿件時,整理出平時檢驗不常用的數據單位的Excel 文檔,在校對數據單位時,就可以調用Excel 檢驗數據單位信息,使這部分工作人工智能化,較傳統編輯校對模式更加快速和準確[13]。
綜上可以看出,大數據和人工智能已滲透到綜合性學術期刊的初審、審稿、選題、編輯、排版、校對等各個工作環節,傳統的期刊編輯模式已悄然發生了變化,已從以人工為主的機械重復勞動中得到解放,轉向到人機協同的人工智能化的編輯模式,人工智能技術正在從根本上改變出版行業工作流程,促進出版專業快速轉型升級,我們編輯人員必須適應大數據時代的發展需求,順應新技術的發展趨勢,與時俱進,加強信息檢索與分析能力,提高大數據的使用與分析能力,在出版各個環節更新思維模式,以積極主動姿態迎向大數據時代,積極尋求綜合類學術期刊的創新發展思路。