秦雅萌?商建輝
【摘要】利用XML技術升級編輯出版手段,是科技期刊增強出版內容附加值,構建數字出版生態的重要支撐。文章以2020年度中國科技期刊卓越行動計劃高起點新刊為研究對象,重點對其XML出版實踐進行描述性分析。研究結果表明,樣本刊物通過構建一站式智能化的XML編輯出版平臺,利用XML技術打造細粒度、高增值的刊文內容,充分對接主流權威數據庫,有效滿足了用戶異質需求,為增強我國科技期刊數字出版傳播力、聲譽力與影響力帶來重要的借鑒啟示。
【關? 鍵? 詞】科技期刊;XML;編輯出版
【作者單位】秦雅萌,河北大學新聞傳播學院;商建輝,河北大學新聞傳播學院。
【中圖分類號】G230.7 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2021.05.018
隨著智能信息技術在數字出版行業中的廣泛普及,我國科技期刊的數字出版質量得到跨越式提升。一方面,科技期刊利用可促進在線約稿、投稿、組稿等出版流程節點有效銜接的數字出版技術,為一體化數字出版奠定硬件基礎。另一方面,科技期刊高度關注數字出版內容可讀性,持續增強刊文的顆粒度與感染力。但讀者對科技期刊出版內容、出版方式與出版渠道的要求日益增長,傳統的數字出版手段很難保證科技期刊內容傳播的實效性與針對性。XML技術作為當今處理分布式結構信息的有效工具,將其應用于科技期刊數字出版領域,有助于同步實現數據規整性處理與多渠道分發,推動數字學術資源的泛在共享[1]。鑒于此,目前全球高水平科技期刊均開始全面推行基于XML技術的數字出版:如Nature、Science、Cell已經擁有十分成熟的XML出版管理系統,這些系統可對科技文獻進行包括采編、處理與發布在內的全鏈條管理,并利用XML技術為讀者提供數據關聯分析與文本深度挖掘等增值服務。我國科技期刊的XML出版亦取得長足發展:入選中國科技期刊卓越行動計劃的刊物不僅開通了基于XML的智能編輯業務,而且為用戶提供視聽資源、文獻鏈接與知識關聯等增值服務,此舉極大拓展了科技期刊數字出版的功能邊界。文章分析了2020年度中國科技期刊卓越行動計劃高起點新刊XML出版的實踐經驗,提出有助于我國高水平科技期刊XML出版可持續發展的策略啟示。
一、研究對象與數據來源
中國科技期刊卓越行動計劃由國家新聞出版署會同中國科協等部門合作發起,目標是創建我國科技期刊可持續發展支持體系,是目前我國實施力度最大、投入資金最多、覆蓋范圍最廣的科技期刊支持項目。其中,高起點新刊項目希望通過支持創辦一批聚焦新興交叉學科的國際英文新刊,增強我國科技期刊的國際學術影響力與全球創新策源力[2]。2020年7月11日, 中國科技期刊卓越行動計劃辦公室正式發布2020年度中國科技期刊卓越行動計劃高起點新刊項目入選刊物名單,從項目規劃可行性、基礎辦刊條件、國際化辦刊條件三個方面遴選了30本刊物作為資助對象[3]。中國科學評價研究中心發布的《中國學術期刊評價研究報告》(第六版)指出,2020年度中國科技期刊卓越行動計劃高起點新刊充分發揮XML出版技術的價值紅利,構建了集采編、結構化校排與網絡發布等功能于一體的數字出版運營體系[4]。
本文以2020年度中國科技期刊卓越行動計劃高起點新刊為研究對象,采用網絡調研與文獻調研方法針對樣本期刊XML出版技術、內容、流程進行實證分析。首先,文章通過網絡調研手段深入考察樣本刊物XML出版的工作流程與核心功能,對此類數據進行分類處理。其次,采用文獻調研方法進一步萃取樣本期刊XML出版的隱性數據,為后文的策略分析提供參考依據。
二、樣本期刊XML出版的實踐策略分析
1.創建全流程一體化的XML編輯出版平臺
第一,依托成熟的XML一體化內容生產管理云平臺同步推進編校工作。如《中國機械工程學報:增材制造前沿》利用中國知網研發的騰云全流程數字出版平臺增強內容運營管理績效。一方面,借助該平臺的數據資源智能管理、信息可視化加工、多主體協作編輯等功能單元,對刊文內容進行高精度歸類分析,并實現基于內容結構與內容屬性的數據標準化存儲,形成各類XML文檔結構化定義出版素材庫。另一方面,憑借XML自動化加工與主題標引功能,促進數字出版內容與形式的有機統一。如開展基于XML的文獻元數據提取工作,協同推進數字出版內容的XML文檔轉換與規整化處理。
第二,構建面向出版流程優化的智能編輯系統。如《廢棄物處置與可持續能源》高度重視XML出版內容的一站式運營,依托XML技術開發了內容定制化加工服務系統,開展數字內容全生命周期管理。一是通過網絡資源采集、電子文件轉換、元數據標引等智能校排工具對刊文內容進行自動化加工標引,生成體現知識內在語義關系的XML格式文檔。二是基于XML格式內容,實現自動標準校對,包括知識體系管理、結構化標引、智能分類標引、標引對象管理等。三是打造模塊化的文檔編輯引擎,采用“流文件”形式發布傳統的版式資源,支持多終端、多形態的數字閱讀方式。
2.依托XML技術為用戶精準推送高增值內容
第一,利用XML技術對數據層、信息層與知識層中的數據進行語義關聯組織,以形象化揭示刊文內容的相關信息。如《數學與統計通訊》利用頁面知識語義關聯方式拓展XML出版內容邊界,讓用戶通過“智能推薦”“自動關聯”“訂閱推送”“行為日志”等功能模塊,獲取更多與XML出版內容高度相關的基礎數據信息。《能源材料前沿》憑借XML技術高效挖掘刊文內容的知識元數據,據此組建出版機構知識庫,不僅允許讀者開源檢索數據庫中的高價值信息,而且極大地促進了各類型科學數據的關聯推薦。
第二,利用XML嵌入式技術讓用戶及時了解刊文內容的學術影響力?!秶铱茖W進展》的做法較具代表性。其不僅在XML頁面中添加了“關聯發現”“統計分析”“采訪決策支持”等用戶行為分析與期刊傳播力分析的功能單元,為用戶智能推送期刊影響因子、收錄分區情況、開放特征、機構成果等大數據分析報告,而且讓用戶下載無版權爭議的數字資源。為增強XML出版的穿透力,《國家科學進展》在微信公眾號開辟“問答式社交服務”專欄,利用XML自然語言處理技術,讓用戶自定義數據檢索條件,公眾號后臺會結合用戶過往的檢索行為向其定制化推送增值信息。
第三,對學術論文中的實證結果、推演流程進行視聽化表達。一是基于XML技術豐富視聽文本?!禖AAI人工智能匯刊》利用XML數據流查詢處理技術對刊物官方網站中的視頻資源進行全媒體發布,在對其進行增值化深加工基礎上,實現期刊不同傳播介質的資源共享。二是策劃模塊化、層次化的視聽內容?!渡锇踩蜕锇脖ks志》借助XML分面搜索推薦技術提供分層分類的視聽數據推送服務。如為生物學科專業研究人員推送研究熱點與研究前沿的主題短視頻,為普通學生與其他社會受眾推送常識性科普視聽文章,顯著增強視聽內容的權威性與貼近性。
3.通過共享權威數據庫增強XML出版生產力
第一,與主流數據庫建立共享關系,提升XML出版內容的供給能力。一方面,深度對接業內權威的數據倉儲平臺,實現與國際主流學術出版平臺的數據實時交換。當前,樣本期刊均與愛思唯爾Ei工程索引數據庫、Springer電子期刊數據庫、IEEE/IET Electronic Library等數據庫服務商締結了深度合作關系,確保讀者能夠實時獲取最新、最權威的科學數據。如《生態過程》基于XML技術建立了面向讀者免費服務的合作模式:與尚唯科技報告資源服務系統簽訂了合作完成XML全文的框架協議,讀者將鼠標懸停在對象引用標識符上便可自動獲取與之適配的外延鏈接數據。另一方面,依托權威數據庫擴大XML出版的覆蓋面。如《植物表型組學》在獲得SAGE Journal平臺的XML出版權后,IOS Press Journals期刊數據庫立刻對其近十年的刊文進行XML網頁發布,科睿唯安僅用7天便完成了對XML文章的元數據提取工作。
第二,吸納優質用戶成為XML出版策劃主體。一是依據投稿與在線評論質量對用戶進行評級,凡被認定為優質用戶的讀者,將會定期獲得科技期刊主動推送的同一研究領域內的前沿文獻、刊文數據被引情況等個性化信息。如《新興污染物》創建了包含積分管理、群組管理、訂閱管理等功能的用戶社區服務生態圈,讓活躍在評論區的優質用戶成為XML出版的主要顧問。二是為增強XML出版的時效性,樣本期刊均提供基于XML的預印本服務,采用XML超鏈接手段第一時間刊發綜述論文,顯著激發讀者參與XML出版的內生動力。
三、我國科技期刊XML出版的發展路徑
1.打造基于XML技術的智能化編輯出版系統
第一,構建基于XML的數字化加工標引系統。一方面,從互聯網上系統化采集公開出版的數字學術資源,經過智能數據處理、存儲、發布,并結合讀者個性化需求進行聚類存檔,形成兼具專業性與權威性的學術資源池。如利用基于XML的WEB數據挖掘技術對國內外網絡學術站點最新發布的數據進行針對性抓取,在對采集的信息進行過濾、信息去噪和結構化內容提取的基礎上,對其進行自動聚類與關聯整合,從而發現熱點學術情報。另一方面,構建元數據標引模塊。即發揮XML技術的知識結構化標引、內容碎片化標引等特色優勢,對刊文內容進行基于元數據的多維度標引,據此為讀者推送具有差異化知識元本體的超文本。如對多來源、多語種的網絡數據資源進行知識框架自動分析與文本知識元分析,而后從主體部分(存儲論文正文關鍵信息的元數據)、后置部分(存儲術語表等輔助信息)、浮動部分(存儲文章的同行評議意見與次級論文等元數據)三個方面規劃不同應用場景下的知識庫標簽集,為XML出版奠定數據支撐。
第二,促進XML出版服務模塊間的深度交互。一是構建協同編撰平臺,對XML出版呈現形式與內容進行動態組合。如利用基于XML的工作流程管理、編輯工具集成等功能插件,讓科技期刊編校人員和讀者協同開展刊文內容的XML轉換、XML注釋等校排工作,提高XML出版的集成化管理水平。二是創建全媒體資源管理平臺,促進期刊學術資源檢索瀏覽、資源庫管理與資源云服務的無縫對接。如借助基于XML的自然語言檢索引擎對非結構化數據、NXD數據、關系型數據進行跨媒體數據挖掘分析,構建涵蓋元數據文件、多階索引文件與數字對象文件的全媒體分布式資源系統,實現科技期刊全媒體資源基礎管理、收集管理和遷入遷出管理的有機協同。另外,科技期刊還應加快建立XML出版數據標準,基于統一的文檔格式打通XML出版數據資源流動的阻滯點,促進XML出版內容的高質量共享。
2.利用XML技術提供定制化、個性化出版服務
第一,借助XML技術豐富科技期刊數字出版內容。一是做細XML出版知識導航服務。即借助基于XML主題地圖的知識導航技術的細粒度呈現刊文內容。如利用XML自動版面分析技術精細化拆分數字出版導航目錄,通過思維導圖向讀者呈現XML出版內容中基礎信息的關聯關系。二是做精社交化知識問答服務。社交化知識問答服務是科技期刊用戶增值服務的重要構成,以簡潔明確的XML標記語言回答用戶咨詢,形成個性化的知識服務社交網絡,有助于提升用戶的依賴感和忠誠度。如利用XML Servlet技術構建全場景知識問答系統,通過問題深度分析、答案生成與排序對用戶意圖進行命名實體識別,確??萍计诳焖冁i定用戶目標信息。三是做強專題知識庫運營服務。專題知識庫運營服務是根據學科與主題將文本知識元進行關聯整合,進而為用戶提供專業性知識集成產品的服務??萍计诳瘧肵ML文本熱點分析技術與文本聚焦技術創建可滿足讀者差異化資源需求的專題知識庫,以提升用戶對XML出版服務的價值感知[5]。
第二,提供XML出版資源情境化推薦服務??萍计诳疿ML出版是情境化、多維度、立體化的知識傳播行為,其實踐主旨是在用戶與期刊之間形成常態化情境適配的交互關系,進而實現信息資源的靶向投放。因此,借助XML資源推薦技術為用戶提供與其使用情境、需求畫像相契合的目標數據,能夠大大增強用戶的感知體驗。如《中華放射醫學與防護》創建具有廣視域、全覆蓋特征的資源推薦系統,借助XML嵌入式技術將移動圖書館、數字圖書館等數字學術平臺嵌入科技期刊網站,通過構建用戶標簽體系提高XML出版資源推薦的情境化、定制化水平。
3.常態化對接優質用戶與權威學術數據庫
第一,放開學術數據庫的訪問接口,通過數據庫跨媒介動態鏈接組建開放式學術資源門戶。一是開發支持科學數據跨庫鏈接的功能接口,確??萍计诳軌驘o障礙共享主流數據庫中的優質資源。如創建以數據交換接口、元數據管理接口、API集成接口為核心的學術數據庫訪問接口體系,與數據庫服務商簽訂旨在實現科學數據開放存取的接口協議,在科技期刊與數據庫間營造科學數據共建共享的生動態勢。二是為規避跨庫檢索過程中的版權侵權風險,科技期刊應與數據庫締結XML出版資源安全共享協議,在獲取數據庫服務商資源鏈接權限許可的前提下,使用戶能夠合法合規地跨庫調用XML出版資源[6]。
第二,提供人性化的數據共享服務。一方面,科技期刊可建立用戶知識貢獻激勵機制,引導用戶深度參與XML出版全周期。如堅守以用戶生成內容為核心的讀者培育理念,基于用戶網絡評論的轉發量與采納量等數據對讀者進行分級管理,并依托XML DOM節點樹技術量化分析用戶聲譽的波動情況,為擁有高聲譽等級的讀者匹配更大的數據共享權限。另一方面,科技期刊可應用“內容+平臺+數據”的運營模式,促進用戶、XML出版渠道和論文作者深度融合。如利用基于XML的知識表示技術全方位呈現學術論文的創新點,系統整合用戶學術成果中的信息流與知識流,推動科技期刊從知識傳遞者向學術貢獻者轉變;通過XML文件可視化方式對刊文內容中的知識元、知識條目等進行體系化關聯,進而形成“用戶貢獻—知識挖掘—共享增值—用戶成長”的良性循環。
|參考文獻|
[1]周小玲,侯春梅,黃愛華,等. 我國百強中文科技期刊XML/HTML出版現狀調研與分析[J]. 中國科技期刊研究,2019 (1):40-45.
[2] 高雅麗. 七部門聯合實施中國科技期刊卓越行動計劃[N]. 中國科學報,2019-09-23.
[3]關于對2020年度中國科技期刊卓越行動計劃高起點新刊項目擬入選項目進行公示的通知[EB/OL]. (2020-07-
09)[2021-01-16]. http://news. sciencenet. cn/htmlnews/2020/
7/442636. shtm.
[4]RCCSE《中國學術期刊評價研究報告》(第六版)新鮮出爐[EB/OL]. (2020-10-26)[2021-01-20]. http://www. eshukan. com/displaynews. aspx?nid=888.
[5]趙少飛,陳輝. 基于XML一體化生產管理云平臺的科技期刊出版流程優化實踐[J]. 編輯學報,2018 (6):627-631.
[6]周驥. 學術期刊的移動出版:現狀、問題和策略[J]. 傳媒,2020(1):31-34.