王建新

教育與出版總是緊密聯系在一起,2月中旬,由教育部、中國聯合國教科文組織全國委員會共同主辦的首屆世界數字教育大會剛剛閉幕,又迎來了中國數字出版博覽會,這是落實黨的二十大關于加快建設數字中國的重要舉措。世界數字教育大會的主題為“數字變革與教育未來”,中國數字出版博覽會的主題為“再出發 創未來”,兩個大會的主題都聚焦未來,探討數字化的未來發展。
● 建設教育強國的全新賽道和強大動能
推動教育數字化轉型是貫徹落實科教興國戰略、人才強國戰略、創新驅動發展戰略的重要手段,也是推動中國式現代化的重要內容。2022年,教育部深入實施教育數字化戰略行動,豐富數字教育資源供給,推動教育治理數字化轉型,在數字教育的技術、模式、業態和制度創新等方面取得了豐碩成果。
國家教育數字化戰略行動為建設教育強國開辟了全新賽道、增添了強大動能。中國教育出版傳媒集團作為教育部直屬企業,積極打造以數字教材為核心的數字化內容資源和產品體系,服務支持國家教育數字化戰略行動,承擔了高等教育智慧教育平臺、職業教育智慧教育平臺和17個子平臺的建設和運維工作,以及中小學智慧教育平臺的資源供給。
中國教育圖書進出口有限公司(以下簡稱“中教圖”)作為集團下屬企業,積極融入國家教育數字化戰略行動,大力推進數字化轉型升級,匯聚優質學術圖書、精品教材、最新學術論文,精心打造“愛學術”、“愛教材”、單篇文獻服務(SOCOLAR)等數字化平臺,各平臺用戶規模持續擴大、影響力持續提升,為高校科研機構文獻保障提供專業服務,助力數字圖書館建設。
匯聚優質學術圖書,建設“愛學術”平臺。2017年,中教圖自主研發具有創新功能的數字化電子書平臺“愛學術”。堅持學術專業類圖書定位,致力于引進和傳播世界最前沿、最新的學術研究成果,更好地滿足高校師生及科研人員對外文文獻的多元需求。平臺提供自主研發的知識圖譜、知識發現、智搜服務、視頻服務等功能。“愛學術”上線電子書超過46萬余種,機構用戶730家。
匯聚精品教材,建設“愛教材”平臺。立足于教育部外教中心項目,于2016年啟動建設,嚴格落實“引進境外優秀教材”的工作要求,堅持高標準甄選原則。由清華大學圖書館牽頭12家外教中心,對標英美地區一流大學課程的教學實踐,精選采選率高的教材引進。平臺匯聚的教材絕大部分為國內獨有資源,重點保障理工農醫及管理類優質教材供給。“愛教材”上線電子教材萬余種,機構用戶198家。
匯聚最新學術論文,建設單篇文獻服務(SOCOLAR)平臺。中教圖傾力打造的中國學術資源一站式服務平臺,為廣大教育科研用戶提供開放獲取期刊、商業學術期刊及全文文章檢索、瀏覽、獲取等一站式服務。單篇文獻服務(SOCOLAR)平臺上線全學科學術文章近7000萬篇,機構用戶超過300家。
該平臺經過多期迭代建設,已實現單篇付費、開放獲取、學術支付(SOCOPay)、作者服務等功能,采用自主開發的自動分類技術,并與百度學術、百度文庫建立了戰略合作關系。與威利出版集團、世界科技出版公司等國際知名出版機構合作,打通了OA文章發表費用(APC)的境外支付通道,為統籌開放獲取文章發文經費管理,引導科研工作者把論文發表在更有價值、更精準的期刊上提供支持。
● 知識服務發展趨勢
當前世界形勢更加復雜多變,百年變局與世紀疫情交織影響,數字化轉型加速演變,新變化、新挑戰不斷呈現。
數字化進程加速。這方面主要表現為國際期刊出版已基本轉向數字化,電子圖書出版穩步增長,開放獲取(OA)正成為新的重要學術交流形態。中教圖進口的數字文獻資源業務比重逐年上升,2022年已超過84%;國內高校圖書館電子資源購置費已占據文獻資源購置費支出的60%以上,并呈現逐年上升的趨勢;用戶對文獻的獲取已經從單一的圖書館借閱,向以數字資源自主獲取為主、圖書館借閱為輔轉變;文獻引進工作的質量評價已從紙質文獻服務的傳統衡量指標擴展到數字化服務體系、數字資源集成能力、服務理念和服務手段諸多方面;在線教育產品形態、服務模式不斷完善,在線課堂、智慧圖書館成為新的發展趨勢。根據中國高校圖書館數字資源采購聯盟(DRAA)2022年發布的報告顯示,高校作為全球學術出版最大的采購主體,其采購的在線知識服務產品中,傳統電子書刊加起來接近50%。
文獻本地化長期保存不可缺失。隨著我國科技創新能力的不斷提升,“文獻安全”“數據安全”“使用安全”被提到前所未有的高度。一方面,西方利用自己掌握的話語權,將一些影響國家文化安全的內容通過數字形式輸出滲透到國內,給國家意識形態安全造成極大隱患;另一方面,建設社會主義現代化強國需要借鑒利用西方高科技成果,但一些涉及高科技的重要文獻的引進使用受到西方國家的制約。2018年以來,部分中國高校科研機構被美方列入出口管制“實體清單”,部分數據庫對名單中的中國機構、企業和學校停止服務。俄烏沖突爆發以后,Web of Science數據庫停止了來自俄羅斯的訪問服務。因此,加快推進數字資源長期保存和服務系統建設,實現文獻資源的長期保存和可持續更新,增強抵御風險的能力,已經變得越來越迫切。無論是印本,還是數字文獻,特別是一流學科建設、關鍵研究領域、前沿技術領域等創新驅動發展需要的文獻資源,實現本地化長期保存勢在必行。
文獻需求日趨多樣化。高校和科研機構除傳統的報紙、期刊、圖書、音像等文獻需求外,已從通用資源的收藏向特色資源、個性化資源收藏轉變。對特藏文獻、電子教材的需求逐步增加,對新媒體、科學數據、富媒體學術資源、事實型數據資源等新興資源的需求日趨增長。如中教圖獨家代理的JOVE視頻類期刊數據庫,主要是生物、醫學、化學等學科的實驗論文,以“視頻+文字”的形式呈現給讀者,使讀者能更好地理解和掌握實驗步驟和方法。
文獻服務向知識服務縱深發展。根據國際科學技術和醫學出版商協會(STM)2021年報告,2020年數字內容占當年科技出版市場的89%以上,比2019年增加了10%,2019年這個數字是77%。用戶對文獻資源的需求已經不再滿足于一般性的文獻索取,而是需要從信息搜索、全文獲取到知識獲得的智慧服務,文獻服務機構不但要提供文獻資源聚合服務系統,還需要提供基于概念實體識別及語義關系抽取、知識計算技術、自動分類、跨語種跨媒體關聯融合等方法和技術構建的知識庫、知識服務、可視化交互等服務。
● 知識服務實踐
“十三五”以來,中教圖順應數字化發展潮流,大力推進“數字行動”,堅持“需求牽引、應用為王、服務至上”的建設思路,開發建設了多類型知識服務平臺和項目,涵蓋海外學術圖書、經典教材、專業文章等各類型數字化資源,通過多類型服務為國內高等院校、科研機構、企事業單位等提供專業的海外文獻資源綜合保障,支撐國家世界一流高校學科建設,服務國家重大科研攻關、技術創新需求。
資源評價,助力學術內容精選。外文學術資源的引進,一直采用“精選”模式。一方面,西方對于知識產權極為重視,保護意識很強,無論是書、刊還是數據資源都定價高,通常是同類型中文內容價格的好幾倍甚至幾十倍;另一方面,國家財政對于教育和科研的經費保障有限,文獻采購經費仍不足,上述兩者之間的矛盾,導致在采購境外學術資源時必須進行優選。
如何實現“優選”呢?一是充分利用專家資源,比如“愛教材”平臺對于電子教材的選擇,就是充分利用高校專家團隊的專業能力,選擇高品質、高價值的教材。二是利用大數據、云計算等技術,通過科學的算法對資源質量進行評價,在“愛學術”平臺上可以看到每本書的權威度分值,這是利用自然語言處理技術實現對知識內容的分析和計算的,這一整套計算方法、系統和裝置在2019年獲得了國家知識產權局頒發的專利證書。在此基礎上,綜合館藏、評論、引文等多維評價指標,進一步優化“核心書目”的推薦辦法,幫助國內用戶優選圖書資源。
人工智能,實現文獻自動分類。海量知識內容的組織、發現,需要借助人工智能的力量使其更加科學和有效。單篇文獻服務(SOCOLAR)平臺收錄超過7000萬篇文章資源,不可能全部由人工來進行篇章級的分類。隨著AI技術的日漸成熟和廣泛應用,中教圖在平臺上應用了基于卷積神經網絡的深度機器學習技術,通過大量的語料庫訓練,實現大規模的篇章級文獻自動分類。
知識圖譜,構建智慧搜索系統。AI分類、資源評價都是利用技術手段增強對文獻知識內容的識別、挖掘和判斷,在此基礎上,好的知識服務還要解決知識發現、智能服務的問題。大家平時在網上搜索內容,常常會被兩個問題所困擾:一是搜不到想要的結果;二是想要的結果沒有排在第一頁。在學術內容服務領域,同樣存在這樣的困擾。所以中教圖追求智慧平臺、智能服務,希望通過知識挖掘和智能呈現技術,實現文獻的精準定位和優先推送。2022年中教圖上線了智搜平臺,運用語義網、知識圖譜和人工智能技術,對近50萬種電子書進行全內容知識挖掘和發現,將多源異構的知識統一成同構知識網絡,并利用可視化技術將知識及其關聯關系推送給終端用戶。
合規安全,確保用戶放心使用。中教圖各知識服務平臺引進、上線境外文獻資源均與相關出版機構、代理商簽署合法的書面授權協議,嚴格排查和規避與產權來源不清晰的問題機構合作,確保所有引進的電子書、電子教材及文章來源合法、版權清晰。各平臺嚴格遵守知識產權規定,采取了一系列知識產權保護措施,包括數字版權保護技術(DRM)、用戶授權控制、水印保護、流量實時監測等,并建立應急預案,嚴密防范發生非法獲取和惡意傳播文獻的行為。
公司建立了完善的內容審核機制,嚴格排查意識形態風險,各平臺引進的所有境外文獻資源均進行上架前的內容審讀和上架后的實時監控,嚴格保障上線資源的內容安全。
中教圖各知識服務平臺系統所有資源均采用本地存儲策略,確保所有數字資源存儲于國內本地服務器,且通過審讀系統核準后對外發布訪問,訪問穩定、快捷,以保障外文學術內容合法合規及使用安全。
中教圖始終堅持“專業、高效”的服務方針,支持國內教育科研文獻保障需求。從2016年至2022年,公司連續六年獲得中國高校圖書館數字資源采購聯盟(DRAA)年度代理商滿意度綜合評分第一名,榮獲第十屆、第十一屆數博會“優秀服務供應商”,榮獲2021年度“全國優秀圖書館數字內容供應商”稱號。
● 積極應對開放出版、開放獲取帶來的新挑戰
開放科學正在成為新的學術交流模式和學術研究范式。開放出版、開放獲取作為開放科學的重要組成部分,已經獲得全球學術界、出版界、圖書情報界的普遍共識。開放出版、開放獲取將對未來學術出版乃至文獻服務方式產生革命性的影響,引領未來學術出版新變革。
從國際來看,全球學術出版巨頭中,Springer Nature有2000種期刊可選OA,其中600種期刊完全OA出版;Elsevier有2700種期刊可選OA,其中300種完全OA出版;Wiley有79種期刊完全OA出版;Sage有205種期刊完全OA出版;Taylor & Francis 有190種期刊完全OA出版。
從國內來看,國內出版社的開放獲取發展推動進程相對緩慢。據2021年《中國科技期刊引證報告》及中國科技論文與引文庫(CSTPCD)統計,中國自然科學領域有2084種期刊,社會科學領域有397種,共計2481種。截至2022年7月,DOAJ上以“country of publisher”確定的我國出版的開放獲取期刊僅193種,僅占全部期刊比例的7.77%,國內開放獲取出版進程與國際相比尚存在較大差距。
根據WOS(全球知名引文索引數據庫Web of Science)近五年的論文發表數據顯示,全球OA文章量占比從2017年的36%上升到2021年的44%;中國作者發表的OA文章量占本國全部發表文章量的比例,也從2017年的31%上升到2021年的38%。
面對國外開放獲取如火如荼的發展態勢,國內越來越多的學者被開放獲取模式所吸引,我國OA文章在國外期刊上的發表量也在逐年增長,打造健康合理的國內開放獲取生態迫在眉睫。目前,國內在開放獲取建設上還存在許多不足,主要表現為缺乏OA發展政策、OA期刊建設不足、缺乏集中的全文本地化倉儲平臺、存在意識形態風險、國際學術傳播話語權不夠等。
一是建議國內出版界加強模式探索。盡快研究新的OA商業模式、新的同行評議方法、新的科研合作伙伴關系和交流模式。要借助數字技術、數字經濟的發展利好,積極開拓新的學術成果發表和傳播路徑,將重心放在論文的創新水平和科學價值上,強調新技術、新產品、新工藝應用于產業化的實際效果。
二是建議產業界加強知識服務建設。開放獲取生態帶來許多知識服務創新空間。新的出版、交流、合作模式必然產生新的流程、交互和信用體系,每個環節都需要創新知識服務的方式方法。在這方面中教圖也在做一些嘗試,單篇文獻服務(SOCOLAR)平臺包含了近2000萬篇的開放獲取文章。通過平臺的建設和技術投入,實際是在做內容發現和OA倉儲的工作,已解決OA文章發表過程中跨境支付(APC)和稅務合規的問題。未來,還有學術評價、經費管理、科研管理等一系列的工作要做,政府、社會和更多的學術行業從業者應共同參與進來,去探索、創造一個健康的、可持續的開放獲取和開放科學生態系統。同時,健全科技評價機制、加強學風建設、積極推進全方位的科技開放措施,實施更加開放包容、互惠共享的國際合作戰略。
作者系中國教育圖書進出口有限公司總經理