谷紫藤
(河北大學管理學院圖書館 河北 保定 071000)
國內語義出版領域相關概念研究綜述
谷紫藤
(河北大學管理學院圖書館 河北 保定 071000)
語義出版是基于傳統互聯網技術和語義網技術,結合自然語言處理、本體和信息可視化技術而發展起來的一種新興出版形態,是數字出版的高級形式。本文以中國知網、萬方、維普三大中文數據庫為檢索平臺,收集了三大數據庫在語義出版領域的研究文獻,梳理了語義出版的概念及發展歷程,對語義出版相關概念,可視化出版、互動出版、增強出版等進行辨別,以期能對當下語義出版領域的發展現狀作出分析,為語義出版的未來發展趨勢作出預測。
語義出版;數字出版;納米出版物;知識組織
如今,博客、微博、社交網絡、移動服務在互聯網時代飛速發展,這給我們帶來了很大的便利,與此同時,我們也面臨著“信息過載”“信息迷航”“信息孤島”等問題。此外,傳統的元數據描述已經無法滿足科研用戶對于資源的獲取以及檢索需求。所以,面向以關聯數據為基礎技術的web3.0的語義技術在出版領域得到應用,它增強了出版內容的語義標識,使得信息組織在語義時代又有了新的發展。語義技術解決了正式學術交流與非正式學術交流共同面對的問題,揭示了出版物之間的關聯,實現內容支架的互操作和交互。
語義出版是借助信息技術對傳統數字出版物進行語義標注、語義關聯等富語義化操作并形成語義出版物的一系列過程。語義出版的實質是在線信息服務提供商和大型學術出版機構運用語義網的核心思想與相關技術向用戶提供科學知識的智能化發布、個性化獲取和共享處理機制。自從2009年提出這個概念以來,學者們對于這個領域的研究逐漸深入,每年發表的論文也日益增多,對于語義出版的研究方向及角度也各有千秋,在此,對于已經發表的文獻進行分析,梳理當下文獻,對當下語義出版領域的發展現狀做出分析,為語義出版的未來發展趨勢做出預測。
本文選取中國知網、萬方、維普這三大中文數據庫為檢索平臺,選定期刊論文、學位論文、會議論文選項,分別進行高級檢索,檢索式為“主題=“語義出版”or“主題=增強出版”or“主題=納米出版物”(2017年6月28日)在將檢索結果導出到NoteExpress文獻管理軟件,然后對三大數據庫的記錄再進行查重合并,在對檢索結果進行剔除,共經過兩輪剔除,其中第一輪剔除標準為剔除人物訪談、期刊索引、會議通知、以及主要題錄信息不全面的文章。第二輪剔除為質量剔除,質量剔除的標準為體現語義出版、增強出版、納米出版物的語義信息,在本次檢索過程中,主要針對的是“增強出版產業”與“增強出版”的分辨以及對一些帶書名號的書目的語義處理信息進行剔除,例如《修辭語義:描寫與闡釋》出版、增強創新意識提高出版競爭力,最終得到檢索結果40條記錄。
科技出版和科學交流的發展植根于科學研究本身的范式轉換,因此其表現不限于數字技術推動的載體遷移與升級,而是朝著增強型科學出版和交流的方向發展,并集中體現在語義出版、可視化出版、互動出版和增強出版等方面。從科學出版和交流的內容來看,新增海量數據將轉化為有效的結構型數據,并向著語義和智能出版方向發展;從科學出版和交流的工具來看,科技文獻將普遍采用3D圖像、視頻、動畫、虛擬現實等多種媒介呈現方式和技術;從科研成果的組織方式來看,科學信息和內容將根據用戶需求從線性向非線性組織方式發展,并表現出更強的交互性特征。[1]
(一)可視化出版
可視化出版利用可視化技術、虛擬仿真技術及可視化工具將科學數據和信息立體地呈現在研究人員面前,具有直觀、生動、交互性強等優點,能夠幫助科研人員快速分析和理解抽象概念。在醫學、生物學、天文學及地球科學等自然科學領域,可視化出版一直廣受關注。可視化出版充分利用2D、3D、虛擬現實技術,將科研數據和信息資源的聯系與關聯生動形象的展現出來,既便于科研人員發現其中的聯系,也更加明顯易懂。2011年2月,國際科技信息委員會(ICSTI)專門召開“科學信息出版的可視化與多媒體創新”主題研討會,討論數據挖掘、可視化、虛擬情境、多媒體創新、圖像索引與分析、人機交互等多個主題[2]。可視化出版在信息泛濫的今天也具有意義非凡的利用價值。
(二)互動出版
打破傳統的單向“傳播”模式轉而形成作者與用戶之間的雙向“交流”,這是互聯網環境下開放科學倡導的前進方向。一直以來,科技出版業也在促進科研工作者之間的互動交流。從方式上看,主要包括以博客、社交網絡等為代表的互動交流方式;以學術維基(wiki)為代表的動態出版方式;還有以開放式同行評議為代表的互動評價方式。當博客最先興起時,這一嶄新的交流平臺就得到科技出版機構的積極采納。近幾年,互動性更強的社交網站如推特、臉書、科學網博客等進入科學交流領域,成為用戶、作者、編輯、出版商等各種角色的主要交流渠道。通過這種雙向的交流,使得用戶不僅作為被動的接受者,也可以表達自己的看法,有利于增強學術交流的范圍。
(三)增強出版
為了更好地促進研究成果的共享和傳播,數字出版越來重視增強型出版,增強出版物也應運而生。增強出版物是連接數據和文獻之間的橋梁和紐帶,能夠幫助科研人員發現大量的灰色文獻。增強出版主要具備以下幾個特點:①可以將研究數據、額外資料及發表出版后的數據,如元數據集、模型、圖表、算法及社交媒體等不同類型數據進行集成連接,便于科研人員全面地理解數據及信息的產生、應用與創新過[3];②能夠利用資源地圖(Resource Maps)及永久標示符(Persistent Identifi cation Numbers)等在不同類型的資源之間建立關聯和資源描述框架,以方便用戶快速檢索和定位資源;③這些內容需具備關鍵詞和數字摘要,具有機器可讀、智能標記及結構化的特點[4]。
綜上,科技出版和科學交流的發展正朝著增強型科學出版和交流的方向發展,并集中體現在語義出版、可視化出版、互動出版和增強出版等方面,這幾個模式之間不相互排斥,反而相互融合,共同實現科學交流的價值目標。要實現大規模的數據關聯,數據集本身是否具有良好結構,標記粒度是否足夠細,它們之間的互操作性如何等又是必須解決的問題。在此過程中,語義出版、可視化出版、互動出版、增強出版之間并不存在嚴格的分界線,而是體現出相互交織的特點,共同服務于科學交流的價值目標,只要符合當下及未來的發展導向的都可以理解為出版的優越模式。
[1]徐麗芳,叢挺.數據密集、語義、可視化與互動出版:全球科技出版發展趨勢研究[J].出版科學,2012,(04):73-80.
[2]翁彥琴,李苑,彭希珺.英國皇家化學會(RSC)——科技期刊語義出版模式的研究[J].中國科技期刊研究,2013,(05):825-829.
[3]Saskia Woutersen-Windhouwer.Enhanced Publications:Linking Publications and Research Data in Digital Repositories[M].Amsterdam:Amsterdam University Press,2009.
[4]汪慶,任慧玲.新技術環境下STM出版發展趨勢探析[J].科技與出版,2014,(09):123-127.
谷紫藤(1995-),女,漢族,河北石家莊市人,本科生,河北大學管理學院圖書館學專業,研究方向:圖書館學。