趙海濤 周長嶺 李文燕



摘要:ISLI國際標識符體系以關聯為核心,可以較好地滿足知識服務對知識整合、資源共享和服務共享的需求。通過對ISLI在知識服務中的應用(ISLI/KLS)體系——ISLI/KLS關聯編碼結構及元數據,注冊管理體系,編碼分配/解析業務,產業化應用體系進行研究及應用,最終實現以ISLI為抓手構建知識服務的生態體系,進而連接知識、資源和服務,為用戶提供精準深度專業的知識服務。
關鍵詞:ISLI 知識服務 ISLI KLS 生態體系
互聯網行業一直都在追求的一個目標就是如何基于人、信息、內容等等之間的連接構建更多元更美好的互聯網應用和服務,并因此不斷地推動著各行各業發生廣泛的變化,而“連接”已成為其中至關重要的基礎因素。
2015年底,為推動新聞出版業專業數字內容資源知識服務試點工作并促進ISLI標準的應用,國家新聞出版廣電總局數字出版司立項展開ISLI標準在知識服務中的應用研究工作,該課題命名為ISLI/KLS(Knowledge Linking Service),由中新金橋數字科技(北京)有限公司牽頭承擔相關的技術研究和實踐驗證工作。通過對ISLI/KLS的體系研究和應用,最終實現以ISLI為抓手構建知識服務的生態體系,進而連接知識、資源和服務,為用戶提供精準深度專業的知識服務。
知識服務對ISLI的需求
ISLI針對資源關聯建立專門的標識符編碼體系,是中國新聞出版業主持起草和管理的第一個國際標準,急需構建和擴展具體的應用服務,擴大其國際影響力;而專業數字內容資源知識服務模式的核心是構建專業知識組織體系,通過知識內在的關聯關系提升內容資源價值,從而改變內容資源的服務效能和服務模式,促進產業增值。將ISLI應用于知識服務體系的構建將成為能夠同時促進ISLI實施應用推廣和專業數字內容資源知識服務的重要契機。
經過深入研究,在知識服務資源及產品構建過程中面臨的如下問題可以借助ISLI技術機制進行解決:
1.各領域知識之間的交叉性、重復性
在知識組織的實踐工作中發現,不論是采用傳統的主題詞表,還是應用當前的知識體系構建方式,在領域知識之間都存在著一定的交叉性和重復性,某個領域的核心知識往往文/趙海濤周長嶺李文燕成為另外一個領域的基礎支撐,因此需要對知識進行一定程度的關聯和整合,構建全局性的知識體系。
2.資源分散且沒有統一的組織體系
專業圖書雖然內部具有較好的縱向知識組織,但是往往缺乏橫向知識關聯,使得眾多專業內容資源處于難以應用甚至無法被發現的狀態,這與用戶尋找知識產生了嚴重的不對稱情況,尋找有價值的資源正變得越來越困難。因此,迫切需要通過知識關聯,促進資源發現并提供精準知識服務。
3.平臺和門戶分散性和獨立性
隨著百度、谷歌等綜合搜索方式的普及,用戶已經培養出單一入口訪問的習慣,當前專業內容平臺和門戶的分散性及獨立性勢必會增加用戶的使用門檻和獲取效率。在這方面,集資源邏輯整合和搜索為一體的知識發現系統的推廣與普及給予我們一定的啟發。
ISLI技術體系以關聯為核心,可以較好地滿足知識服務的以上三個需求:通過構建知識體系對關聯知識進行整合,促進資源的共享分發,打通各平臺實現服務的共享,由統一的門戶平臺提供知識服務,進而支撐一次生產多元發布的模式。
因此,ISLI/KLS的建設將為專業出版帶來巨大價值。對于終端用戶而言,可以了解知識組織結構,獲取精準的資源以及獲得抽象與具化的提升;對于出版單位而言,可構建基于關聯的知識服務產品,帶動傳統數字資源的銷售;對于新聞出版業而言,可形成以知識整合為基礎的資源和服務共享機制,構建國家級知識資源服務平臺。
ISLI/KLS的分析與構建
目前,ISLI已經有效地解決了資源之間基本關聯關系的標識,但是ISLI在知識服務層面應用方面還需要針對知識組織以及知識服務的特性進行關聯屬性和關聯模式等方面的應用擴展,以確保ISLI實現對知識組織和知識服務的底層支撐。
(一)ISLI/KLS應用場景分析
ISLI當前框架擴展為ISLI/KLS框架所面臨的首要問題是ISLI框架中“源”和“目標”指的是什么,ISLI框架關聯模式有哪些。
知識資源組織核心在于構建知識或資源的關聯,所以ISLI/KLS關聯的“源”和“目標”是知識元及內容資源,其中知識元是知識的最小組成單元,它可以完整的表達一項知識。
通過分析,結合ISLI具有關系方向性的特征,我們總結出以下四種典型的關聯應用場景:
1.知識——知識關聯
定義:描述知識元之間的關聯關系。
場景:用戶在學習某項知識時想要了解與該知識相關的知識。問題在于相關的知識數量龐大,用戶需要在知識關系上加以篩選并判斷哪些知識和當前知識關聯更緊密。
分析:以上場景描述了知識到知識關聯的需求,對關聯關系描述提出了要求,其目的是為用戶推送更準確的關聯知識。
2.知識——資源關聯
定義:描述知識元到資源的關聯關系。
場景:用戶需要獲取某項知識的相關內容資源,但資源過多且來自不同的版權所有者。
分析:以上場景描述了知識到資源關聯的需求,ISLI已為一個產品中跨多個領域的資源供給提供了基礎架構,但并未提供關聯關系描述和關聯程度作為篩選依據以更準確地推送資源。
3.資源——資源關聯
定義:描述資源之間的關聯關系。
場景:論文中引用其他論文中的相關內容,用戶對此處引用的內容有所疑惑,需要定位到被引用論文并能瀏覽被引用位置及其上下文。
分析:以上場景描述資源到資源的關聯需求,但僅僅獲取到被關聯的資源是不夠的,還需要提供被關聯資源內部位置的描述以準確定位。endprint
4.資源—知識關聯
定義:描述資源到知識元的關聯關系。
場景:用戶在網頁中瀏覽到一個建筑圖片,非常感興趣,想進一步了解該建筑的建造結構等相關知識。
分析:以上場景描述資源到知識的關聯需求,需要提供內容資源到知識的關聯,以幫助用戶獲取資源背后所蘊含的知識。
總體而言,深入研究知識和資源的關系是專業內容資源知識服務的核心基礎,知識是相對穩定、抽象的,而對應知識的內容資源則非常豐富且形式多樣的,可以供使用者深入了解、學習、研究并將知識轉化到實際工作應用中。在新聞出版業,內容資源海量存在,借助ISLI體系可以很好地實現基于知識組織有效梳理并整合資源的目標。
(二)ISLI/KLS關聯模式構建
如上分析,知識服務的應用場景存在豐富的關聯需求,但是目前的ISLI框架還不足以完全支撐,需對其進行擴展。對應ISLI現有體系,ISLI國際標準在知識服務中的應用研究(ISLI/KLS)可設計為下圖中的體系框架,本框架的主要任務為:以知識元和資源為源/目標,以知識知識、知識資源、資源——資源和資源——知識為關聯模式,遵照ISLI從源到目標的關聯模型和標準體系,構建知識關聯服務應用中的ISLI/KLS擴展元數據和ISLI編碼結構,提供ISLI/KLS的運營支持和技術支持。
其中,核心任務是在ISLI現有的元數據(包括14個ISLI編碼元數據和8個服務編碼元數據)基礎上定義ISLI/KLS擴展元數據和ISLI/KLS編碼結構,以更好滿足ISLI的應用擴展并支撐知識關聯服務。
(三)ISLI/KLS編碼結構及元數據
ISLI編碼結構包括三部分:第一部分是服務字段(SC);第二部分是關聯字段(LC),不定長,由各關聯服務提供商SP定義;第三部分是校驗字段。ISLI/KLS需要對關聯字段進行結構定義。
作為國際標準,ISLI未來需要支撐多種應用,不同的應用需要通過對其元數據擴展得以實現。ISLI的元數據分為編碼元數據和服務元數據,在ISLI/KLS應用中元數據擴展包括:
1.元數據要素擴展
針對知識服務特點和需求,ISLI/KLS在元數據中擴展了關聯模式、關聯關系、關聯程度和關聯位置等描述。
2.元數據取值擴展
在元數據取值方面,在源/目標類型數據項中,知識類型元數據擴充到了22種,資源類型元數據擴充到了7種;源/目標名稱類型數據項中新增KOI(知識唯一標識符);在關聯模式類型中建立了四種模式,即知識——知識、知識——資源、資源——資源和資源——知識;在關聯關系中針對上述四種類型,知識——知識關聯定義類型25種,知識——資源的關聯定義類型14種,資源——資源的關聯定義類型4種,資源——知識的關聯定義類型22種;對于關聯程度,目前尚無法量化判斷,通用來說分為強、中、弱三種程度;對于關聯位置,定義有3種。
(四)ISLI/KLS注冊管理體系
按照ISLI的總體要求,ISLI/KLS注冊管理體系的管理機構是ISLI/KLS RA,主要職責是負責所有知識關聯服務類應用SP的管理,實現對ISLI/KLS編碼進行注冊和解析的服務。其位置位于ISLI RA之下,與已有的ISLI/MPR RA成平行關系,如下圖所示:
(五)ISLI/KLS編碼分配/解析服務
基于當前ISLI的基本流程,ISLI/KLS的編碼分配和解析服務加入ISLI/KLS特定的關聯服務商和ISLI/KLS RA兩大角色。
以ISLI/KLS編碼的分配流程為例:
ISLI編碼分配業務分兩步,首先由出版社或個人向ISLI/RA申請獲得知識關聯服務提供商SP資格,以獲取服務字段(SC)編碼,之后登記者向具體SP申請關聯字段(LC),LC的分配過程如下:
1.LC申請:登記者(出版社或個人)通過SP KLS的關聯構建系統提交ISLI/KLS編碼注冊申請;
2.LC審核:經SP KIN審核后將LC核心元數據提交到ISLI/KLS RA的注冊系統中;
3.LC分配:ISLI/KLS RA收到申請后分配對應SC下的ISLI編碼,并將最新分配的ISLI/KLS編碼同步到ISLIRA的全球ISLI編碼數據庫中。
(六)ISLI/KLS產業化應用體系
ISLI/KLS產業化應用體系由各個面向具體知識關聯應用的SP構成,SP的申請者可以是專業出版社也可以是個人。SP既可以利用自身構建的關聯也可以通過ISLI/KLS的已有關聯構建知識關聯服務。
未來,數字出版編輯的主要工作可能包括構建知識體系、構建知識和資源的關聯關系。知識關聯服務的核心仍是基于內容資源,所關聯內容可以有不同的顆粒度,如何挖掘內容產生更多的價值,ISLI/KIN提供了可行的方式和廣闊的想象空間。
ISLI/KLS應用建設實踐探索
(一)ISLI/KLS在電子技術領域中應用
電子工業出版社與中新金橋公司在2016年共同研發了基于ISLI/KLS的知識服務產品“E知元”,并探索性的在“E知元”中運用ISLI/KLS關聯框架。
“E知元”是一款基于移動端的電子技術知識庫產品,依托電子工業出版社優質內容資源,精選電子技術類專業圖書進行結構化及知識化加工,以探索知識服務新路徑為目標,創造性地利用知識導航、知識地圖、知識束等不同方式展現知識,并提供海量條目的深入閱讀功能,以輔助用戶快速、深入地學習相關知識與技能。該產品采用全新的“內容+平臺+終端”產品形態,適合數字出版的創新需求,具有產品化和市場化的優勢。
“E知元”一期已建設近5200個知識元,并利用ISLI/KIN關聯描述框構建關聯關系,形成大約6000對知識
知識的關聯關系,通過知識化加工形成了166601對知識資源的關聯關系。
(二)ISLI/KLS在建筑施工領域中的應用
在2016年,中新金橋公司還與中國建筑工業出版社共同研發了基于ISLI/KLS的建筑施工知識服務產品“i施工”。
“i施工”是一款多終端的交互型建筑施工領域知識庫產品,以中國建筑工業出版社品牌圖書《建筑施工手冊》(第五版)為核心,精選大量建筑施工類圖書進行結構化、知識化加工,構建以專業閱讀、讀練測一體化在線學習和專業知識共享為核心的建筑施工知識服務平臺,以輔助用戶更方便地獲得建筑施工領域的專業、權威、可信的知識資源,更快地提升知識水平,更好地學習和吸收先進技術,更便捷地與其他各方進行交流溝通。
“i施工”中整理了近30000個建筑施工領域知識元,并利用ISLI/KLS關聯描述框構建關聯關系,形成大約45000對知識—知識的關聯關系,通過知識化加工形成了百萬對知識資源的關聯關系。
(三)ISLI/KLS相關工具和系統研發實踐
為充分驗證ISLI/KLS的運營支撐模型和基本流程,中新金橋公司在ISLI/KLS課題研究過程中專門研發了基于ISLI/KLS框架的領域知識體系構建工具、知識關聯加工工具和相應的知識管理系統,并在ISLI RA的支持下研發了ISLI/KLS編碼注冊及解析模擬流程以及與ISLI RA的模擬接口。相關的技術和工具系統研發工作成果為ISLI/KLS體系的系統性開發、建設和運營提供了重要的實證技術基礎。
ISLI/KLS的展望
ISLI是一個描述關聯關系的開放共享的國際標準,其提供的關聯機制、方法和服務模式先天性契合知識服務的需求。在ISLI技術框架體系下,通過對ISLI/KLS的體系構建和應用支撐建設,可以大幅度地改變傳統知識和資源的生產質量、獲取模式以及應用和傳播效率,實現專業出版領域通過知識提供統一服務,并進一步通過知識關聯實現內容資源基于用戶需求的精準投送,最終實現新聞出版業基于知識服務的共建、共享和共贏。endprint