劉學平 (濰坊學院圖書館 山東 濰坊 261061)
網絡技術的發展使館藏數字資源的環境由傳統文件網絡環境向充滿語義關聯資源的新環境轉變。這為知識發現活動越來越多地基于網絡資源展開增加了新的發展機遇。圖書館是數字資源的聚集地,從迅速增長的館藏數字資源中發現有效的知識,與圖書館知識服務的趨勢正適切,而對館藏數字資源關聯知識發現過程的研究,正好為知識服務的知識推送提供了實現路徑。因此,尋求資源關聯對知識發現效率和能力的影響,優化二者之間的關系,促進資源關聯背景下的知識發現,實現發現知識對讀者需求的針對性,提升圖書館的知識服務能力,成為實現館藏數字資源關聯知識發現過程的目的。這一目的決定了館藏數字資源關聯知識發現過程的實現路徑要分兩個維度展開:一是從微機角度出發,強調微機的計算能力和人工智能,以各種高性能處理算法、智能搜索與挖掘算法等為主要實現內容;二是從讀者對知識的需求角度出發,強調基于人機交互的、符合人的認知規律的分析方法,將人所具備的、微機并不擅長的認知能力融入知識發現過程[1],具體表現如下。
實現館藏數字資源關聯知識發現過程的動力主要來自兩方面,一是讀者快速獲取知識的準確性需求。目前館藏數字資源檢索結果采用一維線性排列方式,讀者需要逐條閱讀篩選出自己需要的資源,在浪費讀者時間的同時降低了資源的查全率與查準率。二是讀者對館藏數字資源關聯知識發現的期望。網絡時代,快節奏的學習方式致使讀者期望一個高效、便捷的知識獲取平臺,能夠在同一張網頁上直觀地看到獲取到的有用資源并顯示出各知識之間的關聯關系。館藏數字資源關聯知識發現過程的實現,為讀者這一期望的實現提供了實現的路徑,即知識發現過程能將檢索結果用有效關聯、建立數據聯系、二次開發等方法實現,使資源具有相關性,再通過二維圖形和圖表、三維圖形和動畫、多維模擬空間等可視化的方式[2],將檢索結果呈現給讀者,實現讀者一站式獲取資源的期望。讀者的這種需求和期望成為館藏數字資源關聯知識發現過程實現的動力源泉。
由于館藏數字資源主要以網頁的形式存在,所以頁面資源的抓取至關重要。網頁抓取技術主要是對HTML頁面的抓取和分析,配合HTML connector即網頁連接器一起使用,抓取雙層鏈接并保存頁面內容。常見的網頁抓取方法有三種,一是URL(Uniform Resource Locator,統一資源定位符)地址中包含分頁信息;二是通過Asp.net開發的網站分頁控件,通過POST方式提交分頁信息到后臺代碼;三是翻頁過程中找不到頁碼信息,所以只能用代碼模擬手動翻頁,然后抓取[3]。
資源挖掘是利用路徑分析技術、關聯規則、序列模式、分類聚類等技術,挖掘出有效的、可能被理解的資源和知識。常用的方法有貝葉斯方法、遺傳算法、神經網絡等。在此基礎上,圖書館利用可視化技術、知識查詢技術等,將得到的資源轉換為讀者可以理解的資源,并刪除無用資源[3]。
索引技術是資源庫與讀者需求之間的橋梁,貫穿于整個資源發現過程中,它包括內容索引和結構索引。結構索引即圖書館將網頁中的頁面和鏈接作為索引的節點和邊的有向圖,有了節點和邊的有向圖就可以對超鏈接創建索引。內容索引主要是Web頁面的文本資源[3],是在資源挖掘時查詢內容相關度的主要方法。
語義聚焦爬蟲發現法分為發現目標的定義和描述、發現策略的分析與制定、頁面語義標注和分析三步。首先,以事先遴選好的URL作為種子樣本來決定爬行的起點,從而達到對爬蟲為發現新目標頁面URL而進行漫游的深度控制和引導;其次,采用傳統的深度優先、廣度優先和啟發式搜索等策略,對提取到的URL列表進行鏈接排序和下載,得到不含任何語義關聯信息的數據和相關的元數據;最后,對得到的資源進行分析和分類,從語義化的網頁或文件格式中(如URL文件、OWL文件、XTM文件、XML文件)嵌入相關語義標記(如RDFa、Microdata的HTML和XHTML),并從文件中提取和分離出語義標注信息。常采用的方法是編寫自定義的解析程序或者采用語義分離器RDF API等。對非語義化標注的網頁文檔,此方法則通過一些自動化語義標注軟件或人工輔助標注方式補充語義信息[4],實現對獲取到相關實體數據和元數據語義標注的完善,最終根據語義標注信息發現新知識。
領域本體發現法與語義聚焦爬蟲發現方法有相同之處,由于它增加了領域本體庫的支持,因而也增加了多道處理工序,主要表現有:其一,在頁面語義標注和分析環節,并不僅僅是對當前頁面進行語義分析,而是結合領域本體庫的知識對頁面進行擴展解析。其二,在完成頁面解析后,能夠把得到的相關語義標注信息重新返回給領域本體庫,由領域本體庫進行基于三元組的拆解和保存,從而達到擴展和豐富現有本體庫的目的。其三,在資源存儲和索引環節,利用本體映射技術對本體庫中新增的異構本體進行本體和實體的映射,同時利用實體融合技術對映射結果庫中相同或相似的實體進行實體融合或實體關聯,然后將最終形成的實體關系和數據交給索引分析模塊進行處理[4],從而形成索引庫以進行存儲和索引。
在數據結構上,語義網主要采用“資源-屬性-值”的RDF三元組形式去描述網絡知識源。一個RDF三元組又可以表示為一個RDF有向圖。因此,對于微機來說,一個有效的語義網資源站點可以被定義為一個或多個RDF有向圖組成的集合。因而基于RDF的查詢,該方法能夠借助于RDF數據模型和語義網自身的優勢,對查詢需求進行明確語義和強結構化的表達,從而查詢到精確滿足特定目標需求的數據,而返回的查詢結果仍然是一個RDF三元組的集合,這有利于進一步的語義關聯和語義挖掘。目前,國際上具有代表性的RDF查詢語言主要包括SPARQL、RQL、RDQL、SERQL、N3、TRIPLE、Versa等[4]。
該方法首先利用語義搜索引擎或關聯數據源提供的接口,在根據應用需求遴選出的相關關聯數據源中,通過訪問這些數據源中的RDF鏈接發現更多的相關資源數據。其次,通過關聯映射實現關聯數據(不同的關聯數據通常采用不同的本體或敘詞表來標注同一實體概念的語義信息)、不同本體或敘詞表中對同一個實體進行定義或描述的術語的標準,并能夠將其全部轉換或使用某種統一的目標規范格式進行表示,以避免后續處理出現誤解和混亂。最后,通過實體〔不同的關聯數據源也通常采用不同的URI(Uniform Resource Identifier,統一資源標識符)去標示同一個實體〕融合,對實體中所有使用標記指向的數據源進行資源獲取和審核,用于對當前實體關系的語義補充和完善,并產生和分配給該實體一個主體的新的URI,形成一個新的關于該實體的RDF聲明,同時將通過審核的RDF鏈接作為來源數據源仍然使用標記在新的RDF聲明中。同時也為了保證知識資源發現的可靠性[4],盡可能地摒棄無效的RDF鏈接和實體關聯信息。
“發現”是一個從無到有的過程。就館藏數字資源知識發現過程而言,它不是通常的知識呈現的過程,而是超出館藏資源范圍以外,用新思維、新方法發現新知識的過程。館藏數字資源的動態增長,會不斷地給知識發現過程提供新的數據和信息,產生更多的新知識。這樣的知識發現過程會使我們意識到,由于讀者對館藏資源需求的滿足永遠是不全面、暫時的,因而知識發現過程是一個動態、不飽和的過程,它會以“發現”更多知識的新思維督促知識發現過程時刻準備著去獲取和挖掘更多的最新知識,而不是停留在原有、靜止的某個層面[5]。這樣的新思維會在調動圖書館知識發現主動性的同時,提升知識發現率,達到提高館藏數字資源利用率的目的。
發現技術的日新月異要求知識發現必須及時跟蹤與關注聚焦爬蟲、領域本體、RDF查詢語言、關聯數據、語義網、資源發現、資源組織等相關領域的前沿技術發展動態,及時對其理論、方法、技術和工具進行了解和掌握,并在知識發現過程中,根據每種發現技術和發現工具的優劣點,按知識發現過程的需要,選擇最佳的技術與工具完成發現過程的設計和發現任務。這也是館藏數字資源關聯知識發現過程實現的基礎條件和必備條件。因為館藏數字資源關聯知識發現過程通常被要求能夠同時支持檢索驅動和知識推理驅動的過程。檢索驅動是指基于頁面分析的標記處理和語義標注的過程,知識推理驅動是指推理引擎借助領域本體和知識庫進行新規則和關聯知識發現的過程[4]。這兩個過程的實現必須借助知識發現領域的最新技術和最新工具才能完成。
由于發現知識的最終目的是滿足讀者的知識需求,因而發現過程應在以讀者知識需求為中心的同時,鼓勵讀者參與到知識發現過程中,使發現知識對讀者的知識需求更具有針對性。讀者的知識需求一般來源于讀者對館藏資源的檢索與閱讀,因而可利用讀者日志、讀者cookie進行讀者需求的提取和收集。采取的方法是對讀者的資源檢索行為進行統計分析,對讀者的閱讀習慣進行聚類,然后根據聚類得到的各類指標(如檢索關鍵詞、關鍵詞出現頻率、讀者登錄頻率、檢索頻率、下載頁數、瀏覽時長等)的相關性、邏輯性,對數據進行過濾,去除無效數據,保留一些能夠體現讀者對資源感興趣的信息,建立讀者需求數據庫,運用分類、聚類、關聯分析等方法,研究出讀者知識需求的內在聯系和普遍規律,如使用習慣、知識背景及知識取向等[6],據此采用知識關聯對發現知識進行有針對性的組織與管理,使其目的明確、方向清晰。讀者參與知識發現過程,是在發現需求調查階段采用角色扮演、預演和模擬的方式獲得讀者對知識的需求和期望,在發現過程中采用滿意度調查和可用性測試方法收集讀者對知識發現效果的評價,在發現知識使用階段采用問卷調查和使用統計來評估館藏數字資源利用率的變化和讀者期望的滿足程度[7]。可見,以讀者知識需求為導向的知識發現過程,在使發現知識更具針對性的同時,對館藏數字資源的建設也有很好的指導作用。
作為一種新型知識發現的探索,館藏數字資源關聯知識發現過程的實現路徑尚處于摸索階段,它需要進一步規范和完善。筆者將館藏數字資源關聯知識發現過程的特殊性擬合到知識發現的一般過程中,得到的實現路徑為:利用相關技術和方法,從館藏資源數據中收集目標數據,對數據進行提取、清理、序化、集成等預處理,再將處理過的數據轉換為能夠進行數據關聯與挖掘的格式進行數據的關聯與挖掘,從中發現相關知識,再將知識進行呈現、推送與評價。由于知識發現本身是一個循環求精的過程,根據評價結果的反饋,可以循環回到知識發現過程的前續階段,進一步獲得更為準確和符合需求的結果[8],完成整個知識發現過程,如圖1所示。

圖1 館藏數字資源關聯知識發現過程
圖1展示出這一實現路徑的獨特之處在于:一是發現過程以資源關聯方法(數據、技術、資源環境、標準、機制)作為邏輯控制。因為知識發現被視為基于資源關聯的特殊應用,因而發現過程的邏輯控制遵循基于資源關聯數據應用的一般規律。資源準備、資源獲取、資源處理和資源挖掘處理過程,都需要根據資源關聯的特殊需求進行重新的設計和解決。二是過程方法控制。流程以知識發現作為基本方法,采用分層結構,很自然地將資源關聯數據與知識發現方法融合在一起,發揮各自優勢。三是功能操作控制。流程各層之間和各功能模塊之間依靠功能操作進行銜接、互動和控制,實現流程中資源的調用、組織和生成[9],它是資源關聯知識發現過程能否實現的關鍵。
問題理解是對館藏數字資源關聯知識發現過程的問題進行分析與定位。問題分析是對發現基礎的問題(通過知識發現的方法實現數字資源關聯的核心價值——關聯發現)、如何發現的問題(通過數據和資源之間的關聯關系去發現新的關系和新的知識)、發現什么的問題(如何發現和產生語義關聯的新知識[9])進行分析。問題定位是將館藏數字資源關聯知識發現過程問題定位為多任務、多路徑、多步驟:多任務是將資源關聯定位為詞表映射(用以實現兩個異構資源之間的轉換)、資源比對(用以計算兩個資源之間的相似度)、資源鑒別(根據一個資源的屬性,通過與規范記錄比對,獲得該資源的規范名稱)、去重(根據資源對比的結果,將兩個被認為同指的資源進行合并)、顯示化(將發現知識進行可視化顯示)等多種任務類型[10];多路徑是指館藏數字資源關聯知識的發現過程同時存在著多條發現路徑;多步驟是將館藏數字資源關聯知識的發現過程分解成多個連續的步驟。
資源收集是將形式多樣、異質異構、數量龐大的館藏數字資源聚集在一起,為知識發現的數量、質量及其覆蓋面奠定基礎。收集方式以集中獲取為主、針對數字資源的特性而異,如針對資源的多樣性,收集過程采用網絡技術、發現技術,確保資源收集的全面性、系統性;針對資源的動態性,采用資源分析技術,經過設置收集資源的時間和關鍵詞等需求,實現對選定資源相關內容的定期監視和自動收集[7];針對內容復雜、信息量大的資源,采用資源挖掘、數據分析等技術,對其進行收集和整理。同時,為使館藏資源知識發現更有針對性,圖書館還要將散存在讀者的個人網站、博客、微博、QQ 群等各種網絡交流工具中有價值的需求資源進行收集。
由于通過以上諸方式收集起來的大量來自不同渠道、不同格式的數字資源是由多個孤立的子網組成,它們彼此之間是獨立自治、弱關聯的,缺乏互操作接口,因此尚不具備支持資源知識發現的能力[10],圖書館需要對其資源進行挖掘。資源挖掘的核心是建立結構化、關聯的資源表示。其方法是通過資源計量統計分析(利用文獻計量工具,如SPSS、TDA、SATI、UCINET 等,對數字資源進行基本統計與挖掘)、引證文獻關系(在簡單統計分析的基礎上更進一步,包括對參考文獻、引文索引等引文關系的分析)、高相關度資源(解決讀者問題的重要參考資料)、交叉資源(從宏觀的角度挖掘數字資源之間的隱含關系)等[11]先進的技術手段,對收集來的數字資源進行處理、分析與挖掘,將資源揭示由表面的信息深入到資源之間的復雜關系,使不同資源節點之間的多重關聯關系充分揭示出來,展現給讀者的資源不再是一個點到點的線性結果表示,而是深入分析讀者需要的、揭示各資源關聯關系的立體資源體系[12],為發現潛藏在資源背后的知識做好充分的準備。
經過挖掘的資源,我們要對其合法性進行檢查,清理錯誤資源,進行初步轉換,即利用一定的技術工具,實現多種格式數字資源的標準轉換,以此獲取規范元數據信息,并對資源的元數據統一標準和規范接口,對各類資源加以描述和標引,將各類資源統一組織和深層揭示,實現各類收錄資源的統一檢索和利用[13];并在轉換過程中進行資源的創建、修改、刪除、克隆等,將其存入臨時數據區;對臨時數據區內的資源,選擇資源相關的屬性子集,并去除冗余屬性,采用資源采樣、資源轉換、資源表達等方式[14],對資源進行相關性排序,即通過合并、去重及內容補充等,保證元數據的品質;通過搜索引擎針對規范化的元數據進行快速索引,建立不同屬性的規范詞表,實現讀者分面查詢和結果關聯。以此實現異構資源有序化的轉換,即資源數據能進行普通瀏覽、檢索瀏覽、分類瀏覽等操作,使資源達到序化的最佳匹配。
資源關聯是在挖掘與序化的資源數據中發現資源數據項之間的關系,生成新的資源數據鏈接的過程,其方法是:用URI來指代資源,用RDF三段式(事物—特性—值)來描述和聯接資源,RDF三段式資源中的任何一部分都可以集中很多信息,既可以回答檢索問題[15],也可通過HTTP協議揭示并獲取這些資源數據。此方法可實現館藏資源的以下關聯:一是文獻本身信息的糅合,如在圖書信息中,通過與網絡圖書封面、摘要、目次及網絡書評等信息的關聯,實現了圖書詳細信息的無縫集成。二是構建以檢索信息為核心的資源網絡,實現引文關聯、知識元引用關聯、相似文獻關聯、概念關系詞關聯等,如分析圖書作者、相關合作者及期刊、會議、文章等不同文獻之間的關系,建立圖書、期刊及學位論文等不同文獻之間相互引用的立體引用關系;分析文獻作者、作者單位等信息的引文網狀,為讀者提供全方位的知識內容信息等。三是通過海量數據聚類學科,進行學科趨勢的分析,提供學科發展的基本脈絡和走勢,為讀者了解不同時期學科研究熱點與發展方向提供重要信息[16]。關聯化館藏資源數據對于資源的發現、融合與互操作具有重要作用,它是知識發現和知識創造的起點。
知識發現不僅取決于知識結點之間的邏輯關系,也取決于知識之間的有機關聯,更取決于讀者對知識的需求和利用。資源的動態性決定了知識發現應在資源進行實時性節點定位的同時,將定位節點不終止于單一資源,應考慮資源間語義關聯關系,進行知識的鏈式發現[17],即對資源數據進行分析、轉換和歸類,形成發現軟件可識別的不同特征的數據集(如期刊影響力數據集、論文被引數據集等),并對不同的數據集采用不同的參數預算和維度表達,形成發現多維索引體系,以滿足各種發現檢索需求。在此基礎上,再通過資源發現技術,在深入分析讀者搜索行為的基礎上,圖書館運用技術手段進行快速匹配,對數字資源進行充分的挖掘、關聯和升值,深入揭示資源的整體性,使得資源的查找和定位更加細化、快捷、準確,幫助讀者發現所需資源的信息、知識、節點、來源等[12]。知識關聯挖掘具體可以分為兩個層級的任務,一是在整合的關聯數據集上,調度和運行傳統的數據挖掘,完成既定模式的知識發現。這一層級的工作需要考慮將關聯數據的檢索過程從數據挖掘過程中分離出來,以便減輕讀者使用和了解關聯數據的底層邏輯(本體、語義)的負擔。第二個層面是利用關聯數據自身的特點,通過鏈接挖掘與發現關聯數據網絡中隱藏的、豐富的、潛在有用的關系。這一層級的工作目標是創建針對關聯數據特性的挖掘算法、知識模式,以便在已有的語義關聯基礎上,推斷和發現任意資源之間的進一步關聯或者通過特定模式重新組織和架構形成新的關聯知識[18]。
知識呈現一方面要借助發現過程中一站式檢索來完成對檢索結果的呈現和獲取,另一方面在一站式檢索中嵌入更多的發現軟件,實現發現知識的多維呈現與關聯呈現。呈現方式主要有發現知識呈現、發現知識流程呈現和發現知識關聯呈現三種類型[13]。發現知識呈現是利用映射將數字知識轉化為圖示表達,以利于讀者的觀察和理解;發現知識流程呈現是利用錄像、音響等技術手段將某些實驗流程、示范片段或者研究報告等進行視頻傳播,使知識發現流程更為顯性透明;發現知識關聯呈現是利用相關發現工具,將某個領域的資源知識進行關聯,以此展示或發現該領域的研究熱點和發展趨勢等。
知識的推送是圖書館在發掘讀者潛在資源知識需求的同時,針對特定讀者的需求,通過RSS、E-mail、收藏推薦等方式,借助于信息推送技術,將發現的館藏資源關聯知識主動傳遞到讀者界面,提高知識服務的主動性。
知識評價是根據知識發現本身是一個循環求精的過程而設定,是一個需要專家、讀者共同參與的人工過程,其方法是:召集資源發現領域專家,對發現的知識進行多維度的測評,并將評價結果與讀者在使用資源知識過程中的反饋意見進行合并,根據對讀者知識需求問題的解決情況,對讀者不滿意的知識重復知識發現過程,將知識進行修復和完善,直至讀者滿意為止[8],以實現知識發現過程的經驗積累、知識修復和目標的完善,進而體現知識發現過程循環求精的不爭事實。
網絡環境下,知識服務成為圖書館服務的趨勢,也是使命使然。因此,如何利用館藏數字資源關聯知識來提升圖書館知識服務力,滿足讀者知識需求,對館藏數字資源關聯知識發現過程實現路徑探究,既為此問題提供了解決的方案,也適應了圖書館提供知識服務的需求。它標志著資源知識的傳播與交流價值凸顯,作為一種新的資源知識發現方式,從資源獲取、關聯揭示、知識發現到知識的呈現、推送與評價,發現過程貫穿其建設推廣和功能擴展的整個流程,有著不可替代的作用。按照研究思路,文章在對發現過程中的問題進行了分析與定位,將館藏數字資源關聯知識發現過程的特殊性擬合到知識發現的一般過程中,把知識發現規律和資源關聯技術、標準、資源環境和知識發現的方法融合,構建了實現館藏數字資源關聯知識發現過程的完整路徑,擴展和融合了知識發現和館藏數字資源關聯的研究體系,并得出了如下結論:一是館藏數字資源關聯知識發現過程的實現路徑是在建立起兩個或者多個資源關聯對象之間直接關聯的基礎上,構建多類資源之間的關聯知識網絡,其本質是資源關聯知識網絡不斷演變的過程。二是資源關聯知識發現過程是一個“多任務、多路徑、多步驟”、 無法一步到位的過程。數字資源的動態性決定其關聯知識發現過程是一個常態化任務;發現過程的復雜性決定館藏數字資源關聯知識的發現過程能真正打破知識在物理和邏輯上的分割和獨立,能在廣泛、動態和完整的基礎上完成知識的發現和創新。三是知識發現本身是一個多發的過程,通常要涉及到多個資源數據集的信息查找和知識組織過程,因而尋找資源信息之間相關點的能力尤為關鍵。館藏數字資源關聯的實現恰恰為讀者增強了這一能力,也為知識的發現提供了新的可能。
當然,館藏數字資源關聯知識發現過程的實現路徑不僅是對發現知識的顯性揭示,還需從讀者多角度需求和資源關聯度出發,對多來源資源進行定向的分析,預測知識發現規律,對新發現的資源知識進行一致性、效用性處理,挖掘資源子類結構的層與發現知識庫中知識要素結點間的一一對應關系,從一個特定角度揭示知識發現的潛在規律與復雜性,實現內容知識的智能化發現和擴展[16]。這是館藏數字資源關聯知識發現過程實現路徑的長遠之道,也是我們未來的研究方向。
[1]任 磊, 杜 一, 馬 帥, 等. 大數據可視分析綜述[J]. 軟件學報,2014,25(9):1909-1936.
[2]田 寧. 讀者服務視角下的資源發現系統可視化服務研究[J].圖書館學研究, 2014(17):71-75.
[3]許 微. 基于知識發現機制的企業決策支持系統構建研究[D].湘潭:湘潭大學公共管理學院, 2013:11-16..
[4]王思麗, 劉 巍, 祝忠明, 等. 語義化的知識資源發現方法探析[J]. 圖書館學研究, 2014(9):2-6.
[5]董岳珂. 發現系統引發的關于信息素養教育的思考[J]. 圖書館論壇, 2014,34(4):58-63.
[6]張為江. 基于用戶需求分析的數字圖書館知識發現系統研究[J].圖書館理論與實踐, 2014(9):83-85.
[7]郝 飛. 圖書館資源發現系統應用研究[J]. 電子世界, 2014(4):48-49.
[8]李 楠. 基于關聯數據的知識發現研究[D].北京:中國農業科學院農業信息研究所研究生院, 2012:93-99.
[9]李 楠, 張學福. 基于關聯數據的知識發現應用體系研究[J]. 圖書情報工作, 2013,57(6):127-133.
[10]沈志宏, 黎建輝, 張曉林. 面向LOD關聯發現過程的定位目標與復雜性分析[J]. 中國圖書館學報, 2013,39(6):101-108.
[11]李迎迎, 王 娟, 鄭春厚. 高校圖書館數字資源服務評價指標體系構建[J]. 情報雜志, 2014,33(3):192-197,142.
[12]劉江玲. 面向大數據的知識發現系統研究[J]. 情報科學, 2014,32(3):90-92,101.
[13]解金蘭, 王 穎. 發現視角下機構庫的建設與功能研究[J]. 圖書館學研究, 2014(8):52-57.
[14]劉 段. 發現系統在學術研究中的應用研究[D]. 武漢:華中師范大學信息管理學院, 2014:16-26.
[15]田 寧. 基于關聯數據的信息資源整合[J]. 圖書館學刊, 2014(1):37-39.
[16]楊 會, 汪 榮. 網絡級知識發現服務的功能分析及問題探討[J]. 情報雜志, 2013,32(11):149-153.
[17]李丹丹. 應急制造資源動態發現與優化配置方法[D]. 哈爾濱:哈爾濱理工大學機械動力工程學院, 2013:22-32.
[18]李 楠,張學福. 基于關聯數據的知識發現模型研究[J]. 圖書館學研究, 2013(1):73-77,67.