999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據的高校圖書館知識創新服務研究

2019-06-11 11:24:42姚遠徐世東郝群盧建秋
中國電化教育 2019年2期
關鍵詞:大數據人工智能

姚遠 徐世東 郝群 盧建秋

摘要:大數據時代,數據成為一種重要的生產因素。高校圖書館運用大數據技術,深入挖掘學術科研數據和讀者學術行為數據,幫助讀者獲得學術資源中的隱性知識、掌握前瞻性的研究視野、建立完善的知識結構、提升讀者的知識創新能力,從而將圖書館演變為知識創新服務中心。該文將這種大數據驅動下的知識服務定義為高校圖書館的知識創新服務,梳理了目前知識服務的現狀,提出高校圖書館知識創新服務平臺的功能模型,利用大數據技術提供對海量數據的實時分析和挖掘能力、語義網技術提供計算機理解和處理事務的能力和判斷與推理能力、人工智能技術持續提高自我性能以幫助人類完成那些一開始無法明確定義的任務的能力,來實現八大創新功能:利用可視化知識圖譜,呈現知識網絡全貌;智能摘要,幫助讀者粗加工大量的文本信息;智能構建個人知識專題;關鍵詞聯想,激發思維聯想;個性化、精準化智能推薦;個人學術軌跡管理與“我的關注領域”呈現;統一檢索與全文檢索;開放學科語義維護功能。由此,高校圖書館的知識服務將站在全數據和智能化的起點上,可望打造為一個創新的服務體系,提供一種全新的服務生態。

關鍵詞:大數據;知識創新服務;語義網:人工智能;知識圖譜;知識關聯網絡

中圖分類號:G434 文獻標識碼:A

大數據時代的到來,顛覆了工業界、學術界對傳統數據的認知。2007年,圖靈獎的獲得者吉姆·格雷發表了專著《第四范式:數據密集型科學發現》,將科學范式從三種擴展為四種,即:實驗科學、理論科學、計算科學和數據密集型科學,這標志著數據思維時代的到來。高校圖書館因提供文獻信息服務和知識服務而擁有和保存的學術科研大數據,為圖書館的發展提供了新機遇。高校圖書館應樹立數據觀,運用大數據技術、語義網技術,自動化完成數據的獲取、整理、統計和呈現,建立文獻信息資源自動化元數據采集與挖掘的大數據倉儲;重新組織圖書館各種類型的文獻資源和信息資源,建立知識關聯網絡,建立語義網絡(學科知識圖譜),可視化呈現知識網絡;追蹤研究熱點、梳理發展脈絡;建立個人學術空間,構建讀者學術畫像,提供知識管理工具,感知和挖掘讀者的隱性學術需求,智能學術推薦。圖書館通過搭建知識創新服務平臺,幫助讀者挖掘學術資源中隱含的知識、掌握更具前瞻性的研究視野、建立完善的知識結構,從而提升讀者的知識創新能力。高校圖書館也從文獻信息服務中心、學術交流中心、文化傳承中心,而真正演變為知識創新服務中心。

一、基于大數據的知識服務現狀

(一)知識服務的概念

以傳播知識為主要任務的圖書館,從最初的文獻服務到信息服務再到如今的知識服務,為滿足用戶的需求而不斷發展用戶服務的實踐。通過對各種知識服務概念的梳理,我們可以提取這樣3個屬性:面向創新、知識挖掘、知識管理。透過這3個關鍵詞總結大數據背景下知識服務的概念,即:圖書館提供通過知識挖掘和知識管理的方式,提供給讀者促進其知識創新的服務。

(二)基于大數據的知識服務的概念

傳統的知識服務概念是指從各種顯性或隱形資源中提煉知識和信息內容,并進行挖掘、重組、濃縮、變形,從而提供知識內容或解決方案的服務過程。知識服務的內涵隨著大數據的驅動而發生變化,它將對眾多分散、異構資源的知識進行加工,通過知識融合、匹配、挖掘等方式,獲取隱含的知識需求與創新,提供新型的知識服務。

(三)高校圖書館基于大數據的知識服務現狀

高校圖書館主要通過知識導航服務、知識培訓服務、問答咨詢服務、情報服務、學科服務平臺及學科服務平臺等方式進行自己的知識服務。以武漢大學圖書館的學科服務平臺為例,圖書館向讀者提供各個學科的整合專業文獻資源,提供館藏文獻和數字資源導航,提供學科服務咨詢、科研分析與評價,以及學術熱點追蹤與評估等服務內容。

在基于大數據的知識服務研究中,高校圖書館界的研究更多地集中在對知識服務創新模式的探討、對大數據知識服務平臺體系架構和關鍵技術的討論上。胡蓮香和張新娜認為大數據知識服務不僅是面向海量數據處理的知識服務,更是基于大數據的智慧圖書館的系統建設,并提出要構建基于大數據的下一代圖書館知識服務平臺;李晨暉等論述了建構大數據知識服務平臺的關鍵技術,并對實施大數據知識服務模式的思路和發展提出了建議;張娟等以養生領域內的領域本體、文獻信息等知識資源為基礎,構建養生單元信息知識服務系統,提供語義檢索、知識瀏覽、知識推理和知識發現等服務,實現大數據環境下“單元信息知識組織體系”的有效利用;劉慶麟梳理了重點學科知識智慧服務的創新策略,提出Web3.0下圖書館重點學科知識服務門戶建設的原則和架構;范興豐以云計算和大數據為基礎,討論了知識服務平臺內容架構和深層資源定制服務;陳川討論了學科元數據中心架構,學科元數據中心的應用特點,提出了基于學科元數據中心的知識服務平臺建設思路,并做了應用實踐分析;余傳明等從解決規模跨度問題、領域跨度問題、語言跨度問題等方面進行了研究,從而提出了觀點檢索的方法。

除此之外,一些高校圖書館還進行了具有特色的知識服務平臺建設研究。以清華大學圖書館為例,他們嘗試從元數據倉儲中提取關鍵詞并進行數據挖掘,分析作者與合作者的關系,建立知識關聯網絡;重慶大學圖書館建設了“智慧門戶”,可實現用戶、資源、服務以數據為中介的交互,能準確預測用戶行為和需求。這些理論研究和實踐探索,都為大數據知識服務平臺的進一步發展提供了有益的嘗試和參考。

(四)數據庫服務商基于大數據的知識服務現狀

國內文獻數據庫服務商除了提供大量優質、及時的原始文獻,還借助公司積累的大量資源和元數據,開始提供數據關聯和計量可視化等知識服務。例如同方知網提供知識網絡節點鏈接技術,實現對節點文獻的各種知識鏈接。同時,同方知網還提供計量可視化分析服務,對選定的200篇以內的文獻提供在線分析其發文總體趨勢、文獻互引網絡、關鍵詞共現網絡、作者合作網絡、資源類型分布、學科分布、來源分布、基金分布、作者分布、機構分布做計量可視化服務。萬方數據知識服務平臺的萬方智搜,可以根據輸入的檢索詞而提供研究趨勢和相關熱詞的可視化呈現,對每一篇文獻都提供相關主題、相關機構、相關學者以及相關文獻和媒體資源的推薦閱讀,并支持讀者對該篇文獻標注標簽。維普推出了情報分析視角的知識服務平臺:維普智立方,可以利用360°網絡圖,獲得多種文獻特征的網絡關系圖,建立關聯網絡。超星統一檢索系統對每一篇文獻提供相關文獻、相同作者的文獻、相同單位的文獻等推薦,并對檢索后的一組文獻進行數據分析和可視化呈現,包括學術發展趨勢、地區統計、基金統計、刊種統計、作者統計、中文學科分類統計等。此外,超星移動圖書館和超星學習通平臺還提供讀者空間服務和建立討論小組等功能。

SpringerLink數據庫運用主題詞表進行規范化標引。對于任何一篇文獻,都標引出研究包含的主題、產業領域及其相關文獻。此外,湯森路透集團提供三大學科服務的統計分析工具InCites、ESI和TDA。Elsevier研發了基于Scopus數據庫的SciVal分析工具,以學術機構為對象,展示機構的科研產出、科研合作情況以及跨學科科研優勢。

(五)高校圖書館迫切需要構建知識創新服務

高校圖書館在提供知識服務的廣度和深度上,越來越落后于專業的文獻數據庫服務商,所以高校圖書館充當著讀者與數據庫服務商之間的銜接和中介作用,而無法給讀者提供基于大數據技術的創新知識服務;對讀者的服務方式還是比較被動,不能根據讀者的已有學術行為分析其需求,并向其準確推薦拓展的學術資源;沒有給讀者提供知識管理工具,用以保存個人的學術軌跡,分析挖掘所關注的文獻中的隱性知識,讀者也并未獲得激發其創造性思維的聯想工具;在針對學科提供學術熱點追蹤、學科評價、科研指導時,也不能基于大數據技術的學科分析工具,需要手動完成大量數據的獲取和整理、統計工作,工作效率較低。正是在這樣的需求之下,本文提出高校圖書館應樹立數據觀,構建基于大數據的“知識創新服務”。

二、知識創新服務的技術基礎

(一)大數據及其特點

大數據,不僅是數據量大,更是一種采集和處理總體數據而非樣本數據的數據集合形式。大數據技術處理的數據量通常是TB級,甚至是PB或EB級的數據,這是傳統數據處理手段所無法完成的,其涉及的技術有分布式計算、高并發處理、高可用處理、集群、實時性計算等。大數據海量的數據規模,使得人們可以獲得龐大的數據信息。大數據還具有時效性強、數據類型多樣性和價值密度低等特點,使得人們通過挖掘和加工數據實現數據的價值發現。

(二)語義網絡及其特點

語義網是一種智能網絡,它能根據語義進行判斷和理解概念間的邏輯關系。語義網的建立極大地涉及了人工智能領域的部分,與Web3.0智能網絡的理念不謀而合。而語義網絡是一種面向語義的結構,它用圖來表示知識間的結構關系。語義網用結點表示信息,結點之間的關系通過有向直線來表示。語義網絡有以下特點:可以深層次地表示知識,包括實體結構、層次及實體間的因果關系;語義解釋依賴于該結構的推理過程而沒有結構的約定;知識表達自然、直觀、易于理解。語義網絡的價值在于計算機可以通過語義網絡來理解判斷和推理。

(三)人工智能及其特點

人工智能即AI,它是模擬、延伸和超越人類智能的理論和實踐。人工智能的第三次浪潮緣起于Hinton等人提出的深度學習技術。從全球范圍來看,AI應用主要集中在各個垂直領域、智能機器人領域、大數據和數據服務、視覺。其中以商業、醫療和金融領域中的應用最為深入。人工智能技術可以對人的思維進行模擬,也可以成為人類智能的擴展和延伸。

人工智能在演進的過程中,呈現出以下新特點:深度學習、跨界融合、人機協同、群智開放和自主智能。人工智能,尤其是機器學習具有一個核心價值:就是機器能夠持續提高自己的性能,而無須人類明確解釋所有這些任務要怎樣完成,成為了自己學習如何完成任務的系統了。這使得對那些我們無法精確表達出的知識,人工智能也可以自動化地實現了。

(四)高校圖書館大數據構成

高校圖書館的大數據由學術資源數據、業務流程數據、情境感知數據、讀者行為數據這四個方面構成。針對這4類數據,圖書館可以開展資源管理與利用數據分析來支持資源采購決策,開展用戶行為分析來指導圖書館業務優化并提供針對性服務,開展情境數據分析提供精準導航和自適應調節,開展學術資源分析與用戶學術行為分析來提供知識創新服務。本文著重討論的是第四種數據分析與服務工作,即深入挖掘圖書館的學術資源用戶學術行為數據,為讀者提供知識創新服務。

(五)大數據加工環節

微軟在《e-Science科學研究的第四種范式》中,把科學研究劃分為4個階段:第一階段是數據收集,第二階段是數據處理,第三階段是數據挖掘,第四階段是可視化。高校圖書館的大數據加工同樣包括這些方面的工作,它主要由這5個環節構成:大數據收集(數據收割)、大數據存儲、大數據處理(數據清洗和預處理)、大數據分析(數據挖掘)、大數據應用服務。

(六)大數據技術概況

目前,大數據的處理主要有以下4種形式:對靜態數據的批量處理、對流式數據的實時處理、實時交互計算、對圖數據的綜合處理。大數據分析的關鍵技術主要包括深度學習、機器學習、知識計算、可視化、社會計算等。

批量數據處理系統以Google文件系統GFS和MapReduce編程模型為典型,Hadoop在此基礎上實現的兩個開源產品:HDFS和MapReduce,繼Hadoop之后由UC Berkeley的Matei Zaharia主導開發了新一代大數據分布式處理框架Spark,提供高層次的Java、Scala、Python以及R語言的API接入。Hadoop的MapReduce和Spark Core使用映射和規約的思想可以進行海量數據的分析和操作。典型流式數據處理系統包括Twitter的Storm系統、Linkedin的流式數據處理框架Samza、Facebook的Scribe、Linkedin的Samza、Cloudera的Flume、Apache的Nutch;交互式數據處理系統的典型代表系統是基于內存計算的Spark和Google研發的Dremel。圖數據處理系統主要有Ne04j、FlockDB、GraphDB等。實際上,Spark提供了一系列工具集,Spark SQL融合多數據源的不同格式結構化數據,能夠實現SQL等結構化數據處理,MLlib支持機器學習,還有針對流數據的Spark Streaming,而Graph X支持圖處理等。如今,Spark與Hadoop在同一個團隊里協同運行,已經被越來越多地運用。

深度學習包括Dato、vlcarlcus、MetaMind、AlchemyAPI、Clarifai、SKYMIND等。機器學習平臺包括kaggle、AzureML、Google等。關于知識計算,代表性的知識庫或應用系統有KnowltAll、TextRunner、NELL、Probase、Satori、PROSPERA、SOFIE以及基于維基百科等構建的知識庫,如DBpedia、YAGO、Omega和WikiTaxonomy。文本可視化包括表現詞頻的標簽云、表現文本結構的DAViewer和DocuBurst、表現形成與變化過程的ThemeRiver和EventRiver;網絡(圖)可視化除了樹狀、球狀、放射圖外,還有基于矩形填充、Voronoi圖填充、嵌套圓填充的樹可視化技術,更有基于邊捆綁(Edge Bundling)的方法和基于層次聚類與多尺度交互的ASK-Graphview等圖簡化方法的可視化技術。社會計算目前還集中在方法層面,例如興趣計算和信任計算。

目前流行的兩個開源搜索引擎Solr和ElasticSearch,都建立在Apache Lucene開源平臺之上。Solr的主要特點有全文索引、高亮、分面搜索、實時索引、動態聚類、數據庫集成、NoSQL特性和豐富的文檔處理(例如Word和PDF文件),Elasticsearch主要特點有分布式搜索、多租戶、查詢統計分析、分組和聚合。

三、知識創新服務平臺功能模型

根據大數據收集、大數據存儲、大數據加工、大數據應用封裝等加工環節,本文建構了知識創新服務平臺,該平臺包括六大核心模塊:資源層、大數據倉儲、運營管理平臺、學科知識服務平臺、讀者學術管理、學科分析平臺。知識創新服務平臺功能結構如下圖所示。

(一)大數據倉儲

本體庫管理:支持對本體庫條目的填加、修訂;

分類聚類:支持對知識庫的分類層級、類目、類目歸類做元設計;

元數據管理:對內容資源的元數據定義、提取、修改和存儲管理;

數據映射:支持不同類型、結構資源按照統一數據規范處理,注入大數據倉儲;

自動標引:支持對資源內容的自動標引,實現對內容資源的語義標注(支持段落級別的語義標注);

知識體系管理:支持多種知識模型的導入、修改、導出;支持對領域知識庫中知識單元、關聯關系管理,包括對知識單元和關聯關系的聚類、分類、導入、導出。

(二)運營管理平臺

日志管理:記錄系統狀態、模塊點擊、登錄行為等日志信息,支持可視化方式呈現;

統一認證管理:通過接口同步OPAC認證信息,對系統的各個功能模塊統一認證;

用戶角色權限管理:設置系統管理員、平臺管理員、領域專家、學科館員、讀者等多種角色,分配不同權限;支持系統管理員開通各個角色權限認證信息,或授權OPAC注銷讀者繼續使用平臺;

資源來源管理:增加大數據倉儲的來源信息,給出資源鏈接;

讀者使用管理:記錄和統計用戶的登陸和使用平臺時間;統計檢索詞并挖掘檢索熱點;填加、修改、讀者信息,為讀者畫像提供信息;

資源使用管理:記錄和統計讀者對資源的搜索、瀏覽、下載、標注等使用情況,作為評價數據庫來源使用情況的數字基礎,支持可視化方式呈現;

讀者畫像管理:對讀者畫像做元策略設計;

資源引用管理:對大數據倉儲中的資源做虛擬打包、封裝、管理和發布,供學科知識平臺建立專題使用;同時提供人工建構專題內容的人口。

(三)知識創新服務平臺

1.學科知識服務平臺

研究熱點專題:對大數據倉儲中自動聚類的資源進行批量選擇、修改、挖掘、編寫說明、提交、審核、發布等操作,在學科知識服務平臺上形成本學科的熱點專題;提供手動編寫專題內容的功能;

知名專家學者專題:對大數據倉儲中自動聚類的資源進行批量選擇、修改、挖掘、編寫說明、提交、審核、發布等操作,在學科知識服務平臺上形成熱點專題;提供手動編寫專家學者相關內容的功能;

統一檢索:實現對大數據倉儲中的內容資源進行跨庫統一檢索,支持通過題名、關鍵詞、主題詞、作者、機構、期刊名等檢索項的元數據檢索,支持專業檢索式檢索;支持檢索結果從學科分類、細分領域、年份、語種、文獻類別、來源等多個分面進行篩選;系統根據讀者輸入的關鍵詞,自動呈現相關的(從語義和關聯兩種角度的)主題詞、屬性值、作者、電子資源提示,點擊這些關鍵詞,則實現此關鍵詞的統一檢索;檢索結果支持相關度、檢索熱度、更新時間、專業度等多個角度的排序方式;檢索結果支持手動篩選,支持生成和保存檢索報表,支持對檢索報表的計量可視化;

學科知識導航:挖掘大數據倉儲,對每個學科提供按照細分領域、主題、文獻類型、研究層次等維度分類的自動知識導航;

學科知識圖譜:建立學科和領域知識語義網絡,點擊該節點,則實現此節點的統一檢索;

關聯網絡:建立以人、機構、知識點為中心的知識關聯網絡,點擊該節點,則實現此節點的統一檢索;關聯網絡的展示范圍可調節;

全文檢索:支持讀者輸入關鍵詞,系統以關鍵詞匹配的搜索方法,迅速查詢所有數據,反饋所有目標資源;

智能摘要:系統根據每一篇語料中的主題,自動對每篇語料生成摘要;

智能問答:挖掘學科知識圖譜,支持基于問答語料的生成式知識問答。

2.讀者學術管理

個人學術軌跡:記錄讀者的學科、專業、導師,記錄所有檢索詞、瀏覽和下載過的資源、借閱的圖書、發表的論文和著作信息;

我的關注領域:根據讀者的個人學術軌跡,挖掘讀者的關注領域(細分領域),點擊這些領域,則呈現此領域的知識圖譜,而讀者關注過的主題,則在知識譜圖中用高亮等方式呈現;點擊知識圖譜中的節點,則展示相關主題的最新資源推薦(一個月內新到館的資源);

智能推薦:根據讀者的個人學術軌跡、學科專業方向、導師研究方向、本專業研究前沿等信息,構建讀者畫像,根據讀者畫像智能推送新到館資源(每個星期更新,歷史推送在“更多推薦”中保存);

知識管理工具:支持讀者對本體、知識庫、知識圖譜進行個性化標注、修正和補充;讀者的標注、修正和補充反饋給管理后臺,作為學科語義完善的一個依據;保存對英文作者、機構、主題詞、期刊名的中文標注。

3.學科分析平臺

學科分析元設計:保存個性化的檢索式;定義和保存個性化檢索主題、查詢范圍、檢索結果字段;保存對英文作者、機構、主題詞、期刊名的中文標注(讀者貢獻標注的入口開放給所有讀者,審核權僅對學科館員開放),當以這些中文標注為關鍵詞檢索時,同時對被標注主題詞進行檢索,中英文檢索結果融合;

多元檢索:提供一般檢索、高級檢索、專業檢索式、統一檢索等多種檢索方式;檢索結果支持手動管理(篩選),支持生成和保存檢索報表;支持報表導出為特定的數據格式,以便在第三方系統中加工處理;支持對檢索報表范圍內的計量可視化;支持對報表中的熱點詞匯、關聯內容、發展趨勢等進行多維度的統計分析和可視化呈現;支持統計結果和可視化內容導出;

數據分析模型:集成常用情報數據分析算法和工具(主題、作者等,暫不涉及引證);

學科語義維護:支持對本體、知識庫、知識圖譜進行個性化標注、修正和補充;學科館員的標注、修正和補充反饋給管理后臺,作為學科語義完善的一個依據。

四、基于大數據的高校圖書館知識創新服務

大數據技術提供對海量數據的實時分析和挖掘能力;語義網技術提供計算機理解和處理事務的能力,并具備一定判斷、推理能力;人工智能技術提供持續提高自我性能的能力,幫助人類完成那些一開始無法明確定義的任務。這些技術的結合,使得高校圖書館的知識服務,得以站在全數據和智能化的起點上,可望打造為一個創新的服務體系,提供一種全新的服務生態。本文提出的知識創新服務,就是要綜合運用大數據技術、語義網技術,重新組織圖書館各種類型的文獻資源和信息資源,建立知識關聯網絡,建立語義網絡(學科知識圖譜),并可視化呈現知識網絡。在這個具備語義基礎的海量知識關聯網絡的基礎上,運用自然語言處理和深度學習等智能化技術,可以為讀者打造提供多樣思維聯想工具、知識管理工具、智能輔助工具的全新知識創新空間。

(一)利用可視化知識圖譜,呈現知識網絡全貌

將充分構建的知識圖譜以可視化的方式直接呈現給讀者,而不僅僅是作為智能檢索與智能化知識服務的底層數據,這將幫助讀者建立完善的知識結構、獲得學術資源中的隱性知識、掌握前瞻性的研究視野、建立廣泛的聯想觸點。當讀者對某個知識點進行檢索時,可以向讀者呈現以此知識點為中心的可視化的知識圖譜,知識圖譜中包含了與這個知識點具有語義、聚類、類別、關鍵詞、屬性、引文等關聯的知識節點呈現。知識圖譜與關聯網絡主要基于構建知識圖譜模塊知識挖掘、知識屬性抽取、知識關系抽取、知識聚類、知識融合、知識反饋、知識推理等算法進行學科領域知識圖譜構建,并挖掘其學科和領域知識語義網絡,最終利用知識圖譜可視化技術實現學科知識圖譜與關聯網絡的可視化展現。

(二)智能摘要,幫助讀者粗加工大量的文本信息

大數據時代的知識創新服務平臺具備的自然語言技術,配合充分構建的基于語義的知識圖譜網絡,運用大數據技術實時處理海量數據的能力,可以實現對讀者選定文獻的智能摘要功能。利用人工智能輔助人類閱讀(粗讀),使用智能摘要技術來解決大量的文本信息與個人有限的閱讀能力之間的矛盾。當讀者閱讀了智能摘要后,會快速掌握自己關注問題的概況,然后再進一步聚焦于細節進行深入閱讀和研究。智能摘要,還可以與知識圖譜一起,共同提供給讀者。當讀者篩選出若干文獻,并希望獲得智能摘要時,知識創新服務平臺就將這些文獻的智能摘要和知識圖譜,實時計算并提供給讀者使用。點擊智能摘要中的知識點或者知識圖譜中的節點,則可呈現相關的來源文獻。

(三)智能構建個人知識專題

利用基于語義的知識圖譜網絡,利用自然語言處理文本聚類算法,知識創新服務平臺可以提供給每一位讀者個性化建構個人知識專題的功能。讀者只需要輸入檢索詞,并對檢索反饋的結果做訂閱操作,讀者就自動建立了一個以檢索詞為主題的知識專題,這個專題自動更新專題內容,并可實現推動功能,這樣讀者就可以持續掌握所關注主題的發展現狀。對專題中的精華內容進行收藏操作,讀者還可以手動構建新的知識專題。同時,平臺還可實現對熱門專題的自動挖掘與推薦,并支持進行批量選擇、修改、挖掘、撰寫說明、提交、審核、發布等操作。

(四)關鍵詞聯想,激發思維聯想

關鍵詞聯想是知識創新服務平臺為讀者提供的一個思維聯想工具,幫助讀者做檢索詞的有效擴展或修正。當讀者在關鍵詞聯想小工具中輸入一個關鍵詞,系統會反饋出若干個與這個關鍵詞高度相似的詞語,以啟發讀者發散思維、拓展思路。關鍵詞聯想是基于知識圖譜的詞向量來實現的。通過關鍵詞聯想,讀者可以很快定位到自己關注領域的核心詞匯,從而進一步鎖定個人的知識需求。

(五)個性化、精準化智能推薦

個性化、精準化智能推薦,是在知識創新平臺充分感知讀者的學術軌跡的基礎上,構建讀者個體學術畫像和群體學術畫像、充分挖掘讀者的隱性學術需求,為讀者提供的實時計算后的推薦結果集。基于用戶畫像的圖書館知識服務,能夠提升讀者的知識服務體驗,促進圖書館實現個性化、精準化的知識服務。本文提出基于本體構建圖書館讀者學術行為的用戶畫像,以知識圖譜的視角考察用戶畫像的構建方法。對讀者的借閱圖書、檢索數據庫、關注論文、發表學術成果等學術行為建模,結合用戶畫像層次模型的合成權重、融合時間上下文因素、參考用戶所屬學科和專業的群體用戶畫像,綜合構建圖書館讀者學術行為的用戶畫像向量空間模型。將用戶畫像的向量空間模型中的向量詞,對應于讀者領域知識圖譜中的概念,將知識圖譜中的概念關系映射到用戶畫像中,獲得用戶畫像本體。所推薦的學術資料包含從語義關聯、聚類關聯、類別關聯、關鍵詞關聯、屬性關聯、引文關聯等多角度相關的內容。

(六)個人學術軌跡管理與“我的關注領域”呈現

個人學術軌跡與“我的關注領域”的呈現功能,主要通過大數據管理系統,實現對讀者學科、專業、導師、檢索詞、瀏覽與下載痕跡、借閱記錄、發表學術成果信息等綜合全面管理;基于對讀者學術軌跡的記錄和分析,實現對讀者學術興趣、關注領域的自動挖掘與發現,并進行相關領域知識的推薦。在這里,“我的關注領域”實際就是對個體用戶畫像實時的可視化呈現。將基于本體構建的用戶畫像匯聚成“我的關注領域”,用以可視化地呈現在讀者個人空間中,能夠展現出這些領域的知識概貌。當讀者在個人空間中點擊各個概念的時候,這些概念可以展開成為以這個概念為中心的知識圖譜,或者針對各個概念進行智能檢索。“我的關注領域”可以幫助讀者發現自己的隱性知識需求,修正自己關注的領域概念,同時系統能實時更新用戶畫像和讀者學術軌跡,更加智能化地為讀者提供創新知識服務。

(七)統一檢索與全文檢索

統一檢索提供包括基礎檢索、智能下拉提示、搜索糾錯、混合智能排序、搜索聯想、意圖識別、語義理解、語義搜索、自然語言BI、圖譜視頻檢索等在內的綜合智能搜索技術,為用戶提供一站化智能搜索。首先,根據用戶畫像獲得符合隱性用戶需求的檢索結果,并將檢索結果按照各種分面規則和排序策略進行個性化推薦服務。知識創新服務平臺還支持用戶通過題名、關鍵詞、主題詞、作者、機構、期刊名等檢索項進行元數據檢索,支持專業檢索式檢索;支持檢索結果從學科分類、細分領域、年份、語種、文獻類別、來源等多個分面進行篩選。對統一檢索的反饋結果,還可以進行基于語義、聚類、類別、關鍵詞、屬性、引文等關聯方式的分析和可視化呈現。提供全文檢索功能,即平臺具有對全文數據進行詞、字、段落等更深層次的編輯、加工的功能。例如,知識創新服務平臺對全文數據中的每一個詞建立一個索引,指明該詞在全文數據中出現的次數和位置,便于讀者查詢使用。

(八)開放學科語義維護功能

知識創新服務平臺主要利用信息反饋技術,向讀者提供學科語義維護功能,支持讀者對本體、知識庫、知識圖譜進行個性化標注、修正和補充,幫助本體、知識庫、知識圖譜變得更加系統與精確;讀者的標注、修正和補充反饋給管理后臺,作為學科語義完善的一個依據。知識創新服務平臺通過單元信息的關聯關系實現了新知識的衍生,讀者基于關系網絡可以發現更多密切相關的單元信息知識。讀者針對這些衍生出的新知識、建立起來的新關聯,都可以在平臺上提出自己對新知識和新關聯的定義,并提供給管理后臺作為完善知識圖譜的一個建議。

五、結語

在大數據時代,高校圖書館應樹立數據觀,利用文獻信息服務和知識服務而擁有和保存的學術科研大數據,運用大數據技術、語義網技術,建立文獻信息資源自動化元數據收割與挖掘的大數據倉儲;建立知識關聯網絡,建立語義網絡(學科知識圖譜),可視化呈現知識網絡;建立個人學術空間,構建讀者學術畫像,提供知識管理工具,感知和挖掘讀者的隱性學術需求,智能學術推薦。圖書館通過搭建知識創新服務平臺,幫助讀者挖掘學術資源中隱含的知識、掌握更具前瞻性的研究視野、建立完善的知識結構,從而提升讀者的知識創新能力。高校圖書館也從文獻信息服務中心、學術交流中心、文化傳承中心,而真正演變為知識創新服務中心。

作者簡介:

姚遠:助理研究員,博士,研究方向為數字圖書館(yaoyuanlaura@126.com).

徐世東:碩士,碩士生導師,研究方向為在線教育、現代教育技術(13693334909@126.com)。

郝群:副研究館員,碩士,碩士生導師,研究方向為現代圖書館管理、信息服務。(haoqunn@163.com)。

盧建秋:教授,博士,博士生導師,館長,研究方向為中藥質量控制研究、圖書館學研究(lujq@vip.sina.com)。

猜你喜歡
大數據人工智能
我校新增“人工智能”本科專業
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 04:56:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 91亚洲精品第一| 最新亚洲人成无码网站欣赏网| 亚洲国产成熟视频在线多多| 自拍亚洲欧美精品| 日韩av在线直播| 欧美激情二区三区| 亚洲一级毛片在线观播放| 欧美不卡视频一区发布| 国产成人精品午夜视频'| 一边摸一边做爽的视频17国产| 丁香五月婷婷激情基地| 伊人福利视频| 欧美精品影院| 中文字幕首页系列人妻| 国产国模一区二区三区四区| 欧美激情综合| 毛片基地美国正在播放亚洲| 丁香六月激情综合| 91精品福利自产拍在线观看| 久996视频精品免费观看| 在线五月婷婷| 国产精品嫩草影院视频| 综合色区亚洲熟妇在线| 香蕉国产精品视频| 四虎国产永久在线观看| 女人18毛片一级毛片在线 | 国产视频a| 少妇精品久久久一区二区三区| 91小视频在线观看免费版高清| 日韩免费毛片视频| 国产色伊人| 热思思久久免费视频| 国产精品第| 九九免费观看全部免费视频| 免费99精品国产自在现线| 国产真实乱子伦视频播放| 中文字幕 91| 久久综合色视频| 亚洲综合专区| 激情六月丁香婷婷| 毛片网站免费在线观看| 国产av剧情无码精品色午夜| 久久国产亚洲偷自| 色偷偷一区二区三区| 国产免费久久精品99re不卡| 欧美一级黄片一区2区| 国产在线一二三区| 波多野结衣久久精品| 8090午夜无码专区| 97se亚洲综合在线天天| 国产在线小视频| 欧美性天天| 精品视频免费在线| 亚洲国产亚综合在线区| 精品国产电影久久九九| 精品夜恋影院亚洲欧洲| 毛片最新网址| 农村乱人伦一区二区| 亚洲区第一页| 欧美色伊人| 熟女日韩精品2区| 国产噜噜噜| 日韩黄色精品| 91在线国内在线播放老师| 亚洲精品图区| 爱爱影院18禁免费| 全部免费特黄特色大片视频| 国产在线97| 国产二级毛片| 日本在线国产| 久久久久无码国产精品不卡| 国产成人精品优优av| 国产成人高清精品免费5388| 亚欧成人无码AV在线播放| 欧洲亚洲一区| 国产精品嫩草影院av| 欧美日韩中文字幕二区三区| 手机在线免费不卡一区二| 欧美啪啪精品| 女人av社区男人的天堂| 男女男免费视频网站国产| 久久综合丝袜长腿丝袜|