999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的圖書館智庫情報服務構建研究

2018-08-22 12:37:48秦宗和
圖書館學刊 2018年6期
關鍵詞:數據挖掘圖書館用戶

秦宗和

(忠縣圖書館,重慶 404300)

1 大數據背景下的圖書館智庫情報服務

1.1 大數據與智庫

信息技術與經濟全球化的發展促使信息量爆炸式增長,許多公共事務需要通過跨學科、跨平臺以及跨機構的協同發展,許多與國計民生相關的項目都需要基于大數據來進行智慧構建[1]。在此背景下,具有智力資本和信息資源優勢的智庫情報服務應運而生,智庫情報服務可以為圖書館決策者提供優質的情報決策服務。傳統的單一智庫運營模式欠缺深層的大數據分析和數據挖掘支持,針對高質量的情報分析存在困難,這種模式下,智庫學者與情報專家之間存在知識鴻溝,二者無法實現更廣泛的交流、合作,導致智庫的情報服務研究結果無法適應現代化的信息技術發展和經濟全球化的趨勢[2]。

近年來,圖書館智庫情報服務在大數據建設與發展的背景下,逐漸呈現出知識與情報緊密結合的發展趨勢,通過數據挖掘產生的知識不斷支撐高質量的決策結果。實際上,圖書館的智庫與情報工作之間存在著天然的聯系,智庫的知識研究過程有較強的情報需求,情報研究能夠為智庫知識研究提供信息支撐和數據支撐[3]。在圖書館的情報研究中,通過智庫提供的大數據分析和數據挖掘工具,針對情報用戶需求中的環境分析、信息加工和情報分析等活動,為情報分析用戶提供穩定的環境監測、態勢跟蹤和深度分析,以及有效的風險預警和決策等功能,這些功能都具有巨大的需求和良好的發展前景。

1.2 數據挖掘與智庫情報分析

一般來說,數據挖掘與智庫情報分析都是以數據為基礎,通過挖掘和分析,獲得隱含在大數據中的知識或情報,從而完成對目標問題的指導和決策。因此,在數據挖掘與智庫情報分析中,應該關注數據之間的多元融合以及多元數據之間的相關性,主要包括以下3個方面[4]:

(1)大數據的基本屬性為數據總量較大,數據挖掘需要通過機器學習獲得的規則對大量數據進行分類,過濾掉冗余信息,減少數據存儲量;現代情報分析更依賴于信息技術,通過人工對大量的信息進行判斷和決策,最終形成穩定的情報分析結論。

(2)數據挖掘能夠面對大量多元異構數據,從結構化、非結構化數據中挖掘出有效信息;在提倡科學性的前提下,智庫情報分析應該從多源異構數據源中獲得深度數據信息。

(3)相關性分析是數據挖掘和智庫情報分析的基本原理,從提升數據挖掘和智庫情報服務之間的協調性和適應性角度來看,通過相關性分析構建多樣性數據之間的相關性有較大的意義。因此,在大數據時代下,采用數據挖掘對智庫情報分析能夠產生更為科學的分析結果。

2 大數據背景下的圖書館智庫情報服務構建

2.1 圖書館智庫情報服務構建的理論基礎

圖書館智庫具有收集數據、信息和情報,加工、檢索和提煉等功能,而這些服務也正是圖書館情報分析所需要的服務。實際上,由于職能的差異性,智庫研究中的情報檢索能力較差,遠不如情報研究中的情報檢索能力,而情報研究中的決策能力遠不如智庫研究中的決策能力[5]。然而兩者在數據挖掘、信息收集和檢索上都有較高的相似性。因此,若將情報研究過程加入到智庫的運行機制中去,可以為圖書館智庫提供有力的信息共享和知識服務體系。圖書館情報研究的自身資源和技術平臺能夠為圖書館智庫提供全面的數據支持和信息保證,其研究的價值能夠完美契合圖書館的智庫研究;反過來,智庫的構建和開發也能夠提升和強化情報機構的信息服務技能。

圖書館情報智庫構建過程中,智庫研究一定要重視對情報運營機制的構建,情報研究的構建需要借鑒智庫研究的服務機制。在二者的工作內容上,智庫和情報研究為服務對象提供戰略決策,二者的服務形式都是知識創新和策略創新。智庫研究以問題為中心,針對圖書館公共事務決策提供智慧支持,情報研究則是以用戶需求為出發點的智能決策支持服務。因此,情報用戶的需求基礎為智庫的問題導向提供了基本保障,智庫的構建則可以將情報研究中的需求導向融入到問題導向中,增加情報研究的多樣性。因此,圖書館智庫和情報研究之間具有較高的相似性,這將為構建大數據背景下基于數據挖掘的圖書館情報智庫構建奠定良好的理論基礎。

2.2 圖書館智庫情報服務平臺構建

圖書館智庫情報服務平臺是一個集合資源檢索、數據處理、情報傳輸、智能數據挖掘等多個功能的有機整合系統,并構建于物聯網、云計算和大數據平臺基礎上,能夠有效地將智庫研究和情報研究有機整合并相互滲透、共享資源。圖書館智庫情報服務平臺能夠借助于各種定量分析和定性分析的數據挖掘工具與方法,將大數據信息和資源轉化為有效的智能決策和支持[6]。該平臺的構建既需要將環境分析、需求分析、任務設計、數據挖掘、知識發現、智能服務和情報服務等基本流程融合,也需要具備較強的認知學習、控制評價的智能反饋能力,最終能夠應用于圖書館的各項公共事務的決策和支持。

圖1 基于數據挖掘的圖書館情報智庫平臺組成模塊和功能

該平臺從圖書館智庫研究和情報工作入手,將用戶的決策需求作為服務出發點,以為用戶提供決策支持作為需求的落腳點,然后再在中間層根據用戶決策的需求來對資源和能力進行各項整合,通過中間會話層將信息采集、知識創新、數據挖掘和服務決策能力凸顯出來。在整個平臺的運作過程中主要包括4個不同的階段:

(1)第一階段:完成圖書館智庫情報數據的掃描,通過數據挖掘的技術對海量信息、數據和情報進行掃描,在掃描過程中發現數據源中存在的問題,并根據掃描后的實際情況構建理論假設。

(2)第二階段:完成圖書館智庫情報系統的需求判斷,基于決策和市場兩個層面構建系統的需求分析。針對不同程度的外部環境掃描和對用戶需求的確認,不但包括智庫的問題導向需求,而且包括情報的用戶導向需求。

(3)第三階段:完成圖書館智庫情報系統的數據分析,針對明確的需求分析采用相關的技術和方法對海量數據進行深度挖掘和提煉,形成具有初步價值的信息產出。

(4)第四階段:完成圖書館智庫情報系統的運營和管理,展開對智庫資源和情報能力的推進工作,形成高度整合數據的能力。將數據挖掘產生的各項決策成果進行高度提煉,并整合構建出研究成果,以快報或簡報的形式推送到不同用戶的手中以幫助用戶完成決策。

實際上,基于數據挖掘的圖書館智庫情報平臺是一個復雜的動態系統,能夠根據不同用戶的各項需求構建解決方案,不但能夠將情報研究嵌入到智庫研究的運營機制中,又能夠很好地在情報研究中采用智庫研究的原理與方法,最終實現一體化的管理流和信息流交互優化,提升智庫和情報的專業水準。

2.3 圖書館智庫情報服務內容構建

在圖書館智庫情報服務內容構建中,從數據收集、需求判斷、數據挖掘和結果推送4個方面進行詳細的內容分析[7]:

(1)數據收集是構建圖書館智庫研究的基礎,是構建智庫情報服務平臺的基本任務,是平臺研究的關鍵。一般來說,可以借助于數據挖掘工具,并采用情報分析方法,有針對性的對外部數據和內部數據進行檢測,并跟蹤追蹤數據,構建策略風險預警和制訂各項預案。在數據采集過程中需要具有專業知識和技能的智庫相關工作人員進行,這樣進行的數據采集結果將會更為理想,構建的數據資料具有更好的價值,可以描述出關聯事件的本質信息,并將采集好的數據保存為相應的數據形式,為數據挖掘提供必要的數據基礎。

(2)需求判斷是圖書館智庫情報平臺的重點內容之一,通過跟蹤分析智庫的各項信息需求,構建任務和確定智庫項目。在信息化、知識化和經濟化的現代圖書館,智庫研究對于情報的需求不再滿足于簡單的文獻檢索和信息支持,而是更多樣化、個性化和深層次的信息需求。針對智庫情報服務的需求判斷是明確的任務過程,包括決策、相關領域動態和行業發展的趨勢,旨在通過情報研究幫助智庫確定相應的研究領域和目標。因此,情報工作應該先于智庫研究啟動,有助于提升智庫研究的環境感知能力,提升智庫研究朝著更為個性化、多樣化的方向發展。

(3)數據挖掘是圖書館智庫情報服務的關鍵內容,在完成需求判斷以后,需要確定研究課題的學科范圍,選擇學科范圍內的各項關聯數據庫,選擇正確的檢索用詞和策略。在數據挖掘的任務設計階段還應該進一步確定研究主題和內容之間的邏輯關系,通過概念表達各項研究主題。一般可以投入專業人員編寫檢索表達式完成對數據資料的收集和檢索。數據挖掘階段的檢索策略將會影響到檢索的效果,所以智庫情報服務平臺應該投入更多的資源構建專家團隊,為數據挖掘設計出明確的工作方案,將數據挖掘任務細分到每一步驟,明確工作性質和任務資源與工具。在數據挖掘過程中,情報機構的任務是為智庫項目明確檢索策略,確定檢索數據庫和檢索關鍵詞,提供合理的排查方案。

(4)推送結果是構建智庫情報服務平臺的目的,由于智庫研究的結果形式為智力成果,不能直接轉化生產力,其價值無法用利潤衡量,只能通過該智力成果如何影響圖書館公共事務決策來衡量。因此,需要智庫情報服務平臺利用網絡資源,通過多種途徑將智庫研究結果和情報工作結果推送給各個用戶,最終實現智庫研究和情報研究的價值。一般來說,在推送結果之前可以組建專家團隊對結果進行客觀評價。通過用戶的反饋意見,有針對性地對情報進行修改,形成高質量的智庫情報結果。確認好智庫情報結果以后,應該及時通過各項媒介手段推送給用戶,協助用戶進行決策。

3 基于數據挖掘的圖書館智庫情報服務

在物聯網和智能技術不斷發展的今天,半結構化和非結構化數據增速加快,傳統的結構化數據挖掘方法已經不能適應大數據時代的需求[8]。在大數據背景下,對圖書館智庫情報數據挖掘方法提出了更高的要求。新時代的數據挖掘方法應該具有采集、處理和分析多源異構數據的能力,具有快速實時全面采集數據的能力,還需要具有處理各項不完備數據源的能力。同時,新時代的數據挖掘還應該綜合應用多種數據挖掘工具,為用戶提供更便捷、有效的智庫及情報服務。

圖2 基于數據挖掘的圖書館智庫情報服務

3.1 構建全面的智庫情報數據

圖書館進入信息、智能時代,音頻、視頻、圖像和文本數據出現了爆炸式的增長,信息的快速更迭導致信息收集速度加快,信息極易出現失效。如果不對爆炸式的信息和數據進行快速預處理,相繼產生的后續數據將會成為圖書館智庫和情報服務的負擔。圖書館智庫情報服務平臺應該實時獲取各項數據源的全部,用于信息資源建設,從新的渠道以及新的載體獲得更多的有價值數據,應用有效的數據挖掘工具從經過預處理的數據中挖掘出有意義的知識信息,讓數據挖掘的結果能夠滿足不同用戶的不同需求,讓用戶享受更個性化和多樣化的服務。圖書館的智庫情報服務在面對海量的增長式數據時需要預處理有效的數據,然后再通過情報分析人員對預處理過的數據進行檢驗和校正,最后用于各項課題的研究。

另外,除了構建合理的預處理工具來對海量增長的數據完成預處理外,還要構建具有融合多源異構數據的處理工具。這是由于大數據時代下,在圖書館智庫情報服務平臺中,通過構建多個數據傳感器,從網絡的多個數據獲取節點中實時傳遞、采集數據,而通過這種方式采集到的數據一般具有多源異構的特點。處理海量的多源異構數據是大數據時代的數據處理重點,針對海量的異構數據處理工具成為了圖書館智庫情報構建的關鍵。一般分為兩個部分,一個部分是通過關聯規則來消除海量多源異構數據中的冗余數據,另一個部分則是通過十字交叉驗證的方式來對多源異構數據進行驗證,減少存入數據庫中的數據錯誤。

3.2 組建完備的智庫情報人員

信息時代是人才競爭的時代,隨著數據挖掘技術、物聯網技術和智能技術的普及,各行各業都需要復合型人才。圖書館作為學科交叉行業,一方面需要努力培養傳統的圖書館員,來增強圖書館的管理和運維。另一方面,圖書館員不能僅僅只擁有傳統的圖書館管理技能,還需要培養更多、更全面的管理知識。針對智庫情報服務平臺,首先可以通過專家講座的形式,為各個年齡段的管理員普及數據挖掘、互聯網的知識,為圖書館進入智能化做好人力資源儲備。其次,針對新加入圖書館的年輕人,著重培養他們在數據挖掘、互聯網和智能技術中的實際動手能力,提拔一些有較強動手能力的年輕人組建圖書館的智庫情報團隊。其成員一方面具有較強的學習新知識能力,另一方面也具有融合智庫和情報之間優勢的能力。在智庫的人員儲備中,圖書館可以購買半成品智庫以及相應的二次開發方案,并讓智庫情報人員學習使用半成品智庫,在此基礎上通過二次開發方案構建與該圖書館的特色相適應的圖書館智庫。通過有圖書館管理和運維經驗的智庫情報人員對智庫進行二次開發形成的圖書館特色智庫,不但能夠滿足情報工作的需求,還能夠為不同用戶提供個性化、多樣化服務。在情報服務的構建上,讓具有智庫服務經驗的人員參與到情報的收集和分析中去,這樣的情報分析工作能夠結合到智庫的數據挖掘優勢,后續的智庫服務又能夠吸收情報分析的特點。

3.3 綜合應用多種數據挖掘工具

大數據時代數據類型多種多樣,通過單一的數據挖掘工具已經無法滿足多樣化數據的分析過程。信息時代的圖書館用戶對信息的需求量和需求效率顯著提升,所以需要運用更快捷的數據挖掘工具,來提供穩定的智庫情報服務。此外智庫情報服務平臺在大數據時代背景下獲得了全面、穩定的數據源,不同的數據源需要采用不同的數據挖掘工具進行分析和挖掘,從各種類型的數據中挖掘出有意義的決策知識,再綜合各個決策知識提供穩定的決策服務。如果僅僅采用單一的數據挖掘工具,多源異構數據和各種不完備的錯綜復雜的數據類型,將會讓圖書館智庫情報服務的數據挖掘和分析成為平臺的負擔。作為智庫情報分析人員,首先需要建立好自己的專業知識基礎,一般可以通過書本學習和講座學習等形式。其次,還需要通過動手實踐建立好自己的實踐基礎,可以通過跟蹤學習智庫技術和情報技術等方式完成。在理論基礎和實踐基礎上,智庫情報分析人員還應該充分利用社交網絡進行智庫情報分析,從海量的社交網絡數據中分析用戶的行為,為用戶提供合理的決策信息。大數據背景下的數據挖掘服務,還應該與傳統的情報分析服務相結合,通過情報分析的經驗,對數據挖掘的方法和手段進行補充和完善,形成全面、可靠的數據挖掘結果。圖書館應該將財力、人力花費至改進和拓展工具與設備的分析能力上,保證情報分析人員能夠處理各種形式的數據規模,在多樣化、個性化數據背景下順利完成復雜、困難的情報分析工作,適應各類用戶不同形式的圖書館智庫情報服務需求[9]。

3.4 構建可持續發展的智庫情報服務

數據挖掘形成智庫情報服務,需要圖書館構建并提供可持續發展的服務類型和形式。從近幾年的互聯網技術和智能技術的發展來看,圖書館由傳統的服務形式轉化到數字化服務形式,再轉化到智能化服務形式的過程非常快,所以要求圖書館能夠構建可持續發展的智庫情報服務。一方面,智庫服務和情報服務隨著互聯網和智能技術的發展都獲得了較大的進步空間和發展效果,需要圖書館投入更多的復合型人才形成可持續發展的智庫服務和情報服務,以及結合二者的發展構建更穩定的智庫情報服務,提供更優質的用戶決策信息。在可持續發展的構建中,針對數據的不完整性和錯誤數據形式是當前最需要解決的問題之一。目前智庫情報服務數據挖掘過程中的有價值數據在數據總量中的比例較小,密度較低,不適合構建可持續發展的智庫情報服務。另外,圖書館作為非盈利性質的單位,沒有足夠的資金構建海量的數據庫。為了構建可持續發展的智庫情報服務,圖書館應該在數據的實施存儲過程中,控制數據庫的運營、管理成本,通過構建合理的預處理算法對存入數據庫中的數據進行清洗和轉化,讓有效數據的密度增高,并利用重復檢索、聚類等算法對文檔、網頁或其他類型的信息資源進行過濾、對海量圖像進行檢索。圖書館還可以采用國際權威智庫的大數據算法,充分利用和擴展分布式數據,構建底層基礎設施,從而形成對不完備數據處理的快速數據流。為保證圖書館的智庫情報服務的可持續發展,還應該不斷改進數據處理方法,提升數據準備的效率,保證數據的時效性,控制好數據庫的存儲門檻,構建高質量的智庫、情報分析數據,提高研究結果的科學性和準確性。

4 結語

經濟全球化和信息智能化的飛速發展,對圖書館的智庫研究和情報分析研究提出了新的信息處理和數據挖掘需求。大數據與智庫,數據挖掘與智庫情報分析,構成了大數據背景下基于數據挖掘的圖書館智庫情報服務體系。在今后的研究中,應進一步構建更合理的數據挖掘體系,充分融合圖書館的智庫研究和情報分析研究,讓二者形成更為完整的服務體系,為各種用戶需求提供理論和實踐指導。

猜你喜歡
數據挖掘圖書館用戶
探討人工智能與數據挖掘發展趨勢
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
飛躍圖書館
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
一種基于Hadoop的大數據挖掘云服務及應用
圖書館里的是是非非
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 在线观看国产精品第一区免费| 久久国产精品夜色| 日本色综合网| 亚洲有无码中文网| 国产精品三级av及在线观看| 国产91无码福利在线| lhav亚洲精品| 色哟哟国产精品| 毛片大全免费观看| 青青青视频91在线 | 国产人人乐人人爱| 2021国产乱人伦在线播放| 国产精品美女自慰喷水| 国内嫩模私拍精品视频| 国产不卡一级毛片视频| 免费国产不卡午夜福在线观看| www.精品国产| 激情国产精品一区| 成年av福利永久免费观看| 亚洲欧美在线综合图区| 五月天久久婷婷| 中文字幕欧美日韩| 国产久草视频| 亚洲精品午夜天堂网页| 久久青草视频| 日本国产一区在线观看| 久久久亚洲色| 国产精品高清国产三级囯产AV| 97在线免费| 国产va在线| 丁香婷婷综合激情| 日本在线亚洲| 日韩免费毛片| 91久久国产综合精品女同我| 18黑白丝水手服自慰喷水网站| 2022国产无码在线| 午夜福利视频一区| 国产视频一区二区在线观看| 国产91丝袜在线播放动漫 | 久久亚洲美女精品国产精品| 中文无码伦av中文字幕| 97国产在线视频| 在线看片中文字幕| 狠狠v日韩v欧美v| 国产日韩欧美精品区性色| 狠狠色丁香婷婷| 农村乱人伦一区二区| 成人福利在线免费观看| 国产69精品久久久久孕妇大杂乱 | 久久99热66这里只有精品一| 日韩毛片免费视频| 国产亚洲欧美日韩在线观看一区二区| 日韩国产综合精选| 国产第一页免费浮力影院| 免费看一级毛片波多结衣| 午夜毛片福利| 国产精品尹人在线观看| 国产精品极品美女自在线网站| 老司机精品久久| 国产成人亚洲欧美激情| 亚洲色图欧美视频| 色妞www精品视频一级下载| 精品国产女同疯狂摩擦2| 亚洲精品无码av中文字幕| 国产一二三区在线| 一级黄色片网| 国产成人精品亚洲日本对白优播| 亚洲天堂网2014| 多人乱p欧美在线观看| 91国内视频在线观看| 婷婷综合在线观看丁香| 国产激爽爽爽大片在线观看| 国产亚洲精品97在线观看| 日韩在线成年视频人网站观看| www.亚洲国产| 亚洲欧美成人在线视频| 亚洲视频一区| 久久中文字幕av不卡一区二区| 91伊人国产| 亚洲国产天堂久久九九九| 五月婷婷激情四射| 97se亚洲综合不卡 |