999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

ETL在數(shù)字圖書館資源建設(shè)及用戶資源管理中的應(yīng)用

2012-08-15 00:52:53劉欣欣
科技傳播 2012年9期
關(guān)鍵詞:數(shù)據(jù)庫圖書館資源

劉欣欣

保定職業(yè)技術(shù)學(xué)院,河北保定 071000

當(dāng)前,數(shù)字圖書館建設(shè)面對龐大的、多類型、多介質(zhì)、多格式、多傳遞渠道的信息資源集合和用戶對電子信息資源的多樣化、個性化需求,數(shù)字圖書館中的信息資源建設(shè)必須朝著整合化的方向發(fā)展。ETL可以應(yīng)用在數(shù)字圖書館中的數(shù)字資源和用戶資源建設(shè)中,對數(shù)字圖書館中不同類型的資源進(jìn)行整合和集成。

1 ETL在數(shù)字資源建設(shè)與處理中的應(yīng)用

1.1 ETL在基于數(shù)據(jù)倉庫的數(shù)字資源物理集成中的應(yīng)用

實現(xiàn)資源整合和集成的方法有多種,既可以是在數(shù)據(jù)層面上的集成,也可以是在界面上的集成。本文所指的資源整合和集成,主要指的是對異構(gòu)信息資源實現(xiàn)數(shù)據(jù)層面的物理整合。也就是根據(jù)資源元數(shù)據(jù)標(biāo)準(zhǔn)建立統(tǒng)一的數(shù)據(jù)倉庫,然后針對各種資源實現(xiàn)不同的元數(shù)據(jù)增量抽取程序,將元數(shù)據(jù)匯集到數(shù)據(jù)倉庫中。采用建立本地數(shù)據(jù)倉庫的方法進(jìn)行整合,可以對整合的結(jié)果作更進(jìn)一步的處理和分析,使更多的工作相對于用戶來說可以脫機(jī)進(jìn)行。異構(gòu)信息資源整合和集成主要包括數(shù)字圖書館內(nèi)部數(shù)據(jù)源的整合、基于協(xié)議的元數(shù)據(jù)整合、淺層Web信息和深層Web信息的整合等。數(shù)據(jù)倉庫是面向主題的,以整合的方式將內(nèi)容組織成層次結(jié)構(gòu),進(jìn)一步為進(jìn)行信息挖掘和數(shù)據(jù)挖掘,提供了一個簡潔精煉的操作平臺。數(shù)據(jù)挖掘可以發(fā)現(xiàn)、抽取、過濾和評價信息和數(shù)字對象以及跟蹤和分析用戶的訪問情況,提供深層次的知識服務(wù)。

1.2 ETI在引文數(shù)據(jù)建設(shè)中的應(yīng)用

為了實現(xiàn)不同來源中文獻(xiàn)之間的引文鏈接,在ETL過程中需要解決一些關(guān)鍵問題。文獻(xiàn)的引文是由題名、作者、來源期刊、發(fā)表年代等字段組成,自動識別這些字段屬性對于資源的參考鏈接服務(wù)是非常有用的,因為它們可以用來鏈接到實際的引文文獻(xiàn)中。不同的期刊來源中,引文通常以不同的形式表現(xiàn)的。引文鏈接一般是采用基于規(guī)則的方式,因此抽取和識別引文數(shù)據(jù)的規(guī)則學(xué)習(xí)尤為重要。

1.3 ETL在知識庫構(gòu)建中的應(yīng)用

對于數(shù)字圖書館中知識庫和知識空間的構(gòu)建,可以通過兩種方式來實現(xiàn):1)以人為中心的知識獲取,即通過有經(jīng)驗的專家手工輸入知識,這種方式很難形成大規(guī)模的知識庫;2)以機(jī)器為中心的知識獲取。在用戶的輔助下,利用知識抽取技術(shù)等自動生成和推理出知識,實現(xiàn)對數(shù)據(jù)源的關(guān)聯(lián)和分析。這種方式是當(dāng)前知識庫的主要建設(shè)方式。

目前,國外已經(jīng)有一些研究機(jī)構(gòu)關(guān)注利用知識抽取技術(shù)來構(gòu)建知識庫和提供知識服務(wù)。在知識庫的建設(shè)中,主要是在ETL過程中融入語義和ontology,抽取出具有語義的信息。

1.4 ETL在數(shù)據(jù)庫內(nèi)容描述信息生成中的應(yīng)用

通過ETL可以自動獲得數(shù)據(jù)庫的內(nèi)容描述信息,從數(shù)據(jù)庫的文獻(xiàn)中抽取特征詞匯,并建立數(shù)據(jù)庫的內(nèi)容描述模型,用以反映數(shù)據(jù)源中所包含的文獻(xiàn)及其內(nèi)容、形式等特征,內(nèi)容描述模型是資源選擇的元數(shù)據(jù)基礎(chǔ),作為檢索時的智能選庫依據(jù)。ETL中隨機(jī)挑選詞匯作為數(shù)據(jù)源的初始的檢索詞,構(gòu)造和發(fā)送提問式以及從數(shù)據(jù)源獲取樣本文獻(xiàn),并從樣本文獻(xiàn)中抽取出文獻(xiàn)的特征表示,經(jīng)過多次的循環(huán),建立起數(shù)據(jù)庫資源描述模型,形成數(shù)據(jù)庫的內(nèi)容描述信息,利用形成的內(nèi)容描述信息實現(xiàn)數(shù)據(jù)庫的自動選擇。可以在ETL過程中運用基于規(guī)則的描述、調(diào)焦查詢探測、基于提問取樣等算法,從分布式、隱藏的web資源中抽取能代表其主題或?qū)W科覆蓋范圍的關(guān)鍵詞,動態(tài)生成數(shù)據(jù)庫內(nèi)容描述信息。

在數(shù)據(jù)庫內(nèi)容描述信息生成的應(yīng)用中,ETL需要解決的關(guān)鍵問題是形成數(shù)據(jù)源的描述模型,資源描述模型一般由數(shù)據(jù)源中所含特征詞及其出現(xiàn)頻牢、詞匯的文獻(xiàn)頻率、不同詞匯的共現(xiàn)概率等信息組成。多次提交檢索提問到各數(shù)據(jù)源,將返回的文獻(xiàn)作為樣本,通過分析樣本文獻(xiàn)建立數(shù)據(jù)源描述模型,以此來描述整個數(shù)據(jù)源。生成數(shù)據(jù)源描述模型具體包括:檢索提問詞的選擇,抽取的文獻(xiàn)數(shù)量,以及取樣停止的條件設(shè)定等。

2 在用戶資源管理中的應(yīng)用

2.1 ETL在統(tǒng)一認(rèn)證系統(tǒng)中的應(yīng)用

隨著計算機(jī)技術(shù)的發(fā)展,數(shù)字圖書館中采用了越來越多的信息系統(tǒng)。由于種種原因,各個信息系統(tǒng)往往相互獨立,在數(shù)據(jù)和業(yè)務(wù)邏輯上都存在大量的冗余,為用戶和管理員帶來諸多的不便。用戶身份和權(quán)限認(rèn)證是數(shù)字圖書館中很重要的部分,然而不同的信息系統(tǒng)卻各自擁有獨立的身份和權(quán)限認(rèn)證模塊,造成了業(yè)務(wù)邏輯的重復(fù)和數(shù)據(jù)的冗余,同時也為用戶身份信息的統(tǒng)一維護(hù)帶來一些問題,很難在數(shù)字圖書館的服務(wù)中真正地實現(xiàn)統(tǒng)一認(rèn)證服務(wù),因此,在數(shù)字圖書館中要實現(xiàn)真正意義的統(tǒng)一認(rèn)證,前提條件之一就是需要建立統(tǒng)一的用戶信息庫,同時還要保證用戶信息與原來系統(tǒng)中的信息保持同步更新。這些要求可以利用ETL機(jī)制來實現(xiàn),通過ETL來達(dá)到用戶信息的統(tǒng)一,即生成統(tǒng)一的用戶信息庫。首先,從不同系統(tǒng)中抽取現(xiàn)有的用戶信息,并進(jìn)行必要的查重處理,一次性地導(dǎo)入認(rèn)證系統(tǒng)中。然后,進(jìn)行增量的抽取,同時保證各個系統(tǒng)的相對獨立性,解決數(shù)字圖書館中的統(tǒng)一認(rèn)證問題。

2.2 面向用戶行為的ETL

面向用戶行為的ETL是基于用戶在研究活動過程中的行為進(jìn)行相關(guān)信息抽取,需要跟蹤和記錄用戶的主要查詢和瀏覽行為,以便提供更適合的服務(wù)。

3 結(jié)論

ETL原本是為了構(gòu)建數(shù)據(jù)倉庫而提出的,有其特定的應(yīng)用環(huán)境。而數(shù)字圖書館的環(huán)境是分布式的,最終目的不只是為了建設(shè)數(shù)據(jù)倉庫,更多是需要進(jìn)行虛擬的集成和整合。兩者雖然最終目的和應(yīng)用場景不同,但ETL的思想和技術(shù)可以用來解決數(shù)字圖書館資源整合和服務(wù)集成的某些問題,在某些應(yīng)用場景中僅僅依賴于ETL自身的技術(shù)是不行的,還必須結(jié)合其他的技術(shù)和方法來實現(xiàn)數(shù)字圖書館中的具體應(yīng)用。

[1]黃永文,李廣建.數(shù)字圖書館中的ETL應(yīng)用研究綜述[J].現(xiàn)代圖書情報技術(shù),2007(12).

[2]黃永文,李廣建.ETL技術(shù)及其在數(shù)字圖書館中的應(yīng)用研究[J].圖書館雜志,2006,25(2).

[3]何濤.使用ETL工具Kettle實現(xiàn)圖書館聯(lián)盟信息系統(tǒng)數(shù)據(jù)集成[J].科學(xué)咨詢,2009(23).

[4]袁小一,俞毅,趙賽.數(shù)字圖書館環(huán)境下ETL系統(tǒng)的設(shè)計與實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2007(7).

猜你喜歡
數(shù)據(jù)庫圖書館資源
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
資源回收
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
飛躍圖書館
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 亚洲国产在一区二区三区| 67194亚洲无码| 亚洲91精品视频| 2020国产精品视频| 在线免费不卡视频| 国产18页| 91av国产在线| 任我操在线视频| 婷婷五月在线| 久久香蕉国产线| 在线观看视频一区二区| 日韩美女福利视频| 国产一区二区人大臿蕉香蕉| 2021最新国产精品网站| 日韩美毛片| 又爽又大又黄a级毛片在线视频 | 亚洲第一成网站| 欧美国产在线一区| 欧美日韩国产在线播放| 国产成人久久777777| 中文字幕亚洲综久久2021| 91在线一9|永久视频在线| 国产成人三级在线观看视频| 日韩中文精品亚洲第三区| 色天堂无毒不卡| 国产99热| 亚洲成年人网| 日本久久免费| 久久精品最新免费国产成人| 久久青草热| 久久亚洲AⅤ无码精品午夜麻豆| 无码人妻免费| 国产色伊人| 欧美亚洲一二三区| 亚洲精品欧美日韩在线| 成色7777精品在线| 日韩精品亚洲一区中文字幕| 国产精品自在线天天看片| 亚洲三级片在线看| 国产欧美日韩91| 扒开粉嫩的小缝隙喷白浆视频| 激情六月丁香婷婷| 成人一级黄色毛片| a在线亚洲男人的天堂试看| 尤物在线观看乱码| 在线免费看片a| 日韩精品无码免费专网站| 国产亚洲美日韩AV中文字幕无码成人| 色呦呦手机在线精品| 国产美女一级毛片| 色悠久久久| 欧美成人精品在线| 国产欧美日本在线观看| 久久无码av三级| 亚洲av无码成人专区| 青青草a国产免费观看| 久久久久久久久久国产精品| 狠狠色狠狠综合久久| 国产白浆视频| 香蕉蕉亚亚洲aav综合| 日本不卡在线播放| 国产网站免费观看| 日本在线欧美在线| 在线观看亚洲国产| 成人免费一区二区三区| 亚洲无码久久久久| 最近最新中文字幕免费的一页| 午夜视频免费试看| 久青草免费视频| 成人看片欧美一区二区| 欧美第二区| 内射人妻无码色AV天堂| 亚洲首页国产精品丝袜| 免费观看成人久久网免费观看| av免费在线观看美女叉开腿| 韩日免费小视频| 成人免费黄色小视频| 国产精品手机视频一区二区| 欧美三级视频网站| 精品国产欧美精品v| 久久精品人人做人人爽电影蜜月| 国产毛片久久国产|