999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于主題關聯的館藏數字資源多維語義標引研究*

2016-07-06 09:41:20華僑大學經濟與金融學院福建泉州362021武漢紡織大學會計學院湖北武漢430000
圖書館建設 2016年4期

瞿 輝(華僑大學經濟與金融學院 福建 泉州 362021)周 磊(武漢紡織大學會計學院 湖北 武漢 430000)

?

基于主題關聯的館藏數字資源多維語義標引研究*

瞿 輝(華僑大學經濟與金融學院 福建 泉州 362021)
周 磊(武漢紡織大學會計學院 湖北 武漢 430000)

[摘 要]以主題關聯為基礎的多維語義標引方法可用于館藏數字資源管理與導航,即通過構建館藏數字資源多維語義標引體系來對不同數字資源知識對象間的語義關聯進行標引,進而實現以內容主題關聯為核心的館藏數字資源組織與多維展示。與傳統數據庫檢索相比,該方法更加準確、直觀和有效,可以作為一種知識發現工具和技術應用于中小型機構知識庫建設。

[關鍵詞]館藏數字資源 主題關聯 多維語義 標引方法

1 引 言

當前,數字化、網絡化已成為館藏資源組織的常態,對圖書館事業產生了深遠影響:一方面,使得館藏資源的生產與加工越來越容易,傳播越來越便利;另一方面,造成館藏資源數量的急劇增長,針對海量數字化館藏資源的組織與服務工作面臨巨大壓力。可以說,由于缺乏對日益增加的數字資源進行深入、有效的組織和規范控制,館藏數字資源管理和服務工作的主要矛盾已從提高資源存量轉為如何高效滿足用戶的多元化、多層次知識需求[1]。因此,有效揭示館藏數字資源所包含的各類知識對象及其關聯就成了圖書館資源建設與管理工作適應知識經濟時代“信息服務知識化”的必然要求,而其首要任務就是對館藏數字資源中各種知識對象及其之間存在的語義關聯進行揭示和描述,以幫助用戶進行準確的知識獲取,提高館藏數字資源的服務效率。為此,本文提出一種以主題關聯為核心的館藏數字資源組織與展示方法,即通過主題關聯來對館藏數字資源知識對象之間不同的語義關系進行多維描述和標引,以提高用戶資源訪問的準確性、便捷性,為館藏數字資源的組織與管理實踐工作提供一些有益的探索。

2 館藏數字資源主題語義關聯

2.1館藏數字資源組織

從整體上來看,館藏數字資源是以資源實體和內容實體兩種形式存在的。所謂資源實體,是指日益增長并不斷異構和分散化的各種數字化資源,如數字化圖書、期刊、報紙、數據及其他數字出版物[2]。從資源實體角度上看,雖然館藏數字資源在采集時就已經具備了一定的形式,但整體上還較為凌亂、無序,給用戶利用造成諸多不便,因而對其進行組織與管理的實質就是要對資源實體進行序化。與資源實體不同,內容實體主要是指蘊含在資源實體中的各種知識對象,如概念、定義、公式及推理等[3]。因此,從內容實體角度而言,館藏數字資源組織就是對資源實體各種知識對象的組織與管理;其核心任務首先是知識對象的識別,其次是不同知識對象間語義關聯的描述與標引,以便適應資源深度開發與利用的需要。而在各種類型館藏數字資源急劇增加的時代背景下,面向內容實體的組織管理變得更加重要和緊迫,這正如Kodama所指出的那樣,只有有效地整合零散、無序的知識才能實現對數字資源的真正管理[4]。

圖1 館藏數字資源常見館語義關聯舉例

2.2館藏數字資源語義關聯

根據所表征內容的不同,館藏數字資源語義關聯總體上可以劃分為主題關聯[5]、主體關聯[6]和指向關聯[7]3種類型。其中,主題關聯是指基于不同知識對象(如關鍵詞、主題詞、概念、公式等)所建立起來的資源內容關聯關系,如描述關系、共生(共現)關系等;主體關聯是指館藏數字資源相關主體(如作者、出版物、研究機構/出版機構)之間所構成的各種約束關系,如撰寫關系、出版關系、隸屬關系及合作關系等;而指向關聯則是館藏數字資源與其數據源之間所具有的鏈接關系(網址、全文鏈接等)。以期刊類館藏數字資源為例,通過4個基本的知識對象(關鍵詞、作者、期刊以及研究機構)可以構建出包含以上3種類型的關聯體系來描述館藏資源的內容語義特征(見圖1)。在實踐中,這些語義關聯具體又可分為兩種類型:一類是同類知識對象語義關聯,即同屬性知識對象所構成的關聯關系,包括“關鍵詞-關鍵詞(K-K)”“期刊-期刊(J-J)”“作者-作者(A-A)”和“研究機構-研究機構(O-O)”4種關聯;另一類是不同知識對象語義關聯,指不同屬性知識對象之間所構成的關聯,包括“關鍵詞-作者(K-A)”“期刊-關鍵詞(K-J)”“關鍵詞-機構(K-O)”“作者-期刊(A-J)”“作者-機構(A-O)”以及“期刊-機構(JO)”6種關聯關系。

從科學學角度來看,對館藏數字資源不同知識對象間所存在的語義關聯進行描述和呈現,既可以提高相似主題資源內容被發現的概率,進而促進知識的快速轉化,也能夠為館藏數字資源動態聚合成細粒度、具有內在邏輯聯系的語義路徑提供基礎[8]。因此,構建系統的多維語義關聯描述機制就成為了科學組織館藏數字資源的關鍵,即通過對知識對象及其相互關系的精確描述來對館藏數字資源進行深度的組織和管理。同時,豐富、完整的語義關聯體系能夠從多角度揭示館藏數字資源的內容結構特征,而這正是館藏數字資源建設工作的重要目標。例如,關聯“A-J”反映了作者與出版期刊之間的對應關系,從中可以發現不同作者論文在發表中的期刊偏好,即在哪類期刊上發表論文較多、某期刊擁有哪些穩定作者群,進而通過作者的群體特征來確定期刊定位,而通過關聯“J-K”則可以揭示期刊發表文獻的主題分布。

如前所述,不同關聯類型對館藏資源內容的語義特征描述能力是不同的,其中主題關聯的描述能力最強,主體關聯次之,而指向關聯則最弱。因此,基于關鍵詞在資源內容描述方面的重要作用,由關鍵詞共現所構成的主題關聯就成為了所有關聯中最為重要的一組語義關系,是構建館藏數字資源多維語義標引體系的基礎,以關鍵詞共現所反映的主題關聯為核心,可以將不同的資源實體利用不同知識對象(內容實體)間所具有的豐富語義關聯連接起來,構成一個基于多維語義關聯視角的館藏數字資源描述與呈現框架。

3 基于主題關聯的館藏數字資源多維語義標引方法與步驟

基于主題關聯的館藏數字資源多維語義標引的關鍵是以資源內容主題關聯為核心構建的一套穩定、可擴展的多維語義體系,以便對不同知識對象間的語義關系進行標引,最終實現對館藏數字資源的多維語義標引。基于此,本文構建了基于主題關聯的館藏數字資源多維語義標引方法,其流程主要包括以下幾個步驟:

(1)知識對象實例庫建設。即在館藏數字資源知識對象的識別基礎上,對知識對象進行抽取與處理,并以其實例形式——特征詞來構建領域對象知識庫。其中,特征詞是指從文章中選取出來用于反映資源知識對象的名詞或術語[9],在規范后作為知識對象的實例進行匯總添加成為館藏數字資源知識對象庫;本文中,“特征詞”的外延有了進一步的擴大,即只要能夠揭示館藏資源內容的獨立名詞或詞組(如關鍵詞、作者、機構名、期刊名等)都應被視為館藏數字資源的特征詞。由于特征詞能夠清晰、有效反映包含于館藏資源的語義關聯,因此對特征詞的提取要盡可能全面,涵蓋所有知識對象,并需要對不同特征詞之間的關系進行精確描述,以構成對館藏數字資源(文獻)內容語義關聯進行描述和標引的基礎[10]。根據需要,本文對館藏數字資源的6類特征詞進行了抽取,并以此構建了對應的知識對象實例庫:學者庫(包含作者信息)、文獻庫(包含不同類型文獻的題名及DOI)、機構庫(主要包括研究機構與出版機構)、關鍵詞庫(主要包含文獻關鍵詞或主題詞)、熱點主題庫(通過對高頻關鍵詞、主題詞的共現分析得到)以及基金庫(包含國內主要的科研基金項目資助信息)。根據不同知識對象之間所具有的不同語義關系,實例庫之間相應設置了不同的邏輯關系,其具體的體系結構如圖2所示。

圖2 知識對象實例庫體系結構

例如,針對《基于知識位勢的技術創新合作中的知識擴散研究》[11],可以提取包括題名=“基于知識位勢的技術創新合作中的知識擴散研究”、學者=“李莉”and“黨興華”and“張首魁”、機構=“西安理工大學工商管理學院”and“陜西省行政學院”and“科學學與科學技術管理”、關鍵詞=“知識擴散”and“知識主體”and“知識深度和寬度”and“知識位勢”、基金=“國家自然科學基金資助項目”and“教育部博士點基金資助項目”等特征信息,這些特征詞添加后根據知識庫之間的體系結構將能夠自動建立起各知識對象之間的不同語義關聯。

(2)主題關聯分析與構建。主要是通過對抽取的關鍵詞進行共現分析,以確定目標館藏數字資源的“關鍵詞-關鍵詞”(K-K)主題關聯,進而以主題關聯為基礎將其他語義關聯進行組配,構成用于館藏數字資源標引的多維語義關聯集。以K-K關聯和A-A關聯組配為例(見圖3),一方面,關鍵詞之間存在著共現關系(關聯1),而作者與作者之間則存在著合作關系(關聯2);另一方面,在作者間不存在直接合作的情況下,因其文獻中使用關鍵詞的不同而存在如下兩種情況:①如果同時使用某一關鍵詞,則其間存在語義關聯(關聯3);②雖然沒有使用同一關鍵詞,但這些關鍵詞之間存在共現關系,那么其間存在耦合語義關聯(關聯4)。在完成主題關聯分析結果基礎上,可以通過不同主題及其包含的關鍵詞將相同或不相同主題下的所有知識對象連接起來。

圖3 學科知識庫及所包含關聯示意圖

(3)知識對象多維語義標引。經過特征詞抽取、主題關聯的分析與建構,就可以對所獲得的資源知識對象進行多維度語義標引。實際上,由于館藏數字資源包含的各類知識對象都經由圖2所示的知識對象實例庫構造了較為完整的關系,因此在標引過程中只需將任何館藏數字文獻與其相應的熱點主題相匹配(關聯r4),便自動與其他知識對象關聯起來,并能夠方便地通過不同知識對象建立起與其他具有相關館藏資源實體之間的多維語義關聯關系。

以上過程可以利用本體軟件(如Proté g é )實現,也可通過主題圖工具(如Ontopia[12])來完成。與本體類似,主題圖(Topic Maps)是“一種用來描述知識以及知識與信息資源聯系的元數據格式,既可以定位某一知識對象的資源位置,也可以用來表示不同知識對象之間的相互聯系”[13]。但與本體相比,主題圖技術所提供的XTM標簽集與語法規范具有操作簡單、描述性強等特點,能夠使整個工作過程變得簡單、高效。因此,本文選用Ontopia作為館藏數字資源多維語義標引方法的實現平臺。

4 實驗與討論

為測試基于主題關聯的館藏數字資源多維語義標引方法的實際效果,本文以國內知識擴散(Knowledge Diffusion)研究領域期刊數字文獻為例進行了驗證。

4.1數據來源和處理

本文以“知識擴散”為主題在CNKI期刊全文數據庫中進行檢索(檢索時間為2015年8月2日),檢索到相關文獻1 074篇,對非相關文獻進行剔除后,得到符合要求的結果1 069篇,從中對相關特征詞進行抽取,共獲得1 897個關鍵詞、2 451名作者(251個研究機構)、237個期刊及36個基金信息。為提高準確性,本文參考專家意見并結合自建詞表對所獲取的特征詞特別是關鍵詞進行了規范與合并,最后將所得到的數據添加到知識對象庫中,以備后續工作使用。

4.2主題分析及結果

利用系統聚類方法對所獲取的高頻關鍵詞進行主題聚類,得到國內知識擴散研究領域的5個熱點研究主題及其對應的相關核心關鍵詞(見表1),其結果與采用概念空間圖和社會網絡分析方法進行分析所得結果基本吻合;在后續的標引過程中,這些熱點主題將作為實例添加到圖2所示的“熱點主題庫”中,并建立主題與核心關鍵詞之間的包含關系,完成后續多維語義標引的準備工作。

4.3館藏數字資源知識對象的多維語義標引

實現館藏數字資源多維語義標引,需要將主題聚類的結果用于相關館藏數字資源知識對象關聯的連接中去,也就是對文獻進行基于主題關聯的多維語義標引。為此,本文利用主題圖工具Ontopia構建了“知識擴散知識對象實例庫”(見圖3)來完成對知識擴散館藏期刊數字資源的多維語義標引。具體過程包括以下兩個步驟:

(1)添加研究主題。根據表1,將5個研究主題作為知識對象實例添加到“熱點主題庫”中并分別命名,然后依據圖4所示的熱點主題庫語義關聯結構,對相應主題建立“包含作者”“包含文獻”“包含關鍵詞”及“涉及機構”4個關聯類型設置功能以及多個開放的主題說明信息——主題含義(Topic Meaning)、參考鏈接(Reference Links)、備注信息(Remarks)、多媒體附件(Multimedia Attachments)、關鍵詞含義(Keyword Meaning)等,用于對主題的深度說明,以增強內容主題的導航功能。

圖4 熱點主題庫語義關聯結構

表1 知識擴散領域熱點主題及核心關鍵詞

(2)多維語義標引。主題實例添加完成之后,就可以用來對不同的知識對象進行多角度的語義關聯,進而實現對館藏數字資源的多維語義標引。具體來講,就是將每個主題與其所涉及的不同作者、文獻、關鍵詞、機構等知識對象聯系起來。實際上,鑒于圖2所示的“知識擴散知識對象實例庫”中本身已經定義好了“學者庫”“文獻庫”“關鍵詞庫”及“機構庫”等6個資源實體類型及其之間的豐富語義關系,因此在具體的標引過程中只需對每一個主題實例與另外任意一個資源實體類型進行完整的關聯,就可以自動實現對其他語義關聯的標引。

4.4基于多維語義的館藏資源展示效果

完成對館藏數字資源的多維語義標注,實質上也就實現了不同數字資源知識對象之間基于主題的語義關聯建構,使基于主題關聯的館藏數字資源可視化與檢索有了可能。本文利用主題圖工具所進行的多維語義標引結果會生成一個包含全部內容語義關聯標引結果的XTM文檔包,可以方便地導出、保存、維護和瀏覽;同時,對XTM文檔結果的查詢方式既可以利用相關插件來可視化瀏覽,也可通過文檔列表進行訪問。圖5為本文利用Ontopia提供的Vizigator插件[14]對知識擴散領域館藏數字期刊文獻多維語義標引結果的可視化效果。

圖5 多維語義標引結果的可視化效果(局部)

從圖5可以看出,通過多維語義標引可以得到一個以主題關聯為核心的、多維集成、語義化程度高的館藏數字資源內容實體(知識對象)展示結果。從中可以方便地對與某一主題相關的資源實體(如期刊、作者、關鍵詞、機構等)進行查詢與訪問,同時也可以反向針對知識對象查詢其所屬的主題及該主題下包含有哪些知識對象,通過簡單的點擊來發現不同的館藏資源內容主題與知識對象;同時,針對不同需要還可以通過對展示的深度進行控制,以便獲得不同強度和豐富程度的理想效果。

為了對該方法應用性和效果進行檢驗,本文設計了基于多維語義關聯的館藏數字資源導航系統(以下簡稱系統),并進行了小范圍的測試。系統主要圍繞實現基于主題關聯的館藏數字資源多維語義可視化推薦功能來構架,系統核心通過ASP.NET技術集成主題圖工具Ontology軟件包來實現。系統基本滿足了用戶通過關鍵詞搜索或者目錄瀏覽的方式來查詢和獲取某一領域相關主題信息的需求,同時可以按照不同主題去方便地查詢相關領域的關鍵詞、機構、作者、文獻及出版物等信息。在對主題進行查詢和瀏覽時,系統為用戶提供了目錄瀏覽和可視化兩種訪問方式;在兩種模式下,用戶都可根據需要預設訪問的深度。

表2為本文對華僑大學經濟學專業二年級本科生所進行的定題檢索效率對比實驗結果,其中準確率采用專家判斷方法予以確認,所有參與測試的同學并無相關知識擴散領域知識背景。通過對3組數據(平均時間與準確率)的對比來看,使用導航服務系統的小組在定題檢索的平均速度和準確率(2.47/98.3%)上都有較為可靠的保證,高于使用CNKI小組的4.63/91.7%和無限制組9.50/84.7%。

表2 不同途徑檢索效率對比數據 單位:分鐘/準確率

5 結 語

本文提出了基于主題關聯的館藏數字資源多維語義標引方法,并對以其為基礎的系統原型的應用效果進行了實驗。結果顯示,作為一種有效的館藏數字資源知識管理工具,該方法克服了傳統數據庫方法在資源內容揭示上的不足,能夠通過更細粒度的知識對象來為館藏數字資源的組織提供多種語義標引角度,在集成相關語義工具基礎上用于館藏數字資源的管理與導航,其效果相對于傳統方法來講更為直觀和高效。同時,該方法實現了基于主題關聯的館藏數字資源知識對象的多維聚合與展示,能夠構成集成度高的內容呈現模式,可以廣泛應用于當前各類在線中小型機構庫的建設。由于篇幅的限制,本文在對有關問題(如知識對象實例庫構建過程中的自動化等問題)上的分析未能充分展開,同時對特征詞抽取過程中的相似度量化、特征詞關系標注等問題還需要在后續工作中進行深入研究、完善。

參考文獻 :

[1]成 全, 許 爽.館藏數字資源語義關聯研究現狀及發展趨勢探析[J].圖書館建設, 2014, 238(4):28-33.

[2]劉壽華, 殷 勤.探討藏書老化規律 優化文獻資源實體:圖書老化實測報告[J].圖書館建設, 1991, 61(1):26-29.

[3]陳嘉勇, 周 婕, 李 玲, 等.基于文獻實體關系模型的高校機構知識庫作者認領模式研究[J].情報理論與實踐, 2015, 38(2): 59-63.

[4]Kodama M.Knowledge Creation Through Networked Strategic Communities: Case Studies on New Product Development in Japanese Companies [J].Long Range Planning, 2005, 38(1):27-49.

[5]王立學, 孫 楊, 楊代慶.基于引文的情報學領域主題關聯特征分析[J].情報雜志, 2012, 31(10):27-31.

[6]唐 義.關聯科學核心詞匯規范:提出、優化及展望[J].圖書館雜志, 2013, 32(3):55-60.

[7]游 毅, 成 全.試論基于關聯數據的館藏資源聚合模式[J].情報理論與實踐, 2013,36(1):109-114.

[8]任瑞娟, 濮德敏, 王劍宏, 等.基于Drupal實現多類型學術資源的語義化組織與關聯化聚合[J].情報科學, 2015,33(5):63-67.

[9]丁 潔, 王曰芬.基于特征項的文獻共現網絡在學術信息檢索中的應用[J].圖書情報工作, 2014,58(15):135-141.

[10]胡昌平, 陳 果.科技論文關鍵詞特征及其對共詞分析的影響[J].情報學報, 2014,33(1):23-32.

[11]李 莉, 黨興華, 張首魁.基于知識位勢的技術創新合作中的知識擴散研究[J].科學學與科學技術管理, 2007,28(4):107-112.

[12]Pepper S.The TAO of Topic Maps [J].Proceedings of Xml Europe, 2000,52(11):4362-4365.

[13]王石林.主題地圖及其在軟件工程專業知識管理中的應用研究[D].武漢: 武漢理工大學計算機科學與技術學院, 2006:6.

[14]Beaman R, Wieczorek J.Determining Space from Place for Natural History Collections [J].D-Lib Magazine, 2004,10(5):1082-1089.

Research on Multidimensional Semantic Indexing of Digital Resource of Collection Based on Topic Relevance

[Abstract]The multidimensional semantic indexing method that based on topic relevance can be used for digital resource of collection management and navigation, that is, through the construction of Library Digital Resource of collection multidimensional semantic indexing system to index the semantic relationship between different digital resource knowledge objects, and to realize the organization and multidimensional display of the digital resource of collection, which is based on the core of the content theme.Compared with traditional database retrieval, this method is more accurate, intuitive and effective.It can be used as a knowledge discovery tool and technology that applied in the construction of small and medium sized institutional repository.

[Key words]Digital resource of collection; Topic relevance; Multidimensional semantic; Indexing method

[中圖分類號]G254.73

[文獻標識碼]A

*本文系國家社會科學基金項目“區域創新中的知識擴散規律及其保障機制研究”,項目編號:14CTQ020;福建省軟科學研究項目“面向福建省縣域經濟創新的知識服務平臺及其利用研究”,項目編號:2015R0054的研究成果之一。

[作者簡介]

瞿 輝 男,1980年生,博士,華僑大學經濟與金融學院講師,碩士生導師,研究方向為知識管理、電子商務、信息經濟與政策,已發表論文20余篇。

周 磊 女,1986年生,博士,武漢紡織大學會計學院講師,碩士生導師,研究方向為專利情報分析、技術創新,已發表論文20余篇。

[收稿日期:2015-11-09]

主站蜘蛛池模板: 亚洲乱码在线播放| 亚洲欧美成人影院| 毛片在线看网站| 国产视频资源在线观看| 成人va亚洲va欧美天堂| 国产美女精品在线| 亚洲女同一区二区| 午夜色综合| 亚洲成综合人影院在院播放| 播五月综合| 99视频精品在线观看| 日本AⅤ精品一区二区三区日| 91麻豆精品国产高清在线 | 国产一二三区视频| 91精品在线视频观看| 亚洲aⅴ天堂| 无码人中文字幕| 91精品视频在线播放| 丁香五月婷婷激情基地| 区国产精品搜索视频| 成人在线欧美| 亚洲精品动漫| 欧美特黄一级大黄录像| 最新国产精品第1页| 亚洲五月激情网| 真实国产乱子伦高清| 中字无码av在线电影| 国产精品太粉嫩高中在线观看| 中文字幕永久在线观看| 国产精品久久久久鬼色| 制服丝袜无码每日更新| 97成人在线视频| 国产精品尤物铁牛tv | 国产欧美精品一区aⅴ影院| 亚洲国产成人超福利久久精品| 久久性视频| 毛片在线播放a| 91精品亚洲| 日本一区二区三区精品视频| 亚洲成网777777国产精品| 久草国产在线观看| 色香蕉影院| 日本不卡视频在线| 亚洲成aⅴ人在线观看| 国产最新无码专区在线| 尤物精品国产福利网站| 国产成人高清在线精品| 日韩人妻精品一区| 露脸国产精品自产在线播| 毛片手机在线看| 精品日韩亚洲欧美高清a| 久久综合九九亚洲一区| 国产人免费人成免费视频| 高清国产va日韩亚洲免费午夜电影| 成人夜夜嗨| 亚洲日韩精品无码专区97| 国产精品19p| 国产亚洲欧美在线中文bt天堂 | a毛片基地免费大全| 国产真实乱了在线播放| 丰满少妇αⅴ无码区| 久久天天躁狠狠躁夜夜躁| www.日韩三级| 国产欧美日韩va| 久久亚洲国产视频| 亚洲一区二区约美女探花| 国产一区二区三区在线观看视频 | 在线观看精品国产入口| 欧美在线视频a| 欧美一级视频免费| 人妻丰满熟妇av五码区| 国产精品v欧美| 国产精品国产三级国产专业不 | 国产婬乱a一级毛片多女| 色香蕉影院| 欧美成人日韩| 性色生活片在线观看| 久久青草视频| 国产美女无遮挡免费视频| 精品久久久久久中文字幕女| 欧美成a人片在线观看| 亚洲婷婷在线视频|