999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

檔案知識聚合的實踐模型構建研究

2018-09-19 17:53:12魏扣李子林郝琦
北京檔案 2018年8期
關鍵詞:資源用戶模型

魏扣 李子林 郝琦

摘要:檔案知識聚合作為知識經濟時代檔案開發利用形式的創新體現,為檔案知識增值與檔案服務社會化提供了實現路徑。本文基于檔案知識聚合模式的選擇應遵循深度性、易操作性、全面性、保密性原則,同時,結合檔案知識聚合的自身特點,參考各類知識聚合模式的優缺點,最終選定基于語義——情景的檔案知識聚合模式,并從基礎層、聚合層、應用層和評估層四個維度搭建檔案知識聚合實踐模型。

關鍵詞:檔案知識聚合知識服務實踐模型

Abstract: Archival knowledge aggregation, as an innovation manifestation of exploitation of ar? chives in the era of knowledge economy, provides a path for the value-added of archives knowledge and the socialization of archives services. This pa? per chooses the semantic- scene based archival knowledge aggregation model, which follows the principles of depth, easy operation, comprehensive? ness and confidentiality. According to the advantag? es and disadvantages of various types of knowl? edge aggregation models. Consequently, we build archival knowledge aggregation practical model from four dimensions: foundation layer, aggrega? tion layer, application layer and evaluation layer.

Keywords: Archives; Knowledge Aggregation; Knowledge Service; Practical Model

早在知識聚合概念提出前,圖情學界已對文獻、數據、信息等粗顆粒度信息資源的整合、聚合展開研究。當前,我國圖情學界在知識聚合理論、聚合模式、技術應用方面均取得一定研究成果,但檔案學界對檔案知識聚合的研究較為少見。截至2018年4月,在中國知網、讀秀知識庫、萬方數據資源系統—數字化期刊全文庫等主流數據庫中以“檔案+聚合”為關鍵詞進行題名檢索,僅得6篇文獻;以“檔案+知識聚合”進行篇名檢索,未檢索出相關文獻。由此可見,我國檔案學界尚未系統開展檔案知識聚合主題研究。一方面,傳統的檔案文獻借閱、檔案編研等服務方式無法滿足知識經濟時代檔案用戶的知識利用需求,這種需求驅動著檔案知識聚合研究的開展;另一方面,檔案學界關于檔案知識管理、檔案利用服務的相關研究成果豐富,為檔案知識聚合研究奠定了理論和實踐基礎。檔案學界現已認識到檔案利用服務中檔案知識挖掘、處理、整合的重要性。在此背景下,開展檔案知識聚合研究,探索檔案知識聚合的理論模式與實踐模型成為應時之事。

一、檔案知識聚合概念分析

檔案知識聚合屬于組合型概念,由“檔案知識”與“知識聚合”兩個概念組配而成。因此,從基礎性概念“知識聚合”著手,在界定“知識聚合”概念的基礎上,逐漸明晰檔案知識聚合的概念內涵。

(一)知識聚合內涵

知識聚合在信息技術深度發展、社會信息量劇增、用戶信息需求驅動的背景之下應運而生。該概念最初起源于文獻、資料等粗粒度信息資源的整合思想;隨后,伴隨著日漸興起的數據整合、信息聚合等中粒度聚合技術應用而逐漸拓展、深化。知識經濟時代,人們意識到知識的重要性并將其視為組織的重要資產,知識聚合逐漸引起研究人員關注。目前,國內學者雖未對知識聚合形成確定一致的概念內涵,但多數學者認同知識聚合是通過對文獻、信息、數據等資源進行知識化處理,抽取其中的知識單元,結合用戶需求,并將這些知識單元按照一定關聯重新聚集和組合,形成用戶所需的高聚合度、強關聯性的新知識集合。換言之,知識聚合是從用戶需求和解決用戶實際問題出發的一種精細化、細粒度層次的聚合活動和方式。

(二)檔案知識聚合

檔案知識聚合概念由“檔案知識”與“知識聚合”概念組配而成。綜合以上兩個概念,總結出“檔案知識聚合”即通過對數字檔案資源進行相應的知識抽取和知識表示處理,形成檔案知識單元并存入檔案知識庫,再按照檔案用戶需求,充分挖掘檔案知識單元間的關聯,對其進行重新聚集和組合,形成用戶感興趣、能解決實際問題、具有較強知識性的檔案知識集合。檔案知識聚合由聚合主體、聚合客體以及聚合環境構成。檔案知識聚合主體主要是作為檔案知識聚合的發起者、實施者和完成者的檔案工作者。檔案知識聚合客體是指蘊含在檔案資源中,對檔案用戶有重要價值,輔助用戶決策或直接幫助其解決實際問題的知識。檔案知識聚合環境要素可分為理論環境、硬件環境、技術環境、需求環境。理論環境主要指檔案知識、知識聚合、檔案管理等檔案知識聚合相關理論的發展情況;硬件和技術環境主要指檔案知識聚合所需計算機、網絡、服務器等基礎實施完備情況和運用的知識挖掘技術和聚類技術等發展情況;需求環境是指檔案用戶對檔案知識、檔案工作者的要求和期望,這是影響檔案知識聚合效果的重要因素。

二、檔案知識聚合模式的選擇

檔案知識聚合模式的選擇是檔案知識聚合實踐模型建構的關鍵,針對不同的信息資源類型、信息環境以及用戶需求,應選取相應的聚合模式。目前,檔案知識聚合模式的相關研究較少,因此,檔案知識聚合模式的選擇需借鑒現有知識聚合模式研究成果。知識聚合模式主要分為基于語義的知識聚合、基于情景的知識聚合、基于計量的知識聚合三大類。這三類知識聚合模式不是相互獨立、不相兼容的,可根據實際知識聚合需求進行復合運用。

(一)檔案知識聚合模式選擇原則

原則是一切行事所依據的準則,檔案知識聚合模式的確定也需在一定準則下進行。一是深度性原則。檔案知識聚合模式選擇首要原則是保證聚合的深度性,只有從檔案知識語義及其關聯角度對分散的檔案知識進行聚合,才能實現對檔案資源的深層次、細粒度的知識層面聚合;二是易操作性原則。檔案知識聚合模式選擇需要考慮具體實踐操作的難易程度,應選擇技術要求合理、聚合成本可控的聚合模式,盡量在操作性、成本控制和聚合效果之間尋找最佳方案;三是全面性原則。選擇檔案知識聚合模式時不僅要保證檔案文獻、檔案信息之間的知識聚合,還要選取能對外部資源(圖書、網絡等)中與目標主題相關知識進行聚合的模式,如此一來,才能保證聚合成果的全面、準確,進一步提升用戶的知識獲取體驗和知識服務滿意度;四是保密性原則。在檔案知識聚合過程中須保證做到檔案知識的安全以及檔案用戶隱私不被侵犯。因此,所選知識聚合模式須能設計相應的安全擴展功能,保障檔案知識在聚合過程過程中不會泄露到公共網絡空間中。

(二)基于語義——情景的檔案知識聚合模式

在檔案知識聚合模式選擇原則基礎上,參考各類知識聚合模式優劣勢,結合檔案自身特點,最終將檔案知識聚合模式確定為基于語義——情景的檔案知識聚合模式。選取該模式的原因有:一是檔案知識聚合對象為檔案知識,檔案知識的深度聚合必須從語義層進行操作。基于本體的知識聚合模式通過構建關于目標主題的檔案知識領域本體實現對檔案知識語義及其之間關聯的準確描述。在此基礎上,利用關聯數據,將領域本體內的知識與領域外的相關知識進行聚合,保證了檔案知識聚合的深度性、全面性。二是檔案內容的多樣性決定了在對檔案資源進行知識聚合時,會涉及大量自然語言文本和圖形圖像文件。針對此類高維檔案資源,可利用主題模型、文本聚類方法進行降維操作,降低對這些文件聚合的難度,滿足檔案知識聚合的可操作性原則。三是用戶檔案需求是檔案知識聚合重點考慮的因素,如欲實現聚合的全面性,就需實現將用戶所處的實時情景(時間、位置等)加入到聚合結果中,而基于情景的知識聚合模式正好能實現上述要求。四是該聚合模式是綜合基于語義的知識聚合模式、基于情景的知識聚合模式的各方面優點而得到的,具有良好的擴展性,可設計相應的安全保障功能,進而確保檔案知識的信息安全和保密性。

三、檔案知識聚合實踐模型的構建

檔案知識聚合實踐模型的構建需要“基于語義——情景”的檔案知識聚合理論模式和實際操作要求兩大因素的共同支持,在此基礎上形成包括:基礎層、聚合層、應用層、評估層四級架構的檔案知識聚合實踐模型,具體如圖1所示。

(一)基礎層

檔案知識聚合實踐模型的基礎層主要包括資源集合、資源預處理、知識獲取、基于本體的知識組織以及知識存儲五個組成部分。資源集合是檔案知識聚合的最原始資源基礎,包含檔案資源、圖書情報資源、專家知識三類。檔案資源、圖書情報資源是固定資源,主要指提供知識聚合服務的檔案館、圖書館、情報機構的文獻、檔案、圖書、期刊、報紙等資料。專家知識指檔案知識聚合服務過程中領域專家關于資源整理、知識處理等方面的技能和知識。這些知識對知識抽取、知識組織具有重要輔助作用,還可對檔案知識聚合結果進行校準、評價和監督。資源預處理是將多種異構資源進行整合、處理,形成計算機可處理的結構化資源的過程,包括資源清理、資源集成、資源轉化、資源歸約、資源離散化以及特征選擇等步驟。[2]知識獲取主要是在資源預處理前提下,對結構化的資源進行知識挖掘、知識抽取、知識表示的過程?;诒倔w的檔案知識組織通過構建檔案資源知識本體,揭示數字檔案資源中所蘊含的檔案知識內在關聯,將之整理為有序的、相互關聯的存在方式,以便檔案知識庫的知識存儲和知識檢索。[3]最后,知識庫是計算機中可用來對有序組織后的關聯知識進行存儲的知識集合軟件,[4]將合理組織后的檔案知識存儲到知識庫中,可方便用戶對某一主題知識的檢索,形成關于該主題的知識資源的較淺層次聚類,為深層次知識聚合打下基礎。

(二)聚合層

檔案知識聚合實踐模型的聚合層是對檔案、圖書和網絡等知識進行聚集整合的關鍵模塊。該層以用戶檔案知識需求為驅動,以基礎層提供的各種知識資源為主要聚合客體,以傳感器提供的實時情景信息為知識聚合的補充,根據用戶的檔案知識需求,從知識語義關聯的深度,通過計算知識間的語義相似度進行聚類、合并、去重等操作,實現多種異構知識的深層次聚合。檔案知識之間的聚合主要通過比對檔案知識中詞匯、句子在語義上的相似度來實現。針對檔案知識目錄和正文文字部分,采用文檔Shingling改進算法來實現聚合,針對正文圖片、圖像部分擬通過構建主題模型來對圖片、圖像進行降維處理,再進行聚合操作。檔案知識與外部知識的聚合主要基于某一主題相關知識的需求,對檔案知識、圖書知識、網絡知識實施綜合的、全面的聚合操作。在聚合過程中,需要將三種知識在其各自知識領域內進行聚合,再將三者領域內知識聚合結果進行二次聚合,形成完整、全面、高聚合度的知識聚合實例。實時情景信息的補充聚合是檔案知識聚合的輔助性活動。檔案知識聚合受用戶檔案知識需求驅動,而用戶檔案知識需求又受到其所處實時情景的影響。因此,在檔案知識聚合過程中能準確獲取用戶的實時情景信息,并對這些情景信息進行分析、將之與檔案知識進行聚合十分關鍵。

(三)應用層

檔案知識聚合結果的可視化呈現是檔案知識聚合實踐模型的應用層關注的重點問題。檔案知識聚合結果的呈現形式受檔案知識服務方式和用戶的檔案知識需求兩個關鍵因素的影響。檔案知識服務方式在系統設計層面起作用,若選擇在移動社交媒體環境下提供檔案知識服務,則適合使用專題文本文檔形式展示。在文檔中可加入圖片、鏈接、視頻等多媒體文件,將檔案知識聚合結果以簡潔、明了、列舉知識點的形式給出,減輕用戶閱讀負擔,增加檔案內容的趣味性;若選擇門戶網站服務方式,則適合采用知識地圖展現。知識地圖能完整展示網頁上所有知識間的層次、關系,便于用戶深入了解整個知識內容的體系架構,以領域知識瀏覽的漸進式方式推進服務[5]。另外,立足用戶檔案知識需求將為用戶提供更加個性化的展示效果,根據系統設計和技術手段的要求,盡量滿足用戶對聚合結果的展示需求。

(四)評估層

檔案知識聚合模型的評估層作為整個模型的重要組成部分,對檔案知識聚合可持續發展具有推動作用。首先,評估層直接影響用戶檔案知識需求的更新,這是檔案知識聚合實施的主要驅動力量。其次,領域專家對模型的評估助于檔案知識聚合方法的改進和檔案知識聚合結果的優化。領域專家憑借豐富的理論積累和實踐工作經驗,對該模型的聚合方法、聚合效率、聚合結果進行評估,有利于模型的調整和改進,經過“實施→評估→實施→評估…”的良性循環,整個聚合模型會不斷進行更新和迭代,最終向最優模型靠攏。最后,評估過程中用戶的全程參與使評估過程更加貼近用戶需求,保證評估結果的真實性、有效性。另外,檔案知識聚合實施主體也可從聚合資源、聚合模式、聚合實踐、聚合結果四方面設計檔案知識聚合模型評估指標體系,以指導檔案知識聚合模型評估工作的穩步推進。

以臺灣歷史數位圖書館項目為例,該歷史數位圖書館作為收錄“淡新檔案”“明清檔案”“古契書”的全文檔案資料數據庫,基本搭建了涵蓋基礎層、聚合層、應用層、評估層在內的四級檔案知識聚合實踐模型。在基礎層存儲各類檔案、文獻的全文數據,系統建設人員與檔案工作者對全文數據進行關鍵詞(人名、地名、時間、官名等)抓取,制定全文數據的元數據方案,實現檔案文獻的有序化存儲,為檔案文獻知識化處理做準備。在數據庫的聚合層,立足用戶的檢索和利用需求,搭建“時間”“空間”“主題”三類檔案文獻組織脈絡,借助關聯數據實現檔案文獻的自動聚合。該數據在應用層面提供檢索結果關系脈絡圖,幫助用戶探尋目標檔案相關的知識。最后,用戶在數據庫評估層支撐下,借助交互接口向數據庫終端反饋此次檔案知識服務的真實感受及個人建議,為數據庫的升級優化提供重要參考數據。

*本文系國家社會科學基金項目青年項目“社交媒體環境下公共檔案資源知識聚合與服務研究”(項目編號:16CTQ032)階段性研究成果之一。

參考文獻:

[1]趙蓉英,王嵩,董克.國內館藏資源聚合模式研究綜述[J].圖書情報工作,2014(18):138-143.

[2]梁亞聲,徐欣等.數據挖掘原理、算法與應用[M].北京:機械工業出版社,2014:61-93.

[3]張斌,郝琦,魏扣.基于檔案知識庫的檔案知識服務研究[J].檔案學通訊,2016(3):51-57.

[4]張斌,魏扣,郝琦.國內外知識庫研究現狀述評與比較[J].圖書情報知識,2016(3):15-25.

[5]王昊,谷俊,蘇新寧.本體驅動的知識管理系統模型及其應用研究[J].中國圖書館學報,2013(3):98-110.

猜你喜歡
資源用戶模型
一半模型
基礎教育資源展示
重要模型『一線三等角』
一樣的資源,不一樣的收獲
重尾非線性自回歸模型自加權M-估計的漸近分布
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 欧美自慰一级看片免费| 亚洲人人视频| 天天色天天操综合网| 亚洲丝袜第一页| 久久人人妻人人爽人人卡片av| 亚洲资源站av无码网址| 一级毛片无毒不卡直接观看| 三区在线视频| 成人午夜天| 亚洲美女视频一区| 人妻出轨无码中文一区二区| 国产无遮挡猛进猛出免费软件| 精品视频福利| 国产女人在线视频| 久久久久久久97| 狠狠色丁香婷婷综合| 亚洲另类色| 色哟哟色院91精品网站| 夜夜操国产| 成人免费午夜视频| 在线无码九区| 五月天久久综合| 91久久精品国产| 在线看片免费人成视久网下载| 亚洲AⅤ永久无码精品毛片| 五月婷婷激情四射| 欧美黑人欧美精品刺激| 亚洲swag精品自拍一区| 99精品国产高清一区二区| 日韩精品一区二区三区大桥未久| 亚洲综合久久成人AV| 美女无遮挡被啪啪到高潮免费| 久久国产乱子| 欧美午夜理伦三级在线观看| 制服丝袜无码每日更新| 人妻少妇久久久久久97人妻| 真实国产精品vr专区| 亚洲精品无码日韩国产不卡| 91久久青青草原精品国产| 国产精品爽爽va在线无码观看| 欧美色视频日本| 色综合激情网| 亚洲二三区| 亚洲男人在线| 日韩无码黄色| 国产一区二区三区视频| 亚洲a级在线观看| 亚洲欧美日韩中文字幕在线一区| 亚洲视频免费播放| 波多野结衣无码AV在线| 伦精品一区二区三区视频| 少妇高潮惨叫久久久久久| 在线观看国产黄色| 99这里只有精品在线| 亚洲无码高清视频在线观看| 亚洲欧美日韩动漫| 国产性生交xxxxx免费| 在线观看精品自拍视频| 亚洲品质国产精品无码| 欧美成人日韩| 日韩高清中文字幕| 欧美一区二区丝袜高跟鞋| 好吊色妇女免费视频免费| 色网站在线免费观看| 精品小视频在线观看| 欧美综合区自拍亚洲综合绿色| 国产成人亚洲精品蜜芽影院| 亚洲一级毛片| 伊人久久久久久久| 国产自在线拍| 2021国产乱人伦在线播放| 国产永久免费视频m3u8| 亚洲swag精品自拍一区| a级毛片免费播放| 色婷婷国产精品视频| 国产精品无码AV片在线观看播放| 她的性爱视频| 色国产视频| 日韩国产综合精选| 日韩无码视频专区| 国产精品网址你懂的| 欧美在线精品一区二区三区|