999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

科技檔案資源知識服務策略研究與實踐探索

2024-12-31 00:00:00張靜席笑潘亞男
北京檔案 2024年7期

摘要:應用信息技術開展科技檔案資源知識服務是當前檔案利用服務的必然趨勢,有助于更好地支撐科技創新與戰略決策。論文通過調研、分析用戶對科技檔案資源的利用需求,及當前科技檔案資源組織現狀,從提升資源質量、深化內容挖掘與拓展利用方式三個方面提出了科技檔案資源知識服務策略,并以重大科技項目為例進行實踐探索,以促進科技檔案資源價值的發揮。

關鍵詞:科技檔案 知識服務 科技創新

科技檔案是科學研究活動中形成的具有保存價值的各種形式和載體記錄,是科研成果的重要組成部分,是支撐國家科技創新的重要基礎性、戰略性資源。為了更好地支撐科技創新與戰略決策,檔案部門可以應用信息技術開展知識服務,挖掘好、利用好科技檔案資源。這也是科技檔案利用服務工作發展的必然趨勢。

當前,關于檔案知識服務策略與技術路線[1]、新技術應用等[2],學者們已開展了廣泛的理論研究與實踐探索。在知識服務策略與技術路線方面,學者們通常基于用戶需求,構建覆蓋檔案收集、整理與組織、存儲與利用服務等的框架。在新技術應用方面,學者們主要集中于本體、關聯數據、數據挖掘、知識圖譜等技術研究與應用。在針對特定領域或主題開展檔案知識服務實踐探索方面,多數學者以名人檔案[3]、紅色資源[4]為對象,引入元數據、本體、關聯數據及知識圖譜等技術進行內容挖掘與知識服務,側重于發揮檔案的“文化”價值屬性。僅有少數學者以推進科技檔案精細化管理為目的,針對科技檔案進行知識挖掘、組織與關聯研究。[5]可見,從科技檔案助力科技創新角度出發,開展科技檔案知識服務策略的相關研究與實踐較少。

本文分析了用戶對科技檔案資源的利用需求,及當前科技檔案資源組織現狀,提出了科技檔案資源知識服務策略,并以重大科技項目為切入點進行實踐探索,以期為開展科技檔案資源知識服務提供具有可操作性的借鑒與參考。

一、科技檔案資源利用需求與組織現狀分析

科技檔案具有海量異構、專業性強、語義復雜等特點;科技檔案的服務對象主要包括科研人員與決策人員。本文針對檔案人員、科研人員及決策人員,就科技檔案資源組織情況、利用現狀與需求等方面開展了問卷調查與訪談,并從資源利用需求和組織現狀兩個方面對91份有效問卷與訪談結果進行了分析。這為后續提出科技檔案資源知識服務策略奠定了基礎。

(一)資源利用需求分析

1.在利用方式上,用戶需要支持面向主題、全文、可視化等方面的多種在線查詢方式。科技檔案資源體量龐大、異構程度高,單一的檢索方式難以滿足用戶多樣化的信息需求。當前絕大部分科技檔案資源查詢方式與呈現結果對內容信息揭示程度較弱,因此用戶難以快速了解資源內容,需要花費較多時間和精力用于信息篩選。此外,科技檔案利用權限要求較為復雜,極大地降低了用戶獲取相關信息線索的可能。因此,開展科技檔案資源知識服務需要考慮如何應對檢索方式單一導致的查不準,以及權限受限導致的查不全等關鍵問題。

2.在利用內容上,用戶需要實現科技檔案資源文本化、數據化與可視化結果呈現。科研人員期望科技檔案元數據不僅局限于科技檔案資源外部形式特征,而是能夠更加深入內容或是語義層面,在利用內容結果呈現方面能夠展示知識單元間的關聯,以便更直觀、全方位地獲取所需具體知識內容;決策人員希望整合各個科技項目的相關檔案資源,從學科領域布局、經費執行、成果管理、人才培養等方面更清晰地了解項目具體情況。因此,科技檔案資源知識服務需要加快科技檔案數據化、語義關聯化及結果可視化進程。

可以看出,在盡可能查全、查準的基礎上,用戶對科技檔案資源利用提出了個性化、精準化的服務需求。不同類型的用戶因利用需求及場景不同,重點關注的科技檔案資源內容有所不同。科研人員更側重于實驗記錄、數據、方法模型、軟件代碼及專利等內容,以期借鑒研究方法、啟發研究新思路等。決策人員較為關注宏觀層面的整體項目布局、單位合作及經費執行情況等,以期為部署科技任務、組織科技合作提供參考。

(二)資源組織現狀

1.資源著錄標準存在“不統一”現象。科技檔案資源的著錄要求在不同時期會有所差異,導致科技檔案資源存在著錄標準、組織方式不同的問題。同時,科技檔案資源體量大、涉及單位多,且不同單位的檔案人員對歸檔要求、元數據著錄、“四性”檢測等規范理解與執行存在不一致,容易使得著錄格式及內容出現不統一的現象。

2.資源描述存在“重外輕內”現象。科技檔案資源元數據包括用于描述外部形式特征的數據(如責任者、日期、頁數、格式、容量大小等),以及關鍵詞、主題詞、摘要等內容描述類元數據。但是,在絕大部分情況下,關于內容描述類元數據著錄的強制性要求較少,且著錄較為困難,因此大多數科技檔案資源內容描述類元數據基本為空。現階段對于科技檔案資源內容的深層次描述與揭示程度較弱。

3.資源分類存在“粗粒度”特征。目前我們主要從檔案門類、機構、年份或保管期限等方面對科技檔案資源進行分類。這種分類方式能夠較為全面、客觀地刻畫資源間的外在邏輯聯系,便于族性檢索。但其對信息對象的組織與揭示主要停留在“線性”“粗粒度”階段,較少從科技檔案資源內容及語義描述方面進行多維度、細粒度的關聯與組織。

整體來看,科研人員和決策人員對科技檔案資源具有較高的利用需求,但當前科技檔案利用權限限制了他們獲取相關信息來源的可能,而且科技檔案資源的現有組織方式也尚不足以支撐開展基于內容關聯的個性化知識服務。因此,檔案部門需要進一步梳理并解決制約科技檔案資源知識服務的關鍵問題,以更好地發揮科技檔案資源的價值。

二、科技檔案資源知識服務策略

從上述分析可以看出,當前檔案部門開展科技檔案資源知識服務需要著重解決三個方面的關鍵問題:一是通過提升資源質量,滿足用戶關于內容關聯分析的需求;二是按照“數字化—文本化—數據化—知識化”的過程,不斷深化科技檔案資源內容揭示和數據化程度,逐步在文本關聯基礎上實現內容語義關聯;三是不斷豐富科技檔案資源利用方式與呈現形式,從不同維度滿足不同用戶的個性化利用需求。因此,本文有針對性地從提升資源質量、深化內容挖掘、拓展利用方式三個方面提出了科技檔案資源知識服務策略。

(一)提升資源質量

高質量的科技檔案資源是開展知識服務的基石。本文認為檔案部門需要從全流程加強科技檔案質量控制。首先,在前端管控環節,檔案部門要進一步完善科技檔案管理體系,包括但不限于明確與完善科技文件材料歸檔范圍,并進一步強化元數據著錄要求及質量審核機制,從源頭提高檔案質量。其次,在過程管控中,檔案部門要充分利用信息技術手段,盡可能將質量控制要求內置到系統功能中。例如,在系統中設置字段著錄規則與要求,實現自動著錄,提升著錄規范性與效率。最后,在歸檔階段,檔案部門要不斷細化“四性”檢測要求,使用系統功能從著錄格式與歸檔資源內容層面進行數據清洗與檢查,提升科技檔案的內容質量。

(二)深化內容挖掘

1.推進檔案數據化。檔案數據化與用戶需求密切相關。[6]檔案部門應探索引入機器學習與人工相結合的方式,開展科技檔案內容標注與知識抽取,提升科技檔案數據化水平。在篇章層面,檔案部門可以通過構建科技檔案語料庫進行知識抽取,提升數據的一致性和標準化程度;在語句層面,檔案部門可以應用機器學習、深度學習等信息抽取模型,進行命名實體識別、事件抽取等;在字詞層面,檔案部門可以利用自然語言處理技術開展分詞、詞性標注、依存句法分析等。此外,由于早期科技檔案手寫體偏多且版式較為復雜,故檔案部門還需借助大模型不斷完善OCR識別算法,提升手寫體、繁體字和豎排版面等特殊情況下的OCR識別準確率,為推進檔案數據化奠定更好的文本基礎。

2.實現知識關聯化。檔案部門應根據檔案內容挖掘粒度不同,采用不同的技術方式,有針對性地聚合知識碎片,不斷推進檔案知識關聯化。在文檔層面,檔案部門可以采用LDA主題模型等算法,從內容主題、事件或情感表達等角度進行關聯或聚合;在術語層面,檔案部門可以借助本體、關聯數據等技術,抽取并關聯檔案資源中包含的實體、屬性及關系等;在語義層面,檔案部門可以引入Word2vec等深度學習算法學習特征詞的上下文語境信息,生成包含語義關系的詞向量,實現語義關聯。

(三)拓展利用方式

1.檢索智能化。傳統的基于關鍵詞匹配的全文檢索雖然直觀、實用,但面對復雜多變的信息需求,其局限性日益凸顯。一方面,檔案部門應積極探索并引入先進的信息檢索技術和方法,如向量空間模型、語言模型與概率模型等,以提升檢索效率和精度;另一方面,針對檢索中的詞義模糊、多義詞和同義詞等問題,檔案部門可引入本體、專業詞典或詞庫、語義網、知識圖譜及大模型等技術,以提升檢索查全率和查準率。

2.結果可視化。檔案部門應借助不同類型的可視化技術[7]讓用戶更加全面、直觀且快速地獲取所需知識,如通過標簽云或詞云可實現文本研究內容或主題的可視化;采用單詞樹、TextArc等可視化技術以展現文本間不同類型的關聯關系,包括文本內部結構與語義關系、引用關系及主題相似性關系等。此外,檔案部門還可將各類可視化技術進行組合,從多維度全面呈現用戶所需知識,如借助Spark? Clouds[8]等技術,從時間、主題、控件、情感等更多視角呈現不同資源間的關聯關系。

三、科技檔案資源知識服務實踐探索

為驗證科技檔案知識服務策略的可行性,本文以重大科技項目檔案為切入點,面向決策人員與科研人員進行了知識服務實踐探索,并取得了較好的應用成效。

(一)面向決策人員的合作關系圖譜

本文以重大科技項目實施責任書、結題報告為數據源,首先采用基于規則的信息抽取方法,提取了項目參與人員及所屬單位信息;然后,運用共現方法生成了科研人員及機構合作關系表;最后,使用可視化技術,生成了科研人員及機構合作關系圖(見圖1)。該圖譜支持節點數量設置和共現數據篩選,有助于決策人員直觀且全面地掌握項目合作情況,為后續優化資源配置、促進協同創新提供參考。

(二)面向科研人員的研究主題知識圖譜

本文以重大科技項目結題報告為數據源,首先采用基于規則的信息抽取技術,提取摘要、關鍵詞及所屬學科字段;然后,引入自然語言處理技術,對文本內容進行中文分詞、去停用詞、詞頻統計、合并同義詞等數據處理操作;最后,利用可視化技術生成了研究主題詞云及學科共現關系圖(見圖2)。該圖譜較為全面地呈現了項目研究關鍵內容(研究主題、關鍵技術等),便于科研人員了解重大科技項目研究熱點、學科交叉研究情況,啟發研究創新思維。

(三)面向內容關聯利用的可視化檢索

為提升科研人員、決策人員對于科技檔案的利用效率,我們可以采用多種方式優化檢索效果及結果呈現方式。以中國科學院檔案館館藏的科技檔案為例,首先,我們以其為數據源,引入基于人工智能的OCR識別技術,提升豎排、表格等特殊版式及手寫體的識別正確率,實現早期科技檔案資源的全文檢索;其次,集成同義詞庫、機構消歧語料庫,提升檢索結果的準確性。考慮到檔案借閱利用的權限要求,我們將檢索結果以不展現檔案具體內容,僅展現其他開放信息的可視化方式呈現,為用戶提供更多相關信息的可能來源。該可視化檢索能夠以項目關系圖的形式直觀反饋檢索檔案所處的項目層級,在有相應權限的前提下雙擊節點即可查看檢索檔案的題名、檔號等目錄信息,極大地提升了項目、機構、人員間的學術交流與知識共享。

四、結語

科技檔案是科研項目從立項論證、研究實施、結題驗收/績效評價,到成果推廣應用全過程的真實記錄,是國家科技戰略資源的重要組成部分。本文從科研人員和決策人員利用需求出發,提出了具有可行性的科技檔案知識服務策略,有利于發揮科技檔案支撐科技創新、助力科技戰略決策的作用,也為后續檔案部門從內容層面開展科技檔案資源開發利用與服務提供了借鑒與參考。

注釋及參考文獻:

[1]魏亮亮.面向數字人文的檔案知識服務模式轉型探析[J].檔案學研究,2021(4):72-79.

[2]夏天,錢毅.面向知識服務的檔案數據語義化重組[J].檔案學研究,2021(2):36-44.

[3]牛力,劉慧琳,高晨翔.數字記憶視角下的學術名人知識庫研究[J].情報理論與實踐,2022,45(9):164-172.

[4]陳海玉,向前,何劍鋒.面向知識服務的抗戰檔案資源聚合與可視化展現探究[J].檔案學研究,2021(2):111-118.

[5]雷潔,趙瑞雪,李思經,等.科研檔案管理知識圖譜構建研究[J].科技管理研究,2020,40(11):162-169.

[6]祁天嬌,馮惠玲.檔案數據化過程中語義組織的內涵、特點與原理解析[J].圖書情報工作,2021,65(9):3-15.

[7]唐家渝,劉知遠,孫茂松.文本可視化研究綜述[J].計算機輔助設計與圖形學學報,2013,25(3):273-285.

[8] LEE B,RICHE N H,KARLSON A K,et al. Sparkclouds:visualizing trends in tag clouds[J]. IEEE Transactions on Visualization and Computer Graphics,2010,16(6):1182-1189.

作者單位:1.中國科學院檔案館2.中國科學院文獻情報中心3.中國科學院大學經濟管理學院信息資源管理系

主站蜘蛛池模板: AV天堂资源福利在线观看| 四虎永久免费地址| 97av视频在线观看| 日韩在线网址| 成人另类稀缺在线观看| 91偷拍一区| 精品国产一区91在线| 91精品国产综合久久不国产大片| 99久久精彩视频| 亚洲色大成网站www国产| 亚洲精品爱草草视频在线| 热re99久久精品国99热| 99青青青精品视频在线| 日韩欧美一区在线观看| 久久黄色一级片| 日韩欧美中文字幕一本| 亚洲专区一区二区在线观看| 国产在线小视频| 欧美国产成人在线| 亚洲三级色| 国产综合日韩另类一区二区| 亚洲日本精品一区二区| 91成人在线观看| av在线人妻熟妇| 国内精品视频在线| 亚洲午夜福利精品无码| 99久久婷婷国产综合精| 亚洲国产第一区二区香蕉| 精品视频在线观看你懂的一区| 国产18在线播放| 国产乱码精品一区二区三区中文| 久久精品中文字幕少妇| 欧美综合中文字幕久久| 国产尤物视频网址导航| 久久大香香蕉国产免费网站| 男女男精品视频| 亚洲高清无码精品| 操国产美女| 国内精品自在欧美一区| 午夜欧美理论2019理论| 91麻豆精品国产91久久久久| 亚洲中文精品久久久久久不卡| 毛片卡一卡二| 嫩草影院在线观看精品视频| 欧美亚洲国产精品久久蜜芽| 国产日韩久久久久无码精品 | 亚洲精品在线影院| 国产精品私拍99pans大尺度 | 美女无遮挡拍拍拍免费视频| 国产一区二区视频在线| 久久午夜夜伦鲁鲁片无码免费| 欧美影院久久| 午夜在线不卡| 丁香婷婷久久| 国产不卡一级毛片视频| 国产成人1024精品| 国产精品亚洲五月天高清| 精品无码日韩国产不卡av| 欧美日韩北条麻妃一区二区| vvvv98国产成人综合青青| 国产精品午夜电影| 久久综合色88| 一级毛片无毒不卡直接观看| 亚洲成网777777国产精品| 国产在线一区视频| 亚洲中文久久精品无玛| 精品少妇三级亚洲| 国产门事件在线| 丁香五月婷婷激情基地| 国产精品区视频中文字幕 | 国产在线97| 久久精品视频一| 中文字幕久久精品波多野结| 高清精品美女在线播放| 亚洲欧州色色免费AV| 91成人免费观看在线观看| 欧美国产日产一区二区| 亚洲AV色香蕉一区二区| 91久久青青草原精品国产| 欧美黄网站免费观看| 国产乱人激情H在线观看| 男女精品视频|