
摘 要:該文探討了一種基于知識(shí)圖譜的檔案管理決策支持系統(tǒng),通過(guò)用戶需求分析、系統(tǒng)功能需求分析和系統(tǒng)性能需求分析,確定系統(tǒng)的設(shè)計(jì)目標(biāo)。在此基礎(chǔ)上,介紹了基于知識(shí)圖譜的系統(tǒng)模型設(shè)計(jì),包括知識(shí)圖譜的構(gòu)建與檔案元數(shù)據(jù)、知識(shí)圖譜的查詢與分析、決策支持模塊、用戶交互模塊以及知識(shí)圖譜維護(hù)與更新模塊。這些模塊相互協(xié)作,實(shí)現(xiàn)了檔案管理的各項(xiàng)功能。最后從知識(shí)庫(kù)搭建和決策分項(xiàng)與計(jì)算兩方面探討了系統(tǒng)的實(shí)現(xiàn)。
關(guān)鍵詞:知識(shí)圖譜;檔案管理;決策支持;系統(tǒng)
大數(shù)據(jù)時(shí)代的到來(lái)促使檔案管理面臨著前所未有的挑戰(zhàn),探尋一種能夠高效、準(zhǔn)確地處理和利用海量數(shù)據(jù)的方法成為檔案管理領(lǐng)域的重要課題[1]。近年來(lái),知識(shí)圖譜和決策支持系統(tǒng)在各種領(lǐng)域得到廣泛的應(yīng)用。知識(shí)圖譜以其獨(dú)特的數(shù)據(jù)表達(dá)形式和處理方式,可以有效地整合、組織、理解和利用數(shù)據(jù)。研究并建立基于知識(shí)圖譜的檔案管理決策支持系統(tǒng),不僅可以有效解決當(dāng)前檔案管理面臨的挑戰(zhàn),也有利于提高檔案管理的效率和質(zhì)量[2]。對(duì)于保護(hù)社會(huì)記憶、推動(dòng)社會(huì)發(fā)展具有重要的意義。
1 基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)的需求分析
1.1 用戶需求分析
1.1.1檔案查詢需求。在檔案管理中,用戶經(jīng)常需要查詢特定的檔案信息。傳統(tǒng)的查詢方式常常需要翻閱大量的檔案,非常耗時(shí)且效率低下。而基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)能夠通過(guò)圖譜中的連接和關(guān)系快速定位到相關(guān)的檔案,大大提高了查詢效率[3]。
1.1.2決策支持需求。檔案管理者需要對(duì)檔案的歸檔、保管、利用等進(jìn)行決策。基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)應(yīng)具備提供決策建議的能力,如基于檔案的屬性和關(guān)系對(duì)檔案的重要性進(jìn)行評(píng)估,為檔案的歸檔、保管提供依據(jù);通過(guò)分析檔案的利用情況,為檔案的利用決策提供參考。
1.1.3用戶交互需求。基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)應(yīng)設(shè)計(jì)出直觀的用戶界面,并提供豐富的交互方式,如圖形化展示檔案的屬性和關(guān)系,支持用戶通過(guò)拖放、點(diǎn)擊等方式進(jìn)行操作[4]。同時(shí),系統(tǒng)還需要提供及時(shí)的反饋,以提高用戶的使用體驗(yàn)。
1.2 系統(tǒng)功能需求分析
1.2.1知識(shí)圖譜構(gòu)建與管理。知識(shí)圖譜是基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)的核心部分,系統(tǒng)需要具有構(gòu)建和管理知識(shí)圖譜的能力。為了確保知識(shí)圖譜的有效性和準(zhǔn)確性,系統(tǒng)還需要具備處理不完整、不準(zhǔn)確數(shù)據(jù)的能力,如數(shù)據(jù)清洗、數(shù)據(jù)融合等。
1.2.2檔案信息處理與分析。基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)需要能夠處理和分析檔案信息,以支持檔案查詢和決策支持。這包括對(duì)檔案的屬性信息、關(guān)系信息的處理,以及基于這些信息的分析。此外,系統(tǒng)還需要支持對(duì)檔案信息的可視化,以幫助用戶更好地理解和利用檔案信息。
1.2.3決策支持功能。系統(tǒng)應(yīng)具備提供決策支持的功能,支持用戶進(jìn)行決策模擬,即用戶可以輸入不同的決策方案,系統(tǒng)將根據(jù)知識(shí)圖譜模擬出可能的結(jié)果,幫助用戶進(jìn)行決策。
1.3 系統(tǒng)性能需求分析
1.3.1數(shù)據(jù)處理性能。基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)需要處理大量的檔案數(shù)據(jù),包括檔案的屬性信息、關(guān)系信息等。系統(tǒng)需要有足夠的數(shù)據(jù)處理性能,能夠快速地讀取、寫(xiě)入、查詢和分析數(shù)據(jù)。
1.3.2系統(tǒng)穩(wěn)定性。系統(tǒng)的穩(wěn)定性是保證用戶正常使用的前提。系統(tǒng)需要能夠持續(xù)穩(wěn)定地運(yùn)行,即使在處理大量請(qǐng)求或者數(shù)據(jù)時(shí),也能保持良好的響應(yīng)速度和準(zhǔn)確性。此外,系統(tǒng)還需要具備一定的容錯(cuò)能力,即當(dāng)系統(tǒng)出現(xiàn)錯(cuò)誤或者故障時(shí),能夠及時(shí)進(jìn)行恢復(fù)。
1.3.3系統(tǒng)安全性。檔案數(shù)據(jù)往往包含大量的敏感信息,因此,系統(tǒng)的安全性非常重要。系統(tǒng)需要有足夠的安全防護(hù)措施,防止數(shù)據(jù)被非法訪問(wèn)或者修改。此外,系統(tǒng)還需要有數(shù)據(jù)備份和恢復(fù)機(jī)制,以防數(shù)據(jù)丟失。
2 基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)的模型設(shè)計(jì)
基于上文的需求分析,提出基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)的模型,設(shè)計(jì)如圖1所示的邏輯框架圖。
2.1 知識(shí)圖譜構(gòu)建與檔案元數(shù)據(jù)
首先,系統(tǒng)要處理的是大量的檔案元數(shù)據(jù),包括但不限于檔號(hào)、年代、文件題名、責(zé)任者、保管單位、載體形態(tài)、內(nèi)容描述等。這些元數(shù)據(jù)被作為知識(shí)圖譜中的實(shí)體和屬性進(jìn)行整合。對(duì)于檔案的內(nèi)容進(jìn)行深度文本分析和實(shí)體抽取,形成知識(shí)圖譜中的實(shí)體和關(guān)系。每個(gè)檔案的實(shí)體(如人物、組織、地點(diǎn)、事件等)都作為節(jié)點(diǎn),其關(guān)系則作為邊。對(duì)于數(shù)據(jù)的不完整性和不準(zhǔn)確性,系統(tǒng)采用數(shù)據(jù)清洗和數(shù)據(jù)融合的技術(shù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以提高數(shù)據(jù)質(zhì)量。另外,為了保證知識(shí)圖譜的動(dòng)態(tài)性和實(shí)時(shí)性,系統(tǒng)引入了增量更新策略,實(shí)現(xiàn)知識(shí)圖譜的實(shí)時(shí)更新。
2.2 知識(shí)圖譜的查詢與分析
檔案知識(shí)圖譜構(gòu)建后,系統(tǒng)將提供多種查詢接口,如SPARQL語(yǔ)言查詢,同時(shí)支持語(yǔ)義檢索,增強(qiáng)檢索的準(zhǔn)確性和用戶體驗(yàn)。系統(tǒng)利用知識(shí)圖譜進(jìn)行多維度的檔案信息分析,如時(shí)間軸分析、空間分析、主題分析、情感分析等[5]。
2.3 決策支持模塊
決策支持模塊以知識(shí)圖譜為基礎(chǔ),通過(guò)機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等技術(shù),分析檔案信息,提供數(shù)據(jù)驅(qū)動(dòng)的決策支持。系統(tǒng)可通過(guò)分析檔案的引用次數(shù)、涉及主題的重要性等因素,對(duì)檔案的長(zhǎng)期保存價(jià)值進(jìn)行評(píng)估,為檔案的永久保存或銷(xiāo)毀提供決策依據(jù)[6]。系統(tǒng)還會(huì)根據(jù)檔案的使用頻率、用戶評(píng)價(jià)等信息,對(duì)檔案的使用效率和使用滿意度進(jìn)行評(píng)估,以便持續(xù)改進(jìn)檔案服務(wù)。
2.4 用戶交互模塊
用戶交互模塊是系統(tǒng)的前端展示部分,提供友好的用戶界面。該模塊通過(guò)可視化的方式,將知識(shí)圖譜的內(nèi)容和分析結(jié)果展示給用戶。系統(tǒng)會(huì)提供互動(dòng)式的知識(shí)圖譜視圖,用戶可以通過(guò)點(diǎn)擊節(jié)點(diǎn)和邊來(lái)瀏覽和查詢檔案信息。用戶交互模塊還提供多種自定義選項(xiàng),如過(guò)濾條件、排序方式等,讓用戶能夠根據(jù)自己的需求定制查詢和分析結(jié)果。系統(tǒng)也會(huì)記錄用戶的操作和反饋,以支持用戶行為分析和系統(tǒng)優(yōu)化。
2.5 知識(shí)圖譜維護(hù)與更新模塊
為了保證知識(shí)圖譜的持久性和穩(wěn)定性,系統(tǒng)設(shè)計(jì)了知識(shí)圖譜維護(hù)與更新模塊。這個(gè)模塊主要負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)、備份、恢復(fù)等操作,以防止數(shù)據(jù)丟失或損壞。另外,系統(tǒng)還引入了數(shù)據(jù)審計(jì)機(jī)制,對(duì)知識(shí)圖譜的操作進(jìn)行記錄和審查,以確保數(shù)據(jù)的完整性和一致性。同時(shí),為了應(yīng)對(duì)檔案信息的變化,系統(tǒng)采用了增量更新策略,定期收集和處理新的檔案信息,更新知識(shí)圖譜。這個(gè)過(guò)程包括數(shù)據(jù)抓取、數(shù)據(jù)清洗、數(shù)據(jù)融合、知識(shí)圖譜構(gòu)建等步驟,確保知識(shí)圖譜的實(shí)時(shí)性和準(zhǔn)確性。
3 基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)的實(shí)現(xiàn)
3.1 知識(shí)庫(kù)的實(shí)現(xiàn)
知識(shí)庫(kù)管理是基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)的核心組成部分。它負(fù)責(zé)收集、組織、存儲(chǔ)和維護(hù)大量的檔案信息,以便為系統(tǒng)用戶提供全面、準(zhǔn)確的知識(shí)支持。
3.1.1知識(shí)庫(kù)管理需要進(jìn)行檔案信息的收集。這包括從多個(gè)數(shù)據(jù)源獲取檔案信息,如文本文檔、數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)等。收集的信息可能以不同的格式和結(jié)構(gòu)存在,因此需要使用自然語(yǔ)言處理和信息抽取技術(shù)對(duì)其進(jìn)行解析和提取。這些技術(shù)可以幫助系統(tǒng)識(shí)別出關(guān)鍵詞、實(shí)體、屬性和關(guān)系等重要信息,并將其轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)據(jù)形式。
3.1.2知識(shí)庫(kù)管理需要將收集的檔案信息以圖譜的形式進(jìn)行表示。知識(shí)圖譜是一種利用圖結(jié)構(gòu)來(lái)表示實(shí)體和它們之間關(guān)系的方法。通過(guò)構(gòu)建知識(shí)圖譜,系統(tǒng)能夠更好地描述檔案信息之間的關(guān)聯(lián)性,幫助用戶理解和發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的潛在知識(shí)。在構(gòu)建知識(shí)圖譜時(shí),需要定義合適的實(shí)體類(lèi)型和關(guān)系類(lèi)型,并使用圖數(shù)據(jù)庫(kù)等技術(shù)進(jìn)行存儲(chǔ)和管理。
3.1.3知識(shí)庫(kù)管理還需要考慮知識(shí)圖譜的更新和維護(hù)。由于檔案信息可能會(huì)隨著時(shí)間的推移而發(fā)生變化,知識(shí)庫(kù)需要及時(shí)更新以反映最新的信息。這可以通過(guò)定期的數(shù)據(jù)更新和監(jiān)控機(jī)制來(lái)實(shí)現(xiàn)。系統(tǒng)可以與外部數(shù)據(jù)源進(jìn)行連接,自動(dòng)獲取最新的檔案信息并將其添加到知識(shí)庫(kù)中。還可以進(jìn)行知識(shí)庫(kù)的一致性檢查和修復(fù),包括處理重復(fù)信息、消除沖突和修正錯(cuò)誤等。
3.1.4知識(shí)庫(kù)管理還可以提供一些輔助功能來(lái)提高系統(tǒng)的可用性和易用性。首先是搜索和查詢功能,用戶可以通過(guò)關(guān)鍵詞、屬性或?qū)嶓w進(jìn)行搜索,快速找到所需的檔案信息。其次是分類(lèi)和標(biāo)簽功能,通過(guò)對(duì)檔案信息進(jìn)行分類(lèi)和標(biāo)記,用戶可以更方便地進(jìn)行瀏覽和篩選。還可以實(shí)現(xiàn)推薦功能,根據(jù)用戶的偏好和行為,系統(tǒng)可以推薦相關(guān)的檔案信息或決策案例,幫助用戶發(fā)現(xiàn)新的知識(shí)。
3.1.5知識(shí)庫(kù)管理還需要與其他系統(tǒng)進(jìn)行集成和共享。通過(guò)將知識(shí)庫(kù)與其他系統(tǒng)無(wú)縫集成,實(shí)現(xiàn)知識(shí)的共享和交流,促進(jìn)團(tuán)隊(duì)協(xié)作和決策的合理性。
3.2 決策分享與計(jì)算
決策分享與計(jì)算是基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)的重要組成部分。它包括建立決策任務(wù)、分享決策任務(wù)和決策結(jié)果計(jì)算三個(gè)關(guān)鍵步驟,旨在支持用戶在檔案管理過(guò)程中的決策需求。
3.2.1建立決策任務(wù)。在建立決策任務(wù)階段,用戶需要明確決策的目標(biāo)和需求,并將其轉(zhuǎn)化為系統(tǒng)可識(shí)別的決策任務(wù)。為了實(shí)現(xiàn)這一目標(biāo),可以進(jìn)行以下步驟:確定決策目標(biāo),明確檔案管理決策的目標(biāo),如改進(jìn)檔案組織、提高檢索效率等;確定決策問(wèn)題,界定決策任務(wù)的具體問(wèn)題,如確定最佳的檔案分類(lèi)方法、選擇合適的存儲(chǔ)方案等;定義決策參數(shù),確定影響決策的關(guān)鍵參數(shù),如檔案數(shù)量、可用存儲(chǔ)空間、訪問(wèn)頻率等;收集必要的數(shù)據(jù)和信息,確定決策所需的數(shù)據(jù)來(lái)源,并收集相關(guān)的檔案統(tǒng)計(jì)數(shù)據(jù)、用戶需求等信息;分析和評(píng)估,使用適當(dāng)?shù)臎Q策方法和技術(shù),對(duì)收集到的數(shù)據(jù)和信息進(jìn)行分析和評(píng)估,以支持決策的制定;制定決策方案,基于分析結(jié)果,生成候選的決策方案,并評(píng)估其在給定參數(shù)下的優(yōu)劣;選擇最佳決策方案,綜合考慮決策目標(biāo)和關(guān)鍵參數(shù),選擇最佳的決策方案,并確定實(shí)施計(jì)劃。
3.2.2分享決策任務(wù)。在分享決策任務(wù)階段,系統(tǒng)可以根據(jù)邀請(qǐng)和因素輸入選擇確定當(dāng)前用戶因素輸入列表,并支持相關(guān)用戶的協(xié)作和合作,主要包括以下步驟:輸入因素,用戶可以輸入與決策相關(guān)的因素,這些因素可以是決策任務(wù)中需要考慮的變量、條件或限制。用戶根據(jù)自己的知識(shí)和經(jīng)驗(yàn),輸入相關(guān)的因素,并指定其權(quán)重和重要性;決策報(bào)告,用戶可以選擇接受決策報(bào)告的人員,這些人員可以是與決策任務(wù)相關(guān)的利益相關(guān)者、決策團(tuán)隊(duì)成員或其他需要了解決策結(jié)果的人員;讀取因素值和權(quán)重值,如果存在決策模塊對(duì)應(yīng)的任務(wù)因素輸入數(shù)據(jù)文件,系統(tǒng)將讀取被邀請(qǐng)人的因素輸入選擇、權(quán)重和接受報(bào)告選擇數(shù)據(jù),并作為本次任務(wù)用戶當(dāng)前因素輸入的初始值;處理不存在的任務(wù)因素輸入數(shù)據(jù)文件,如果決策模塊對(duì)應(yīng)的任務(wù)邀請(qǐng)數(shù)據(jù)文件不存在,系統(tǒng)將根據(jù)當(dāng)前決策模塊的每個(gè)因素的第一個(gè)選擇值或因素序號(hào)值0,作為本次任務(wù)用戶當(dāng)前因素輸入值;處理存在的任務(wù)邀請(qǐng)數(shù)據(jù)文件,如果決策模塊對(duì)應(yīng)的任務(wù)邀請(qǐng)數(shù)據(jù)文件存在,系統(tǒng)將讀取被邀請(qǐng)人的因素輸入選擇、權(quán)重、接受報(bào)告選擇數(shù)據(jù)和其參與輸入的因素列表;確定當(dāng)前用戶因素輸入列表,根據(jù)邀請(qǐng)選擇和因素輸入選擇,系統(tǒng)確定當(dāng)前用戶的因素輸入列表。這將決定當(dāng)前用戶在決策過(guò)程中參與的因素和權(quán)重;分享決策任務(wù)和協(xié)作,根據(jù)確定的當(dāng)前用戶因素輸入列表,系統(tǒng)支持決策任務(wù)的分享和協(xié)作。被邀請(qǐng)人可以共同討論、編輯和更新因素輸入值,并在系統(tǒng)中交流和協(xié)作。
3.2.3決策結(jié)果計(jì)算。決策結(jié)果計(jì)算是基于知識(shí)圖譜的檔案管理決策支持系統(tǒng)的重要環(huán)節(jié)。在這個(gè)階段,系統(tǒng)根據(jù)已確定的決策任務(wù)和相關(guān)的因素輸入進(jìn)行計(jì)算和評(píng)估,以生成最終的決策結(jié)果。
參考文獻(xiàn)
[1]俞倫祥.大型研究院所檔案管理向知識(shí)智能輔助決策轉(zhuǎn)型研究[J].機(jī)電兵船檔案,2022(02):30-32.
[2]武凈煜.知識(shí)管理視域下政務(wù)檔案信息知識(shí)發(fā)現(xiàn)研究[D].遼寧大學(xué),2022.DOI:10.27209/d.cnki.glniu.2022.001670.
[3]鐘昊,郭永貞,宗孝鵬.基于知識(shí)圖譜的智能決策輔助系統(tǒng)研究[C]//中國(guó)指揮與控制學(xué)會(huì).第九屆中國(guó)指揮控制大會(huì)論文集.第九屆中國(guó)指揮控制大會(huì)論文集,2021:133-138.DOI:10.26914/c.cnkihy.2021.011158.
[4]王阮.數(shù)字人文視域下口述歷史檔案資源知識(shí)發(fā)現(xiàn)研究[D].吉林大學(xué),2021.DOI:10.27162/d.cnki.gjlin.2021.000856.
[5]雷潔.基于知識(shí)圖譜的科研檔案管理研究[D].中國(guó)農(nóng)業(yè)科學(xué)院,2020.DOI:10.27630/d.cnki.gznky.2020.000122.
[6]雷潔,李思經(jīng),趙瑞雪,鮮國(guó)建,寇遠(yuǎn)濤.面向科研檔案管理的知識(shí)圖譜構(gòu)建與應(yīng)用研究[J].數(shù)字圖書(shū)館論壇,2020(05):8-15.
作者簡(jiǎn)介:溫學(xué)鵬(1982— ),寧夏醫(yī)科大學(xué)檔案館館員,研究方向: 檔案信息化。