999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)資源整合探究

2022-11-26 03:30:38李佳男
檔案與建設(shè) 2022年9期
關(guān)鍵詞:資源

金 波 陳 堅(jiān) 李佳男 海 嘯 楊 鵬

(1.上海大學(xué)文化遺產(chǎn)與信息管理學(xué)院,上海,200444;2.上海市醫(yī)療保險(xiǎn)事業(yè)管理中心,上海,200041)

檔案數(shù)據(jù)資源整合是檔案數(shù)據(jù)資源建設(shè)的重要內(nèi)容。大數(shù)據(jù)時(shí)代,隨著社會(huì)對(duì)檔案信息資源需求的日益增長(zhǎng),檔案數(shù)據(jù)資源布局的不均衡性、分散性、封閉性等成為共享利用的瓶頸,需要立足檔案數(shù)據(jù)資源現(xiàn)狀與管理實(shí)踐,探索檔案數(shù)據(jù)資源整合動(dòng)力、整合模式和整合策略,利用現(xiàn)代信息技術(shù)手段對(duì)分散獨(dú)立的檔案數(shù)據(jù)資源進(jìn)行整合匯聚、集成管理,打破檔案數(shù)據(jù)孤島,力爭(zhēng)將離散、多元、異構(gòu)的檔案數(shù)據(jù)資源通過邏輯方式或物理方式聯(lián)結(jié)成一個(gè)有序化、系統(tǒng)化、結(jié)構(gòu)化的整體,構(gòu)建檔案數(shù)據(jù)資源共享空間,為檔案數(shù)據(jù)資源互聯(lián)互通和開發(fā)利用提供支撐。

1 檔案數(shù)據(jù)資源整合內(nèi)涵

大數(shù)據(jù)時(shí)代,新一代信息技術(shù)迅速發(fā)展和應(yīng)用,檔案管理工作對(duì)象逐漸由模擬態(tài)、數(shù)字態(tài)向數(shù)據(jù)態(tài)轉(zhuǎn)型,檔案數(shù)據(jù)成為檔案學(xué)研究的新熱點(diǎn),檔案數(shù)據(jù)資源整合也成為新的研究方向。根據(jù)檔案信息資源整合相關(guān)概念,結(jié)合數(shù)據(jù)整合理論,檔案數(shù)據(jù)資源整合的內(nèi)涵是指:檔案部門與社會(huì)組織協(xié)同合作,利用一定的技術(shù)方法,使分散保管的檔案數(shù)據(jù)資源相互聯(lián)結(jié)成為有序化、結(jié)構(gòu)化、系統(tǒng)化的整體,實(shí)現(xiàn)檔案數(shù)據(jù)資源集成和融合匯聚。檔案數(shù)據(jù)資源整合對(duì)象是檔案數(shù)據(jù);整合范圍應(yīng)根據(jù)整合要求確定,既可以是一定區(qū)域內(nèi)的檔案部門,也可以是檔案部門與形成機(jī)構(gòu),或者是檔案部門與數(shù)據(jù)管理部門;整合方法是利用數(shù)據(jù)管理技術(shù)方式手段消除檔案數(shù)據(jù)之間的格式異構(gòu)、語義異構(gòu)、系統(tǒng)異構(gòu)和資源異構(gòu),打破檔案數(shù)據(jù)孤島,使檔案數(shù)據(jù)資源從分散走向集成;整合目的是實(shí)現(xiàn)檔案數(shù)據(jù)資源匯聚融合、互聯(lián)互通、集成共享。開展檔案數(shù)據(jù)資源整合具有重要意義:

一是促進(jìn)檔案數(shù)據(jù)資源有效集成。大數(shù)據(jù)時(shí)代,數(shù)據(jù)資源在各種平臺(tái)和系統(tǒng)中大量形成,檔案數(shù)據(jù)資源分散保管在各個(gè)部門和機(jī)構(gòu)中,由于管理體制、軟硬件系統(tǒng)、技術(shù)標(biāo)準(zhǔn)的差異,部門與行業(yè)間形成了“數(shù)據(jù)鴻溝”“數(shù)據(jù)孤島”,如何將分散異構(gòu)的檔案數(shù)據(jù)資源實(shí)現(xiàn)集成統(tǒng)一管理,是檔案數(shù)據(jù)資源整合的首要任務(wù)。將檔案數(shù)據(jù)資源進(jìn)行整合的直接目的就是為了解決“檔案數(shù)據(jù)資源管理無序與有序、分散與集成、孤立與互通、異構(gòu)與統(tǒng)一之間的矛盾”[1],實(shí)現(xiàn)檔案數(shù)據(jù)資源結(jié)構(gòu)標(biāo)準(zhǔn)化、管理系統(tǒng)標(biāo)準(zhǔn)化和運(yùn)行平臺(tái)標(biāo)準(zhǔn)化,破除檔案數(shù)據(jù)管理壁壘,促進(jìn)多源異構(gòu)檔案數(shù)據(jù)資源的集成統(tǒng)一和互聯(lián)互通,激活檔案數(shù)據(jù)資源的潛在價(jià)值。

二是提高檔案數(shù)據(jù)資源管理與利用效率。通過整合,一方面,能夠全面、直觀地了解當(dāng)前檔案數(shù)據(jù)存量、種類和保存狀況,發(fā)現(xiàn)管理環(huán)節(jié)中存在的漏洞與不足,以便完善與加強(qiáng)檔案數(shù)據(jù)資源管理,有效提高檔案數(shù)據(jù)資源管理效率。另一方面,檔案數(shù)據(jù)資源由于分散、異構(gòu)的特點(diǎn),往往被存儲(chǔ)在不同類型、不同地點(diǎn)的數(shù)據(jù)庫中,用戶為獲取所需的檔案數(shù)據(jù)資源常常需要訪問多方數(shù)據(jù)庫,不同數(shù)據(jù)庫采用的查詢語言、數(shù)據(jù)存儲(chǔ)方式和數(shù)據(jù)表示形式往往也不一致,極大降低用戶利用檔案數(shù)據(jù)資源效率。而進(jìn)行檔案數(shù)據(jù)資源整合,對(duì)檔案數(shù)據(jù)資源進(jìn)行集成處理后,便可為用戶提供統(tǒng)一通用的檔案數(shù)據(jù)查詢界面和檢索語言,從而方便用戶獲取準(zhǔn)確、完整、全面的檔案數(shù)據(jù)資源,提高檔案數(shù)據(jù)資源利用效率。

三是推動(dòng)檔案數(shù)據(jù)資源開放共享。我國檔案工作歷來十分重視檔案保密工作,存在“保密保險(xiǎn),利用危險(xiǎn)”的觀念,檔案資源的開放度較低,與發(fā)達(dá)國家存在較大差距。大數(shù)據(jù)時(shí)代,數(shù)據(jù)來源更加多元、數(shù)據(jù)異構(gòu)更加突出、數(shù)據(jù)流動(dòng)越來越頻繁快速,為了加強(qiáng)對(duì)檔案數(shù)據(jù)資源的管理,滿足社會(huì)大眾利用需求,充分釋放檔案數(shù)據(jù)資源價(jià)值,需要強(qiáng)化檔案數(shù)據(jù)資源工作的整體布局和戰(zhàn)略規(guī)劃,通過技術(shù)和管理手段整合各社會(huì)主體形成的有價(jià)值的檔案數(shù)據(jù)資源,加大檔案數(shù)據(jù)資源開放開發(fā)力度,構(gòu)建起跨層級(jí)、跨區(qū)域、跨部門的一體化檔案數(shù)據(jù)資源交換共享平臺(tái),促進(jìn)檔案數(shù)據(jù)資源開放共享。

2 檔案數(shù)據(jù)資源整合動(dòng)力

檔案數(shù)據(jù)資源整合在實(shí)踐中受到多種因素推動(dòng),其中包括國家政策的支持、現(xiàn)代信息技術(shù)的應(yīng)用、社會(huì)信息需求的拉動(dòng)、檔案資源整合的實(shí)踐等方面。深入分析探索檔案數(shù)據(jù)資源整合動(dòng)力,有助于更加科學(xué)合理地開展檔案數(shù)據(jù)資源整合工作。

2.1 國家政策支持

大數(shù)據(jù)時(shí)代,數(shù)據(jù)資源已成為國家經(jīng)濟(jì)社會(huì)發(fā)展的戰(zhàn)略性資源,國家高度重視數(shù)據(jù)資源建設(shè),出臺(tái)了一系列戰(zhàn)略舉措,為檔案數(shù)據(jù)資源整合提供政策支持。2015年,國務(wù)院印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》提出,“加快政府?dāng)?shù)據(jù)開放共享,推動(dòng)資源整合,提升治理能力。”[2]2021年,《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》提出,“依托全國檔案查詢利用服務(wù)平臺(tái)建立更加便捷的檔案信息資源共享聯(lián)動(dòng)新機(jī)制,推動(dòng)國家、地區(qū)檔案信息資源共享平臺(tái)一體化發(fā)展。”[3]可見,數(shù)據(jù)資源整合已成為提升國家治理能力的重要途徑和手段。檔案數(shù)據(jù)資源整合是數(shù)據(jù)資源整合的重要內(nèi)容,國家出臺(tái)的相關(guān)政策規(guī)劃了檔案數(shù)據(jù)資源整合發(fā)展藍(lán)圖,調(diào)動(dòng)了檔案部門主動(dòng)開展檔案數(shù)據(jù)資源整合的積極性和主動(dòng)性,有力地推動(dòng)了檔案數(shù)據(jù)資源整合共享。

2.2 現(xiàn)代信息技術(shù)應(yīng)用

現(xiàn)代信息技術(shù)對(duì)檔案數(shù)據(jù)資源整合具有重要的推動(dòng)作用,不僅加快了檔案數(shù)據(jù)資源整合技術(shù)的升級(jí),而且變革了檔案數(shù)據(jù)資源整合的方式。一是為檔案數(shù)據(jù)的整合共享創(chuàng)造條件。大數(shù)據(jù)、云計(jì)算等現(xiàn)代信息技術(shù)的廣泛應(yīng)用,能夠?qū)崿F(xiàn)檔案資源數(shù)據(jù)化和檔案數(shù)據(jù)資源虛擬存儲(chǔ),為檔案數(shù)據(jù)資源的集約存儲(chǔ)、整合利用、集成共享創(chuàng)造條件。二是推動(dòng)檔案數(shù)據(jù)資源的互聯(lián)互通。檔案數(shù)據(jù)來源于不同機(jī)構(gòu)、不同部門、不同系統(tǒng),數(shù)據(jù)類型多種、數(shù)據(jù)描述多樣、數(shù)據(jù)內(nèi)容多元,檔案數(shù)據(jù)資源必然存在結(jié)構(gòu)性異構(gòu)和語義性異構(gòu)等問題。[4]利用關(guān)聯(lián)數(shù)據(jù)技術(shù)建立數(shù)字檔案多維語義關(guān)聯(lián)框架[5],能夠?qū)崿F(xiàn)分散、異構(gòu)、跨界檔案數(shù)據(jù)資源語義層的關(guān)聯(lián),有助于檔案數(shù)據(jù)資源之間、檔案數(shù)據(jù)資源與其他領(lǐng)域數(shù)據(jù)資源之間進(jìn)行語義互操作;運(yùn)用人工智能技術(shù)、集群技術(shù)、數(shù)據(jù)交換技術(shù)等貫通聯(lián)結(jié)多元、分散的檔案數(shù)據(jù)平臺(tái),能夠?qū)崿F(xiàn)檔案數(shù)據(jù)在各平臺(tái)之間的無縫對(duì)接和自由流動(dòng)。三是促進(jìn)檔案數(shù)據(jù)資源的有效傳遞。隨著移動(dòng)通信技術(shù)的發(fā)展及應(yīng)用,檔案信息資源傳播方式更加多維、傳播速度更加快捷、傳播范圍更加廣泛。“依靠互聯(lián)網(wǎng)、衛(wèi)星網(wǎng)等傳輸途徑以及光盤、移動(dòng)存儲(chǔ)設(shè)備等傳輸體系,可以達(dá)成全方位、高速度傳遞檔案資源整合成果的目的。”[6]5G、元宇宙等技術(shù)的發(fā)展與應(yīng)用,為檔案數(shù)據(jù)資源提供更加廣闊的傳播平臺(tái),推動(dòng)檔案數(shù)據(jù)資源在更大范圍、更廣空間、更深領(lǐng)域整合集成。

2.3 社會(huì)信息需求拉動(dòng)

一是用戶信息需求的轉(zhuǎn)型。信息時(shí)代,“檔案用戶的信息需求呈現(xiàn)出多樣化、網(wǎng)絡(luò)化等新的特點(diǎn),其利用目的也呈現(xiàn)出了多元化的發(fā)展態(tài)勢(shì)”[7],需要檔案部門提供及時(shí)、精準(zhǔn)、高效、智能的檔案信息服務(wù)和檔案文化服務(wù),激活社會(huì)對(duì)信息的各方面需求。二是組織管理決策的需求。大數(shù)據(jù)時(shí)代,政府組織決策面對(duì)的情況更為復(fù)雜多樣,需要能夠直接解決問題的知識(shí)方案。檔案作為一種重要的信息資源和組織的核心知識(shí)資產(chǎn),因其真實(shí)性、可靠性、原始性成為組織機(jī)構(gòu)進(jìn)行管理決策的重要參考和分析依據(jù)。對(duì)檔案數(shù)據(jù)資源進(jìn)行整合集成,運(yùn)用數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)資源進(jìn)行分析挖掘、知識(shí)關(guān)聯(lián)和可視化,從海量數(shù)據(jù)中揭示出隱含潛在價(jià)值的知識(shí)單元,將檔案數(shù)據(jù)資源轉(zhuǎn)化為能夠直接支撐組織開展管理決策的知識(shí)資源,有助于充分發(fā)揮檔案資源的資政作用,提高政府組織決策能效。三是數(shù)字記憶建構(gòu)的需要。大數(shù)據(jù)時(shí)代,社會(huì)各領(lǐng)域在進(jìn)行實(shí)踐活動(dòng)的同時(shí)形成了海量的數(shù)據(jù),檔案數(shù)據(jù)資源作為社會(huì)實(shí)踐活動(dòng)在數(shù)字世界的映射,成為構(gòu)建社會(huì)記憶的基礎(chǔ)性資源。作為重要的記憶機(jī)構(gòu)之一,檔案館承擔(dān)著守護(hù)社會(huì)記憶的責(zé)任,在信息時(shí)代的數(shù)字記憶建設(shè)和存續(xù)中扮演著越發(fā)重要的角色。因此,為建構(gòu)完整的數(shù)字記憶,檔案部門需要聯(lián)合其他信息機(jī)構(gòu)、數(shù)據(jù)機(jī)構(gòu)和個(gè)人協(xié)同開展檔案數(shù)據(jù)資源整合,構(gòu)建數(shù)字記憶資源集成空間,借助數(shù)字技術(shù)再現(xiàn)歷史記憶、編織數(shù)字記憶。

2.4 檔案資源整合實(shí)踐

信息時(shí)代,為適應(yīng)政府職能轉(zhuǎn)變,優(yōu)化政府管理方式,提高政府信息資源管理與利用效率,檔案部門主動(dòng)行動(dòng),積極推動(dòng)檔案資源整合。檔案部門開展檔案信息資源整合的早期實(shí)踐主要有浦東模式、和縣模式、深圳模式和順德模式等。舉例而言,浦東模式是2001年浦東新區(qū)提出整合檔案管理體制、實(shí)行大檔案機(jī)構(gòu)框架的構(gòu)想,其強(qiáng)調(diào)整合浦東新區(qū)檔案局的綜合檔案工作、規(guī)劃局的城建檔案工作和建設(shè)局的房產(chǎn)土地檔案工作,在體制上實(shí)行檔案局、檔案館、城建檔案信息管理中心,形成“三塊牌子、一個(gè)機(jī)構(gòu)、統(tǒng)一管理”的檔案工作局面。[8]數(shù)字時(shí)代下,源于數(shù)字轉(zhuǎn)型、電子政務(wù)等的推動(dòng)作用,政府機(jī)構(gòu)開始大力推行無紙化辦公,數(shù)字檔案資源體量增長(zhǎng)迅速,為了滿足公眾多元化、跨區(qū)域的利用需求,檔案部門針對(duì)數(shù)字檔案資源也開展了一系列整合實(shí)踐。如2013年,“浙江省麗水市建立‘1+9+N檔案協(xié)同管理系統(tǒng)’,將市級(jí)、9個(gè)縣(市、區(qū))的黨政機(jī)關(guān)和鄉(xiāng)鎮(zhèn)數(shù)字檔案室整合到同一個(gè)網(wǎng)絡(luò)平臺(tái)上,形成了以市級(jí)為中心,9縣(市、區(qū))為節(jié)點(diǎn)的強(qiáng)大的云檔案服務(wù)系統(tǒng)。”[9]

多層次、多種類檔案資源整合實(shí)踐的開展,為檔案數(shù)據(jù)資源整合提供了實(shí)踐依據(jù)和寶貴經(jīng)驗(yàn)。一是在檔案數(shù)據(jù)資源整合過程中要建立統(tǒng)一的數(shù)據(jù)平臺(tái)。通過平臺(tái)發(fā)揮聚集效應(yīng),實(shí)現(xiàn)區(qū)域內(nèi)多方檔案資源整合力量的協(xié)作,將區(qū)域內(nèi)不同主體的檔案數(shù)據(jù)資源加以有效整合,以實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)資源的集成管理和共享利用。二是順應(yīng)電子政務(wù)發(fā)展潮流。將檔案數(shù)據(jù)資源集成整合融入到電子政務(wù)中,依托電子政務(wù)系統(tǒng)收集政府檔案數(shù)據(jù)資源,推進(jìn)文件、檔案資源的一體化管理和整合。三是重點(diǎn)關(guān)注民生領(lǐng)域檔案數(shù)據(jù)資源的整合。整合的目的是為了滿足公眾日益增長(zhǎng)的檔案利用需求,民生數(shù)據(jù)資源直接關(guān)系到公眾的根本利益,需要強(qiáng)化主體協(xié)同,整合就業(yè)、教育、社保、住房、醫(yī)療衛(wèi)生等方面的民生檔案數(shù)據(jù)資源,滿足公眾檔案信息和文化需求。

3 檔案數(shù)據(jù)資源整合策略

《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》提出,“加大相關(guān)檔案資源跨領(lǐng)域、跨區(qū)域、跨層級(jí)整合力度……推動(dòng)檔案全面納入國家大數(shù)據(jù)戰(zhàn)略,在國家相關(guān)政策和重大舉措中強(qiáng)化電子檔案管理要求,實(shí)現(xiàn)對(duì)國家和社會(huì)具有長(zhǎng)久保存價(jià)值的數(shù)據(jù)歸口各級(jí)各類檔案館集中管理。”[10]檔案數(shù)據(jù)資源整合是一項(xiàng)系統(tǒng)工程,在實(shí)踐中受到信息技術(shù)、標(biāo)準(zhǔn)法規(guī)、機(jī)構(gòu)狀況等多種因素影響,需要理念、管理、技術(shù)、平臺(tái)多要素協(xié)同發(fā)力。應(yīng)通過加強(qiáng)檔案數(shù)據(jù)資源整合頂層設(shè)計(jì)、推進(jìn)檔案數(shù)據(jù)資源整合新技術(shù)應(yīng)用、完善檔案數(shù)據(jù)資源整合系統(tǒng)平臺(tái)建設(shè)等策略,全面促進(jìn)檔案數(shù)據(jù)資源整合活動(dòng)的開展與落實(shí),提升檔案數(shù)據(jù)資源整合能力,填平不同地區(qū)、不同層級(jí)、不同部門之間的“數(shù)字鴻溝”。

3.1 加強(qiáng)檔案數(shù)據(jù)資源整合頂層設(shè)計(jì)

檔案數(shù)據(jù)資源整合作為一項(xiàng)系統(tǒng)性活動(dòng),需要通過頂層設(shè)計(jì)來謀劃布局、指引方向、營(yíng)造氛圍、激勵(lì)主體、規(guī)制行動(dòng),為檔案數(shù)據(jù)資源整合提供整體方案與上層牽引。

(1)制定檔案數(shù)據(jù)資源整合規(guī)劃

作為對(duì)檔案數(shù)據(jù)資源整合的宏觀管控,頂層設(shè)計(jì)首先需要做好檔案數(shù)據(jù)資源整合規(guī)劃,即明確檔案數(shù)據(jù)資源整合總體建設(shè)與發(fā)展的思路、任務(wù)與目標(biāo),保證檔案數(shù)據(jù)資源整合質(zhì)量與效率,將檔案數(shù)據(jù)資源整合納入到科學(xué)、有序、預(yù)設(shè)的軌道運(yùn)行,減少不必要的重復(fù)或沖突,指引檔案數(shù)據(jù)資源建設(shè),提高工作效率。第一,理清現(xiàn)階段檔案數(shù)據(jù)資源整合的發(fā)展環(huán)境與面臨挑戰(zhàn),總結(jié)經(jīng)驗(yàn),認(rèn)清態(tài)勢(shì),在此基礎(chǔ)上制定規(guī)劃;第二,明確檔案數(shù)據(jù)資源整合的戰(zhàn)略定位,對(duì)檔案數(shù)據(jù)資源整合的指導(dǎo)思想、需求、目標(biāo)、價(jià)值做出基本界定與判斷,將之作為檔案數(shù)據(jù)資源整合的基本出發(fā)點(diǎn);第三,制定檔案數(shù)據(jù)資源整合的主要任務(wù),明確相關(guān)主體責(zé)任目標(biāo),使檔案數(shù)據(jù)資源整合實(shí)踐更有方向性和針對(duì)性;第四,確立檔案數(shù)據(jù)資源整合實(shí)現(xiàn)指標(biāo),以便對(duì)照檢查,保證檔案數(shù)據(jù)資源整合質(zhì)量;第五,確定檔案數(shù)據(jù)資源整合保障措施與實(shí)施建議,如組織實(shí)施、科技支撐、人才培養(yǎng)、宣傳推廣、合作交流等,為檔案數(shù)據(jù)資源整合提供行動(dòng)指南。

(2)構(gòu)建檔案數(shù)據(jù)資源整合協(xié)同機(jī)制

檔案數(shù)據(jù)資源整合要突破單一主體界限,在跨層級(jí)、跨系統(tǒng)、跨部門、跨區(qū)域間實(shí)現(xiàn)檔案數(shù)據(jù)資源集成。為此,構(gòu)建檔案數(shù)據(jù)資源整合協(xié)同機(jī)制至關(guān)重要,通過疏通和協(xié)調(diào)檔案數(shù)據(jù)資源整合的內(nèi)外部關(guān)系,強(qiáng)化多主體協(xié)同共建,提高檔案數(shù)據(jù)資源整合的廣度、深度、全度,破除數(shù)據(jù)壁壘,實(shí)現(xiàn)數(shù)據(jù)共享利用。第一,構(gòu)建檔案部門間的協(xié)同機(jī)制。檔案部門作為檔案數(shù)據(jù)治理的“元治者”,是檔案數(shù)據(jù)資源整合的主要場(chǎng)域。“按照‘統(tǒng)一平臺(tái)、互聯(lián)互通,存量共享、增量共建,物理分散、邏輯集中’的原則,利用大數(shù)據(jù)技術(shù),打破部門隔閡和‘條塊分割’的碎片化狀態(tài)”[11],通過目標(biāo)協(xié)同、工具協(xié)同、規(guī)劃協(xié)同等具體機(jī)制路徑,優(yōu)化完善檔案部門的檔案數(shù)據(jù)資源整合模式,使檔案數(shù)據(jù)資源在縱向、橫向檔案部門之間得以充分流通,打破層級(jí)隔閡、系統(tǒng)壁壘、區(qū)域限制,使各級(jí)各類檔案部門成為檔案數(shù)據(jù)資源整合的“共同體”。第二,構(gòu)建檔案部門與信息(數(shù)據(jù))管理部門間的協(xié)同機(jī)制。大數(shù)據(jù)環(huán)境下,檔案部門不是唯一的檔案數(shù)據(jù)保管部門,很多檔案數(shù)據(jù)資源流向其他數(shù)據(jù)保管機(jī)構(gòu)。推動(dòng)檔案數(shù)據(jù)資源整合,需要檔案部門主動(dòng)出擊,構(gòu)建檔案部門與信息(數(shù)據(jù))管理部門間的協(xié)同機(jī)制,明確數(shù)據(jù)權(quán)責(zé)、共享方式、整合渠道,落實(shí)跨界整合,共同推動(dòng)檔案數(shù)據(jù)資源建設(shè),促進(jìn)檔案數(shù)據(jù)資源有序流動(dòng)和共建共享。第三,構(gòu)建檔案部門與其他社會(huì)主體間的協(xié)同機(jī)制。企事業(yè)單位、社會(huì)團(tuán)體組織、民眾個(gè)人等形成和保管的有價(jià)值的檔案數(shù)據(jù),諸如企業(yè)經(jīng)營(yíng)數(shù)據(jù)、公共健康數(shù)據(jù)、民情輿情數(shù)據(jù)、社交媒體數(shù)據(jù)等,也是大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)資源的重要組成部分,但這一部分檔案數(shù)據(jù)資源通常游離于檔案工作與檔案部門管轄范圍之外。實(shí)現(xiàn)對(duì)這部分檔案數(shù)據(jù)資源的整合,形成檔案數(shù)據(jù)資源群,需要檔案部門加強(qiáng)與社會(huì)主體間的協(xié)同,引導(dǎo)激勵(lì)社會(huì)主體參與檔案數(shù)據(jù)資源建設(shè),通過宣傳引導(dǎo)、開辟渠道、搭建平臺(tái)等措施,推動(dòng)社會(huì)檔案數(shù)據(jù)資源集成管理,保障社會(huì)檔案數(shù)據(jù)資源融入到檔案數(shù)據(jù)資源倉庫中。

(3)健全檔案數(shù)據(jù)資源整合標(biāo)準(zhǔn)規(guī)范

完善的標(biāo)準(zhǔn)規(guī)范體系是檔案數(shù)據(jù)資源整合的前提,傳統(tǒng)檔案資源相關(guān)的規(guī)章、制度、措施難以適應(yīng)大數(shù)據(jù)時(shí)代的檔案數(shù)據(jù)資源管理。第一,強(qiáng)化檔案數(shù)據(jù)資源整合法制化建設(shè)。法制化是實(shí)現(xiàn)檔案數(shù)據(jù)資源整合的基礎(chǔ)和保障。當(dāng)前針對(duì)檔案數(shù)據(jù)資源建設(shè)的相關(guān)法規(guī)制度缺乏,迫切需要制定專門的管理法規(guī)、指南、條例,推動(dòng)檔案數(shù)據(jù)資源整合,促進(jìn)檔案資源建設(shè)。第二,加強(qiáng)檔案數(shù)據(jù)資源整合標(biāo)準(zhǔn)化建設(shè)。首先,推動(dòng)檔案元數(shù)據(jù)標(biāo)準(zhǔn)完善。完善檔案元數(shù)據(jù)標(biāo)準(zhǔn)有助于推動(dòng)檔案數(shù)據(jù)在各個(gè)系統(tǒng)平臺(tái)的交換和轉(zhuǎn)換,實(shí)現(xiàn)檔案數(shù)據(jù)關(guān)聯(lián)集成,推動(dòng)檔案數(shù)據(jù)有序化整合利用[12];完善檔案元數(shù)據(jù)標(biāo)準(zhǔn)要從本體角度出發(fā),合理構(gòu)建由形式和內(nèi)容組成的檔案數(shù)據(jù)資源描述體系。其次,制定檔案管理軟硬件標(biāo)準(zhǔn)。在檔案信息化建設(shè)早期,各部門往往采用不同軟硬件設(shè)施,相互之間難以兼容,檔案數(shù)據(jù)難以進(jìn)行轉(zhuǎn)換和交換,檔案數(shù)據(jù)存在丟失和失真的風(fēng)險(xiǎn)。因此,要著力推動(dòng)檔案信息化中的網(wǎng)絡(luò)設(shè)施、應(yīng)用軟硬件、檔案數(shù)據(jù)化、存儲(chǔ)系統(tǒng)等的標(biāo)準(zhǔn)化建設(shè),制定完善檔案數(shù)據(jù)管理軟硬件標(biāo)準(zhǔn)。最后,加強(qiáng)與各級(jí)標(biāo)準(zhǔn)的協(xié)調(diào),做好標(biāo)準(zhǔn)的銜接工作,避免發(fā)生矛盾,維護(hù)標(biāo)準(zhǔn)的系統(tǒng)性,提高標(biāo)準(zhǔn)的前瞻性和適用性。

3.2 推進(jìn)檔案數(shù)據(jù)資源整合新技術(shù)應(yīng)用

大數(shù)據(jù)時(shí)代,數(shù)據(jù)處理技術(shù)持續(xù)發(fā)展創(chuàng)新,數(shù)據(jù)處理效能不斷提高。在檔案數(shù)據(jù)資源整合中,應(yīng)當(dāng)注重關(guān)鍵技術(shù)和新技術(shù)的引進(jìn)、選優(yōu)、應(yīng)用與推廣,推動(dòng)技術(shù)升級(jí)與技術(shù)賦能,讓技術(shù)成為檔案數(shù)據(jù)資源整合的重要驅(qū)動(dòng)力。

(1)利用關(guān)聯(lián)數(shù)據(jù)技術(shù)實(shí)現(xiàn)檔案數(shù)據(jù)資源關(guān)聯(lián)集成

關(guān)聯(lián)數(shù)據(jù)是指通過明確的語義表達(dá)發(fā)布數(shù)據(jù)資源,使數(shù)據(jù)之間能夠相互關(guān)聯(lián)。關(guān)聯(lián)數(shù)據(jù)技術(shù)在檔案數(shù)據(jù)資源整合過程中很好契合了檔案數(shù)據(jù)內(nèi)容細(xì)粒度的整合需求,具有廣闊的應(yīng)用前景。首先,在檔案數(shù)據(jù)資源整合集成中,可以從檔案主題、類型格式、內(nèi)容屬性、時(shí)空范圍等多個(gè)維度,通過計(jì)算相關(guān)度,建立檔案數(shù)據(jù)資源之間定量化的語義關(guān)聯(lián),實(shí)現(xiàn)檔案數(shù)據(jù)資源的智能管理和精準(zhǔn)搜索。與此同時(shí),還可根據(jù)用戶需求,實(shí)現(xiàn)不同時(shí)間階段、地理位置、專業(yè)領(lǐng)域檔案數(shù)據(jù)資源的關(guān)聯(lián)聚合,形成具有高度關(guān)聯(lián)、能夠滿足用戶需求的檔案數(shù)據(jù)塊。其次,通過關(guān)聯(lián)數(shù)據(jù)的URI標(biāo)識(shí)與復(fù)用機(jī)制,確定檔案數(shù)據(jù)實(shí)體對(duì)象的URI標(biāo)識(shí),從而在實(shí)現(xiàn)信息資源的聚合、知識(shí)的關(guān)聯(lián)的同時(shí),利用關(guān)聯(lián)數(shù)據(jù)自身攜帶的大量URI鏈接關(guān)聯(lián)到更多數(shù)據(jù)集的信息,有效地?cái)U(kuò)大信息挖掘的信息量、信息范圍和深度。[13]再次,通過關(guān)聯(lián)數(shù)據(jù)的RDF描述與鏈接機(jī)制,將數(shù)據(jù)轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)所要求的RDF數(shù)據(jù)形式[14],利用RDF將分散保存的檔案數(shù)據(jù)資源形成共享集成的關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò),從而提高檔案數(shù)據(jù)資源整合的深度和廣度。

(2)利用知識(shí)圖譜技術(shù)構(gòu)建檔案數(shù)據(jù)知識(shí)網(wǎng)絡(luò)

知識(shí)圖譜的本質(zhì)是揭示實(shí)體間關(guān)系的語義網(wǎng)絡(luò),可以形式化地描述事物及其之間的相互關(guān)系。[15]大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)資源整合將逐漸從傳統(tǒng)的全宗級(jí)、案卷級(jí)、文件級(jí)過渡到語義層面,知識(shí)圖譜技術(shù)對(duì)檔案數(shù)據(jù)資源實(shí)現(xiàn)語義層面的整合具有重要意義。運(yùn)用知識(shí)圖譜技術(shù)實(shí)現(xiàn)檔案數(shù)據(jù)資源語義層面的整合主要包括四方面:一是將多源異構(gòu)檔案數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,統(tǒng)一成特定的格式。多源異構(gòu)的檔案數(shù)據(jù)既包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),也有文本、圖形、音視頻等格式。二是進(jìn)行知識(shí)抽取。包括實(shí)體抽取、關(guān)系抽取和屬性抽取,主要運(yùn)用專家法、爬蟲法、機(jī)器學(xué)習(xí)等方法,構(gòu)建檔案數(shù)據(jù)資源的實(shí)體、屬性和關(guān)系三元組。三是進(jìn)行信息融合。信息融合目的是對(duì)多源異構(gòu)知識(shí)進(jìn)行聚合集成,獲取蘊(yùn)含的知識(shí)。檔案數(shù)據(jù)信息融合需要數(shù)據(jù)格式清洗轉(zhuǎn)化,“通過對(duì)抽取的實(shí)體、屬性和關(guān)系三元組與已構(gòu)建的知識(shí)圖譜進(jìn)行語義相似度計(jì)算,確定最優(yōu)概念匹配和關(guān)系匹配,實(shí)現(xiàn)信息融合。”[16]四是進(jìn)行知識(shí)建模和知識(shí)存儲(chǔ)。將檔案數(shù)據(jù)資源存儲(chǔ)于相關(guān)的關(guān)系數(shù)據(jù)庫中,使檔案數(shù)據(jù)資源、屬性、事件等實(shí)現(xiàn)關(guān)聯(lián)集成。

(3)利用數(shù)據(jù)虛擬化技術(shù)實(shí)現(xiàn)多源異構(gòu)檔案數(shù)據(jù)集成

數(shù)據(jù)虛擬化技術(shù)是提供一個(gè)虛擬的視圖,來獲取和查閱異構(gòu)數(shù)據(jù)庫中數(shù)據(jù)的技術(shù)。[17]數(shù)據(jù)虛擬化技術(shù)超越了原有的系統(tǒng)數(shù)據(jù)管理和存儲(chǔ)環(huán)境,提供的中間層類似于一個(gè)統(tǒng)一、虛擬的整合數(shù)據(jù)庫,用戶可以通過同一頁面和平臺(tái)訪問各個(gè)數(shù)據(jù)庫中的多元異構(gòu)數(shù)據(jù),無須關(guān)注數(shù)據(jù)的存儲(chǔ)位置、存儲(chǔ)格式等,就能夠便捷地獲取所需數(shù)據(jù)資源。數(shù)據(jù)虛擬化對(duì)推進(jìn)多元異構(gòu)的檔案數(shù)據(jù)集成具有重要的技術(shù)優(yōu)勢(shì)。一是應(yīng)用數(shù)據(jù)虛擬化技術(shù)可以讓檔案數(shù)據(jù)的關(guān)聯(lián)性被自動(dòng)發(fā)現(xiàn)或人工定義,無論是實(shí)時(shí)檔案數(shù)據(jù)還是歷史檔案數(shù)據(jù),無論是文本數(shù)據(jù)庫還是多媒體數(shù)據(jù)庫,無論是關(guān)系型數(shù)據(jù)庫還是非關(guān)系型數(shù)據(jù)庫,都將被重新分類和關(guān)聯(lián),并且在新的虛擬平臺(tái)上進(jìn)行展現(xiàn)。二是提供統(tǒng)一的數(shù)據(jù)訪問接口。不同的檔案數(shù)據(jù)存儲(chǔ)可能使用不同的格式,例如有的檔案數(shù)據(jù)存儲(chǔ)在XML文件中,有的存儲(chǔ)在HTML網(wǎng)頁中,有的存儲(chǔ)在Excel電子表格中,數(shù)據(jù)虛擬化層可以提供一個(gè)統(tǒng)一的數(shù)據(jù)訪問接口區(qū),訪問不同的存儲(chǔ)格式,如ODBC/JDBC/ADO.NET接口等,大大縮短了檔案數(shù)據(jù)的訪問時(shí)間。三是運(yùn)用數(shù)據(jù)虛擬化技術(shù)有助于對(duì)檔案元數(shù)據(jù)進(jìn)行規(guī)范,檔案數(shù)據(jù)庫中可能會(huì)存在一些不規(guī)范、不標(biāo)準(zhǔn)、不統(tǒng)一的格式,對(duì)此,數(shù)據(jù)虛擬化層可以實(shí)現(xiàn)檔案數(shù)據(jù)的集中轉(zhuǎn)換和數(shù)據(jù)清洗。

3.3 完善檔案數(shù)據(jù)資源系統(tǒng)平臺(tái)建設(shè)

大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)資源整合需要借助一定的系統(tǒng)平臺(tái)來實(shí)現(xiàn)。檔案數(shù)據(jù)資源系統(tǒng)平臺(tái)既是檔案數(shù)據(jù)資源的生存環(huán)境,也是檔案數(shù)據(jù)運(yùn)行、流轉(zhuǎn)、保存、利用的場(chǎng)域。因此,完善檔案數(shù)據(jù)資源系統(tǒng)平臺(tái)建設(shè)是推進(jìn)檔案數(shù)據(jù)資源整合的關(guān)鍵內(nèi)容。

(1)創(chuàng)建統(tǒng)一的檔案數(shù)據(jù)管理系統(tǒng)

檔案數(shù)據(jù)管理系統(tǒng)是檔案數(shù)據(jù)賴以生存的軟硬件平臺(tái),離開系統(tǒng),檔案數(shù)據(jù)采集、處理、存儲(chǔ)、利用等一系列處置活動(dòng)無從談起。推進(jìn)檔案數(shù)據(jù)資源整合,需要?jiǎng)?chuàng)建統(tǒng)一的檔案數(shù)據(jù)管理系統(tǒng),且具有可擴(kuò)展性、可對(duì)接性、可關(guān)聯(lián)性,有利于檔案數(shù)據(jù)資源的快速響應(yīng)和便捷調(diào)取。一方面,加強(qiáng)檔案數(shù)據(jù)融合是基礎(chǔ)。檔案數(shù)據(jù)融合要求將分散保存在不同數(shù)據(jù)庫中的不同數(shù)據(jù)格式、不同數(shù)據(jù)類型、關(guān)聯(lián)度低的數(shù)據(jù)進(jìn)行統(tǒng)一架構(gòu)、無縫鏈接、綜合集成。其可從三個(gè)方面進(jìn)行:一是統(tǒng)一檔案數(shù)據(jù)格式,解決檔案數(shù)據(jù)資源結(jié)構(gòu)層面的異構(gòu)問題,排除檔案數(shù)據(jù)融合障礙;二是加強(qiáng)檔案數(shù)據(jù)清洗與轉(zhuǎn)換,提高檔案數(shù)據(jù)質(zhì)量,減少無用數(shù)據(jù)或價(jià)值密度低的數(shù)據(jù)對(duì)檔案數(shù)據(jù)整合集成的影響;三是完善檔案數(shù)據(jù)語義本體建設(shè),“對(duì)檔案資源管理領(lǐng)域的知識(shí)元進(jìn)行提煉”[18],建立由責(zé)任者、時(shí)間、地點(diǎn)、關(guān)鍵詞、檔號(hào)等組成的檔案數(shù)據(jù)關(guān)聯(lián)體系。另一方面,統(tǒng)一系統(tǒng)架構(gòu)是關(guān)鍵。由管理系統(tǒng)異構(gòu)導(dǎo)致檔案數(shù)據(jù)整合共享障礙的現(xiàn)象普遍存在,有必要?jiǎng)?chuàng)建基于統(tǒng)一邏輯、統(tǒng)一接口、統(tǒng)一架構(gòu)的檔案數(shù)據(jù)管理系統(tǒng),保障檔案數(shù)據(jù)資源整合系統(tǒng)具有良好的耦合性、擴(kuò)展性、互通性,確保檔案數(shù)據(jù)傳遞便捷、運(yùn)行通暢、利用方便、整合高效。[19]

(2)組建國家檔案數(shù)據(jù)資源庫

大數(shù)據(jù)時(shí)代,海量檔案數(shù)據(jù)資源被分散保存在不同主體和不同部門,給檔案數(shù)據(jù)資源一站式利用服務(wù)帶來障礙,需要強(qiáng)化檔案館在保存和管理檔案數(shù)據(jù)資源中的主體地位,“建立國家檔案數(shù)據(jù)庫,整合各類數(shù)據(jù)資源,構(gòu)建統(tǒng)一的檔案數(shù)據(jù)共享平臺(tái),提供檔案數(shù)據(jù)的一站式服務(wù)。”[20]首先,加強(qiáng)檔案數(shù)據(jù)化建設(shè)。強(qiáng)化檔案數(shù)據(jù)資源規(guī)劃管理和頂層設(shè)計(jì),圍繞“增量電子化”“存量數(shù)據(jù)化”,開展檔案數(shù)據(jù)資源建設(shè),逐步建立以檔案數(shù)據(jù)資源為主導(dǎo)的現(xiàn)代檔案資源體系。“加強(qiáng)新型檔案資源建設(shè),廣泛開展業(yè)務(wù)數(shù)據(jù)、公務(wù)電子郵件、網(wǎng)頁信息、社交媒體信息等的收集歸檔工作”[21],推動(dòng)檔案部門同數(shù)據(jù)管理機(jī)構(gòu)、政府部門、社會(huì)組織等的有效協(xié)同,促進(jìn)檔案數(shù)據(jù)管理系統(tǒng)與業(yè)務(wù)系統(tǒng)的無縫對(duì)接,實(shí)現(xiàn)檔案數(shù)據(jù)應(yīng)歸盡歸、應(yīng)收盡收、應(yīng)管盡管,建立覆蓋全面、種類齊全、內(nèi)容豐富、質(zhì)量上乘的檔案數(shù)據(jù)倉儲(chǔ)。其次,創(chuàng)建檔案數(shù)據(jù)一體化平臺(tái)。加快檔案數(shù)據(jù)管理系統(tǒng)平臺(tái)建設(shè),推進(jìn)檔案數(shù)據(jù)管理流程重構(gòu)、技術(shù)融合和平臺(tái)整合,推動(dòng)國家、地方檔案數(shù)據(jù)資源一體化平臺(tái)建設(shè),推進(jìn)檔案數(shù)據(jù)資源跨區(qū)域、跨層級(jí)、跨部門集成整合,“實(shí)現(xiàn)各類信息內(nèi)容、媒介資源、技術(shù)應(yīng)用和系統(tǒng)平臺(tái)有效整合、共融共通。”[22]創(chuàng)建檔案數(shù)據(jù)資源共享聯(lián)動(dòng)新機(jī)制,打造一站式、知識(shí)化、智慧型服務(wù)平臺(tái),探索智慧檔案館建設(shè)路徑,拓展檔案數(shù)據(jù)應(yīng)用場(chǎng)景,推動(dòng)檔案數(shù)據(jù)資源規(guī)模、質(zhì)量和服務(wù)能力同步提升。最后,建設(shè)國家檔案數(shù)據(jù)庫。檔案數(shù)據(jù)整合的基本任務(wù)是建立檔案數(shù)據(jù)資源庫,在檔案數(shù)據(jù)資源庫建設(shè)過程中,遵循“利用優(yōu)先、分步實(shí)施、集約高效”的原則,優(yōu)先完成檔案文件級(jí)目錄數(shù)據(jù)庫和案卷級(jí)目錄數(shù)據(jù)庫建設(shè),逐步推進(jìn)全文檔案數(shù)據(jù)庫、專題檔案數(shù)據(jù)庫、多媒體檔案數(shù)據(jù)庫、特色檔案數(shù)據(jù)庫建設(shè),“逐步在全國建立起區(qū)域性、多層次、分布式、規(guī)范化的各類檔案數(shù)據(jù)庫群”[23],為檔案數(shù)據(jù)“一站式”利用服務(wù)提供資源支撐。

猜你喜歡
資源
讓有限的“資源”更有效
污水磷資源回收
基礎(chǔ)教育資源展示
崛起·一場(chǎng)青銅資源掠奪戰(zhàn)
一樣的資源,不一樣的收獲
我給資源分分類
資源回收
做好綠色資源保護(hù)和開發(fā)
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
激活村莊內(nèi)部治理資源
決策(2015年9期)2015-09-10 07:22:44
主站蜘蛛池模板: 视频二区欧美| 99免费视频观看| 国产精品微拍| 成人亚洲国产| 全部免费毛片免费播放| 五月婷婷精品| 亚洲精品午夜天堂网页| 中日韩欧亚无码视频| 亚洲国产精品国自产拍A| 在线无码九区| 草逼视频国产| 国产极品粉嫩小泬免费看| 国产高清国内精品福利| 国产91熟女高潮一区二区| 在线网站18禁| 精品伊人久久久香线蕉 | 激情六月丁香婷婷| 在线a视频免费观看| 亚欧乱色视频网站大全| 日韩欧美中文| 亚洲无线视频| 无码视频国产精品一区二区| 亚洲第一页在线观看| 91无码国产视频| 中文国产成人精品久久一| 影音先锋丝袜制服| 日韩精品无码免费一区二区三区| 欧美另类第一页| 亚洲中文无码h在线观看| 狠狠v日韩v欧美v| 国产精品无码久久久久AV| 国产成人h在线观看网站站| 国产精品亚洲αv天堂无码| 在线看片中文字幕| 免费啪啪网址| 国产99视频在线| 欧美色伊人| 国产精品一区二区国产主播| 免费女人18毛片a级毛片视频| 日本午夜在线视频| 欧美人在线一区二区三区| 99激情网| 67194亚洲无码| 久久一色本道亚洲| 成人精品午夜福利在线播放| 亚洲国产欧美自拍| 毛片a级毛片免费观看免下载| 91一级片| 久久情精品国产品免费| 午夜国产在线观看| 亚洲男人的天堂在线| 丁香五月婷婷激情基地| 毛片网站免费在线观看| 97免费在线观看视频| 国产一区免费在线观看| 日本a级免费| 亚洲成a人片在线观看88| 尤物成AV人片在线观看| 国产丝袜啪啪| 亚洲成人福利网站| 国产不卡一级毛片视频| 制服丝袜无码每日更新| 亚欧美国产综合| 亚洲精品福利视频| 丰满人妻被猛烈进入无码| 白浆视频在线观看| 在线看免费无码av天堂的| 精品国产免费观看| V一区无码内射国产| 高清欧美性猛交XXXX黑人猛交| 91色在线观看| 国产无人区一区二区三区| 99精品视频在线观看免费播放| 国产91透明丝袜美腿在线| 亚洲AV无码不卡无码 | 久久精品国产国语对白| 天天做天天爱夜夜爽毛片毛片| 欧美中文字幕在线播放| 日韩大乳视频中文字幕| 在线国产欧美| 久久久久亚洲AV成人人电影软件| 亚洲人成电影在线播放|