經(jīng)驗(yàn)人:方 瓊
應(yīng)對(duì)大數(shù)據(jù)的智慧檔案
經(jīng)驗(yàn)人:方 瓊
隨著大數(shù)據(jù)時(shí)代的來臨,檔案信息量激增,亟需通過互聯(lián)形成物聯(lián)網(wǎng),運(yùn)用超級(jí)計(jì)算機(jī)和云計(jì)算等技術(shù),對(duì)海量的數(shù)據(jù)和信息進(jìn)行分析與處理,實(shí)施智能化的控制,并在智慧城市建設(shè)中提供相應(yīng)的公共服務(wù),從而使檔案管理達(dá)到高效、動(dòng)態(tài)、安全的智慧狀態(tài)。
隨著科技的不斷進(jìn)步,全球數(shù)據(jù)信息量呈現(xiàn)爆炸式增長,據(jù)統(tǒng)計(jì),2011年被創(chuàng)建和復(fù)制的數(shù)據(jù)總量為1.82ZB,預(yù)測到2020年該值將增加到35.2ZB,人們將這種海量數(shù)據(jù)稱之為“大數(shù)據(jù)”,為應(yīng)對(duì)海量數(shù)據(jù)和信息的分析與處理,必然將要求實(shí)現(xiàn)智能化控制,數(shù)字地球已經(jīng)發(fā)展到第二代“智慧地球”階段。檔案信息資源亟需通過互聯(lián)形成物聯(lián)網(wǎng),以超級(jí)計(jì)算機(jī)和云計(jì)算等技術(shù),運(yùn)用各種數(shù)據(jù)挖掘方法,在智慧城市建設(shè)中提供相應(yīng)的公共服務(wù),從而使檔案管理達(dá)到實(shí)時(shí)、動(dòng)態(tài)的智慧狀態(tài),為檔案工作提供高效、安全的智力支持。
物聯(lián)網(wǎng)是通過RFID、紅外感應(yīng)器、全球定位系統(tǒng)等信息傳感設(shè)備,按約定的協(xié)議,把物品與互聯(lián)網(wǎng)連接,以實(shí)現(xiàn)對(duì)物品的智能化識(shí)別、定位、監(jiān)控、管理的一種網(wǎng)絡(luò)。檔案管理物聯(lián)網(wǎng)作為一個(gè)龐大、復(fù)雜的綜合信息系統(tǒng),涉及的技術(shù)較多,主要由感知層(RFID、傳感器等)、網(wǎng)絡(luò)層(WSN、近距離通信、無線網(wǎng)絡(luò)等)、應(yīng)用層(終端服務(wù)等)等核心技術(shù)構(gòu)成。
感知層的信息傳感設(shè)備不僅包括上行的傳感器,還應(yīng)包括下行的執(zhí)行器,物品的識(shí)別信息不僅有感知信息還有控制信息,感知層的識(shí)別技術(shù)解決了物聯(lián)網(wǎng)中在多種不同傳感器控制設(shè)備間的采集感知信息和接收控制信息,實(shí)現(xiàn)了物品感知信息和控制信息的統(tǒng)一識(shí)別。將RFID電子標(biāo)簽粘貼在檔案資料上,在統(tǒng)計(jì)、查閱、檢索、盤存等業(yè)務(wù)中均可與電子標(biāo)簽進(jìn)行關(guān)聯(lián),進(jìn)行無接觸式自動(dòng)感知、探測、定位,實(shí)現(xiàn)不拆盒的、自動(dòng)的、快速而準(zhǔn)確的無損操作,未來還可借助機(jī)械手進(jìn)行自動(dòng)提取資料。通過電子傳感器可以實(shí)現(xiàn)對(duì)檔案館庫房不同區(qū)域的溫度、濕度、煙霧等全分散系監(jiān)測與控制,較之傳統(tǒng)的報(bào)警系統(tǒng),這種分布式物聯(lián)網(wǎng)技術(shù)對(duì)館庫區(qū)的監(jiān)控更準(zhǔn)確、高效。
在感知層識(shí)別各種感知和控制信息后,網(wǎng)絡(luò)層可以將其中的信息通過通用的數(shù)據(jù)傳輸協(xié)議進(jìn)行雙向傳遞、路由和控制,該層可在現(xiàn)有的互聯(lián)網(wǎng)和通信網(wǎng)基礎(chǔ)上建立,主要包括各種有線和無線網(wǎng)關(guān)、接入網(wǎng)以及核心網(wǎng)。網(wǎng)關(guān)在邏輯上距離感知層較近,可按檔案職能部門進(jìn)行劃分,網(wǎng)關(guān)匯聚的數(shù)據(jù)經(jīng)過初步處理后,通過統(tǒng)一的接口上傳到各職能部門的云存儲(chǔ)中,以便進(jìn)一步進(jìn)行數(shù)據(jù)融合和處理。由于匯聚后的數(shù)據(jù)量較大,同時(shí)為了確保數(shù)據(jù)的安全性,可采用高速安全的VPN虛擬專用網(wǎng)技術(shù)來實(shí)現(xiàn)數(shù)據(jù)的傳輸。
應(yīng)用層通過對(duì)網(wǎng)絡(luò)層獲取來的各類檔案數(shù)據(jù)參數(shù)進(jìn)行加工處理、統(tǒng)計(jì)分析、查詢檢索,借助IPv6、高性能云計(jì)算、海量存儲(chǔ)等各種軟、硬件技術(shù)實(shí)現(xiàn),同時(shí)開發(fā)檔案應(yīng)用組件,以滿足不同用戶的需求。
“云計(jì)算”主要采用Web服務(wù)、P2P點(diǎn)對(duì)點(diǎn)傳輸、MPI消息傳遞編程接口等技術(shù)實(shí)現(xiàn),具有計(jì)算與存儲(chǔ)能力高、維護(hù)費(fèi)低,擴(kuò)展彈性強(qiáng)等優(yōu)點(diǎn)。云計(jì)算以“一切皆服務(wù)”為理念,在檔案領(lǐng)域搭建云計(jì)算平臺(tái),提供松散耦合的、不同粒度的、甚至是適應(yīng)多粒度和變粒度的服務(wù),將分布在不同服務(wù)器上的“檔案云滴”匯聚成“檔案云團(tuán)”,從而滿足用戶不同層次、不同角度的需求。
以SOA為基本框架搭建虛擬化的檔案云計(jì)算平臺(tái),給出服務(wù)管理、搜索調(diào)用機(jī)制;采用SOA基于面向服務(wù)的體系結(jié)構(gòu),對(duì)多元、異構(gòu)的檔案數(shù)據(jù)集成與共享;采用計(jì)算服務(wù)對(duì)已有算法進(jìn)行封裝,實(shí)現(xiàn)計(jì)算組件共享;對(duì)海量、異構(gòu)檔案數(shù)據(jù)的訪問通過不同粒度的數(shù)據(jù)服務(wù)和計(jì)算服務(wù)來實(shí)現(xiàn),并將這些服務(wù)發(fā)布;采用Silverlight、Flex實(shí)現(xiàn)基于RIA技術(shù)的客戶端方法;基于SOAP協(xié)議、REST接口技術(shù),將有效提升數(shù)據(jù)集成與共享服務(wù)終端的用戶體驗(yàn)與應(yīng)用效果。
云存儲(chǔ)可以我國現(xiàn)有的國家級(jí)、省市級(jí)綜合檔案館為基礎(chǔ),以特定網(wǎng)絡(luò)范圍內(nèi)的檔案目錄或全文數(shù)據(jù)庫為依托,通過技術(shù)手段把不同來源、不同數(shù)據(jù)標(biāo)準(zhǔn)、不同通信協(xié)議的信息體系完全融合,實(shí)現(xiàn)全國各級(jí)檔案數(shù)據(jù)集中整合、無縫銜接,有效解決信息孤島問題。采用TB級(jí)存儲(chǔ)設(shè)備,未來將提升至PB級(jí)、EB或ZB級(jí),搭建檔案云存儲(chǔ)平臺(tái),并可擴(kuò)展作為節(jié)點(diǎn)分布式存儲(chǔ)。檔案的云存儲(chǔ)可以分為公有云存儲(chǔ)和私有云存儲(chǔ):公有云存儲(chǔ)構(gòu)建在Internet上,將可公開的檔案信息發(fā)布在外網(wǎng)支持的SOA服務(wù)器上,向公眾發(fā)布資源調(diào)用的API;而私有云構(gòu)建于Intranet內(nèi),采用虛擬化軟件將后臺(tái)的若干存儲(chǔ)、內(nèi)存、CPU等進(jìn)行劃分,裝載不同的操作系統(tǒng),應(yīng)用程序級(jí)、桌面級(jí)的虛擬應(yīng)用,使用戶可以像使用本地設(shè)備一樣使用遠(yuǎn)端的操作系統(tǒng)、應(yīng)用程序等。
智慧城市是把新一代信息技術(shù)充分運(yùn)用于城市各行各業(yè)中的、基于知識(shí)社會(huì)的下一代創(chuàng)新(創(chuàng)新2.0)的城市信息化高級(jí)形態(tài)。智慧檔案就是把為用戶提供各種服務(wù)作為核心目標(biāo),采用一站式門戶技術(shù)與設(shè)計(jì)理念,通過物聯(lián)網(wǎng)基礎(chǔ)設(shè)施、云計(jì)算基礎(chǔ)設(shè)施、地理空間設(shè)施及社交網(wǎng)絡(luò)、綜合集成、網(wǎng)動(dòng)全媒體融合通信終端,實(shí)現(xiàn)全面透徹的感知、寬帶泛在的互聯(lián)、智能融合的應(yīng)用,以檔案云平臺(tái)中資源的消費(fèi)搭建服務(wù)平臺(tái),將檔案服務(wù)系統(tǒng)融入智慧城市的整體架構(gòu)中。
建構(gòu)智慧檔案服務(wù)平臺(tái),可從以下兩方面入手:首先,建立檔案智能化服務(wù)體系。搭建檔案信息數(shù)據(jù)庫系統(tǒng),依托物聯(lián)網(wǎng)的識(shí)別和定位技術(shù),開展用戶自我檢索、查詢、交付功能,實(shí)現(xiàn)一站式的服務(wù),從內(nèi)容性、時(shí)間性、相關(guān)性等多個(gè)維度構(gòu)建全方位、立體式的服務(wù)模式。服務(wù)內(nèi)容性是指內(nèi)容的多樣化,不僅有單一的文字服務(wù),還包括圖片、音頻、視頻在內(nèi)的全媒體服務(wù)體系;時(shí)間性是指檔案信息按時(shí)間排序,使用戶對(duì)其發(fā)展架構(gòu)有一目了然的認(rèn)識(shí)和了解;相關(guān)性是指當(dāng)用戶查詢某一主題的檔案時(shí),系統(tǒng)會(huì)自動(dòng)關(guān)聯(lián)與該主題相關(guān)的所有信息,以供用戶參考和選擇。其次,建立檔案個(gè)性化服務(wù)體系。以物聯(lián)網(wǎng)技術(shù)為基礎(chǔ),從用戶的背景、習(xí)慣和綜合素質(zhì)等方面對(duì)其檔案需求偏好進(jìn)行分析和總結(jié),通過手機(jī)或電腦等網(wǎng)絡(luò)終端向用戶提供潛在需要的或感興趣的檔案資料,為其提供定單式和推送式的APP應(yīng)用,客戶端對(duì)服務(wù)調(diào)用返回的結(jié)果進(jìn)行處理與格式化,并將結(jié)果以文檔、圖片、影像等多種形式進(jìn)行顯示,最終,客戶感覺如同使用搜索引擎似的方便地使用應(yīng)用程序。
科學(xué)技術(shù)是一把雙刃劍,大數(shù)據(jù)所引發(fā)的問題與其帶來的價(jià)值同樣引人注目,特別是數(shù)據(jù)安全與隱私保護(hù)問題日益突顯。針對(duì)安全性的威脅之一是偽造或刻意制造的數(shù)據(jù),之二是數(shù)據(jù)在傳播過程中的逐步失真;針對(duì)隱私性的攻擊可分為外部攻擊和內(nèi)部攻擊兩種模式,外部攻擊主要指攻擊者通過鏈路層竊取敏感數(shù)據(jù),內(nèi)部攻擊主要指攻擊者偽裝成網(wǎng)絡(luò)的參與者以俘獲所有數(shù)據(jù)。針對(duì)上述大數(shù)據(jù)面臨的數(shù)據(jù)內(nèi)容可信驗(yàn)證、用戶隱私保護(hù)、訪問控制等問題,急需開展大數(shù)據(jù)安全等關(guān)鍵技術(shù)研究,如可應(yīng)用數(shù)據(jù)水印技術(shù)、數(shù)據(jù)溯源技術(shù)、數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)、角色挖掘技術(shù)等,更主動(dòng)地發(fā)現(xiàn)潛在的安全隱患,做好風(fēng)險(xiǎn)評(píng)估,從而規(guī)范大數(shù)據(jù)建設(shè),完善大數(shù)據(jù)資產(chǎn)管理,建立從物理防護(hù)、網(wǎng)絡(luò)防護(hù)、平臺(tái)防護(hù)到應(yīng)用防護(hù)的全方位的安全屏障,完善檔案信息的安全性和隱私性。
在大數(shù)據(jù)時(shí)代背景下,智慧檔案的建設(shè)與應(yīng)用是一個(gè)龐大的系統(tǒng)工程,方興未艾的物聯(lián)網(wǎng)科技和云計(jì)算技術(shù)為構(gòu)建新一代的檔案管理平臺(tái)提供了良好的智力支撐,為檔案工作的快速、安全、全面發(fā)展提供了一個(gè)良好的環(huán)境,智慧檔案建設(shè)任重而道遠(yuǎn)。


方 瓊
三峽大學(xué)檔案館
方瓊(1978-)女,碩士,三峽大學(xué)檔案館館員,主要研究方向?yàn)闄n案信息化管理。
10.3969/j.issn.1001-8972.2015.16.048