◆湯桂清 孫玲玲 陳艷輝
網(wǎng)絡(luò)環(huán)境下的檔案數(shù)據(jù)儲(chǔ)存安全管理及其構(gòu)建分析
◆湯桂清1孫玲玲2陳艷輝3
(1.承德廣通信息網(wǎng)絡(luò)有限公司灤平分公司 河北 068250;2.河北民族師范學(xué)院 河北 050000;3.灤平縣國(guó)土資源局灤平鎮(zhèn)國(guó)土資源所 河北 068250)
隨著社會(huì)經(jīng)濟(jì)的持續(xù)發(fā)展及技術(shù)的不斷更新,檔案數(shù)據(jù)庫(kù)在此浪潮中已被認(rèn)定為檔案信息資源共享、管理與組織的最優(yōu)方案與方法,管理檔案數(shù)據(jù)庫(kù)需要有一個(gè)系統(tǒng)化平臺(tái)與有效工具,而構(gòu)建一個(gè)統(tǒng)一化的檔案數(shù)據(jù)存儲(chǔ)管理平臺(tái),則恰好能滿(mǎn)足此需求。至此,本文對(duì)此平臺(tái)的構(gòu)建內(nèi)容、所面臨問(wèn)題及主要功能進(jìn)行適當(dāng)性論述,探討統(tǒng)一數(shù)據(jù)管理平臺(tái)內(nèi)在特性及所持有優(yōu)勢(shì),以期為相關(guān)應(yīng)用研究提供理論參考。
檔案數(shù)據(jù)存儲(chǔ);安全管理;構(gòu)建
伴隨當(dāng)今社會(huì)信息化程度的日漸加深與彼此融合,社會(huì)各級(jí)別檔案館也正在趨向于海量化、系統(tǒng)化的檔案信息存儲(chǔ)中心。建設(shè)安全可靠而又實(shí)用的數(shù)字化檔案信息存儲(chǔ)管理平臺(tái),已然成為當(dāng)前檔案館需要積極落實(shí)的關(guān)鍵內(nèi)容。當(dāng)前,對(duì)于日漸規(guī)模化、數(shù)字化的檔案信息存儲(chǔ)體系而言,其主要包含四方面內(nèi)容,即歸檔、備份、容災(zāi)與存儲(chǔ)。
1.1 存儲(chǔ)
存儲(chǔ)架構(gòu)有3種類(lèi)型劃分,即網(wǎng)絡(luò)區(qū)域存儲(chǔ)(SAN)、網(wǎng)絡(luò)附加存儲(chǔ)(NAS)及直連存儲(chǔ)(DAS)。在檔案系統(tǒng)運(yùn)用時(shí),選用SAN或者NAS架構(gòu),最具合理性:NAS結(jié)構(gòu),其將文件系統(tǒng)作為其內(nèi)在基礎(chǔ),所以在檔案文件存放當(dāng)中運(yùn)用NAS架構(gòu),能夠高效化且相對(duì)經(jīng)濟(jì)性的落實(shí)檔案的電子化;而SAN結(jié)構(gòu),其主要是將數(shù)據(jù)塊作為其基礎(chǔ),所以其對(duì)于檔案數(shù)據(jù)庫(kù)的構(gòu)建,更加具有適用性,能夠以更高的速度與效率,查詢(xún)與管理檔案數(shù)據(jù)。另外,存儲(chǔ)產(chǎn)品可靠性,比如存儲(chǔ)構(gòu)造是否合理及存儲(chǔ)控制器有無(wú)冗余狀況等。對(duì)于一個(gè)較為可靠的存儲(chǔ)系統(tǒng)來(lái)講,需要同時(shí)設(shè)置2個(gè)甚至更多的高性能控制器,以此為核心控制的安全性與可靠性提供充足保障;還需具有N+1設(shè)備冗余,如通道卡、風(fēng)扇及電源等;對(duì)于存儲(chǔ)構(gòu)造,需要選用點(diǎn)對(duì)點(diǎn)模式或者是交換模式,以此來(lái)獲取更加的數(shù)據(jù)傳輸性能;對(duì)自身數(shù)據(jù)存儲(chǔ)進(jìn)行安全保護(hù),需考慮遠(yuǎn)程數(shù)據(jù)的復(fù)制支持、故障監(jiān)測(cè)、硬盤(pán)raid級(jí)別及數(shù)據(jù)快照支持等。
1.2 容災(zāi)
容災(zāi)實(shí)際就是為應(yīng)對(duì)可能出現(xiàn)的災(zāi)難,實(shí)現(xiàn)準(zhǔn)備好的各項(xiàng)預(yù)防應(yīng)急措施。在遠(yuǎn)程容災(zāi)系統(tǒng)方案實(shí)際規(guī)劃過(guò)程中,需要結(jié)合相關(guān)要求,就方案各項(xiàng)細(xì)致化內(nèi)容及所需達(dá)成目標(biāo)予以明確。由于災(zāi)難在恢復(fù)目標(biāo)方面存有差異,因此,可運(yùn)用與災(zāi)難類(lèi)型相適應(yīng)的恢復(fù)技術(shù),至此,無(wú)論是在運(yùn)行成本上,還是在投資規(guī)模方面,均會(huì)存有差別。依據(jù)信息中心實(shí)況,檔案館在容災(zāi)系統(tǒng)方案實(shí)際選擇時(shí),需酌情考慮如下內(nèi)容:(1)目標(biāo)1:應(yīng)對(duì)災(zāi)難的實(shí)際種類(lèi)。計(jì)算機(jī)所在環(huán)境及系統(tǒng)內(nèi)當(dāng)中所存在的各種潛藏性因素,可能會(huì)導(dǎo)致數(shù)據(jù)大范圍丟失。相關(guān)數(shù)據(jù)統(tǒng)計(jì)顯示,在導(dǎo)致數(shù)據(jù)丟失的各類(lèi)型事件當(dāng)中,網(wǎng)絡(luò)故障及軟硬件所占比例達(dá)11%,而電源故障及斷電所占比例為50%,雷電、爆炸、火災(zāi)、地震等為18%,人為占17%,其它4%。為了能夠采取有效措施,對(duì)各種突發(fā)災(zāi)難予以應(yīng)對(duì),對(duì)于主中心的選址而言,其與災(zāi)備中心的選址存在差突出不同。比如針對(duì)地震災(zāi)害,為施加應(yīng)對(duì),災(zāi)備中心與主中心需要選址于不同城市,不可同城;為了應(yīng)對(duì)長(zhǎng)時(shí)間停電,在災(zāi)備中心與主中心的選址上,需選擇不同的電廠覆蓋區(qū)域。只需將災(zāi)害類(lèi)型予以明確,方能更加合理、高效的選出災(zāi)備中心與主中心的適宜位置。(2)目標(biāo)-2:恢復(fù)時(shí)間目標(biāo)。所謂恢復(fù)時(shí)間目標(biāo)實(shí)際就是當(dāng)發(fā)生災(zāi)難之后,業(yè)務(wù)能夠接受或者最大忍耐的停頓時(shí)間,還可理解為:當(dāng)災(zāi)難出現(xiàn)后,業(yè)務(wù)在運(yùn)行恢復(fù)方面所需時(shí)間,通常情況下,當(dāng)具有越短的恢復(fù)時(shí)間時(shí),則會(huì)具有相對(duì)較高的災(zāi)難恢復(fù)方案的成本,但由此而導(dǎo)致的業(yè)務(wù)損失量也就隨之而變小;相反,當(dāng)具有越長(zhǎng)的恢復(fù)時(shí)間時(shí),則會(huì)具有越低的災(zāi)難恢復(fù)方案成本,但會(huì)具有越大的業(yè)務(wù)損失。其中最為恰當(dāng)而又合宜的恢復(fù)時(shí)間,需為方案成本曲線(xiàn),與業(yè)務(wù)影響曲線(xiàn)相交點(diǎn),即對(duì)應(yīng)的時(shí)間。若短于最佳,則會(huì)導(dǎo)致較大的投資浪費(fèi);若長(zhǎng)于最佳恢復(fù)時(shí)間的目標(biāo),當(dāng)發(fā)生災(zāi)難之后,所產(chǎn)生的損失會(huì)超過(guò)方案投資成本,因此,具有較大的災(zāi)難損失風(fēng)險(xiǎn)。(3)目標(biāo)-3:恢復(fù)數(shù)據(jù)目標(biāo)。所謂恢復(fù)數(shù)據(jù)目標(biāo),實(shí)際就是發(fā)生災(zāi)難之后,業(yè)務(wù)可接受的數(shù)據(jù)丟失量,還可理解為有災(zāi)難所導(dǎo)致的最大數(shù)據(jù)丟失量。通常情況下,當(dāng)恢復(fù)數(shù)據(jù)目標(biāo)越高,則具有越高的方案成本,但會(huì)具有越小的因?yàn)?zāi)難所致業(yè)務(wù)損失;相反,當(dāng)具有越低的恢復(fù)數(shù)據(jù)目標(biāo),則會(huì)具有越低的方案成本,但由災(zāi)難所導(dǎo)致的業(yè)務(wù) 也會(huì)隨之而增大。
1.3 備份
備份乃是為數(shù)據(jù)安全最后屏障,不管是容災(zāi),還是還是后續(xù)的存儲(chǔ)環(huán)節(jié),均為在線(xiàn)儲(chǔ)存。針對(duì)以備份方式而存在的數(shù)據(jù),除了可在線(xiàn)存放外,還可利用硬盤(pán)等分方式而實(shí)現(xiàn)離線(xiàn)保存,對(duì)于那些在線(xiàn)保存的數(shù)據(jù)而言,可實(shí)現(xiàn)快速恢復(fù)。而對(duì)于那些離線(xiàn)保存下來(lái)的數(shù)據(jù)而言,則相比于其它數(shù)據(jù),具有更加安全的存放環(huán)境。當(dāng)一個(gè)嚴(yán)重性災(zāi)難發(fā)生,導(dǎo)致容災(zāi)系統(tǒng)當(dāng)中的數(shù)據(jù)不可用,或者是本地系統(tǒng)當(dāng)中的數(shù)據(jù)不可用時(shí),利用備份,便可最大程度的恢復(fù)可用數(shù)據(jù)。便能最大程度、最大限量的實(shí)現(xiàn)損失量的減少。如果數(shù)據(jù)丟失因素乃因人為,則可利用磁盤(pán)等介質(zhì),以在線(xiàn)的方式,進(jìn)行數(shù)據(jù)備份,便可以較快的方式。所以在條件許可狀況下,可選擇磁帶備份與磁盤(pán)備份相結(jié)合的方式,以此為數(shù)據(jù)安全提供保障。當(dāng)前所開(kāi)發(fā)出的各種類(lèi)型的備份軟件,能夠?yàn)闉?zāi)難時(shí)數(shù)據(jù)提供可靠備份,還能運(yùn)用各種介質(zhì),恢復(fù)所丟失的數(shù)據(jù),進(jìn)而以較快速度、較短的時(shí)間,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)的恢復(fù)。
1.4 歸檔
備份就是為了恢復(fù),以此在出現(xiàn)以往故障時(shí),能夠確保業(yè)務(wù)持續(xù)與連貫。尤其是在線(xiàn)備份,在速度方面通常會(huì)有比其它內(nèi)容更高的要求,但在容量方面,卻要求較低。實(shí)施歸檔的最終目的而言,其與備份相比,存有較大差別,由于檔案館內(nèi)數(shù)據(jù)龐大,且其中多數(shù)今后較少用到,但這些數(shù)據(jù)還需要認(rèn)真保存,以備用時(shí)能夠及時(shí)查詢(xún)到。實(shí)際上,進(jìn)行歸檔,就是保障數(shù)據(jù)始終保持完整性。在歸檔系統(tǒng)選擇時(shí),可遵循如下原則。(1)需長(zhǎng)久保留數(shù)據(jù)。不管是備份還是歸檔,均需要切實(shí)有效的保證數(shù)據(jù)的完整性,需在制定時(shí)間內(nèi),使數(shù)據(jù)能夠安全的得以?xún)?chǔ)存。(2)數(shù)據(jù)需便于讀取。盡管諸多數(shù)據(jù)日后所用范圍不大,但歸檔系統(tǒng)仍然是一個(gè)大倉(cāng)庫(kù),需要確保在實(shí)際使用時(shí),能夠便于讀取,此乃歸檔系統(tǒng)的基礎(chǔ)原則。(3)法規(guī)運(yùn)用。當(dāng)前對(duì)于國(guó)內(nèi)而言,在此方面的法規(guī),仍然處于不斷完善階段,而在國(guó)外,已經(jīng)頒布實(shí)施了薩班斯-奧克斯萊法案及SEC法案等,并明確了電子記錄的可存取性、保密性與完整性。(4)數(shù)據(jù)具有可擴(kuò)展性。數(shù)據(jù)始終處于不斷擴(kuò)展之中,對(duì)于歸檔系統(tǒng),需時(shí)刻提升自身所持有的可擴(kuò)展性,滿(mǎn)足今后需求。
當(dāng)前,各級(jí)檔案館均在大力度建設(shè)數(shù)字化檔案信息存儲(chǔ)系統(tǒng),構(gòu)建包含有諸多功能的儲(chǔ)存系統(tǒng),如歸檔、備份、容災(zāi)及存儲(chǔ)等。但因各廠家所生產(chǎn)出的產(chǎn)品缺乏兼容性,不能有效管理數(shù)據(jù)的有效性與完整性。數(shù)據(jù)管理人員未能深入了解所儲(chǔ)存數(shù)字檔案信息的重要性,通常是只知道有此數(shù)據(jù),而卻不知道其準(zhǔn)確位置。對(duì)于數(shù)據(jù)是否為有效儲(chǔ)存不太了解,難以結(jié)合各儲(chǔ)存系統(tǒng)實(shí)際運(yùn)行情況,及時(shí)制定并提出切實(shí)有效的數(shù)據(jù)遷移計(jì)劃。為了將數(shù)據(jù)備份工作盡量做好,當(dāng)前,許多檔案館選用了各種備份模式,如局部集中備份等,造成在運(yùn)用數(shù)據(jù)備份方面,一些系統(tǒng)存在不充分狀況,完成備份的時(shí)間也相對(duì)較長(zhǎng),難以系統(tǒng)化、全面性保存數(shù)據(jù)。這些問(wèn)題的實(shí)際存在,往往會(huì)促使數(shù)據(jù)保護(hù)風(fēng)險(xiǎn)的增加,管理成本也會(huì)保持高位。數(shù)字化檔案信息,需將其所保管信息資源的價(jià)值最大化挖掘出來(lái)。而為實(shí)現(xiàn)此功能,網(wǎng)絡(luò)、服務(wù)器及存儲(chǔ)設(shè)備為其提供了基礎(chǔ)結(jié)構(gòu)與工具,但要想構(gòu)建一個(gè)完備的數(shù)字化檔案信息的存儲(chǔ)中心,需在適當(dāng)?shù)牡攸c(diǎn)及適當(dāng)?shù)臅r(shí)間,提供真實(shí)所需的信息能力上。要想實(shí)現(xiàn)此目標(biāo),需做到各環(huán)節(jié)的有機(jī)整合,構(gòu)建統(tǒng)一化、完善的檔案存儲(chǔ)管理平臺(tái)。
對(duì)于檔案管理平臺(tái),其由多模塊構(gòu)成,如資源管理及恢復(fù)等,運(yùn)用相同源代碼緊密融合在一起。此些功能功能強(qiáng)大,在起初的軟件架構(gòu)設(shè)計(jì)階段,便立足于此些功能模塊能夠?qū)ο嗤姆?wù)功能實(shí)現(xiàn)共享,還可利用單一的控制臺(tái),對(duì)全部數(shù)據(jù)管理功能,可靠、簡(jiǎn)單而又迅速的執(zhí)行,能夠以一種較為有效的方式,幫助客戶(hù)將基礎(chǔ)架構(gòu)階段所存在的成本問(wèn)題予以消除,還可實(shí)現(xiàn)數(shù)據(jù)管理效率的大幅提升。針對(duì)統(tǒng)一數(shù)據(jù)管理平臺(tái)而言,需選用一個(gè)統(tǒng)一視圖,以此來(lái)提供如下功能:(1)數(shù)據(jù)恢復(fù)與備份。不僅能夠?qū)︵]件系統(tǒng)及數(shù)據(jù)庫(kù)實(shí)施備份,而且還能對(duì)文件系統(tǒng)及種操作系統(tǒng)進(jìn)行備份。備份時(shí),可結(jié)合實(shí)際,自動(dòng)完成此操作。(2)快照恢復(fù)與管理。可運(yùn)用軟硬件引擎,基于存儲(chǔ)設(shè)備,建立存在時(shí)間點(diǎn)的各類(lèi)恢復(fù)卷,在較短時(shí)間內(nèi),便可實(shí)現(xiàn)硬軟件的快速恢復(fù),以此為業(yè)務(wù)的連續(xù)性提供保證。(3)復(fù)制遠(yuǎn)程連續(xù)數(shù)據(jù)。可運(yùn)用有限寬帶,來(lái)運(yùn)用軟件數(shù)據(jù),并對(duì)文件進(jìn)行復(fù)制,建立恢復(fù)點(diǎn),保證數(shù)據(jù)一致性。可運(yùn)用此功能,把原來(lái)儲(chǔ)存在中心處的各種數(shù)據(jù),以復(fù)制的方式向異地復(fù)制,實(shí)現(xiàn)容災(zāi);另外,還可將各個(gè)地方數(shù)據(jù),向中心區(qū)域復(fù)制,實(shí)施集中保護(hù)。(4)服務(wù)管理和報(bào)告。運(yùn)用此工具軟件,管理者能夠以一種較為輕松的方式管理存儲(chǔ)資源,并對(duì)數(shù)據(jù)管理的全部操作進(jìn)行跟蹤,提供對(duì)應(yīng)報(bào)告,保證服務(wù)質(zhì)量。
總而言之,構(gòu)建統(tǒng)一檔案數(shù)據(jù)存儲(chǔ)管理平臺(tái),乃是有效管理檔案的重要內(nèi)容,同時(shí)也是隨著當(dāng)前檔案管理工作發(fā)展的實(shí)際需求。至此,通過(guò)運(yùn)用此平臺(tái),保證檔案資源的可靠性與完整性,為社會(huì)提供更為豐富、全面的檔案信息資源,推動(dòng)資源的融合與共享。
[1]孫志強(qiáng),高旭,官澤.健康檔案管理模型構(gòu)建與系統(tǒng)開(kāi)發(fā)[J].軟件工程師,2013.
[2]王振興,楊敏華,吳勰等.檔案掃描入庫(kù)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].測(cè)繪科學(xué),2008.
[3]王玉涵,黃茂海,劉飛飛.SVOM數(shù)據(jù)檔案庫(kù)軟件原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].天文研究與技術(shù),2015.
[4]胡銳.基于Hadoop的高校檔案管理存儲(chǔ)系統(tǒng)研究[J].無(wú)線(xiàn)互聯(lián)科技,2016.
[5]朱曉鐘,李鑫.能源行業(yè)檔案管理系統(tǒng)存儲(chǔ)架構(gòu)設(shè)計(jì)分析[J].信息系統(tǒng)工程,2012.
本文為承德市科學(xué)技術(shù)研究與發(fā)展計(jì)劃項(xiàng)目“京津冀一體化環(huán)境下基于‘互聯(lián)網(wǎng)+’的檔案管理數(shù)據(jù)庫(kù)平臺(tái)建設(shè)與服務(wù)研究”(編號(hào):201606A133)的研究成果之一。