張磊 徐寧 李新艷 周培瑩
(江蘇省衛生健康發展研究中心 江蘇省南京市 210036)
目前,網絡與人們的工作、生活息息相關,因此人們需要借助網絡對數據進行管理,以便使用數據來滿足自身各方面的需求,但隨著網絡的普及與應用的不斷深化,網絡環境中的數據量級龐大,且增長速度極快,導致傳統數據管理方法不適用,因此為了在新時代下做好數據管理工作,需要重新選擇數據管理方法,原有技術手段亟待更新。在這一情況下,多項計算機數據庫技術應運而出,從中擇優而選,再圍繞技術進行數據庫設計,即可解決當下難題,因此有必要展開相關研究。
數據管理的前提是得到相關數據,因此需要進行數據采集工作。但在新時代下,隨著網絡在工作中的不斷深入、普及,需要采集的數據項目飛速增長,且數據更新頻率也有大幅提升,故數據量級龐大、增長速度極快,如何儲存龐大數據成為了一大難題,即傳統數據庫雖然種類繁多,但容量均有限,而當前數據管理中的數據具有單次量級龐大、增長速度快的特征,因此傳統數據庫并不滿足數據儲存需求[1]。在這種情況下,新時代數據管理需要一個能滿足當下數據儲存容量需要的數據庫,且考慮到數據量級會不斷增長,數據庫的容量還要具備良好的可拓展性。
數據管理工作的第一步就是對數據進行預處理,目的是去除重復的無用數據、修復錯誤或不全數據、完成數據分類,因此工作人員需要在預處理中對數據進行整理,識別數據特征,以便進行處理。但龐大的數據量級、繁多的數據種類導致人工不能直接對數據進行預處理,即龐大的量級會導致數據預處理工作量大幅增長,而人工工作效率有限,不可能在規定時間內對所有數據進行處理,同時繁多的數據種類會增大數據預處理難度,故人工難以進行整理[2]。在這種情況下,人們就需要使用技術手段來完成數據整理工作,以便做好數據預處理,故存在數據整理技術需要。
下文將對計算機數據庫技術應用進行全面分析,涉及技術選型與應用方法,同時還包括數據安全管理。
計算機數據庫的關鍵技術有二,分別為數據庫技術、數據管理技術,下文將結合新時代數據管理需要進行技術選型。
2.1.1 數據庫技術
自數據庫概念提出以來,人們就一直在開發計算機數據庫技術,故經過多年發展該項技術有了多種形式,現今主要使用的技術是基于云計算的SQL 數據庫技術。該項技術與云計算結合后具有兩大特征:第一近乎無限,且拓展性的儲存空間,即該數據庫的數據儲存空間位于網絡,而網絡空間無限延伸,因此理論上該數據庫的儲存空間無限,全面滿足數據儲存需要。同時在近乎無限的儲存容量下,人們可以隨意設定容量大小,且在容量較小的情況下能隨時擴張,故儲存空間可拓展性強[3];第二分布式部署,即該數據技術由1 個總系統、若干個子系統組成,所有子系統相互獨立,但均與總系統保持聯系,圖1為分布式部署的拓撲圖。在這種部署格局下,每個計算機可以利用子系統對自身數據進行管理,而數據管理總管理員可以通過總系統了解子系統運作情況,同時能對各子系統進行一對一、一對多的管理,可實現子系統協同運作,并保障子系統運作正常,全面做好數據管理工作。

圖1:數據庫分布式部署的拓撲圖
2.1.2 數據管理技術
數據庫技術主要負責數據儲存,并提供基本的數據管理邏輯,但并不能應對數據預處理等方面的實操需求,因此還需要進行數據管理技術選型。面對龐大的數據量以及復雜的數據關系,普通數據管理技術并不能起到良好作用,故本文主要選擇智能技術作為數據管理技術。智能技術能夠根據預設的智能邏輯自主完成相關工作,在數據管理的預處理環節中該項技術的基本邏輯見圖2。根據圖2,智能技術會依照知識庫進行運作,首先提取各項數據的特征,諸如關鍵詞等,隨后將數據特征與知識庫內的特征做對比,可以對數據進行識別。其次會依照數據特征對比結果判斷數據是否重復,同時檢測數據是否完整,即數據是否滿足知識庫內對完整數據的定義,若不滿足則數據不完整,若發現重復則刪除其中任意一項,若發現數據不完整則會通知人工補充[4]。最后將對數據進行關聯性分析,若發現數據關聯性不對稱或不存在關聯性,則判定數據組存在錯誤,單獨列出待人工處理。

圖2:數據管理技術的基本邏輯
本文結合數據管理需求,利用計算機數據庫技術進行了數據庫設計,該數據庫總體框架見圖3。

圖3:數據庫總體框架
結合三大關鍵技術,可展開方案設計工作,該項工作可分為兩個部分,分別是數據庫搭建、數據管理功能設計,具體如下。
2.3.1 數據庫搭建
采用基于云計算的SQL 數據庫技術搭建數據庫:第一統計單次數據導入總量,在網絡空間內劃分出對等儲存資源,生成初始數據庫,該數據庫容量可滿足單次數據導入需求,便于人機交互;第二分布式部署,結合現場計算機數量、從屬、級別,開發對應子系統,并完成子系統安裝、子系統等級劃分等工作,諸如上級部門計算機等級較高,有權對下級部門計算機進行管理,故對應子系統也要符合這種等級關系[5]。完成后將所有子系統與總系統連接,使得子系統內產生的數據會自動進入總數據庫,且子系統可以從總數據庫中調度出數據,以便針對性管理;第三數據分類項目設計,主要根據部門職能差異,對數據進行初步的分類定義,同步設立分類項目,諸如財務部門與財務數據對應,因此要設計財務數據分類項目,以便數據分類清晰,避免數據混亂的現象發生。另外,在之后的應用中如果出現單次數據量級增大的現象,則再次加大資源,可使容量提升,滿足當下需求。
2.3.2 數據管理功能設計
根據數據管理需要,數據管理功能大體有四項:第一數據查詢檢索功能,主要通過編程技術開發數據查詢檢索窗口,結合智能技術,人工在窗口輸入數據關鍵詞,例如數據的某個字段、數據生成日期等,即可得到所有包含關鍵詞的數據,關鍵詞越精確,則檢索結果越精確,以便人工查詢數據;第二數據分類功能,主要根據智能技術得到各項數據的特征,將數據自動導入對應的分類項目中,諸如財務數據將自動被導入財務數據分類項。關于數據分類功能的實現方法,主要是設計對應的智能邏輯,邏輯包含識別流程與識別特征,其中識別流程與圖2“數據特征提取系列”相同,此處不多加贅述,而識別特征見表1(表1僅展示一部分內容)。另外,關于數據完整性、關聯分析功能的實現方法相同,區別僅限于智能邏輯,故此處同樣不進行贅述;第三數據權限管理功能,在子系統部署基礎上不同數據只能為對應部門或人員所用,否則可能會出現數據混亂或其他不良影響,因此需要設計數據權限管理功能。該功能主要采用編程方法實現,編輯部門賬號身份屬性以及數據分類項目屬性,并通過智能技術對賬號身份進行識別,同步獲取賬號身份屬性,在得到身份屬性的基礎上開放對應屬性的數據分類項目,用戶可獲取分類項目中的相關數據,其他數據則無法查看。針對高層或系統管理員的賬號身份屬性,每個數據分類項目中都應當包含對應屬性,使相關用戶能查閱所有數據。另外,數據權限管理功能的基本邏輯比較復雜,除了要針對數據查閱等需求以外,還要考慮到數據修改等權限,而權限所指雖然不同,但基本實現方法相似,只要細心設計即可;第四數據修改功能,因為在實際工作中可能會遇到錯誤數據或不完整數據,這一類數據無法起到實用效果,所以管理人員要對此類數據進行修改。在權限允許的情況下,數據管理人員可雙擊需修改數據,隨即進行修改,該功能實現方法同樣需編程。所有數據管理功能都依托于云計算資源,相關人員可以將這些資源在界面上進行部署、設計,若技術水平有限,也可以通過云供應商服務直接獲取對應功能,以豐富數據管理功能。

表1:數據分類項目的識別特征
新時代下數據管理與網絡關系緊密,諸如數據管理人員需要通過網絡搜集數據,或者要將數據存放到網絡環境中,因此網絡內的一些風險因素會對數據造成安全威脅,故數據安全保護成為了數據管理的重點。針對數據安全問題,現代數據管理人員一般會采用殺毒軟件、防火墻等安全防護手段來管理,但因為風險因素層出不窮,且數據管理人員使用手段的方式簡陋,所以并不能有效保護數據,實際風險水平依然居高不下,故如何進一步加強數據安全保護力度成為了數據管理的一大問題,說明存在數據安全保護需要。
為滿足安全防護需要,需要在數據庫基礎上增設數據庫安全防護體系,該體系主要有數據庫安全防護技術實現。總體上數據安全防護要求比較復雜,故單獨使用某一項技術并不能起到應有效果,因此本文將選擇智能技術與云計算技術進行安全防護。云計算技術主要負責提供防護邏輯,諸如利用云計算技術可以生成用戶認證機制、權限管理機制,該機制作用下能夠對用戶身份進行識別,判斷用戶身份是否合法、用戶身份類型,再根據判斷結果賦予對應權限,即若用戶身份不合法這不賦予任何權限,拒絕其訪問,若用戶身份合法,則根據身份類型予以對應權限[6]。而智能技術主要根據機制執行用戶身份識別工作,即根據用戶身份信息進行判斷,再依照判斷結果決定功能開閉,同時智能技術能夠對外界惡意攻擊等進行識別與學習,若知識庫中具有某種惡意攻擊的記錄,則會直接處理,若沒有記錄則會控制惡意攻擊程序,并且學習,待人工處理完成后,知識庫內會生成對應記錄,下一次即可直接防護,故能夠應對層出不窮的網絡風險。
另外,因為基于云數據庫的SQL 數據庫技術的數據儲存空間位于網絡,而網絡的公共性、公共性會使得數據風險增大,可能會帶來大量安全攻擊,所以在安全防護基礎上,建議通過智能技術與計算機數據庫結合,實現用戶認證功能,該功能可構成封閉式環境,只留下一個接口,用戶必須通過身份認證才能進入數據庫,因此借助用戶認證機制,智能技術可以與計算機數據庫相結合,幫助管理人員對數據安全進行管理。同時數據安全管理要考慮全面,例如針對交換機要借助智能技術開發反入侵功能、針對數據通信渠道要借助加密技術、反監聽技術進行防護,通過這些技術與功能能讓數據管理更加完善,計算機數據庫技術的作用也能充分發揮[7]。
綜上,數據管理工作內容復雜,且在新時代下該項工作難度、量級龐大,遠非人工力所能及,因此需要使用技術手段來進行管理,而計算機數據庫技術自然是不二之選。計算機數據庫技術并不是單指某一項技術,諸如智能技術、云技術等都在其列,因此在技術應用中要結合實際需求進行選擇,組合,在搭建數據庫的同時豐富數據庫功能,并關注數據安全問題,這樣才能幫助人工全面做好各項數據庫管理工作。