曹春勇
中郵通建設咨詢有限公司 江蘇南京 210000
云計算屬于現階段新興的一種共享基礎架構的方式,利用云計算可以將巨大的系統池進行連接而后為人們提供各種基礎化的信息服務。與于并行計算、分布式計算以及網絡計算的融合與商業化實現。
在分布式數據管理中主要包括分布式文件系統、鍵值數據庫以及列存數據庫等。而每一個不同的系統所針對的數據處理環節也有所差異。
首先對于分布式文件系統來說,其是根據Hadoop的HDFS構建形成的,而所以HDFS則由數據節點與名字節點兩個節點組合而成。在這其中,名字節點的主要作用就是負責文件數據分布以及文件目錄結構等數據的管理,而對于數據節點來說,其主要負責的工作內容就是對實際業務所產生的數據進行儲存。系統在運行的過程中,客戶端需要對名字節點進行頻繁的訪問,從而獲取到相關有價值的數據信息,也就說明名字節點是整個系統的核心,雖然該系統儲存數據的可靠性比較高,但是僅僅只支持單一化的名字節點,如果名字節點一旦崩潰,則會導致系統無法正常運行。因此,為了能夠提高系統運行的穩定性與可靠性,需要采用更加高科技的元數據管理技術,使HDFS可以具有兩個名字節點,兩個名字節點之間可以實現數據的同步,并為數據讀取服務提供便利。
對于多維查詢來說,其屬于整個數據處理過程中一個非常常用的需求,在進行數據處理時,經常會出現對組件或者多個其他索引列進行區域查詢或點查詢的要求。但是在如今的多個信息系統中,均是采用列存儲數據庫,當對主鍵以外的其他數據進行查詢時,效率比較低,所以為了能夠提高工作效率,實現高性能和低儲存開銷的要求,應采用更加高效的索引技術。
互補聚簇索引屬于一種適用于列存數據庫中的分布式索引技術,采用該技術可以為每一個查詢列創建專門的查詢列值拼接,形成為主鍵的順序表,也可以將其稱作為互補聚簇索引表,這樣一來,就可以提高查詢的效率。
所以,在進行分布式數據管理的過程中,應該重點關注數據的實時同步、故障的切換、數據讀取負載均衡、異常情況的處理以及故障恢復等功能。
經過上述敘述可知,分布式數據管理工作中的重點工作內容就是對數據多節點進行實時處理、應急處理,以及數據備份恢復等方面,所以作為信息系統的管理監理人員,必須要將重點的工作內容作為中心,而后開展相應的管理與監理工作。
根據多節點數據處理的具體要求進行分析,在開展這一項工作時,往往會涉及到大量的設備,而且同時涉及到到貨驗收、設備選型、系統聯調以及安裝調試等多項工作,這樣一來就會導致應急處理、數據備份恢復等工作內容,一定會涉及到安全管理、儲存管理以及風險管理等多方面工作內容[1]。
(1)多節點數據處理方案。多節點也等同于多業務流程、多標準格式等方面,因此為了能夠使布局更加合理化,實現節約成本的目的,可采取以下三種數據處理策略。
首先,是以點帶面,全面開花,因為每一個節點的具體實施情況有所差異,而且地區的發展情況、信息化水平也有所不同,所以可以先對部分節點進行試點部署與調研,總結相關的工作經驗與工作教訓,從而形成更加規范化的總結報告,從中提煉出更加優化的措施與方法,而后推廣實施,對每一個節點進行宣傳與貫徹;其次是實施未,動標準先行。在實際的項目開始之前,應該全面的考慮每一個節點的具體情況,使所有節點都可以保持統一化的思想,并總結前期部分試點所取得的經驗和教訓,將此作為依據,形成完善化的標準與規范,最后在整個建設范圍內進行貫徹與落實;最后是區域劃分合理分組,在實際進行驗收時,該將就近劃分作為主要的原則,并合理劃分工作小組,指定專門的人選作為小組負責人,落實責任制度,從而確保項目可以順利開展與完成。
(2)多節點數據處理方法。首先應審核關鍵的設備,在選擇系統軟件型號前,應該明確實際的需求和整個系統的具體規劃情況,只有這樣才可以選擇出更加具有針對性的系統軟件類型。在選型時也要充分的考慮預算情況。重點關注系統選型的基本核心要素,其中主要包括穩定性、技術性、安全性、先進性以及針對性等,具體的設備選型方法如圖1所示。
其次應做好設備的驗收工作,監理工作的主要內容就是對軟硬件設備的供貨證明、出廠合格證、配件表、說明書以及出廠合格證等文件資料信息進行驗收,如果設備經過進口渠道,則應驗收其相關的海關證明文件[2-3]。
最后,應做好系統的調試工作,監理工作應全程介入到系統集成工程項目的具體實施中,對其進行有目的的參與、檢查和跟蹤,及時發現其中存在的問題,并督促相關的單位或人員進行改正。
總之,無論新興的技術發生任何形式的變化,其本質都是基于傳統技術的眼神,因此,應對傳統的監理手段進行創新與延伸,合理的利用信息系統完成監理工作,發揮云計算的價值與作用。