王鵬濤

摘? 要:隨著國民經濟的不斷增長,科學技術的不斷創新,我國電子商務行業發展得到了質的飛躍。海量數據安全存儲作為現代電子商務建設運營管理過程的重中之重,是一項必不可缺的關鍵內容,直接關系到電子商務系統運行的穩定性,能否保障每個用戶切身利益。因此現代電子商務企業必須高度重視數據安全存儲工作,面對持續增長的電子商務數據要科學采用分布式存儲系統,優化改善不同類型數據存儲組織方式,全面提高電子商務數據安全儲存質量。該文將進一步對電子商務數據存儲展開分析與探討。
關鍵詞:電子商務? 數據? 存儲
中圖分類號:TP333 ? ?文獻標識碼:A 文章編號:1672-3791(2020)01(b)-0020-02
當前是一個互聯網時代,電子商務發展極大地方便了人們的日常生活,同時也給商家帶來了更多創造利益的機會。數據儲存作為電子商務運營管理工作的重要內容,受到了社會各界人士的高度關注,能否將處理好的各項數據安全儲存在系統數據庫中,會直接影響到系統日常運行的穩定性,并為用市場用戶提供更加良好的UE體驗服務。為了保障我國電子商務和諧健康的持續發展,就必須加強對電子商務數據信息的安全存儲保護工作,全面提高電子商務網絡數據安全儲存管理水平。
1? 數據存儲概述
數據存儲實質是指數據流在加工處理過程中產生的臨時文件或者加工處理過程中需要檢索獲取的相關信息。數據存儲方式與數據文件組織存在著密不可分的聯系,其核心在于建立記錄的邏輯與物理順序間對應的關系,明確數據存儲地位,以此來充分提升數據存儲效率。在當前計算機市場上常見的數據存儲方式主要包括了3種,它們分別是DAS、NAS以及SAN,數據存儲應用最為顯著的特征就是不存在統一標準的體系結構[1],這3種數據存儲方式是相輔相成、相互共存的,能夠最大程度地滿足市場企業信息化的應用發展,現代電子商務企業在優化設計數據庫時,要結合自身系統應用環境特點,合理構建出最佳的數據庫運行管理模式,同時科學完善系統數據庫,確保其能夠符合海量數據的安全儲存和高效檢索需求。
2? 電子商務環境數據存儲分析
在現代電子商務行業中阿里巴巴作為龍頭企業,其底下的淘寶網每天都會產生海量的信息數據,這些數據除了包括各種線上產品交易數據信息、用戶信息、門戶網站等,還涉及到淘江湖、社區等信息交流內容,需要為個性化用戶提供其他數據功能作用。而在這些海量數據當中,絕大多數都是以圖片和文字描述的小文件為主,大文件的視頻數據、索引較少。因此,當淘寶網在構建電子商務海量數據存儲模型時,相關技術人員要充分考慮到解決不同大小文件的高效存儲問題,并且還需解決對大量小文件的讀取問題[2],確保整個電子商務系統能夠穩定持續的運行。伴隨著時間的不斷推移,電子商務用戶的不斷增加,電子商務企業將會面臨著更多數據的儲存管理問題,企業需要根據實際情況合理采取數據存儲方式,打造出科學完善的系統數據儲存庫。
3? 電子商務數據存儲模型設計
3.1 Hadoop存儲系統
在我國電子商務數據儲存管理工作中,Hadoop分布式系統是一種常用的從數據儲存系統,像電商市場上的淘寶網、京東以及百度等都在用這種儲存系統。雖然說Hadoop存儲系統最早是為了搜索引擎中的大文件開發的,更加針對于大文件的處理和儲存,不適宜用在大量小文件的處理存儲工作中,但是只要通過對其進行一定的優化設計,就可以最大程度地發揮出該種數據存儲系統的價值作用,促使其能夠為各種大小海量數據提供安全可靠的存儲服務知識。Hadoop存儲系統設計主要包括了兩個部分,它們分別是HDFS(Hadoop分布式文件系統)、Hbase(Hadoop分布式數據庫)。
3.2 海量數據存儲模型設計
海量數據存儲模型的設計主要包括了3個部分內容,分別是主服務器、次服務器以及客戶端。如海量數據存儲模型中主服務器的構成有兩個部分:一部分是主服務器部分,另一部分是查詢主服務器,在優化設計數據存儲模型主服務器時,技術人員要確保主服務器能夠通過主動發送修改信息與查詢主服務器保持一致性[3],這樣能夠保障系統內數據被修改后,查詢主服務器能夠有效獲取到對應的映射數據修改信息;次服務器是由眾多獨立服務器基于網絡連接構成的,其能夠幫助電子商務企業實現對海量數據存儲功能,任何一個次服務器都是由系統主服務器分配決定客戶提交的數據表和文件存儲,當客戶從主服務器上獲取到數據位置信息后,就能夠有效從對應次服務器上獲取到信息數據;客戶端作為海量數據存儲系統中的各種命令發起端,它的主要功能作用是讀取、更新以及創建數據等。客戶端會自動按照用戶的不同命令將其科學有效地分配到對應的服務器當中,倘若是讀取命令就會自動分配到查詢主服務器,倘若是其他邏輯命令就會自動分配到主服務器端。現代電子商務企業要想實現對海量數據的快速檢索讀取,除了要安排專業技術人員設置專門數據查詢部門外,還必須在存儲模型當中優化設計一個全局的兩層次分布式緩存系統,該分布式緩存系統設計可以采用市場上應用較為廣泛的開源Memcached系統來完成。電子商務系統內的主服務器之間、次服務器之間的通信協議都是基于TCP/IP協議的。相關工作人員可以在Hadoop存儲系統中合理設計RPC以此實現兩個協議。
3.3 電子商務數據組織方式
基于現代電子商務發展環境下,海量數據有著多種形式,比如結構化數據與非結構化數據、超媒體數據等。其中結構化數據主要指的是文本數據、非結構化數據指的是圖片視頻、超媒體數據指的是文本信息和多媒體信息的結合產物。在Hbase分布式數據庫搭建過程中,所有存儲數據都會被默認成字符串類型,針對于此,工作人員在處理結構化文本數據時需要采用Hbase分布式數據庫科學存儲對應的字符串[4];對于非結構化數據圖片和視頻數據時,工作人員需要將其以文件形式高效存儲在對應的HDFS中,同時還需在Hbase有效設置對應的描述和地址信息表;而對于以HTML表示的超媒體數據,工作人員需要將HTML數據有效轉換成相對應的XML數據,這樣就能夠將其有效存儲在Hbase分布式數據庫中,轉換后的XML數據更加有助于描述信息內容的方便檢索查詢。電子商務企業在數據存儲管理工作中,還可以根據不同類型數據信息,采取不同次服務器存儲的方式。比如,工作人員通過建立專門的文本次服務器、圖片視頻次服務器等。
4? 結語
綜上所述,現代電子商務企業要高度重視海量數據安全高效存儲管理工作,通過優化設計海量數據存儲模型,有效實現對海量電子商務數據的處理。基于電子商務發展環境下,企業可以通過設計應用Hadoop系統的存儲架構Hbase和HDFS,同時還需注重解決存儲系統中的小文件處理問題,合理增加基于Memcached的分布式緩存系統,根據不同類型數據合理采取對應的存儲組織方式。
參考文獻
[1] 李克然,劉東蘇,鄧媛.電子商務環境下海量數據存儲模型[J].情報雜志,2016(2):54-57.
[2] 袁建軍.電子商務海量數據的獲取、存儲及檢索[J].計算機研究,2017(1):142-143.
[3] 徐國華.數據管理:電子商務數據的存儲問題[J].金融信息化論壇,2018(11):35-37.
[4] 章麗芳.云計算環境下的電子商務數據管理模式研究[J].電腦知識與技術,2017(3):81-83.