唐新宇 陳曉明
摘 要:本文重點探討深度計算評估模型的算法設計原理,從模型構建與程序開發兩方面做出研究,結合大數據學習特征,探討計算評估模型建立的主體方向。并以具體算法應用為例,對設計構建內容進行整理,幫助提升大數據環境下的信息資源更新獲取效率,為深度計算評估模型算法應用提供技術參照。
關鍵詞:大數據特征學習;深度計算;評估模型
中圖分類號:TP301 文獻標識碼:A
文章編號:2096-1472(2018)-07-39-03
1 引言(Introduction)
大數據分析環境下,計算機軟件程序所面對的信息處理任務量較大,數據處理面向信息更新所開展,但在一些軟件使用中也需要對歷史參數進行保留,用于接下來的軟件自我檢測維護。實現參數自我保留功能,需要在原有的歷史數據模型基礎上,對數據進行更新計算,增量性數據分析計算模型是當前比較常用的一種方法[1]。應用增量深度計算模型,能夠在原有數據庫基礎上自動構建出新的數據庫,并對內部信息進行編碼補充,這一系列任務均在網絡環境中自動完成。同時增量式數據處理模型也能夠適應大數據網絡環境下的信息獲取特征,在資源獲取,以及請求對接方面更具有實效性,更新后的數據資源庫,在信息自動獲取方面并不會產生沖突,而是能夠以一種融合的方法共同存在處在應用軟件中。當程序軟件使用中需要對歷史數據與更新后的數據進行調動時,內部數據庫則會自動做出匹配,將所需數據通過傳輸局要發送至程序控制中心,常規狀態下歷史數據與更新后的數據是相互獨立保存的,由此可見該用方法具有極強的信息審核時效性,應用在大數據分析環境下對模型自動更新,以及數據信息自動檢索都有極大的幫助。
2 大數據特征學習中的增量式計算模型基礎構建
2.1 增量式計算評估模型中的參數更新
大數據特征學習環境下開展深度計算評估模型建立,首先需要對參數更新部分進行設計。增量式計算評估模型中,采用歷史信息保留同時更新新的數據資源模式,在此基礎上所開展的參數更新部分模型設計,需要先對歷史保存功能進行構建[2]。歷史數據與更新數據應該存儲在兩個獨立的數據庫中,增量式計算評估模式運行中威保障最高計算速度,數據庫劃分結構也要盡可能的簡便,通過這種方法來降低檢索任務量。自動編碼機的第一層通過編碼函數f將輸入層數據X映射到隱藏層特征h:
計算公式中Sf為一個非線性激活函數,常用的激活函數為Sigmoid函數,即f(z)=1/(1+e-z)。第二層通過解碼畫數將隱藏層特征h映射到網絡的實際輸出z:
大數據環境下,信息更新可以自動完成,在網絡環境下獲取計算所需要的參數資源,通過大數據運算方法來將其融合到評估模型的結構層次中。大數據處理中結構更新如圖1所示。
參數自動更新可以理解為是一種學習能力,為提升深度計算評估效率,在模型構建中采用特征提取的方法來對參數進行更新[3]。在系統結構內部會自動整理出所需要更新部分信息的特征,與網絡環境下所獲取的數據信息進行對比,特征保持一致后則會自動更新檢索,這一方法不僅能夠快速定位所需要更新的范圍,也能提升更新后的數據精準度。實現數據更新環境下的網絡資源與內部數據庫之間的高度融合。
2.2 增量式計算評估模型中的結構更新
結構更新需要在網絡平臺下自動檢索更新補丁,對原有結構中存在的漏洞進行修補,增量式深度計算評估模式中對于結構的更新,是基于環境威脅分析基礎上所構建的。對應用軟件程序所處運行環境中存在的風險做出評估,將風險類型與內部結構做出對比,從而判斷出當前結構是否能夠滿足大數據環境下的信息更新要求。一旦結構中存在風險隱患,則會作為接下來補丁檢索更新的依據,通過風險控制來實現結構構建。對于深度計算模型的每一層而言,假設輸入層和隱藏層分別具有I1·I2·…·In和J1·J2·…·JN的計算特征。當同一系統結構多次使用,可能會出現數據分析計算速度下降的問題,此時必須要進行自動結構檢索更新,更新設計后的結構能夠適應數據深度挖掘需求,原有結構中所存在的數據計算分析速度下降問題也將得到解決。增量式深度數據計算評估模型中,同樣采用保留技術結構同時更新組成方法的模式,為避免冗余結構影響到系統運行速度,在自動更新檢索中也會對冗余部分進行刪除處理,確保完成自動更新后的軟件結構形式是最優化合理的。
2.3 實現增量更新的計算模型構建
數據更新與結構更新實現后需要對深度計算評估模型進行構建,實現深度計算功能的模型構建中主要從兩方面進行。首先是預訓練,預訓練是對結構,以及參數更新算法的確定,確定所需要保留的基本信息,在此基礎上來對每個模塊中所要更新的內容進行自動編碼,形成增量式的高階編碼更新形式。
其中,W等于綜合算法大數據分析模型結果、基礎模型,以及所需要更新的各個結構層次均得到確定后,深度評估計算模型建立也能在此基礎上高效開展。其次是微調,微調則是針對基礎訓練模擬中所存在的漏洞部分進行調整,將計算模型調整成為最適合大數據分析特征的形式,通過這種方法才能夠在網絡環境下高校獲取信息,將其更新并進入到自動對接環節中[4]。微調過程中會對數據進行標簽確定,每一項參數均獨立的編號,這樣便不會影響到最終的深度計算分析、數據微調,以及標簽調整對最終參數獲取都有極大的影響。深度計算分析模型設計中還需要將數據資源整合,在結構內實現數據模型對比堆疊,從而實現分析模塊向總設計系統中的融合。參數更新是一個比較籠統的概念,微調則是對最終數據獲取精準度的保障,微調是在預訓練基礎上所開展的,兩項功能連續開展可以將深度評估計算消耗的時間降至最低。
3 深度計算評估模型算法設計中的數據安全控制措施
3.1 同態加密設計構建
由于大數據特征學習環境下所進行的深度計算評估,建立在網絡環境下開展,因此在更新參數,以及結構期間也可能會產生一部分網絡安全威脅。如果在參數更新過程中對于帶有風險的數據不能有效隔離控制,可能會影響到深度計算評估過程中的安全性,造成數據丟失或者計算評估軟件癱瘓等問題。為預防網絡風險,在開展數據深度計算評估任務期間,會進行同態加密結構構建設計,隨著參數更新實時對數據進行加密保護,確保所下載更新的信息在安全性上可以達到防護標準。大數據這種,采用了DDPCM一維壓縮,壓縮比為8∶1,壓縮標志2b01;Tile2壓縮失敗采用原始格式存儲,壓縮標志2b00;Tile3采用了DDPCM的自適應壓縮壓縮比為5.3∶1,壓縮標志2b10;Tile4采用了DO壓縮格式存儲,壓縮比為4∶1,數據按照這一比例壓縮,進入到更高效的狀態中。同態加密設計體現出數據更新的時效性,能夠隨著參數信息產生零間隔進行加密,經過加密,以及風險預防控制的信息進入到深度計算環節內,也能夠更高效地進行數據轉換,安全加密結構如圖2所示。
通過安全加密結構避免風險隱患造成分析運算系統癱瘓的問題,大數據特征學習環境下首先需要保障數據更新時間,因此同態加密設計中應該重點從同等時間內提升安全性層面來進行。大數據分析與傳統控制方法在最終目的上是一致,但深度計算分析過程卻有很大區別,開展同態加密設計中需要體現出這一不同,能夠面向不同數據分析環境來開展基礎功能層構建。
3.2 同態加密算法應用
由于大數據特征學習環境下所進行的深度計算評估建立在網絡環境下開展,因此在更新參數和結構期間也可能會產生一部分網絡安全威脅,選擇適合高階反向傳播算法的同態加密方案,由于高階反向傳播算法在求解深度計算模型過程中,需要同時用到多次連乘操作和多次連續加法操作,因此必須選擇全同態方案對高階反向傳播算法進行加密。如果在參數更新過程中對于帶有風險的數據不能有效隔離控制,可能會影響到深度計算評估過程中的安全性,造成數據丟失或者計算評估軟件癱瘓等問題。為預防網絡風險,在開展數據深度計算評估任務期間,會進行同態加密結構構建設計,隨著參數更新實時對數據進行加密保護,確保所下載更新的信息在安全性上可以達到防護標準。在對數據進行壓縮時,按照8×8的Tile進行壓縮,原始數據8×8×32bit=2048bit,DDPCM的壓縮后數據:32+32+32+61×2=218bit,由于外部DDR存儲器帶寬一般是2的整數冪,設計上采用128bit總線傳輸,所以DDPCM的壓縮后數據占用的實際帶寬需求為256bit,實際的DDPCM壓縮率為8∶1。同態加密設計體現出數據更新的時效性,能夠隨著參數信息產生零間隔進行加密,經過加密和風險預防控制的信息進入到深度計算環節內,也能夠更高效地進行數據轉換。從而避免風險隱患造成分析運算系統癱瘓的問題,大數據特征學習環境下數據更新時間是首先需要保障的,因此同態加密設計中應該重點從同等時間內提升安全性層面來進行。大數據分析與傳統控制方法在最終目的上是一致,但深度計算分析過程卻有很大區別,開展同態加密設計中需要體現出這一不同,能夠面向不同數據分析環境來開展基礎功能層構建。
3.3 基于同態加密的計算評估算法設計
同態加密與深度計算評估算法相結合,所構建的基礎模型不僅具有大數據環境下學習能力,也能夠實現模型與數據間的融合,提升深度計算評估軟件的適應能力。隨著深度計算評估任務進行來開展同態加密,對數據的評估和分析是在雙重指標引導下共同進行的,尤其是在加密過程中對數據深度挖掘速度的提升,充分運用模糊數據處理模式來提升速度。可以采用一種高級安全的反向傳播算法模式來構建模型,反向傳播對數據安全審核是雙重進行的,單向傳播并且進入到控制系統內發現存在風險威脅時,會將就威脅的信息再次返回到獲取模塊中進行風險評估判斷,確保絕對安全后信息處理任務才能夠得以進行。高階反向傳播算法包括連續加法和連續乘法操作,因此需要采用全同態加密算法對數據進行加密,保證云端在密文上操作的正確性。確定大數據學習特征下參數風險來源,結構和數據自動更新檢索設計中也能進行規避,開展更為高效的數據分析處理任務。計算評估算法的軟件程序匯編與硬件結構組成需要保持一致,通過這種方法來達到強化效果,從而確保最終的管理控制任務能夠安全高效開展。
3.4 云端數據高效獲取模型
云端數據獲取能夠擴大大數據計算評估模型中信息更新的范圍,云端信息處理量十分大,自動更新檢索期間需要保證在單位時間內數據處理任務量,可以與云端獲取量保持一致。提出云端安全深度計算模型,將加密后的數據安全的推送到云端,利用云端強大的計算能力,通過安全高階反向傳播算法在密文上進行操作,高效訓練深度計算模型的參數。云端大數據獲取和分析檢索任務進行過程中,通過優化信息數據獲取模式來提升資源可靠性。在設計基礎模型和軟件程序中,采用雙系統程序設計方法來完成,通過這種方法來提升軟件使用功能穩定性,能夠同時在不同環境下對數據進行檢索和更新獲取。云端環境中分析是面對海量數據資源所進行的,基于特征進行數據資源提取時,也可以首先判斷數據特征獲取范圍,確定宏觀或許范圍后,再進行圍觀的特征調整,從而達到大數據信息資源獲取效率提升目標,云端環境下深度計算評估結構構建如圖3所示。
采用安全加法操作計算原理來進行結構優化,只對通過系統安全驗證的參數進行疊加處理,這樣才能夠保證最終的安全處理速度。安全加法計算所建立的模型對于安全性與風險性區分十分明確,但在面向加法操作過程中開展的數據來源確定分析,還需要對網絡數據獲取環境進一步確定。只有了解環境中所存在的信息安全威脅,開展基礎模型建立中,對于結構安全確定才能更加合理。將加密后的數據推送到云端,云端在密文上執行安全高階反向傳播算法,訓練深度計算模型參數,獲得參數的密文,然后將密文發送回客戶端。計算方法應用時,也可以根據所疊加的基礎結構特征來進行數據安全檢索,體現出環境信息安全威脅在結構中的優化控制。
4 結論(Conclusion)
深度學習模型在大數據特征學習方面依然存在許多關鍵的科學問題。本文圍繞著大數據的本質特征,深入研究了面向大數據特征學習的深度計算模型,提出了一系列針對大數據特征學習的深度計算模型算法。深度學習工作在向量空間,僅適合學習單一類型數據的特征,無法有效的學習異構數據的特征。如何擴展深度學習模型,有效挖掘異構數據的特征,是面向大數據特征學習首要解決的科學問題。針對大數據的異構性,研究了基于張量數據的深度計算模型,從而實現如何將深度學習模型從向量空間擴展到張量空間,設計面向異構數據特征學習的深度計算模型,學習異構數據的特征。設計張量空間中的反向傳播算法,訓練深度計算模型的參數。研究張量空間的距離度量方式,將張量距離引入深度計算模型的誤差函數,捕捉異構數據在張量空間的分布特征。理論分析表明深度學習模型是深度計算模型的特例,深度計算模型則是深度學習模型在高階空間的擴展與泛化。
參考文獻(References)
[1] 謝天宇,曹繼忠,趙姝婷,等.基于大數據深度學習的中醫“證候”到“方劑”的新型算法研究[J].亞太傳統醫藥,2018(1):51-53.
[2] 張佩珩,卜東波,熊勁,等.“面向深度測序大數據量的計算模型與體系結構研究”立項報告[J].科技創新導報,2016(11):163.
[3] 劉晶,和述群,朱清香,等.基于深度學習的線上農產品銷量預測模型研究[J].計算機應用研究,2017,34(8):2291-2293.
[4] 劉洋,劉博,王峰.基于ParameterServer框架的大數據挖掘優化算法[J].山東大學學報:工學版,2017,47(4):1-6.
作者簡介:
唐新宇(1981-),女,碩士,副教授.研究領域:大數據分析,計算機應用.
陳曉明(1981-),男,碩士,高級講師.研究領域:大數據分析,計算機網絡.