胡珊
(廣州工商學院,廣東 廣州 510850)
傳統算法存在顯著的局限性,應用性能和處理能力有限,為此應積極探討新型算法。常規算法應用后,因為存在熱度聚集問題,較易造成數據缺少收斂性,導致運算精度降低。目前數據篩選算法中,應用范圍較廣、應用評價較好的算法是TSC-SF 算法和UEG 算法這2 種,但是實際應用效果均不理想。
結合云計算技術的人工智能技術常見應用于數據篩選運算,當前技術水平下,通常采用的調度模式為“網-邊緣”調度方法。分析現有資源規模、特點,以網絡數據為依據,利用云中間件構建數學模型,通過模型處理數據資源和業務。通過模型分析可確定調度函數,然后以此為依據定義篩選數據的原則。當前技術方案應用時主要為經濟調度模式,通常將云中心作為數據庫,在數據庫中存儲大量決定參數,包括篩選進程、中間件以及帶寬等。受此影響,在實際調度過程中,各個云中心調度模型時所耗費的成本存在顯著差異。
TSC-SF 算法即時間片累積調度篩選,UEG 算法即超歐里幾何數據篩選。TSC-SF 算法采用分配時間片方法輪詢調度數據,然而實際應用中缺少大規模的調度參數參與,導致其篩選性能低于預期。UEG 算法使用時,業務收斂實現方式是拓撲映射,但是在實際應用中供給側至用戶側未能予以有效資源分配,導致UEG 算法實際應用時篩選質量、篩選效率不理想。因此,優化智能數據篩選算法具有必要性[1]。
想要將用戶任務成本降低至可能范圍內的最低水平,必須大量占用云中心資源,影響系統性能,因此目標用戶任務通常難以以最低成本完成資源調度。在經濟調度應用時,對用戶數據質量要求較高,在支付層處理數據時,通常比較重視支付穩定性評價,積極提高支付效率,但是在任務匹配數據時,通常側重于促進及時匹配以及提高匹配效率,導致算法應用效果較差。智能數據篩選模式不同時,需要動態監控供需側情況,促進供需平衡。與此同時,應明確用戶需求,從而動態驅動云中心資源,使其與用戶需求有效適配。
基于此種背景,優化設計新型經濟調動方案,新算法以調度時間片、用戶需求成本為基礎條件,促進智能化動態驅動匹配,在裁決任務時,調度參數取決于用戶需求聚合度。在此基礎上,采用熱點收斂映射處理方法整合聚合成本因素、一般成本因素以及中心資源,映射處理云中心資源時采用2 組調度序列模式,裁決模式為“時間片-成本”模式,以期通過此種算法優化實現數據篩選提質增效。
在應用經濟模型時,應保證云調度中心盡可能利用現有資源滿足用戶需求。達成此目標后,應積極降低系統資源消耗,從而保證系統運行性能良好。通過交互方法篩選數據可滿足上述要求。基于云計算技術篩選數據時,需要保證算法性能符合數據吞吐容量要求,具有較好的數據可用性,并且一定確定數據篩選時間等。通過設置相關參數調度用戶。本文算法優化中,選取3 個重要參數,分別為用戶可靠度(W-P)、時間片(T-P)、聚焦成本(K-P)。對(W-P)參數、(T-P)參數與(K-P)參數進行抽象化處理,得出裁決函數(W-P)參數、(T-P)參數、(K-P)參數。調度資源過程中使用裁決函數描述調度經濟成本,然后分析經濟成本得出最優解,即作出裁決。云中心可并行處理多個調度任務,當多組用戶需求等待處理時可采用上述裁決函數實施并行處理,以此為背景設計并發調度模型作為數據篩選工具[2]。
在設計模型時,首先設定系統基礎運行原則,并且匹配模式采用“供給側-需求側”模式。調度用戶需求時,當用戶任務大于1 個,并且任務之間無顯著相互影響,可進行并行調度。選取用戶任務時,可通過抽象化處理全部任務為(T-P)性能、(K-P)性能和(W-P)性能。云中心在進行資源調度時,采用鎖模式處理用戶任務,在此種模式中,調度用戶任務時用戶任務與時間片為一對一關系。輪詢調度原則是時間片的基礎運行原則,用戶需求未處理時,系統自動鎖定相關資源。
此種調度屬于“N-M”調度。在此種調度中,云調度中心作為供給側主體,中心在執行任務時主要預期是保證現有資源得到充分利用,同時有效控制時間片成本,從而積極提高經濟效益。用戶作為需求側主體,其在調度過程中任務目標是積極降低聚焦成本,同時保證調度高效率完成。調度過程的主要目標是降耗、提質、增效。假設系統中當前存在N個用戶任務等待系統篩選處理,資源分配情況為Ti,聚焦成本(K-P)、時間片(T-P)符合用戶初始化要求。在調度時,由高到低排序不同任務對應的資源量。當業務為B0時,其對應的時間片為Ti0,對應的資源量為T0,對應的聚焦成本為K0;當業務為Bn-1時,其對應的時間片為Tn-1,對應的資源量為Tn-1,對應的聚焦成本為Kn-1[3]。
時間片即Ti描述為(T-P);聚焦成本K聚焦為(K-P),即K聚焦=(K-P);業務(work)使用W表示,用戶可靠度描述為(W-P)。云系統運行中,第j個時間片描述為Tij,第i個業務描述為Wi,Tij節點處理Wi時,Wi預申請資源用x(i,j)表示。假設Tij范圍系統資源總量用y(j)表示,此時資源分配時符合如下約束條件:
云系統預分配時間片描述為T(i),Wi與的t(i)需求匹配的模型為:
資源j處Wi需要付出代價描述為u(i,j),全部代價描述為u(j),同時u(j)符合如下條件:
使用K描述成本,使用P描述利潤,權重描述為w。K聚焦直接受到成本影響。K聚焦與業務熱點呈正相關。模型參數以模型(1)—模型(4)參數為依據,數據業務聚焦成本描述為K業務聚焦,K業務聚焦權重描述為:
時間片描述為(T-K),影響(T-K)耗費代價的核心因素為系統篩選時間,即T系統篩選。業務開支中時間片權重為:
第n組業務資源需求完成數量描述為L(i,n),時間片冗余使用D描述,根據模型(1)、模型(2)、模型(3)進行模型參數設置。由此可構建如下模型:
業務收斂程度采用用戶可靠度表示,描述為(W-P),系統業務處理水平與(W-P)呈正相關。時間片在系統中運行期間完成的業務量描述為A1,當前業務總量描述為A2,由此創建模型:
疊加模型(4)—模型(6)可得出系統調動效率,描述為(C云-P),符合如下模型關系:
網絡資源分配宏觀預期是基于固定資源量,服務于任意業務即W(i)。在此種情況下,C云-P=T+KP+W-P應符合如下條件:
在構建該模型時參數設置與模型(1)—模型(8)一致。通過拉格朗日法針對該模型求出最優解,得出拉格朗日函數:
針對該函數設定如下條件:
利用該模型計算得出最優聚焦成本K聚焦與時間片Ti。優化供給側資源,根據模型(1)—模型(8)參數設置條件構建如下模型:
結合上述模型可得出如下拉格朗日函數:
一階微分處理該模型,從而得出供給側資源成本P資源、最優時間片Ti最優。
采用仿真實驗方法進行優化后算法應用效果檢驗。分別應用本文優化后算法、TSC-SF 算法以及UEG 算法3 種算法,進行對照分析實驗,評價本文優化后算法的實際應用性能。軟件工具選用MATLAB,構建仿真實驗環境,實施仿真實驗[4]。
仿真指標主要選擇2 項內容,分別為數據處理帶寬與數據篩選業務量。在設置仿真參數時,業務維持時間參數設置為10 h,云資源池密度參數設置為10 以上,設置處理速率為96 Mbps 以上,資源更新周期參數為超過512 s。
篩選業務量分析顯示,本算法具有篩選業務量更大、篩選效率更高、增幅顯著的優勢。資源池中分為2 種資源,分別為低密度資源與高密度資源,如圖1 所示。

圖1 業務量篩選情況
解讀圖1 信息可知:當云資源池滿足不同密度條件時,采用本文建模數據篩選算法時,數據篩選結果與TSC-SF 算法、UEG 算法篩選結果存在一定差異。應用本文算法后,總體篩選業務量呈現持續增長趨勢,其他2 種算法雖然也可見此種趨勢,但是增幅顯著低于本文算法。經過分析認為,此種表現的核心誘因是本文算法中結合聚合度熱點收斂映射,在使用模型運算處理數據時優先處理高聚焦度用戶,即熱點用戶。本文結合熱點收斂映射實現算法優化,降低熱度聚集產生的消極影響,促使數據有效收斂。應用此種算法篩選目標數據時,多方位應用拉格朗日法促進配置均衡,促使業務篩選處理高效率完成。
數據處理帶寬方面,針對不同密度的數據資源,應用TSC-SF 算法、UEG 算法效果相對較差,本文算法應用效果顯著。帶寬測試結果顯示,本算法帶寬水平較高,同時穩定性較好。TSC-SF 算法、UEG 算法存在波動顯著、穩定性較差的問題。本文通過特殊收斂映射機制應用,同時進行拉格朗日法進行算法優化,與傳統算法相比顯著提高了業務處理效率,可更大規模地并行處理業務,具有顯著應用優勢。
綜上所述,當前數據篩選運算中主要采用TSC-SF算法、UEG 算法,但是上述2 種算法均存在一定弊端,處理數據時帶寬、篩選業務量低于預期。本文從當前算法缺陷出發,采用聚合度熱點收斂映射機制構建新型算法,優化供給側與需求側資源匹配,分析用戶可靠度、聚焦成本與時間片,同時進行拉格朗日法促進算法優化,提高了算法應用效率,應用效果顯著。