楊維 鄧志東 馬永波 王雷
摘 要:傳統(tǒng)大型數(shù)據(jù)中心實(shí)現(xiàn)異地雙活是一種必要的發(fā)展趨勢,具有資源利用率高、業(yè)務(wù)連續(xù)性好和災(zāi)備能力強(qiáng)等特點(diǎn)。針對高并發(fā)訪問、海量數(shù)據(jù)處理、應(yīng)急響應(yīng)和災(zāi)難快速恢復(fù)等要求,國家電網(wǎng)公司適時(shí)提出了95598核心業(yè)務(wù)異地雙活系統(tǒng)的建設(shè)方案。以此為基礎(chǔ),介紹了異地雙活環(huán)境下GTM全局負(fù)載均衡總體邏輯架構(gòu),并遵照該架構(gòu)介紹了包括基于DNS域名解析、OSB企業(yè)服務(wù)總線和全局路由表的3種GTM設(shè)備全局負(fù)載均衡關(guān)鍵技術(shù)。最后,兼顧考慮省市接入距離和數(shù)據(jù)中心最大負(fù)載量利用率,提出了一種基于logistic回歸模型預(yù)測潛在用戶數(shù)量的省市用戶優(yōu)化接入方法。
關(guān)鍵詞: 異地雙活; 95598核心業(yè)務(wù)系統(tǒng); GTM全局負(fù)載均衡; 潛在用戶
中圖分類號: F426
文獻(xiàn)標(biāo)志碼: B
Abstract: The implementation of remote dual-activity for traditional large-scale datacenters is a necessary development trend, it has the advantages of high resource utilization, good business continuity and strong disaster recovery capabilities. In response to the requirements of high-level concurrent access, massive data processing, emergency response and rapid disaster recovery, the State Grid timely puts forward a construction scheme of the remote dual-active system for the 95598 core business system. Based on this system, this paper introduces the overall logic architecture of GTM global load balancing under the remote dual-activity, and describes the global load balancing design in detail which includes three key technologies for global load balancing based on DNS domain name resolution, OSB enterprise service bus and global routing table. Finally, taking into account the access distances of provinces and cities and the maximum load utilization rate of data centers, an optimized access method for provinces and cities based on the logistic regression model to predict the number of potential users is proposed.
Key words: remote dual-active; 95598 core business system; GTM global load balancing; potential users
0 引言
目前,越來越多的組織機(jī)構(gòu)選擇異地多數(shù)據(jù)中心的建設(shè)模式進(jìn)行容災(zāi)備份,如銀行、醫(yī)院和社保等[1-3]。根據(jù)國網(wǎng)公司改革總體部署,國網(wǎng)天津客服中心于2012年4月23日正式掛牌成立,下設(shè)南上海、北亦莊兩個(gè)相距100公里以上的分中心。在日常工作中,兩個(gè)系統(tǒng)可以共同承載業(yè)務(wù)的服務(wù),互為備份,保證當(dāng)其中一邊發(fā)生災(zāi)害事件時(shí),另一方接管所有的業(yè)務(wù)服務(wù),是一種充分利用資源的計(jì)算機(jī)災(zāi)備方案,以實(shí)現(xiàn)遠(yuǎn)距離異地雙活。
然而,雙數(shù)據(jù)中心環(huán)境下,數(shù)據(jù)中心要得到整體上較高的服務(wù)水平,也需要考慮均衡數(shù)據(jù)中心之間的負(fù)載均衡。本文結(jié)合異地雙活環(huán)境下95598客戶服務(wù)中心GTM全局負(fù)載均衡總體邏輯架構(gòu),介紹了全局負(fù)載均衡的關(guān)鍵技術(shù),包括GTM設(shè)備基于DNS域名解析、OSB企業(yè)服務(wù)總線和全局路由表的全局負(fù)載均衡方法。之后,兼顧最小化省市接入距離和考慮數(shù)據(jù)中心最大負(fù)載量利用率,提出了一種簡單的基于logistic回歸模型預(yù)測潛在用戶數(shù)量的省市用戶優(yōu)化接入方法。
1 異地雙活系統(tǒng)全局負(fù)載均衡總體邏輯架構(gòu)
95598核心業(yè)務(wù)系統(tǒng)主要包含基礎(chǔ)支撐平臺和業(yè)務(wù)支持系統(tǒng)兩部分。其中,業(yè)務(wù)支持系統(tǒng)作為使用人員的登錄平臺及界面,全面受理95598客戶服務(wù)業(yè)務(wù),負(fù)責(zé)業(yè)務(wù)工單受理、查詢、咨詢等,而基礎(chǔ)支撐平臺作為底層的數(shù)據(jù)支撐,是27個(gè)省公司營銷數(shù)據(jù)來源的存儲數(shù)據(jù)中心,同時(shí)提供對外的企業(yè)服務(wù)總線OSB服務(wù),起到承上啟下的關(guān)鍵作用。95598核心業(yè)務(wù)系統(tǒng)的GTM全局負(fù)載均衡的總體邏輯架構(gòu)圖,如圖1所示。
全局負(fù)載均衡[4-5](global server load balance,GSLB)是指應(yīng)用在生產(chǎn)中心前端、對放置在不同地理位置和不同生產(chǎn)中心間的負(fù)載均衡,實(shí)現(xiàn)將用戶訪問流量快速導(dǎo)向距離其最快、最近的可用生產(chǎn)中心的相對應(yīng)的業(yè)務(wù)系統(tǒng),提高用戶
服務(wù)響應(yīng)速度和訪問體驗(yàn),同時(shí)實(shí)現(xiàn)兩個(gè)異地生產(chǎn)中心之間互相備份和負(fù)載均衡。
異地雙活數(shù)據(jù)中心構(gòu)建在兩個(gè)生產(chǎn)中心的基礎(chǔ)上,需要考慮實(shí)現(xiàn)兩個(gè)生產(chǎn)中心間的協(xié)調(diào)工作,控制廣域流量全局負(fù)載均衡,同時(shí)引導(dǎo)用戶訪問最優(yōu)的生產(chǎn)中心,或者當(dāng)某個(gè)生產(chǎn)中心出現(xiàn)災(zāi)難性故障后,引導(dǎo)用戶通過訪問其他生產(chǎn)中心實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)的訪問,是實(shí)現(xiàn)異地雙活最為關(guān)鍵的問題。
在服務(wù)區(qū)域劃分的過程中,針對省市用戶接入數(shù)據(jù)中心,傳統(tǒng)的做法通常僅僅是依據(jù)依靠地理上的位置分布信息,沒有考慮數(shù)據(jù)中心的用戶負(fù)載量。同時(shí),在區(qū)域內(nèi)訪問用戶數(shù)量的處理上,直接假設(shè)潛在用戶數(shù)與與人口數(shù)成正比。因此,在3.2節(jié)的訪問概率估計(jì)的基礎(chǔ)上,為了優(yōu)化省市接入數(shù)據(jù)中心方案,本節(jié)提出了一種兼顧考慮數(shù)據(jù)中心負(fù)載量的優(yōu)化模型,對基于最小化用戶接入距離的接入方案進(jìn)行重新劃分。
對于電力客服中心多數(shù)據(jù)中心系統(tǒng)來說,不同的省市接入方案都會帶來相應(yīng)的代價(jià)。這里,為更清楚地描述接入代價(jià),需定義0-1二進(jìn)制數(shù),當(dāng)且僅當(dāng)aij值為1時(shí),表示將省市Ui接入數(shù)據(jù)中心Dj,并且規(guī)定每個(gè)省市僅能接入一個(gè)數(shù)據(jù)中心。
首先,從傳統(tǒng)的單數(shù)據(jù)中心改造為多活數(shù)據(jù)中心后,保障各中心的負(fù)載均衡性對于系統(tǒng)性能提升尤為重要,因此,本文定義“均衡代價(jià)”,如式(6)。
其中,調(diào)和系數(shù)α,β滿足和為1,以調(diào)整生成接入方案時(shí)總接入代價(jià)F對于均衡代價(jià)VA和時(shí)延代價(jià)DE的重視程度,即當(dāng)α較大時(shí),方案偏向于考慮負(fù)載均衡性,反之,則偏向于考慮控制總接入距離。此外,為盡可能的協(xié)調(diào)各個(gè)數(shù)據(jù)中心的用戶負(fù)載量,引入λ,γ分別表示數(shù)據(jù)中心的最低利用率和最高利用率,達(dá)到既能夠充分利用數(shù)據(jù)中心的資源量,又避免數(shù)據(jù)中心負(fù)載量過大。
3.4 仿真結(jié)果及分析
在仿真過程中,本文對27個(gè)省市和南北兩個(gè)數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行合理地?cái)?shù)學(xué)化處理,并采用數(shù)據(jù)挖掘工具中的邏輯回歸模型預(yù)測各省市的潛在用戶,結(jié)果如圖5所示。
同時(shí),結(jié)合圖5中估計(jì)的潛在用戶數(shù)和圖6中的各省市到數(shù)據(jù)中心的距離,運(yùn)用LINGO優(yōu)化求解器求解省市用戶接入數(shù)據(jù)中心的優(yōu)化模型。仿真過程中,將各省市的省會到數(shù)據(jù)中心的距離作為省市到數(shù)據(jù)中心的距離,并設(shè)置兩個(gè)數(shù)據(jù)中心的最大用戶負(fù)載量相同,且作為對比,本文同時(shí)實(shí)驗(yàn)了用戶就近接入的方案,即α為0,相關(guān)結(jié)果如圖6—圖8所示。
從圖7和圖8可以看到,在兩個(gè)數(shù)據(jù)中心的最大負(fù)載相同的情況下,按就近接入原則分配時(shí)超過大半的省市用戶都將接入北方分中心,造成該中心負(fù)擔(dān)嚴(yán)重而另一個(gè)中心的資源大量閑置的局面。相反,按照本文的優(yōu)化接入方案,考慮各省市的接入距離和潛在用戶數(shù)量,同時(shí)兼顧數(shù)據(jù)中心的最大負(fù)載量,各省市被合理地分配到南北兩個(gè)數(shù)據(jù)中心,能有效發(fā)揮異地雙中心的優(yōu)勢。同時(shí),由于接入距離一定程度上可以反映訪問時(shí)延,因此隨著調(diào)整調(diào)和系數(shù)α,β的相對大小,可以獲得在負(fù)載均衡性和時(shí)延上的不同要求。
4 總結(jié)
本文簡要介紹了國家電網(wǎng)公司95598客戶服務(wù)中心全局負(fù)載均衡總體邏輯架構(gòu),并詳細(xì)敘述了此架構(gòu)下的3種GTM全局負(fù)載均衡關(guān)鍵技術(shù),包括DNS域名解析、OSB企業(yè)服務(wù)總線和全局路由表。最后,兼顧最小化省市接入距離和考慮數(shù)據(jù)中心最大負(fù)載量利用率,提出了一種基于logistic回歸模型預(yù)測潛在用戶數(shù)量的省市用戶優(yōu)化接入方法。
參考文獻(xiàn)
[1] 魯茜, 徐迅. 異地雙活容災(zāi)技術(shù)在數(shù)字化醫(yī)院信息安全中的應(yīng)用[J]. 企業(yè)科技與發(fā)展, 2015(9): 28-29.
[2] 宋汝勇. “雙活”異地容災(zāi)的技術(shù)方案社保行業(yè)解決方案[J]. 科技經(jīng)濟(jì)導(dǎo)刊, 2016(19): 215.
[3] 秦文劭. 浦發(fā)銀行網(wǎng)上銀行安全體系的構(gòu)建[D]. 上海:復(fù)旦大學(xué), 2012.
[4] 武欣欣, 徐敏, 儲世華. 全局負(fù)載均衡器技術(shù)在雙數(shù)據(jù)中心架構(gòu)下的研究與實(shí)現(xiàn)[J]. 科技風(fēng), 2016(1): 34-35.
[5] 張鵬飛, 魏軍, 李方軍,等. 應(yīng)用層全局負(fù)載均衡及本地負(fù)載均衡研究及設(shè)計(jì)[J]. 電力信息與通信技術(shù), 2015(2): 119-122.
(收稿日期: 2019.08.10)