999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

軟件定義的“可靠性”到底可不可靠

2022-07-19 09:35:04李進(jìn)才
關(guān)鍵詞:定義機(jī)制故障

李進(jìn)才

服務(wù)器宕機(jī)可能是很多運(yùn)維工程師最可怕的噩夢(mèng)。谷歌的一項(xiàng)研究表明大多數(shù)死機(jī)故障是由內(nèi)存問(wèn)題引起的,而且每年有1/3的谷歌服務(wù)器都會(huì)出現(xiàn)可糾正的內(nèi)存故障,而有1 %的谷歌服務(wù)器會(huì)出現(xiàn)不可糾正的內(nèi)存故障,后者是造成系統(tǒng)宕機(jī)的典型情況之一。

如果有人說(shuō),用軟件的方式,可以解決硬件的內(nèi)存問(wèn)題,還能減少30 %的服務(wù)器宕機(jī)故障,你覺得可靠嗎?

當(dāng)前的數(shù)據(jù)中心已經(jīng)走向軟件定義的時(shí)代,從最初的軟件定義網(wǎng)絡(luò)SDN到軟件定義數(shù)據(jù)中心SDDC。為了防止服務(wù)器宕機(jī)的意外發(fā)生,越來(lái)越多的企業(yè)開始考慮軟件定義的解決方案,并通過(guò)軟件定義的可靠性屏蔽服務(wù)器、內(nèi)存等硬件故障帶來(lái)的影響。那么軟件是如何實(shí)現(xiàn)對(duì)內(nèi)存以及服務(wù)器可用性的提升呢?

內(nèi)存故障非常多,就看系統(tǒng)能不能識(shí)別出來(lái),有些故障是內(nèi)存單個(gè)或多個(gè)bit故障,有些是內(nèi)存顆粒故障,有些是內(nèi)存顆粒上的單行或單列的存儲(chǔ)單元出現(xiàn)故障,還有firmware故障、內(nèi)存控制器故障。另外還有一些是內(nèi)存金手指焊接點(diǎn)老化、主板上的內(nèi)存插槽松動(dòng)或有灰塵等引起的故障。

器件質(zhì)量類的故障只能通過(guò)工藝的改進(jìn)來(lái)解決,而信服云要解決的是軟件層面可以控制的bit級(jí)故障。往往大故障來(lái)自于bit級(jí)小故障的持續(xù)積累,這時(shí)要做的就是“防微杜漸”,在小故障發(fā)生的時(shí)候就抓住它、隔離它,避免影響擴(kuò)大。

Intel有一種機(jī)制叫做MCA(MachineCheck Architecture),可以監(jiān)測(cè)這種類型錯(cuò)誤。這個(gè)機(jī)制的運(yùn)行方式是:首先需定義出這些錯(cuò)誤模型,把可以自動(dòng)糾正的錯(cuò)誤叫做CE(Correctable Error),這些往往是任意單比特錯(cuò)誤、部分是單顆粒比特的錯(cuò)誤。但是一些錯(cuò)誤無(wú)法自動(dòng)糾正恢復(fù),會(huì)導(dǎo)致系統(tǒng)宕機(jī),這些錯(cuò)誤被定義為UCE(Uncorrectable Error)。根據(jù)統(tǒng)計(jì),CE/UCE類的問(wèn)題類型占內(nèi)存所有類型問(wèn)題的59 %,所以,如果能夠設(shè)計(jì)一種故障檢查和糾正的機(jī)制,其價(jià)值會(huì)非常大。

這個(gè)全套的錯(cuò)誤檢查和糾正的機(jī)制就是ECC(Error Checking and Correcting)。ECC在遇到故障時(shí)首先會(huì)進(jìn)行問(wèn)題識(shí)別,通過(guò)設(shè)計(jì)內(nèi)存主動(dòng)掃描機(jī)制,可以設(shè)置一天24 h不休(也可以調(diào)整)掃描和發(fā)現(xiàn)故障。識(shí)別后判斷故障位置(這里其實(shí)用到了一些特殊的bit計(jì)算和校驗(yàn)算法),認(rèn)定故障位置后,就嘗試隔離有問(wèn)題的內(nèi)存空間,避免后續(xù)業(yè)務(wù)再次使用該內(nèi)存空間。

業(yè)界主流的IT服務(wù)商都會(huì)利用Intel的MCA機(jī)制進(jìn)行內(nèi)存錯(cuò)誤處理,但是其軟件實(shí)現(xiàn)的精細(xì)化程度不一,比如有些服務(wù)商只是把CE錯(cuò)誤屏蔽掉,或者只是簡(jiǎn)單的告警,沒(méi)有做進(jìn)一步處理;還有一些服務(wù)商即使有告警但是無(wú)法準(zhǔn)確定位到發(fā)生問(wèn)題的插槽。而信服云則提出了一個(gè)風(fēng)險(xiǎn)區(qū)機(jī)制,一旦發(fā)生內(nèi)存錯(cuò)誤,就將問(wèn)題單元置于一個(gè)“緩沖區(qū)”進(jìn)行觀察,當(dāng)CE錯(cuò)誤達(dá)到一定閾值則立刻自動(dòng)隔離有風(fēng)險(xiǎn)的內(nèi)存區(qū)域,避免錯(cuò)誤繼續(xù)擴(kuò)大引起嚴(yán)重的宕機(jī)。

近年來(lái),信服云在內(nèi)存隔離恢復(fù)機(jī)制上不斷優(yōu)化,2022年1月推出的超融合HCI6.7.0中還對(duì)ECC機(jī)制進(jìn)行了增強(qiáng)。該增強(qiáng)機(jī)制的運(yùn)行方式是:首先通過(guò)CPU的BIOS設(shè)置CE Record選項(xiàng),使得硬件識(shí)別出內(nèi)存錯(cuò)誤,一旦發(fā)現(xiàn)CE/UCE錯(cuò)誤,硬件就會(huì)把這個(gè)錯(cuò)誤上報(bào)給信服云的軟件。然后輪到軟件機(jī)制上場(chǎng),OS系統(tǒng)先是判斷這個(gè)內(nèi)存是否被軟件(包括應(yīng)用軟件和操作系統(tǒng))使用,如果沒(méi)有使用就直接隔離,不允許再分配給軟件使用。

如果被軟件使用了,就獲取軟件的上下文,判斷區(qū)分其是被操作系統(tǒng)內(nèi)核(in_kernel)還是被用戶應(yīng)用軟件(in_user)使用。

如果是被應(yīng)用軟件(in_user)使用,對(duì)于CE可糾正錯(cuò)誤,信服云的內(nèi)存ECC增強(qiáng)機(jī)制就用一塊好的內(nèi)存區(qū)域替換掉有錯(cuò)誤的內(nèi)存區(qū)域,這個(gè)過(guò)程中業(yè)務(wù)完全不受影響。如果是UCE不可糾正的錯(cuò)誤,該機(jī)制就重新啟動(dòng)該進(jìn)程,把錯(cuò)誤的內(nèi)存區(qū)域釋放出來(lái)并隔離出去不再使用,進(jìn)程重啟后就可以使用完全正常的內(nèi)存了。

如果是被操作系統(tǒng)內(nèi)核(in_kernel)使用,其內(nèi)存ECC增強(qiáng)機(jī)制就把有錯(cuò)誤的內(nèi)存區(qū)域的信息記錄下來(lái),在系統(tǒng)再次啟動(dòng)的時(shí)候,該機(jī)制會(huì)隔離這些有錯(cuò)誤的內(nèi)存,以保證不會(huì)被再次使用。

推出上述機(jī)制后,信服云在1 000臺(tái)主機(jī)環(huán)境中進(jìn)行了驗(yàn)證。結(jié)果證明,通過(guò)軟件控制的ECC機(jī)制,能夠提前發(fā)現(xiàn)內(nèi)存異常,并且100 %自動(dòng)隔離成功,提前處置以規(guī)避更大的故障影響,總體上相對(duì)原有方式能夠減少30 %的服務(wù)器宕機(jī)故障。

回到開頭的問(wèn)題,用軟件可以解決硬件層面帶來(lái)的問(wèn)題嗎?毫無(wú)疑問(wèn),當(dāng)然可以。信服云的ECC機(jī)制就通過(guò)創(chuàng)新性的軟件技術(shù),更加準(zhǔn)確、智能地控制了服務(wù)器的內(nèi)存故障,有效地提高了IT系統(tǒng)的可靠性。

猜你喜歡
定義機(jī)制故障
故障一點(diǎn)通
自制力是一種很好的篩選機(jī)制
文苑(2018年21期)2018-11-09 01:23:06
奔馳R320車ABS、ESP故障燈異常點(diǎn)亮
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
破除舊機(jī)制要分步推進(jìn)
故障一點(diǎn)通
江淮車故障3例
注重機(jī)制的相互配合
打基礎(chǔ) 抓機(jī)制 顯成效
修辭學(xué)的重大定義
主站蜘蛛池模板: 成年人午夜免费视频| 国产最新无码专区在线| 欧美日韩一区二区三| av在线人妻熟妇| 午夜丁香婷婷| 国产黑丝视频在线观看| 爱爱影院18禁免费| 亚洲最新网址| 好久久免费视频高清| 伊人久久精品亚洲午夜| 国产乱子伦手机在线| 日韩成人午夜| 国产精品视频白浆免费视频| 国产va在线| 亚洲精品老司机| 992tv国产人成在线观看| 一本大道东京热无码av| 成人伊人色一区二区三区| 国产极品美女在线播放| 青草国产在线视频| 国内精品91| 日本黄网在线观看| 免费在线国产一区二区三区精品| 91破解版在线亚洲| 亚洲国产AV无码综合原创| 欧美性天天| 亚洲色图欧美激情| 1024你懂的国产精品| 精品视频一区二区三区在线播| 精品视频免费在线| 国产精品美女在线| 欧美一区二区福利视频| 99视频在线免费| 99视频有精品视频免费观看| 成人在线综合| www.99在线观看| 国产91成人| 国语少妇高潮| 亚卅精品无码久久毛片乌克兰| 日韩欧美国产另类| 伊人丁香五月天久久综合| 国内精品九九久久久精品| 久久夜色撩人精品国产| 日韩在线播放中文字幕| 色综合热无码热国产| 无码人中文字幕| 国产真实乱子伦视频播放| 18禁高潮出水呻吟娇喘蜜芽| 亚洲欧美综合在线观看| 国禁国产you女视频网站| 欧美激情综合一区二区| 天天综合网亚洲网站| 91免费观看视频| av在线5g无码天天| 精品国产91爱| 亚洲第一视频区| 91久久精品日日躁夜夜躁欧美| 久草性视频| 亚洲狠狠婷婷综合久久久久| 88国产经典欧美一区二区三区| 国产欧美日本在线观看| 日韩久久精品无码aV| 国产精品嫩草影院视频| 国产新AV天堂| 99热这里只有免费国产精品| 国产精品国产主播在线观看| 久久这里只有精品23| 美女高潮全身流白浆福利区| 天天综合网色中文字幕| 欧美精品aⅴ在线视频| 国模私拍一区二区| 国产系列在线| 中文字幕在线日本| 福利在线不卡| 九九免费观看全部免费视频| 19国产精品麻豆免费观看| 人妻21p大胆| 亚洲欧洲日韩国产综合在线二区| 亚洲综合日韩精品| 久久永久精品免费视频| 国产爽爽视频| 国产网站免费看|