激情五月天婷婷,亚洲愉拍一区二区三区,日韩视频一区,a√天堂中文官网8

<ul id="buwfs"><strike id="buwfs"><strong id="buwfs"></strong></strike></ul>
    <output id="buwfs"></output>
  • <dfn id="buwfs"><source id="buwfs"></source></dfn>
      <dfn id="buwfs"><td id="buwfs"></td></dfn>
      <div id="buwfs"><small id="buwfs"></small></div>
      <dfn id="buwfs"><source id="buwfs"></source></dfn>
      1. <dfn id="buwfs"><td id="buwfs"></td></dfn>
        億恩科技有限公司旗下門戶資訊平臺!
        服務(wù)器租用 4元建網(wǎng)站

        淺談:數(shù)據(jù)中心災(zāi)備和多活的過去、現(xiàn)在與未來

        5月底的那波運(yùn)維故障余波未了,端午期間阿里云的香港機(jī)房又出現(xiàn)了電力故障,很多金融圈的小伙伴紛紛關(guān)注和討論數(shù)據(jù)中心的災(zāi)備方案。從應(yīng)用和業(yè)務(wù)的角度,談?wù)勎覍?zāi)備和多活架構(gòu)演進(jìn)的一些體會與觀點(diǎn),更多的是還是拋磚引玉。
        淺談:數(shù)據(jù)中心災(zāi)備和多活的過去、現(xiàn)在與未來
        5月底的那波運(yùn)維故障余波未了,端午期間阿里云的香港機(jī)房又出現(xiàn)了電力故障,很多金融圈的小伙伴紛紛關(guān)注和討論數(shù)據(jù)中心的災(zāi)備方案。同時,《大話存儲》的作者張冬寫了一篇《淺談容災(zāi)和雙活數(shù)據(jù)中心》,從底層和硬件實現(xiàn)的角度深入解析了容災(zāi)和雙活的原理和觀點(diǎn),張冬說的“淺談”是謙虛,對底層原理的闡述再淺也不容易。我這篇淺談?wù)娴氖菧\談了,換個角度,從應(yīng)用和業(yè)務(wù)的角度,談?wù)勎覍?zāi)備和多活架構(gòu)演進(jìn)的一些體會與觀點(diǎn),更多的是還是拋磚引玉。

        一、過去:集中式架構(gòu)下的數(shù)據(jù)復(fù)制


        國內(nèi)的災(zāi)備體系建設(shè),起源和最受重視的都是金融行業(yè)。 2005 年 4 月:國信辦發(fā)布了《重要信息系統(tǒng)災(zāi)難恢復(fù)指南》,是國內(nèi)第一份針對災(zāi)難恢復(fù)的指南文件。 2008 年2 月:中國人民銀行發(fā)布了《銀行業(yè)信息系統(tǒng)災(zāi)難恢復(fù)管理規(guī)范》( JR/T0044-2008),是國內(nèi)金融行業(yè)發(fā)布的第一份針對災(zāi)難恢復(fù)的金融國家標(biāo)準(zhǔn)。到 2011 年 12 月,銀監(jiān)會《商業(yè)銀行業(yè)務(wù)連續(xù)性監(jiān)管指引》【 2011 】( 104 號)的發(fā)布,標(biāo)志著國家和行業(yè)監(jiān)管部門對災(zāi)備的重視程度已經(jīng)提升到了一個新的高度,從單純 IT 領(lǐng)域的容災(zāi)備份上升到了保障業(yè)務(wù)持續(xù)運(yùn)行的層面,業(yè)務(wù)連續(xù)性管理( BCM )成為了一個專業(yè)領(lǐng)域受到廣泛重視。

        技術(shù)架構(gòu)層面, IBM 引入的“兩地三中心”概念和架構(gòu)成為了災(zāi)備的代名詞,標(biāo)準(zhǔn)做法是北京上海建兩個生產(chǎn)數(shù)據(jù)中心,再在其中一個城市建一個專門的災(zāi)備中心,滿足生產(chǎn)和災(zāi)備相隔 1000 公里以上監(jiān)管要求。過去金融行業(yè)普遍采取的是集中式架構(gòu),也就是今天常說的“ IOE ”架構(gòu),核心業(yè)務(wù)數(shù)據(jù)通過集中的數(shù)據(jù)庫,最終寫入到集中的存儲中去。因此,“兩地三中心”的災(zāi)備方案就通過數(shù)據(jù)庫的數(shù)據(jù)復(fù)制或者存儲的數(shù)據(jù)復(fù)制技術(shù),在廣域網(wǎng)上進(jìn)行數(shù)據(jù)的復(fù)制,最核心的三個要素是:數(shù)據(jù)庫、存儲、網(wǎng)絡(luò)。

        這種災(zāi)備體系體系架構(gòu)的優(yōu)點(diǎn)和缺點(diǎn)同樣顯著。優(yōu)點(diǎn)是基于數(shù)據(jù)庫和存儲的復(fù)制技術(shù)的通用性很強(qiáng),對于應(yīng)用透明。缺點(diǎn)是這種備份還是數(shù)據(jù)級別的備份,在 RPO (Recovery Point Objective ,企業(yè)能容忍的最大數(shù)據(jù)丟失量)和 RTO ( Recovery Time Objective ,企業(yè)能容忍的恢復(fù)時間)這兩個指標(biāo)中間,更強(qiáng)調(diào)的是數(shù)據(jù)安全。因此,往往投入巨額資金建設(shè)的災(zāi)備中心,只能用于冷備,也叫單活,在需要的時候由人工手工切換生產(chǎn)和災(zāi)備中心。

        這種集中式架構(gòu)下的數(shù)據(jù)復(fù)制架構(gòu),形成很多年了,雖然說是過去,但到今天為止仍然是主流的做法。

        二、現(xiàn)在:論數(shù)據(jù)復(fù)制的異地多活不可能定律


        在過去兩地三中心的架構(gòu)下,大家的普遍痛苦是建一個災(zāi)備中心容易,維護(hù)一個災(zāi)備中心太難了。在單活模式下,為保持生產(chǎn)和災(zāi)備中心的設(shè)備比例,需要不斷的追加災(zāi)備的硬件投入,對于備份數(shù)據(jù)的有效性、恢復(fù)的及時性也要不斷的進(jìn)行驗證演練,同時,出于對災(zāi)備切換之后的數(shù)據(jù)丟失風(fēng)險的考慮,不到萬不得已,企業(yè)是不敢貿(mào)然切換。因此,傳統(tǒng)的災(zāi)備體系就和核武器一樣,是最后一道防線,不得不建,但建完之后,維護(hù)成本非常高,能用到的機(jī)會非常少,投入產(chǎn)出比很低。

        在這樣的情況下,數(shù)據(jù)中心多活很自然的成為大家的追求目標(biāo),如果能和服務(wù)器集群一樣,多個數(shù)據(jù)中心能同時提供服務(wù),災(zāi)備中心也同時承載生產(chǎn)中心的職能,自然是最好的災(zāi)備解決方案。多活方案看上很美,但早在 2008 年,我們在支付寶建第一個災(zāi)備中心時,就發(fā)現(xiàn)基于數(shù)據(jù)復(fù)制異地多活數(shù)據(jù)中心是不可能實現(xiàn)的。

        1. 數(shù)據(jù)庫的多活模式。 如果通過數(shù)據(jù)復(fù)制的方式,就意味著需要實現(xiàn)雙向數(shù)據(jù)復(fù)制,并通過數(shù)據(jù)加鎖的方式解決兩邊的寫沖突,無論是數(shù)據(jù)庫實現(xiàn)還是存儲實現(xiàn)都會帶來性能的急劇下降,對于聯(lián)機(jī)交易系統(tǒng)是不可接受的。

        2. 數(shù)據(jù)庫單活、應(yīng)用多活的模式。 數(shù)據(jù)庫采用傳統(tǒng)單活容災(zāi)模式,讓應(yīng)用通過網(wǎng)絡(luò)訪問遠(yuǎn)程的主數(shù)據(jù)庫,實現(xiàn)應(yīng)用層面的多活,這是一個看似合理的解決方案,也是當(dāng)時支付寶災(zāi)備的建設(shè)目標(biāo)。當(dāng)時相隔 100 公里的機(jī)房的光纖網(wǎng)絡(luò)延時是 2 毫秒,認(rèn)為能滿足應(yīng)用對數(shù)據(jù)庫的訪問。但是真正實施時,才發(fā)現(xiàn)應(yīng)用和數(shù)據(jù)庫之間請求過于頻繁,一個事務(wù)中間往往高達(dá) 10 多次交互,總體延時累加之后就發(fā)現(xiàn)性能無法支撐。這個結(jié)果,對于實時性要求很高的聯(lián)機(jī)交易系統(tǒng)還是不能接受。

        時隔幾年之后,今天又有不少廠商在宣傳基于產(chǎn)品實現(xiàn)的異地多活數(shù)據(jù)中心方案。雖說技術(shù)發(fā)展很快,但我們對此可以有個簡單的判斷:不管基于什么方案,數(shù)據(jù)復(fù)制都是依賴網(wǎng)絡(luò)的,網(wǎng)絡(luò)帶寬可以不斷的擴(kuò)大,而光纖網(wǎng)絡(luò)隨著距離的增長帶來的延時問題是物理學(xué)上的限制,除非找到比光速更快的介質(zhì),否則在依靠底層數(shù)據(jù)模式下不可能找到多活的解決方案。

        三、現(xiàn)在:互聯(lián)網(wǎng)思維下的災(zāi)備創(chuàng)新和技術(shù)突破


        基于以上的認(rèn)識,支付寶在第一個多活數(shù)據(jù)中心的方案嘗試失敗后,很快以互聯(lián)網(wǎng)思維尋找新的解決方案。我們發(fā)現(xiàn),在傳統(tǒng)的兩地三中心的方案里面,異地的備份是要做能切換的應(yīng)用級備份,而支付寶作為第三方支付機(jī)構(gòu),對于災(zāi)備和業(yè)務(wù)連續(xù)性的重視和災(zāi)備目標(biāo)等同于銀行,但當(dāng)時的監(jiān)管要求沒有銀行那么明確。因此,首先從業(yè)務(wù)的目標(biāo)出發(fā),對傳統(tǒng)的災(zāi)備思維進(jìn)行了革新,找到了創(chuàng)新的災(zāi)備解決方案:同城多活加異地數(shù)據(jù)災(zāi)備。

        該方案主要依賴于以下幾個因素:

        1. 同城多數(shù)據(jù)中心。 在光纖延時的問題上,既然異地的網(wǎng)絡(luò)延時無法解決,就繞過該問題。依托于阿里在杭州的企業(yè)骨干網(wǎng),將同城多個機(jī)房通過裸光纖連在一起,發(fā)展同城多中心。在裸光纖距離不超過 40 公里的情況下,可以視為在一個局域網(wǎng)中間,延時可接受。

        2. 數(shù)據(jù)庫分庫分表。 隨著“去 IOE ”的進(jìn)行,支付寶的數(shù)據(jù)庫變成了分布式的 X86 服務(wù)器和 Mysql ,數(shù)據(jù)保護(hù)模式也由集中存儲變成“三副本”,每個數(shù)據(jù)庫的三個副本服務(wù)器分布在同城的三個數(shù)據(jù)中心, 1 主 2 從,由應(yīng)用進(jìn)行數(shù)據(jù)的復(fù)制和一致性的保證。

        3. 應(yīng)用層面實現(xiàn)的同城多活。 數(shù)據(jù)庫實現(xiàn)分布式之后,同城的應(yīng)用可以跨機(jī)房寫數(shù)據(jù)庫,應(yīng)用層面的多活就實現(xiàn)了。而在強(qiáng)化了應(yīng)用層面的容錯和故障處置手段之后,在主數(shù)據(jù)庫故障時,應(yīng)用可快速把主數(shù)據(jù)庫切換到其他機(jī)房的從數(shù)據(jù)庫。在這種機(jī)制下,不單可以實現(xiàn)數(shù)據(jù)庫的多活,而且進(jìn)一步實現(xiàn)了數(shù)據(jù)中心層面的同城多活,理論上任何一個數(shù)據(jù)中心中斷都不會導(dǎo)致業(yè)務(wù)中斷,切換過程也非常簡單。

        4. 異地遠(yuǎn)程數(shù)據(jù)備份。 在相隔 1000 公里的遠(yuǎn)程機(jī)房,由應(yīng)用程序進(jìn)行數(shù)據(jù)的備份。通常只需要把關(guān)鍵的賬務(wù)數(shù)據(jù)變動增量同步過去,由于不用備份應(yīng)用系統(tǒng),實現(xiàn)起來較為簡單。

        支付寶構(gòu)建的這一代災(zāi)備體系,乍一看似乎不符合傳統(tǒng)的金融行業(yè)的規(guī)范,但確實達(dá)到了監(jiān)管的要求,實踐效果非常好。其最大的改變是在保證金融行業(yè)的不丟數(shù)據(jù)(RPO 趨近于 0 )的前提下,對 RTO 數(shù)據(jù)恢復(fù)時間做了分類,在最常見的單節(jié)點(diǎn)或者單機(jī)房的故障場景下, RTO 時間也趨近于 0 ,這是遠(yuǎn)遠(yuǎn)超過傳統(tǒng)的災(zāi)備方案效果。而最極端的同城多機(jī)房故障,這種概率的可能性極低,真要發(fā)生也變成一個需要社會應(yīng)對的問題,在這個情況下,只要遠(yuǎn)程數(shù)據(jù)備份在, RTO 時間長一點(diǎn)也是完全可以接受的事情。這種務(wù)實的災(zāi)備思路看似簡單和取巧,實際上對技術(shù)的要求很高,如果沒有這套分布式架構(gòu)和應(yīng)用的配套改造,仍然是無法實現(xiàn)的。

        四、未來:超融合的異地多活


        基于應(yīng)用的同城多活實施成功后,阿里從 2013 年就開始嘗試在異地多活方面的突破。要異地多活,就不可避免的遇到跨中心數(shù)據(jù)交互和網(wǎng)絡(luò)延時的問題,其解決思路也很簡單,在同城多活的基礎(chǔ)上進(jìn)行“單元化”、“服務(wù)治理”和“異地數(shù)據(jù)交互優(yōu)化”?!皢卧北U厦總€單元之中的基礎(chǔ)設(shè)施、應(yīng)用系統(tǒng)、數(shù)據(jù)庫都齊備,大部分業(yè)務(wù)處理都可以在本單元之中完成;“服務(wù)治理”梳理業(yè)務(wù)之間的耦合關(guān)系,盡量減少和降低跨單元之間的數(shù)據(jù)交互,“異地數(shù)據(jù)交互優(yōu)化”則是降低異地數(shù)據(jù)交互的頻率、提高異地之間數(shù)據(jù)交互的效率,使業(yè)務(wù)系統(tǒng)可以適應(yīng)異地的網(wǎng)絡(luò)延時。具體的一些技術(shù)背景可以參考阿里巴巴技術(shù)保障部畢玄大師前段時間發(fā)表的文章。

        隨著集中式架構(gòu)向分布式架構(gòu)的轉(zhuǎn)換,以及云計算的實施,未來海量系統(tǒng)的運(yùn)維模式之下,對于災(zāi)備和業(yè)務(wù)連續(xù)性的要求會越來越高,多活數(shù)據(jù)中心一定是未來發(fā)展的方向。今天在這個領(lǐng)域,各大 IT 廠商以及 BAT 為代表的互聯(lián)網(wǎng)企業(yè)都在重點(diǎn)發(fā)展,但是趨于兩個極端。傳統(tǒng)廠商局限于硬件和底層層面,把底層做的越來越復(fù)雜,互聯(lián)網(wǎng)公司則采取軟件定義數(shù)據(jù)中心的模式,完全拋棄了硬件的高可靠,把自身的業(yè)務(wù)層做的越來越復(fù)雜。最近的幾個運(yùn)維故障,也表明了當(dāng)前多活還處于一個探索期,方法論和實施經(jīng)驗還需要磨合。

        未來企業(yè)數(shù)據(jù)中心一定是需要簡單最可靠的多活解決方案。個人淺見,未來一個可能的解決方案是超融合架構(gòu)下的多活數(shù)據(jù)中心,總體的復(fù)雜度不會降低,但可以多方分工各自負(fù)責(zé)最擅長的領(lǐng)域,即 IT 廠商提供對于多活的底層技術(shù)支撐,互聯(lián)網(wǎng)公司提供在應(yīng)用開發(fā)框架層面的最佳實踐和指引,各企業(yè)結(jié)合各自的業(yè)務(wù)目標(biāo)做整合與開發(fā)。另外一個可能的趨勢是,隨著云計算實施的深入,未來的生產(chǎn)和災(zāi)備中心都將在基于云來建立,大部分企業(yè)都不再需要單獨(dú)建立數(shù)據(jù)中心。

        河南億恩科技股份有限公司(mszdt.com)始創(chuàng)于2000年,專注服務(wù)器托管租用,是國家工信部認(rèn)定的綜合電信服務(wù)運(yùn)營商。億恩為近五十萬的用戶提供服務(wù)器托管、服務(wù)器租用、機(jī)柜租用、云服務(wù)器、網(wǎng)站建設(shè)、網(wǎng)站托管等網(wǎng)絡(luò)基礎(chǔ)服務(wù),另有網(wǎng)總管、名片俠網(wǎng)絡(luò)推廣服務(wù),使得客戶不斷的獲得更大的收益。
        服務(wù)器/云主機(jī) 24小時售后服務(wù)電話:0371-60135900
        虛擬主機(jī)/智能建站 24小時售后服務(wù)電話:0371-55621053
        網(wǎng)絡(luò)版權(quán)侵權(quán)舉報電話:0371-60135995
        服務(wù)熱線:0371-60135900

        6
        0
        分享到:責(zé)任編輯:小柳

        相關(guān)推介

        共有:0條評論網(wǎng)友評論:

        驗證碼 看不清換一張 換一張

        親,還沒評論呢!速度搶沙發(fā)吧!