你的數(shù)據(jù)中心適合向上擴展還是向外擴展? |
發(fā)布時間: 2012/6/24 16:51:13 |
每個數(shù)據(jù)中心都要使用服務器提供計算資源——處理周期、內(nèi)存空間、網(wǎng)絡和磁盤I/O,工作負載運行需要這些資源,隨著工作負載激增和計算需求增長,服務器資源必須增長或擴展以滿足這些需求,我們將回答一些關于服務器擴展的常規(guī)問題,并考慮這些對企業(yè)的影響。 我們經(jīng)常聽說服務器向上擴展和向外擴展這兩個詞語,但它們究竟是什么,它們又有何區(qū)別呢? Stephen Bigelow:擴展數(shù)據(jù)中心服務器資源的方法一般來說有兩種,第一種是增加更多的服務器,或者說向外擴展,假設某個企業(yè)有一個虛擬服務器運行了五個商業(yè)應用系統(tǒng),總共使用了80%的服務器物理計算容量,如果企業(yè)需要部署更多工作負載,當前服務器可能沒有足夠的資源可供分配,因此企業(yè)可能會再購買和部署一臺服務器來支持新的應用系統(tǒng)。 向外擴展架構也包括集群或分布式計算方法,多臺小服務器共同承擔單個應用系統(tǒng)的計算負載,例如,某個關鍵任務工作負載可能運行在兩臺或更多服務器上,進程可以跨這些服務器以主動/主動配置模式分配,如果其中一臺服務器出現(xiàn)故障,其它服務器可以接管,使應用系統(tǒng)的可用性得到保障,如果需要更多的冗余,集群可以增加更多的服務器進行向外擴展。 現(xiàn)在的服務器與過去的服務器相比,占用同樣的物理空間(如1U或2U機架),但能提供更多的處理、內(nèi)存和I/O資源,并且消耗的能源也更少,這個方法叫做向上擴展,因為物理機可以處理更多或更大的工作負載。 再回顧一下前面的例子,一個虛擬服務器的資源不夠用時,可以在下一個技術更新周期部署具有更多計算資源的新服務器,將所有工作負載從舊服務器遷移到新服務器,舊服務器則淘汰,或分配給其它任務,這樣可以延遲服務器的退役時間。 那數(shù)據(jù)中心什么時候該使用向上擴展服務器,什么時候使用向外擴展服務器呢? Bigelow:我告訴你,你這個問題沒有一個最好的答案,向上擴展和向外擴展這兩種方法都可以為數(shù)據(jù)中心環(huán)境增加計算資源,實際上,它們并不是相互排斥的關系,需要大量小型節(jié)點時,向外擴展方法可能是最好的選擇,對于一個Web服務器農(nóng)場或一個服務器集群,可能需要物理上保證主機冗余,相反,向上擴展服務器可能更適合虛擬服務器整合,讓更多的工作負載駐留在更少的物理服務器上。 虛擬化會平息向上擴展和向外擴展的爭論嗎? Bigelow:從前面的問題你應該能看出一點,實施服務器虛擬化的組織可以通過服務器整合,在計算資源更豐富的服務器上可以承載更多的工作負載,可以減少組織購買服務器的總數(shù),因此向上擴展方法更受重視。 最大的問題是資源分配,資源分配不足或資源濫用都會對向上擴展計劃產(chǎn)生負面影響,虛擬化允許你為每個工作負載提供一個虛擬機,給每個虛擬機分配合適的計算資源,如果你給虛擬機分配太多的資源,如只需要1GB內(nèi)存時你給分配了2GB內(nèi)存,那些過度分配的資源實際上是被浪費掉了,服務器托管的虛擬機就比預期的要少一些,相反,如果管理員給虛擬機分配的資源不足,工作負載可能執(zhí)行得很慢,甚至有可能導致整個服務器崩潰。 如果資源能正確地分配,滿足每個工作負載的需要,那么采用向上擴展服務器的整合方式對企業(yè)來說價值更大。 向上擴展服務器會給數(shù)據(jù)中心造成更多的中斷嗎? Bigelow:向上擴展服務器潛在的故障和工作中斷的確存在,當一個強大的服務器運行一個單一應用系統(tǒng),如一個數(shù)據(jù)庫時,只允許很少的中斷,因為應用程序崩潰或服務器故障意味著這個單一的工作負載需要恢復,只要服務器在運行,或其它合適的服務器可用,就不需要經(jīng)驗豐富的IT人員恢復應用系統(tǒng),這一切都得益于服務器的強大計算功能。 但如果向上擴展服務器被虛擬化,整合眾多工作負載,問題則有點不同,如果服務器出現(xiàn)故障,則有更多工作負載需要恢復,整個過程將需要更多的時間,記住,每個工作負載在恢復時,將使用額外的網(wǎng)絡和其它計算資源。 重要的是要以合適的視角來看待這種中斷,關鍵任務工作負載應該用種彈性策略進行保護,如物理服務器集群或使用EverRun等工具實現(xiàn)冗余虛擬工作負載,當關鍵任務工作負載受到保護時,成功恢復后,它們將保持和原始機器同步,只有非關鍵工作負載要承受較長的停機時間。 向上擴展和向外擴展服務器相比哪個更可靠? Bigelow:向上擴展和向外擴展服務器相比,可靠性通常不錯,有趣的是許多企業(yè)級服務器已經(jīng)將增強可靠性納入到設計中,從而減少意外停機時間,現(xiàn)在入門級服務器已經(jīng)有不錯的可靠性了。 即使是入門級1U服務器也包括冗余電源,其中一個電源出現(xiàn)故障,服務器也可以繼續(xù)運行,與此類似,多核處理器的出現(xiàn)意味著某個核心出現(xiàn)故障,也只有一部分工作負載被迫中斷,受到影響的工作負載也可以轉(zhuǎn)移到其它系統(tǒng)上重新啟動,或者轉(zhuǎn)移到同一個系統(tǒng)上的其它可用處理器上,同樣,當多網(wǎng)絡I/O端口出現(xiàn)時,工作負載流量可以從故障端口轉(zhuǎn)移到正常端口,或者將受影響的工作負載遷移到另一臺性能變化最小服務器,入門級企業(yè)服務器可以實現(xiàn)CPU和網(wǎng)絡端口冗余。 內(nèi)存是服務器可靠性最后的邊界,因為虛擬機是以鏡像的方式駐留在服務器內(nèi)存中的,入門級企業(yè)服務器,如戴爾PowerEdge R510支持ECC內(nèi)存,它可以糾正常見的內(nèi)存中斷,但ECC通常不會保護所有的內(nèi)存故障。 更復雜的服務器,如惠普ProLiant家族,希望通過引入故障冗余內(nèi)存技術(如與RAID1類似的內(nèi)存鏡像,可自動接管故障內(nèi)存模塊的在線備用內(nèi)存模塊,與熱備用磁盤存儲類似)減少停機時間。 本文出自:億恩科技【mszdt.com】 |