修復數(shù)據(jù)中心故障中需注意的問題 |
發(fā)布時間: 2012/8/2 19:23:49 |
故障切換和故障恢復流程相當之復雜,并且必需在事先仔細規(guī)劃并測試。當切換到一個備用站點,相應的技術(shù)應當能夠接管應用,尤其是運營系統(tǒng)、網(wǎng)絡訪問以及帶寬、足夠的數(shù)據(jù)存儲、數(shù)據(jù)庫、文件和設備。不過,在切換回原系統(tǒng)之前必需解決一些額外的情況。本篇將分析在故障切換和恢復系統(tǒng)至主站點之前所要解決的各項問題。 如果企業(yè)規(guī)模較大,有諸多辦公室和完善的IT部門,那么在你故障切換和故障恢復時可能不會遇到太大的障礙。這是因為你在倉庫中應當會留有備份資源,比如服務器、桌面系統(tǒng)、筆記本電腦和其它設備,在恢復站點可以進行快速地替換。不過如果你的企業(yè)規(guī)模較小并且沒有這種額外的資源,你的恢復選擇可能會比較局限。 對于中小型企業(yè)(SMB),有許多種災難恢復可供選擇,不過必需在財務資源、員工、物理空間、已有系統(tǒng)和所需數(shù)據(jù)之間進行平衡。 不過當你準備恢復(故障恢復)至原系統(tǒng)時,事故發(fā)生后的環(huán)境可能和之前一樣,但也可能不一樣。在故障恢復時,你通常有兩種可能性:你之前的辦公環(huán)境(假如和事故前沒什么兩樣);抑或是一個不同的場所,部分或甚至全部失去了你原有的辦公空間。 在故障切換時,應當將以下問題作為整體解決的一部分加以考慮確認: 現(xiàn)有系統(tǒng)和相關(guān)軟件可以復制在備用站點中(物理設備和基于云的解決方案)。 所有的重要數(shù)據(jù)(例如日常工作文件)和信息(例如用戶記錄)可以復制在備用站點中,并且時間節(jié)點盡可能接近事故發(fā)生時。 特定的故障切換軟件(例如Double-Take)在兩個站點都可用來啟動故障切換作業(yè)。 有足夠的網(wǎng)絡帶寬(例如通過因特網(wǎng))傳輸數(shù)據(jù)至進行故障切換的備用站點。 當準備恢復至原站點時,測試系統(tǒng)和基礎架構(gòu)來確保其工作正常;確保有足夠的存儲容量處理返回的系統(tǒng)和數(shù)據(jù);并且確保有足夠的網(wǎng)絡帶寬來用于故障恢復。 現(xiàn)在,如果你的原站點并不可用,你的災難恢復規(guī)劃必須啟動如下步驟: 獲取新的硬件(例如服務器、存儲和路由器)和軟件(例如操作系統(tǒng)和應用程序)來支持你實現(xiàn)和原環(huán)境類似的運作環(huán)境。 確?臻g來放置新的IT設備。 獲取新的桌面系統(tǒng)和周邊設備。 安裝故障切換/故障恢復軟件,如果在你的恢復規(guī)劃中有這部分策略的話。 確保網(wǎng)絡帶寬足以支持故障恢復工作。 再次提醒下,如果你是中小型企業(yè),請考慮購買數(shù)TB的外部存儲來備份你的系統(tǒng)和數(shù)據(jù)。這些存儲設備可以在許多辦公供應商那里購得。同時,部署“第二層備份”也是個不錯的作法,以防你的故障切換和故障恢復部署沒有如期工作。 好消息是市場上有大量用于中小型企業(yè)(以及大型企業(yè))的故障切換和故障恢復工具。無論部署何種策略,你需要牢記以下關(guān)鍵點: 確保災難恢復規(guī)劃中的故障切換和故障恢復活動的正常運作。 和已確定的數(shù)據(jù)恢復供應商協(xié)作安排應急備份和恢復。 將災難恢復規(guī)劃文檔化,其中清晰地概括故障切換到備用站點以及故障恢復回主站點或新站點的各項步驟(例如具體腳本)。 建立IT硬件和軟件的主和備用源。 每年測試故障切換和故障恢復流程和系統(tǒng),確保其工作正常。(最好每周末時進行一次測試,不過桌面的演練同樣有效) 明確災難事故中員工的角色和職責。 培訓IT員工故障切換和故障恢復的流程內(nèi)容總結(jié) 確保在進行災難恢復規(guī)劃時,你會考慮將IT運營故障切換至另一個備用站點,并且你如何恢復(故障恢復)至原始站點或可能的新站點。很有可能你的故障恢復會比故障切換更為復雜,因此準備好仔細檢驗所有的可用方式。 本文出自:億恩科技【mszdt.com】 |