如何在災(zāi)難恢復(fù)中作出快速反應(yīng)? |
發(fā)布時間: 2012/5/25 19:35:40 |
中國IDC評述網(wǎng)08月05日報道:當(dāng)你的系統(tǒng)面對災(zāi)難的時候,你有能力“關(guān)閉大門”,阻止破壞的進一步繼續(xù)。下面的這些建議可能會對你有所幫助,幫助你在災(zāi)難恢復(fù)中作出更快的反應(yīng)。
2002年2月1日上午九點十三分,美國航空航天局飛行主管LeRoy Cain意識到哥倫比亞號航天飛機出現(xiàn)了問題,毀滅性的災(zāi)難將不可避免。他迅速發(fā)出命令“關(guān)閉大門”。這項命令的發(fā)布意味著控制中心所有的工作人員都要開始制定適當(dāng)?shù)耐ㄓ崊f(xié)議,保證現(xiàn)有數(shù)據(jù)的安全,為日后的分析做準(zhǔn)備。這樣一來就可以盡可能的捕捉最大量的信息,為日后的災(zāi)難分析提供更多的細節(jié)數(shù)據(jù),并盡可能的減少通訊錯誤,以免影響調(diào)查和恢復(fù)工作的進行。
當(dāng)你的系統(tǒng)出現(xiàn)了問題的時候,你想要知道發(fā)生了什么事,為什么會發(fā)生這樣的事,想知道你自己的處境,想知道該做些什么事才能讓一切走上正軌。你的手頭可能已經(jīng)有了災(zāi)難應(yīng)急指南,告訴你具體應(yīng)該怎么做。但是,你同樣也有能力“關(guān)閉大門”,阻止破壞的進一步繼續(xù)。下面所提供的這些建議可能是你以前從未想到過的,有一些可能也只是小事情,但是,它們卻可以幫助你更快的采取行動,避免局面的混亂。
開通電話
當(dāng)系統(tǒng)出現(xiàn)了問題的時候(特別是遇到了大的災(zāi)難的時候),人們都想要迅速知道到底發(fā)生了什么事情。同樣,有些工作人員需要得到指導(dǎo),要知道自己該怎么去做。
從這一點來看,你會遇到的最糟糕的問題可能就是一個瓶頸。為了讓用戶和管理人員知道發(fā)生了什么事情,知道災(zāi)難恢復(fù)的進展情況,你需要保證公司范圍內(nèi)信息的暢通無阻。你需要開通多種通訊渠道,確保信息能夠迅速傳達到用戶和管理人員那里。對于用戶來說,最糟糕的事情莫過于無法得到信息,被蒙在鼓里了。
開通各種通訊渠道,定期向用戶提供災(zāi)難恢復(fù)的所有最新信息。在必要的情況下,可以指定專人負責(zé)。
你知道應(yīng)用程序都在哪兒嗎?
所有的應(yīng)用程序都不是平等創(chuàng)建的,這是一個無法回避的商業(yè)事實。有一件事你以前可能從未想到過,那就是你在編寫災(zāi)難恢復(fù)程序的時候一般不會給各種不同的應(yīng)用程序排定優(yōu)先順序。而事實上對于公司業(yè)務(wù)的連貫性來說,有一些程序的重要性是其他一些程序所無法比擬的。有的程序是即時的,有的程序是相互影響的,還有的程序是同檔案有關(guān)的。所以要確保一點,那就是要把關(guān)鍵的應(yīng)用程序擺在優(yōu)先的恢復(fù)地位。
當(dāng)災(zāi)難發(fā)生的時候,要確定用戶和所有相關(guān)的IT工作人員已經(jīng)開始著手對自己負責(zé)的應(yīng)用程序進行恢復(fù)。這包括在線恢復(fù)數(shù)據(jù),當(dāng)然也包括恢復(fù)用戶系統(tǒng)的運行。但是,當(dāng)災(zāi)難發(fā)生的時候恢復(fù)軟數(shù)據(jù)、同步收集數(shù)據(jù)并在系統(tǒng)癱瘓時期通過過渡程序發(fā)布數(shù)據(jù)也是十分重要的。如果這些事情沒有小心做好的話,你所遇到的麻煩可能要遠遠超出這場系統(tǒng)災(zāi)難本身。
聯(lián)系合作伙伴
如果系統(tǒng)是在ERP環(huán)境下運行,那么公司和商業(yè)合作伙伴之間就存在者相互影響的或是即時的網(wǎng)絡(luò)。要迅速將系統(tǒng)的中斷通知給這些合作伙伴!同公司內(nèi)部的應(yīng)用程序一樣,公司同合作伙伴共享的擴展程序也需要再次進行同步處理,公司當(dāng)然也希望能夠盡量減少系統(tǒng)癱瘓期間可能的數(shù)據(jù)損失。由于迅速將數(shù)據(jù)發(fā)送到公司的系統(tǒng)(或是從公司的系統(tǒng)獲取數(shù)據(jù))是合作伙伴的職責(zé)所在,所以公司通知的越及時,情況就會越好。
DOS系統(tǒng)
你的災(zāi)難恢復(fù)過程是否包含DOS系統(tǒng)的恢復(fù)呢?如果是的話,那么就要作好充分的準(zhǔn)備,來保持公司業(yè)務(wù)的連貫性。你可以在幾秒鐘之內(nèi)就對DOS系統(tǒng)的關(guān)鍵程序進行變更。
你可以做的不止如此。你可以在控制住局面的情況下將用戶集中到DOS系統(tǒng)當(dāng)中。正如上面曾經(jīng)提到的,要安排好程序的優(yōu)先順序,建立一種垂直的控制程序。
為什么要這樣做呢?原因是多方面的。首先也是最重要的一點,DOS系統(tǒng)平時是不太用于即時用途的,雖然在模擬的情況下可以突然同時讓一千五百名用戶轉(zhuǎn)換到這一系統(tǒng),但是在現(xiàn)實情況下,這樣做可能會帶來又一次災(zāi)難。不要急于求成,企圖一次就解決全部的問題,而應(yīng)該分別采取幾個步驟,這樣就能夠?qū)@種系統(tǒng)轉(zhuǎn)換進行很好的控制,及早發(fā)現(xiàn)問題,防患于未然。其次,如果在用戶轉(zhuǎn)換到DOS系統(tǒng)的過程中會出現(xiàn)什么問題的話,那么這些問題的出現(xiàn)也是會有先后順序的。
是否有黑客?
系統(tǒng)為什么會發(fā)生災(zāi)難?是偶然的事故嗎?或者是出現(xiàn)了什么愚蠢的錯誤?還是有黑客在作怪?
要學(xué)會識別黑客的攻擊,采取適當(dāng)?shù)膶?yīng)措施。大家一定要明白,如果真的是有黑客在作怪的話,必須要迅速采取一些“關(guān)閉大門”的措施。
停止攻擊。如果必須的話,通過關(guān)閉網(wǎng)絡(luò)來隔離系統(tǒng)。如果是服務(wù)器遇到了問題,并且可以鎖定是哪臺服務(wù)器遇到了黑客攻擊的話,可以關(guān)閉該服務(wù)器。你是否有記錄服務(wù)器活動日志呢?是否是在遠端服務(wù)器上進行這項工作呢?(如果是的話,這確實是一個非常好的習(xí)慣。)然后,如果可能的話,迅速對黑客做出識別。你可能能夠封鎖黑客的攻擊途徑,關(guān)閉通路,在幾分鐘之內(nèi)完成系統(tǒng)的備分。
記錄遠端用戶的身份,并將這些用戶的身份迅速保存起來,以防黑客搶在你之前抹去這些身份。如果你不能迅速識別黑客身份的話,就一定要給自己充分詳細的活動資料以備日后的調(diào)查。即使是最狡猾的黑客也難免會留下蛛絲馬跡的。
觀察公司內(nèi)所有的服務(wù)器用戶。在這些用戶當(dāng)中,有沒有人能夠進入服務(wù)器的安全通道呢?有的時候,“黑客”行為是偶然發(fā)生的。某個應(yīng)用程序可能會由于用戶的介入而變得混亂,而對系統(tǒng)造成破壞。有的時候,用戶難免會犯一些錯誤。要了解那些用戶/工作站可能出現(xiàn)問題,迅速對其進行檢查。
最后,不管系統(tǒng)故障的發(fā)生原因如何,是由黑客攻擊引起的,還是其他的什么原因,都要考慮系統(tǒng)鏡像工具的應(yīng)用。這種工具在很多場合都在應(yīng)用,比如說美國宇航局控制中心在應(yīng)對像哥倫比亞號航天飛機失事這樣的災(zāi)難性事故時。應(yīng)用系統(tǒng)鏡像工具有什么好處呢?一旦你的應(yīng)用程序重新恢復(fù)商業(yè)應(yīng)用,你可以重建系統(tǒng)出現(xiàn)問題是的確切數(shù)據(jù)。這不僅可以幫助你判斷什么地方出了問題,還可以幫你找到系統(tǒng)自身存在的弱點。要記住,理想的災(zāi)難恢復(fù)不僅僅是要恢復(fù)系統(tǒng)的運行,還要重建一個更為穩(wěn)定和安全的系統(tǒng)。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |