高效虛擬化策略實現(xiàn)私有云的性能監(jiān)控 |
發(fā)布時間: 2012/8/10 16:23:33 |
私有云性能監(jiān)控非常重要,不僅能診斷故障,而且確保服務(wù)級別滿足集中化服務(wù)所需。為保證成功,聰明的IT人員經(jīng)常創(chuàng)建高效率的虛擬化策略來完成私有云的性能監(jiān)控。
持續(xù)收集私有云性能監(jiān)控數(shù)據(jù) 私有云主要是關(guān)于流程、自動化、人員管理和整合集中等內(nèi)容。一些私有云使用虛擬化技術(shù)和物理宿主機,所以無論采用哪種工具完成性能監(jiān)控,您需要收集來自于各種宿主機的數(shù)據(jù)。持續(xù)地收集數(shù)據(jù)而不是僅在整合、集中或故障診斷時才去做。 通常,用戶和監(jiān)控系統(tǒng)在問題剛剛產(chǎn)生時不會察覺。只有當(dāng)問題變得嚴重足以影響到用戶使用后才被發(fā)現(xiàn)。通過歷史數(shù)據(jù),您可以看到問題產(chǎn)生的時間;蛟SCPU負載的問題在一周前的病毒掃描程序升級完成后就產(chǎn)生了。您可以在歷史數(shù)據(jù)中輕松發(fā)現(xiàn)這點,幫助解決問題的人員快速地定位、修復(fù)和恢復(fù)到高效狀態(tài)。 私有云性能監(jiān)控還帶來一些非技術(shù)性收益。您希望集中的一些服務(wù),例如各部門的Web服務(wù)器通常不會設(shè)置很多的監(jiān)控。當(dāng)服務(wù)宕機或變慢時,很多部門的做法是簡單重啟。而這種做法是錯誤的。 如果您推動集中服務(wù)的理由是通過監(jiān)控提高可用性和性能,那么各部門很難拒絕。畢竟,您做了正確的事情,而他們沒有。 透明化 透明化也很重要。把云性能數(shù)據(jù)開放給開發(fā)人員和應(yīng)用管理員,這樣他們可以看到自己所做配置選擇對性能的影響。對基于虛擬化架構(gòu)的云而言,類似的一些選擇可能對應(yīng)用本身是有益的,但卻影響到整個環(huán)境的性能。IT系統(tǒng)也講究平衡,包括性能在內(nèi)。某個應(yīng)用的性能目標(biāo)應(yīng)該用文檔記錄,這樣可以盡力去達到而不是超出。超出這些目標(biāo)需要額外的資金和時間投入。 選擇相關(guān)聯(lián)的數(shù)據(jù)采集點對私有云性能進行監(jiān)控 當(dāng)部署私有云性能監(jiān)控系統(tǒng)時,盡可能多地從正確的地點收集相關(guān)聯(lián)維度的數(shù)據(jù)。不要從虛擬化環(huán)境中某臺虛擬機中獲取關(guān)于CPU負載的信息,結(jié)果會是錯誤的。您應(yīng)該從虛擬化平臺角度去獲取準(zhǔn)確數(shù)據(jù)。同樣,內(nèi)存使用率、網(wǎng)絡(luò)I/O、存儲I/O等等也是這樣。 相反,應(yīng)用性能最好從單個服務(wù)器的級別上判斷,可以幫助識別某個集群成員是否已超負荷。 另外,盡可能地以最小粒度收集數(shù)據(jù)。很多性能監(jiān)控工具以5、15或60分鐘的平均數(shù)據(jù)作為歷史數(shù)據(jù),這體現(xiàn)到圖形上就使得峰值數(shù)據(jù)變得平緩。這種平緩帶來一些假象,因為峰值數(shù)據(jù)意義重大。 當(dāng)應(yīng)用響應(yīng)工作時,不是慢慢地進行,而是調(diào)用所有它可用的CPU資源盡可能快速地完成,在圖形上體現(xiàn)為100%的CPU使用率峰值。峰值時間的長度非常重要,這通常代表最終用戶對應(yīng)用快慢的感受。換句話說,是請求和結(jié)果之間的延遲時間。 如果性能監(jiān)控軟件把這些峰值跟空閑時間進行了平均,可能看到的是50%的CPU使用率,從而得到錯誤的結(jié)論認為性能可以滿足。網(wǎng)絡(luò)和存儲連接的工作方式類似。假設(shè)某一分鐘100%的使用率,而下一分鐘為0%,那么平均使用率為50%,看起來不是什么問題。這種情況下通過高解析度軟件進行深入分析很有必要。當(dāng)然保留大量的數(shù)據(jù)和收集高精度數(shù)據(jù)的過程也會消耗CPU、內(nèi)存、網(wǎng)絡(luò)和存儲資源,所以您需要找到平衡點。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |