內(nèi)存技術(shù)篇 |
發(fā)布時間: 2012/7/26 16:30:53 |
如今大容量高速度的內(nèi)存技術(shù)已經(jīng)相當(dāng)成熟了,但對于服務(wù)器而言,穩(wěn)定性勝過一切,然而服務(wù)器內(nèi)存之所以能承擔(dān)服務(wù)器穩(wěn)定性的重任,其中之一的關(guān)鍵技術(shù)就是“內(nèi)存查糾錯技術(shù)”。服務(wù)器中的內(nèi)存我們都知道一般采用帶有ECC技術(shù)的(ECC的英文全稱是“ Error Checking and Correcting”,中文名為“錯誤檢查和糾正”),從這個名稱就可以看出它的主要功能就是“發(fā)現(xiàn)并糾正錯誤”。ECC比以前的奇偶校正技術(shù)更先進(jìn)的方面體現(xiàn)在它不僅能發(fā)現(xiàn)錯誤,而且能糾正這些錯誤。但ECC技術(shù)只能糾正單比特的內(nèi)存錯誤, 當(dāng)有多比特錯誤發(fā)生的時候,ECC內(nèi)存會生成一個不可隱藏(non-maskable interrupt)的中斷 (NMI),系統(tǒng)會中止運行。IBM還有一種更先進(jìn)的特殊內(nèi)存糾錯技術(shù),那就是ChipKill內(nèi)存技術(shù)。而這些技術(shù)是如何使服務(wù)器內(nèi)存進(jìn)行錯誤檢查并糾正呢?在下面這篇文章中將詳細(xì)為您介紹…… [技術(shù)]服務(wù)器內(nèi)存技術(shù)知識充電 看完了上面的文章后,我相信我們對服務(wù)器內(nèi)存已經(jīng)有了個大概的認(rèn)識,或許你認(rèn)為內(nèi)存已經(jīng)為服務(wù)器提供了很大的保險了,但面臨著一些意外的內(nèi)存錯誤,有另外一種技術(shù)比內(nèi)存錯誤糾正技術(shù)有效得多。IBM的內(nèi)存保護(hù)技術(shù)就是保護(hù)由于意外的內(nèi)存錯誤而帶來的損失,它使用的是標(biāo)準(zhǔn)的ECC 168內(nèi)存。它的工作方式有點像在Windows NT的NTFS文件系統(tǒng)下的在線備份磁盤扇區(qū)一樣,當(dāng)操作系統(tǒng)在磁盤上檢測到壞的磁盤扇區(qū)時,它將在另外的扇區(qū)中寫下這些數(shù)據(jù)放一邊留作備用,我們可以認(rèn)為內(nèi)存保護(hù)就是提供在線備份數(shù)據(jù)位。這內(nèi)存錯誤的糾正是通過內(nèi)存控制器來完成的,所以不會增加操作系統(tǒng)的工作量,也不需要操作系統(tǒng)來提供支持,完全與操作系統(tǒng)無關(guān)。因為這是在標(biāo)準(zhǔn)的ECC 168線內(nèi)存起作用的,無需為這種保護(hù)增加另外的開支。 內(nèi)存保護(hù)(在其它系統(tǒng)中也有稱“多余的數(shù)據(jù)位”)技術(shù)最初的發(fā)展是在IBM大型機上,而且在Z系列和I系列服務(wù)器上使用了許多年。在一個2路交叉存取的內(nèi)存系統(tǒng)中,每2片168線ECC內(nèi)存包含144位,但是只有140位是用于數(shù)據(jù)存取和校驗的。余下的4位是沒有用上的,標(biāo)準(zhǔn)的ECC內(nèi)存可以檢測出2位的數(shù)據(jù)錯誤,但它只能糾正一位錯誤。如果在同時內(nèi)存上有多位出錯,那么這整個內(nèi)存讀取就失敗了,此時唯有使系統(tǒng)臨時掛起來,以盡量減少內(nèi)存容量的需求,直到這個節(jié)點被更換。如果具有內(nèi)存保護(hù),那么就可以立即隔離這個失效的內(nèi)存,重寫數(shù)據(jù)在空余的數(shù)據(jù)位。通過這種方法可以在每4對(1個內(nèi)存控制器,有的服務(wù)器不止包括一個內(nèi)存控制器)168線內(nèi)存中修復(fù)4個4位連續(xù)的內(nèi)存錯誤。當(dāng)服務(wù)器下次重啟就會重新檢查內(nèi)存的狀態(tài),如果是內(nèi)存軟錯誤(臨時的),系統(tǒng)重啟后內(nèi)存的這些用于在線數(shù)據(jù)備份的數(shù)據(jù)位就重新釋放了,恢復(fù)空的狀態(tài)。如果是屬于硬故障,這些在線備份數(shù)據(jù)位還會繼續(xù)用來備份,直到更換為止。這種先進(jìn)技術(shù)可以使減少停機機時間,使服務(wù)器持續(xù)保持高效的計算平臺。這對于大型的數(shù)據(jù)庫系統(tǒng)中尤其重要。 前面提到的在線內(nèi)存?zhèn)浞菔橇硪环N更高級別的內(nèi)存保護(hù)。需要注意的是由于系統(tǒng)使用了雙路交叉(2-way Interleaving)訪問技術(shù),所以必須成對安裝雙列直插式內(nèi)存模塊(Dual In-line Memory Module,DIMM)的內(nèi)存條。每個DIMM必須是同一型號的,而且容量相同,否則內(nèi)存系統(tǒng)的性能會受到影響。如果一共有三組內(nèi)存條組,把C組作為在線備份內(nèi)存,其內(nèi)存容量總合要是A、B兩組的容量總合之和。這種技術(shù)特別適用于沒有足夠的計算機系統(tǒng)維護(hù)后人員或者手頭沒有多余的內(nèi)存可以方便替換的場所,像HP ProLiant服務(wù)器的ML 370、DL 380系列產(chǎn)品均采用在線備份模式。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |