IBM服務(wù)器常見的故障及分析 |
發(fā)布時(shí)間: 2012/5/18 19:15:26 |
IBM億恩科技服務(wù)器常見的故障及分析:一、造成億恩科技服務(wù)器無法啟動(dòng)的主要原因: 市電或電源線故障(斷電或接觸不良) 電源或電源模組故障 內(nèi)存故障(一般伴有報(bào)警聲) CPU故障(一般也會(huì)有報(bào)警聲) 主板故障 其它插卡造成中斷沖突 二、億恩科技服務(wù)器無法啟動(dòng)? 檢查電源線和各種I/O接線是否連接正常。 檢查連接電源線后主板是否加電。 將億恩科技服務(wù)器設(shè)為最小配置(只接單顆cpu,最少的內(nèi)存,只連接顯示器和鍵盤)直接短接主板開關(guān)跳線,看看是否能夠啟動(dòng)。 檢查電源,將所有的電源接口拔下,將電源的主板供電口的綠線和黑線短接,看看電源是否啟動(dòng)。 如果判斷電源正常,則需要用替換法來排除故障,替換法是在最小化配置下先由最容易替換的配件開始替換(內(nèi)存、cpu、主板) 三、系統(tǒng)頻繁重啟? 造成系統(tǒng)頻繁重啟的原因: 電源故障(替換法判斷解決) 內(nèi)存故障(可從BIOS錯(cuò)誤報(bào)告中查出) 網(wǎng)絡(luò)端口數(shù)據(jù)流量過大(工作壓力過大) 軟件故障(更新或重裝操作系統(tǒng)解決) 四、億恩科技服務(wù)器死機(jī)故障判斷處理: 億恩科技服務(wù)器死機(jī)故障比較難以判斷,一般分為軟件和硬件兩個(gè)方面: 軟件故障 硬件故障 軟件故障 首先檢查操作系統(tǒng)的系統(tǒng)日志,可以通過系統(tǒng)日志來判斷部分造成死機(jī)的原因。 電腦病毒的原因。 系統(tǒng)軟件的bug或漏洞造成的死機(jī),這種故障需要在判斷硬件無故障后做出,而且需要軟件提供商提供幫助。 軟件使用不當(dāng)或系統(tǒng)工作壓力過大,可以請(qǐng)客戶適當(dāng)降低億恩科技服務(wù)器的工作壓力來看看是否能夠解決 硬件故障 硬件沖突 電源故障或電源供電不足,可以通過對(duì)比計(jì)算億恩科技服務(wù)器電源所有的負(fù)載功率的值來作出判斷。 硬盤故障(通過掃描硬盤表面來檢查是否有壞道) 內(nèi)存故障(可以通過主板BIOS中的錯(cuò)誤報(bào)告和操作系統(tǒng)的報(bào)錯(cuò)信息來判斷) 主板故障(使用替換法來判斷) CPU故障(使用替換法) 板卡故障(一般是SCSI/RAID卡或其他pci設(shè)備也有可能造成系統(tǒng)死機(jī),可用替換法判斷處理) 注意:系統(tǒng)死機(jī)故障需要在處理完后需要在一段時(shí)間內(nèi)進(jìn)行一定壓力的拷機(jī)測試來盡一步檢查故障是否徹底解決。 五、安裝操作系統(tǒng)時(shí)提示找不到硬盤? 故障原因: 無物理硬盤設(shè)備 硬盤線纜連接問題 沒有安裝硬盤控制器驅(qū)動(dòng)或驅(qū)動(dòng)不相符 六、如何獲得驅(qū)動(dòng)程序? 使用隨機(jī)光盤制作相應(yīng)驅(qū)動(dòng) 七、為什么用正確的驅(qū)動(dòng)仍然無法加載硬盤控制器驅(qū)動(dòng)? 查看是否啟用了hostraid功能。 八、新購買的一塊硬盤,安裝到機(jī)器上之后,機(jī)器自檢無法通過? 將新的硬盤取下,機(jī)器是否可以自檢通過; 檢查新增加的硬盤的ID號(hào)是否與原來的硬盤的ID號(hào)相同,如果硬盤的ID號(hào)相同的話,自檢將無法通過。 九、如何格式化SCSI硬盤? 有操作系統(tǒng)的情況:使用磁盤管理工具格式化; 無操作系統(tǒng)的情況:在SCSI管理控制界面格式化; 以ADAPTECRaid卡為例:開機(jī)-出現(xiàn)CTRL+A信息時(shí),按CTRL+A進(jìn)入-選中通道A -選中SCSIUTILITY-將檢測到硬盤-選中要檢測的硬盤 -選中FORMAT可對(duì)硬盤進(jìn)行全面格式化 選中VERIFY可對(duì)硬盤進(jìn)行檢測,檢查是否有壞道 注意:在格式化硬盤時(shí)不能中斷或停電,不然會(huì)損壞磁盤 十、在Aisino系列中有RAID卡機(jī)器,當(dāng)其中一個(gè)硬盤不能正常工作RAID報(bào)警,但系統(tǒng)能正常運(yùn)行,怎么辦? 用一個(gè)新硬盤,確保容量大于或等于不能正常工作的硬盤,最好用相同型號(hào)的硬盤替換即可。 RAID卡相關(guān)常見故障 第一類:RAID卡本身有問題 經(jīng)常表現(xiàn)為RAID信息丟失,硬盤經(jīng)常掉線,不能做REBUILD,開機(jī)自檢時(shí)檢測不到硬盤或時(shí)間長。 典型故障A: 作完RAID1,安裝操作系統(tǒng),一切正常,但第二次重啟系統(tǒng)時(shí),發(fā)出報(bào)警聲,經(jīng)檢查發(fā)現(xiàn)一塊硬盤掉線,REBUILD后,又恢復(fù)正常,但重啟后又掉線。懷疑為硬盤故障,校驗(yàn)硬盤后均無問題。最后更換RAID卡,故障解決。 典型故障B: 機(jī)器經(jīng)常死機(jī),且有時(shí)候啟動(dòng)速度非常慢。觀察系統(tǒng)日志,發(fā)現(xiàn)在系統(tǒng)啟動(dòng)時(shí)有這樣一個(gè)錯(cuò)誤提示:設(shè)備/devices/scsi/port0在傳輸?shù)却臅r(shí)間內(nèi)沒有響應(yīng)。更換RAID卡后,恢復(fù)正常。 第二類:硬盤本身問題 表現(xiàn)為硬盤掉線,在RAID陣列中的狀態(tài)為DEAD,或者在作REBUILD時(shí),作到某一進(jìn)度就不能繼續(xù) 典型故障: 硬盤掉線后,做REBUILD時(shí),作到20%時(shí)出現(xiàn)錯(cuò)誤提示無法繼續(xù)進(jìn)行。在確認(rèn)掉線硬盤,硬盤盒及SCSI電纜都能正常工作后,對(duì)在線硬盤進(jìn)行校驗(yàn),發(fā)現(xiàn)有壞道,修復(fù)硬盤,重做REBUILD,恢復(fù)正常。 第三類:硬盤盒或模組的接觸問題 此類問題經(jīng)常表現(xiàn)為RAID卡根本檢測不到硬盤,此類問題比較簡單,但在處理硬盤盒相關(guān)機(jī)器時(shí),需要注意一些問題。 典型故障: RIAD卡中檢測不到硬盤,把SCSI電纜接到主板的ULTRA160接口上,故障依舊,拔出硬盤盒(不包括硬盤盒后面的托架)更換,故障依舊,IBM小型機(jī)更換硬盤,還是不行。最后卸下硬盤盒后面的托架(非熱插拔部分),發(fā)現(xiàn)后托架上80PIN接口上的一根針彎曲,校直彎針,恢復(fù)正常。 十一、在億恩科技服務(wù)器上使用的SCSI硬盤,為什么硬盤的ID號(hào)不能設(shè)置為7? SCSI控制器中,默認(rèn)將ID=7設(shè)置為硬盤控制器占,所以硬盤的ID號(hào)不能設(shè)置為7 十二、為什么開機(jī)自檢無法通過? 解決方法: 機(jī)器切斷電源,將機(jī)箱打開,用“COMSCLEAR”跳線的跳線帽將“COMSCLEAR”跳線的另外兩個(gè)針短接(跳線參看主板說明書) 機(jī)器加電,自檢,等機(jī)器自檢完閉,報(bào)CMOS已被清除,然后將機(jī)器電源關(guān)掉,把跳線復(fù)原即可 機(jī)器重新開機(jī) 十三、物理內(nèi)存插槽報(bào)錯(cuò) 解決方法: 開機(jī)-按F2進(jìn)入“SETUP”-“ADVANCED”——“MEMORYCONFIGURATION”回車-“CLEARDIMMERRORS”直接回車 十四、為什么處理器報(bào)錯(cuò)或自檢過程中只找到一個(gè)處理器? 解決方法: 開機(jī)——〉按F2鍵,進(jìn)入"SETUP" 1、依次"MAIN"——〉"PROCESSOR"——〉"CLEARPROCESSORERRORS[]":將此選項(xiàng)值設(shè)置為"YES"; 2、依次"ADVANCED"——〉"RESETCONFIGURATIONDATA[]":將此選項(xiàng)的值設(shè)置為"YES"; 3、依次"SERVER"——〉"PROCESSORRESET[]":將此選項(xiàng)的值設(shè)置為"YES"; 4、依次"SERVER"——〉"SYSTEMMANAGEMENT":回車——〉"CLEAREVENTLOG[]":將此選項(xiàng)的值設(shè)置為"YES" 5、按F10,保存退出 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |