服務(wù)器(qì)常見故障及解決方法簡析
一、造成服(fú)務器無法啟動的主(zhǔ)要原因 :
市電或電源線故障(斷電或接觸不良)
電源或電源(yuán)模(mó)組故障
內存故(gù)障(zhàng)(一般伴有報(bào)警聲)
CPU故障(一(yī)般(bān)也會有報警聲)
主板故障(zhàng)
其它插卡造成中斷衝突
二、服務器無(wú)法啟動(dòng) ?
檢查電源線和各種I/O接線是否連接正常。
檢查連接電源(yuán)線後主板是否加電。
將服務器設為最小配置(隻接單顆cpu,最少的內存,隻連接顯示器和鍵盤(pán))直接短接主板開關跳(tiào)線,看看(kàn)是否能夠啟動。
檢(jiǎn)查電源,將所有(yǒu)的電源接口拔下,將電源的主板供電口(kǒu)的綠線和黑線短接,看(kàn)看(kàn)電(diàn)源是否啟動。
如果判斷電源正常,則需要用替換法來排(pái)除故障,替換法是(shì)在最小化配置下先由最(zuì)容易替換的配件開始替換(內存、cpu、主板)(本文轉(zhuǎn)自河南數據恢複網www.hnsjhf.cn )
三、係(xì)統頻繁重啟 ?
造成係(xì)統頻繁重啟的原因:
電源故障(替換法判斷解決)
內存故障(可從(cóng)Bioses錯(cuò)誤報告中查出)
網絡端口數(shù)據(jù)流量過大(工作壓力過大)
軟件故障(更新或重裝操(cāo)作係統解決)
四、服務器死機故障判斷處理:
服務器死機故障比較難以判斷,一般分為軟件和硬件兩個(gè)方麵:
軟件故障
硬件故障
軟件故障
首先檢查操作係統的係統日誌,可以通過係統日誌來判斷部分造成死機的原因。
電腦病毒的原因。
係統軟(ruǎn)件的bug或漏(lòu)洞造成的死機,這(zhè)種(zhǒng)故障需要在判斷(duàn)硬件無故(gù)障後做出,而且需要軟件提供商(shāng)提供幫(bāng)助。
軟件使用不當或(huò)係統工作壓力過大,可以請客戶適當降(jiàng)低服務器的工作壓力來看看是否能夠解(jiě)決
硬件故障(zhàng)
硬件衝(chōng)突
電源故障或電源供電不足,可以通過對(duì)比計算服務器電(diàn)源所有的負載(zǎi)功率的值(zhí)來作出判斷。
硬盤故障(通過掃描硬盤表麵來檢查是(shì)否有壞道)
內存故障(可以通過主板Bioses中的錯誤報告和(hé)操作係統的報錯信息(xī)來判斷)
主板故(gù)障(使用替換(huàn)法來判(pàn)斷)
CPU故(gù)障(使用(yòng)替換法)
板卡(kǎ)故障(一般是(shì)SCSI/RAID卡或其他pci設備也有可能造成係統死機,可用(yòng)替換法判斷處(chù)理)
注意:係統死機故障需要在處理完後需要在一(yī)段時間(jiān)內進行(háng)一定壓力的拷機測試來(lái)盡一步檢查故障是否徹底解決。
五、安裝操作係統時提示找不到硬盤?
故障原因:
無物(wù)理硬盤設備
硬盤線(xiàn)纜連接問題
沒有安裝(zhuāng)硬盤控製(zhì)器驅動或驅動不相符
六(liù)、如何(hé)獲得驅動程序?
使用隨機光盤製作相應驅動
七、為什麽用正確的驅動仍然無法加載硬盤控製器驅動?
查看是否啟用了hostraid功能。
八、新購買的一(yī)塊硬盤,安裝到機器上之後,機器自檢無法通過?
將新的硬盤取(qǔ)下,機器是否可以自檢通過;
檢查新(xīn)增加的硬盤的ID號是否與原(yuán)來的硬盤的ID號相(xiàng)同(tóng),如果硬盤的ID號相同的話,自檢將無法通過。
九、如何格式化SCSI硬盤?
有操作係統的情況:使用磁盤管理(lǐ)工具格式化;
無操(cāo)作係統的情況:在(zài)SCSI管理控製界麵格式(shì)化;
以ADAPTEC Raid卡為例:開機(jī)-出現(xiàn)CTRL+A 信息(xī)時,按CTRL+A進 入-選中通道A
-選中SCSI UTILITY-將檢測到硬盤-選中要檢測的硬盤
-選(xuǎn)中FORMAT可(kě)對硬盤進行全麵(miàn)格式(shì)化
選中VERIFY可對(duì)硬盤進行檢測,檢(jiǎn)查是否有壞道
注意:在格式(shì)化硬盤時不能中斷或停電,不(bú)然會損壞磁盤
十、在(zài)Aisino 係列中有RAID卡機器,當其中一(yī)個硬盤不能正常工(gōng)作RAID報警,但係統能正(zhèng)常(cháng)運行,怎麽辦?
用一個新硬盤,確(què)保容量大於(yú)或等於不能正常工作的(de)硬盤,最好用相(xiàng)同型號的硬盤替換即可。
RAID卡相關常見故障
第一類: RAID卡本身有問題
經(jīng)常表現(xiàn)為RAID信息丟失,硬盤經常掉線,不能做REBUILD,開(kāi)機自檢時檢測不(bú)到硬盤或(huò)時間長。
典型故障(zhàng)A:
作完RAID1,安裝操作係統,一切正常,但第二次重啟(qǐ)係統(tǒng)時,發出報警聲,經檢查發現(xiàn)一塊硬盤掉線,REBUILD後,又(yòu)恢複正(zhèng)常,但(dàn)重(chóng)啟後又掉線。懷疑(yí)為硬盤故(gù)障,校驗硬盤後均無問題。最後更換RAID卡,故障解決。
典型故障B:
機器經常死機,且有時候啟動速(sù)度非常慢(màn)。觀察係統(tǒng)日誌,發現(xiàn)在(zài)係統啟(qǐ)動(dòng)時有這樣一個錯誤提示:設備/devices/scsi/port0 在傳輸等待的時間內沒有響應。更換RAID卡後,恢複正常。
第二類: 硬盤本身問題
表現為硬盤掉(diào)線,在RAID陣列(liè)中的狀(zhuàng)態為(wéi)DEAD,或(huò)者在作REBUILD時,作到某一進度就不能繼續(xù)
典型故障:
硬盤掉線後,做REBUILD時,作到20%時出(chū)現錯誤提示無法繼(jì)續進行(háng)。在確認掉線硬盤,硬盤盒及SCSI電纜都能正常工作後,對在線硬盤(pán)進行校(xiào)驗,發現有壞道,修複硬盤,重做REBUILD,恢複正常。
第三類(lèi): 硬盤盒或模組的接觸問題
此類問題經常表現為RAID卡根本檢測不(bú)到硬盤,此類問題(tí)比較簡單,但在處理硬(yìng)盤盒相關機器時,需要注(zhù)意一些問題。
典(diǎn)型故障:
RIAD卡中檢測不到硬盤,把(bǎ)SCSI電纜接(jiē)到主板的ULTRA160接口上(shàng),故障依舊,拔出硬(yìng)盤盒(不包括硬盤盒後(hòu)麵的托架(jià))更換,故(gù)障依(yī)舊,更換硬盤,還(hái)是不行。最後(hòu)卸下(xià)硬盤盒(hé)後麵的托架(非熱插拔部分),發現後托架上80PIN接口上的一(yī)根針彎曲,校直彎針,恢複正常(cháng)。
十一、在服務器上使用的SCSI硬盤,為什麽硬盤的ID號不能設置為7?
SCSI控製器中,默認將ID=7設置為硬(yìng)盤控製器占,所以硬盤的ID號不能(néng)設置為7
十二、為什麽(me)開機自檢無法通過(guò)?
解決(jué)方法:
機器切斷電源,將機箱打開,用“COMS CLEAR”跳線的跳線帽將“COMS CLEAR”跳線的另外兩個針短接(跳線參看主板說明書)
機器加電,自檢,等機器自檢完(wán)閉,報CMOS已被清除,然後將機器電源關掉,把(bǎ)跳線複原即可
機器重新開機(jī)
十三、物理內存插槽報錯(cuò)
解決方法:
開機-按F2進入“SETUP”-“ADVANCED”--“MEMORY CONFIGURATION” 回車-“CLEAR DIMM ERRORS” 直接回車
十四、為什麽處理器報錯或自檢過程中隻找到一個處理器?
解決方法:
開機--〉按F2鍵,進入"SETUP"
1、依次"MAIN" --〉"PROCESSOR" --〉"CLEAR PROCESSOR ERRORS [ ]" :將此選項值設置為"YES" ;
2、依次"ADVANCED " --〉"RESET CONFIGURATION DATA [ ] ":將此選項(xiàng)的值設置為" YES" ;
3、依次"SERVER " --〉"PROCESSOR RESET [ ] ":將(jiāng)此(cǐ)選項的值設置為" YES" ;
4、依次"SERVER " --〉"SYSTEM MANAGEMENT ":回車 --〉 "CLEAR EVENTLOG [ ] " :將此選項 的值設置為(wéi)" YES"
5、按F10,保存退出
關鍵詞(cí):服務器
閱讀本文後您有什麽感想? 已(yǐ)有 人給出評(píng)價!
- 1
- 1
- 1
- 1
- 1
- 1