綠色資源網:您身邊最放(fàng)心的安全下載(zǎi)站! 最(zuì)新軟件|熱門排行|軟件分類|軟件專題|廠商大全

綠色(sè)資源網

技術教程(chéng)
您的位置:首頁電腦醫(yī)院(yuàn)係統故障 → 3大(dà)常見的服務器硬件故障 你是否遭遇過

3大常見的服務器硬件(jiàn)故障 你是否遭遇過

我要評論 2010/11/28 17:00:29 來源:綠色資(zī)源網 編輯:綠色軟件(jiàn)站 [ 中(zhōng) ] 評論:0 點擊:238次

  如今,談及X86服務器平台的CPU,很多人可能對英特爾和AMD兩大芯片巨頭的產品(pǐn)如數家珍,從之前的至強(qiáng)5400到主流的至強5600、至強7500,以(yǐ)及AMD強勁(jìn)的12核心x86處理器“Magny-Cours”(馬尼庫爾)等(děng)等。同(tóng)時,服務器的另外兩個核心在CPU的基礎上作用不(bú)容小視,以帶ECC、ChipKill、熱插(chā)拔技術的內存,防(fáng)止數(shù)據異常丟失的RAID硬盤等組件(jiàn)共同打(dǎ)造出一個堅若磐石的X86服務器。

  但由(yóu)於X86服務器和台式機有著(zhe)很多相似之處(chù),無論是從前期部署、中期(qī)維護到後期管理都有著眾多相似之處。因此,X86服(fú)務器盡管有著成熟穩定(dìng)的架構體係,也不免出現“罷工(gōng)”。特別是企業負載應用得多了,遇到的(de)故(gù)障是很平常的事情,以三大組(zǔ)件出現的故障與大家共同分享,可以有效避免大家在以(yǐ)後的業務平台上出現。

  服務器核心(xīn)——CPU

  危害程度:★

  故障回放:做過測試的朋友知道,一台基於Intel至強服務器,開機無顯示,係統指示燈瘋狂的閃爍(shuò),最直接懷疑是CPU與主板的接觸(chù)不良,但將其更(gèng)換到多路(lù)服務器主板的另外一個CPU插槽之上,依舊沒有反應。

  解決方案:在這種狀況下經測量,CPU電壓居然出現異常,原來是CPU的VRM(Voltage Regulator Module,電壓調節模塊)出現了故障,不(bú)能執行主板上DC電路轉換,無法為CPU提供(gòng)穩定的工作電壓,至此隻能更(gèng)換CPU。

  筆者認為這個故障(zhàng)是比較致命,CPU的損壞將(jiāng)直接導致(zhì)整個服務器的不可用,但(dàn)是CPU本身的安全性是非常高的,故障率(lǜ)極(jí)低。所以在日常維(wéi)護任務中,由於CPU的損壞(huài)導致的服務中斷情況是(shì)較為(wéi)少見,它的危害程(chéng)度不(bú)算太高,如果是(shì)多路(lù)服(fú)務(wù)器更是不用擔心CPU損壞而帶來的服務器宕機了。

  服務器平台(tái)的另外兩大(dà)核心,莫過(guò)於內存和(hé)硬盤,具體到(dào)內存的選擇上,服務器內存與普通台(tái)式機內存還是有一些差異的。仔(zǎi)細觀察過服務器內存的用戶會發現,相比普通內存單麵8顆粒的設計,服務器內存通常單麵有9顆芯片,這就是我(wǒ)們常說的ECC內存。

  服務器讀取性(xìng)能——內存

  危害程度:★★☆

  故障回(huí)放:之前在一台安裝(zhuāng)2條2GB內存的服務器上,由於(yú)自身承載的服務過多(duō),服務器的處理數據的速度越來越慢(màn),於是,通過增(zēng)加(jiā)2條同型號的內存條來(lái)升級服務器。將(jiāng)這些(xiē)內存全部插入主板(bǎn)後,係統檢測隻有6GB,另外2GB內存神秘消失,反複(fù)的插拔新(xīn)的內存(cún)依舊無法正常檢測。

  解決方案:通過服務器產品官方網站了解,該種情況是因為該服(fú)務器的內存插槽(cáo)是配對(duì)使用,1-4、2-5、3-6、7-10、8-11、9-12,新內存插在了2、3槽,無法形(xíng)成配對,自然隻能檢測(cè)出(chū)一(yī)條內存,將內存插到5槽,8GB內存(cún)順利被檢測(cè)。

  可見,服務器內存的優勢不僅僅體現在性(xìng)能上,在容錯能力同(tóng)樣投入(rù)很多精力,目的是為整個(gè)平台(tái)提供高穩定環境(jìng),之前提到的內存采用的ECC(錯誤檢(jiǎn)查和糾正)技術、Register、Chipkill都(dōu)是為了提高內存的穩定性,使各個內存條和插槽(cáo)之(zhī)間能更好的融合。

  作為服務(wù)器存儲終端,硬盤的穩定工作關係到(dào)企業數據的安全(quán),服務器硬盤就是這個核心的數據倉庫,所有(yǒu)的(de)軟件和數據都存儲在這裏,因此服務器硬盤對可靠性和穩定性有著非常高的要求。

  另外,服務器一般需要24*7小時不停的運行(háng),其硬盤也要24小時不停的運轉。因此,服務器硬盤對穩定性和可靠性有著很高(gāo)的要求。服務器(qì)市場上采用的硬盤主要有三種(zhǒng),SATA硬盤、SCSI硬盤以及SAS硬盤,其中SATA硬(yìng)盤主要應用在低端服務器領域,而(ér)SCSI和SAS硬盤則麵向中高端服務器。

  服務器存儲(chǔ)核心——硬盤

  危害程度:★★☆

  故障回放:每台服(fú)務器會出現(xiàn)死機、無征兆的重(chóng)啟(qǐ),如果頻繁出現,就(jiù)會經數據中心IT運維人員進行檢測後發(fā)現是硬盤工(gōng)作時(shí)間(jiān)太長,出現了(le)物理壞道。於是立即將硬盤做備份和更換是最佳解決辦法,將硬盤內的(de)數據導出,結果在(zài)轉移數據(jù)的(de)過程中,不停地彈出I/O錯誤,這直接導致數據轉移的速度非(fēi)常慢,且(qiě)丟失了很多重(chóng)要(yào)數據。

  解決方(fāng)案:這種情況多數是磁(cí)頭或者盤片出(chū)現了錯誤(wù)。如果拆開(kāi)硬盤盤(pán)片出現了劃傷,但麵(miàn)積並不(bú)大,通(tōng)過專業(yè)的公司可以通過更(gèng)換磁頭後重新恢複數(shù)據,恢(huī)複了95%以上的數據,這種(zhǒng)情況相對來說比較幸運。

  但通常說防患於未然(rán),如果這(zhè)個故障發現的及時,在盤片沒有出現更多物理損傷前予以解決,一旦等到盤片損壞嚴重,數據將永久性丟失,為了避免這種狀況的(de)發生建議做到以下:

  在硬盤選(xuǎn)擇上,要專(zhuān)業的服務器硬盤,比如:平均無故障時間超過1600000小時,年故障率低於0.55%,抗震方麵要有300G/2ms的以上的耐衝擊能力等等,此外(wài)應用相關服務器(qì)RAID陣列技術,比如:RAID5,它由至少3塊硬盤組成,在向硬盤寫入數(shù)據信息(xī)的同時(shí),還寫入校驗信息,當其中有1塊硬盤出現故障時,可以根據算(suàn)法從另外2塊硬盤上得出這塊故障硬盤(pán)的(de)數據,安全性大大提高。

  以上(shàng)三大組件的故障僅僅是(shì)拋磚引(yǐn)玉的簡單介紹,其實在服務器故障方麵不僅僅限於這幾點,在電源、管理模塊以及網卡方(fāng)麵也有類似的問題,希望用戶在應用中(zhōng)多多積累經驗,盡可能減小故障的發生(shēng)率,提(tí)供一個穩定靈活的IT應用環境。

關鍵詞(cí):服(fú)務器(qì)硬件故障

閱讀本文後您有(yǒu)什麽感想? 已有 人給出(chū)評價!

  • 0 歡迎喜歡
  • 0 白癡
  • 0 拜托
  • 0 哇
  • 0 加油
  • 0 鄙視
免费人欧美成又黄又爽的视频丨一本色道久久88综合日韩精品丨国产专区日韩精品欧美色丨午夜无遮挡男女啪啪视频丨国产欧美日韩综合精品一区二区丨亚洲精品无码不卡在线播HE丨亚洲精品国产精品国自产观看丨日韩国产高清av不卡