引言
服務器技術已經發展幾十年,但隨著互聯網信息技術的發展。云技術和移動平臺成為新的技術標準。為了使終端更便捷,客戶端會采用手持式移動設備和瀏覽器,并要求相關的數據和程序須保留在“云”端。隨著云技術和移動平臺的發展,服務器的數量和規模必將成幾何級數的增長。故障和問題也會成倍增長。但和在個人使用的情況不同,網絡化的服務器由于同時支持眾多的操作者。運行不同的網絡應用程序。管理眾多的本地和遠程設備。其設備的故障診斷就相對復雜。
UNIX本身是為復雜網絡化環境設計的操作系統,而AIX操作系統是最大的系統集成商IBM開發的第二代UNIX,具有性能完善,使用方便,擴充性強,適合企業關鍵業務等特點,所以本文實例均在AIX環境下實現。
1、故障概述
服務器的在線模式故障是指服務器發生了一般性錯誤。這些錯誤雖然不至于系統崩潰。但影響系統的正常運行,影響數據的健壯性,并有進一步擴大危害的可能。系統的問題和故障應該及早發現。并及時進行處理和解決,避免進一步的危害,引起嚴重后果。及早的預判。及早的發現。及早的排查是故障診斷的關鍵。
2、系統故障分析和判斷
系統硬件故障分析可以使用diag命令進行分析和判斷。
在系統管理員狀態下運行命令#diag進行硬件診斷程序。檢測主機內硬件存在的問題。
1)基本系統
2)I/O設備
3)異步設備
4)圖形設備
5)SCSI設備
6)存儲設備
7)通信設備
8)多媒體設備
#diag —S
在所有資源上運行診斷。
3、查看系統的錯誤日志
在系統運行時,一些系統錯誤會記錄在errlog中,其中有些錯誤還會在終端上顯示。檢查錯誤日志可用以下命令
4、DUMP
當系統發生軟硬件故障導致宕機時,系統將搜集故障發生時系統的內存和處理器狀態等信息,產生DUMP文件,并且在液晶屏上顯示888開始的代碼。記錄第二段開始的故障碼,并分析DUMP狀態碼有助于分析故障原因,找到問題所在。
5、日常檢查服務器狀態的項目及其相關命令
作為輔助。定期運行檢查服務器性能的相關工具和命令,有助于掌握服務器狀態,預測故障點,相關命令包括:
Iostat
查看系統I/O狀態。分析CPU對各端口的服務占比,了解硬盤swap空間和內存的數據比例關系。
Vmstat
查看系統虛擬內存狀態信息。
Sar
Sat查看系統活動狀態信息。
Topas
Topas可以監控系統內存,CPU,I/O端口,swap空間的情況
no 命令用來修改內核參數。調整系統性能。
Svmon
svm on 命令用來查看系統當前的內存的具體使用。
6、結論
任何完好的系統它都不可能一點錯誤或故障都沒有,網絡服務器系統在運行時總是會或多或少的問題出現,雖然AIX系統具有自動診斷錯誤和故障的能力,但用戶熟悉系統,并定期監視診斷系統的運行情況,方可避免不必要故障的發生。本文相關維護方法在IBM P520服務器,AIX 6.1操作系統下實現通過。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:服務器在線模式下硬件故障診斷的方法