所謂IT運維管理是指單位IT部門采用相關的方法、手段、技術、流程和文檔等,對IT運維環境(如硬軟件環境、網絡環境等)、IT業務系統和IT運維人員進行的綜合管理。
IT運維管理主要包括八個方面的管理內容。
設備管理:對網絡設備、服務器設備、操作系統運行狀況進行監控和管理。
應用/服務管理:對各種應用支持軟件如數據庫、中間件、群件以及各種通用或特定服務的監控管理,如郵件系統、DNS、Web等的監控與管理。
數據/存儲/容災的管理:對系統和業務數據進行統一的存儲、備份和恢復。
業務管理:包含對企業自身核心業務系統運行情況的監控和管理.對于業務的管理,主要關注該業務系統的CSF (關鍵成功因素Critical Success Factors)和KFI(關鍵績效指標Key Performance Idicators)。目錄/內容管理:該部分主要對于企業需要統一發布或因人定制的內容管理和對公共信息的管理。
資源資產管理:管理企業中各IT系統的資源資產情況,這些資源資產可以是物理存在的,也可以是邏輯存在的。并可以與企業的財務部門進行數據交換。
信息安全管理:該部分包含了許多方面的內容,目前信息安全管理主要依據的國際標準是ISO17799,該標準涵蓋了信息安全管理的十大控制方面,36個控制目標和127中控制方式,如企業安全組織方式、資產分類與控制、人員安全、物理與環境安全、通信與運營安全、訪問控制、業務連續性管理等。
日常工作管理:該部分主要用于規范和明確運維人員的崗位職責和工作安排、提供績效考核量化依據、提供解決經驗與知識的積累與共享手段。
通過以上對IT運維管理的理解,我們對服務器設備進行了系統的維護,根據企業的實際情況制定了詳細的策略和方法,為服務器穩定運行提供最基礎的保障。
2 企業運維管理的策略和方法
在錯綜復雜的信息環境中,企業要想吸取有效信息 就必須面對跨越異構環境(硬件平臺、操作系統、數據庫平臺……)帶來的層層障礙。針對企業的現狀以及我們對IT運維管理的理解,我們制定的策略和方法。
2.1設備管理
設備管理主要是對網絡設備、服務器設備和操作系統等的運行狀況進行監控和管理。本公司的網絡設備有思科、華為和中興等三家的產品,服務器設備IBM、HP、Sun以及聯想等四家;操作系統更是有AIX、Windows、Unix和Solaris等四種;為保證應用系統安全穩定的運行,各應用系統也由單機系統變成了雙機備份系統,這樣就大大提高了網管系統的效率和可用性。
2.1.1 網絡設備
對于企業來說,功能完善的網絡屬于必備的條件。本公司的網絡設備類型有三種,我們使用HP的軟件在被管節點上安裝代理程序通過SNMP把需要采集的信息,包括性能數據、閾值告警等傳遞到管理站,然后我們的網絡管理員就可以通過網絡管理站來實時的監控獲取到的相關信息來監控網絡運行狀況,為網絡管理和運維提供可靠依據,保證網絡7x24小時穩定運行。
2.1.2 服務器設備
我們首先對設備進行正常的日常維護,除此之外,我們還針對不同設備、應用系統的要求以及維護的要求分別對各類設備進行維護,如我們現有服務器50多臺,一臺一臺地檢查一次至少需要2個小時,既浪費時間也麻煩還容易出錯,給運維帶來很大的工作量,我們根據這種情況通過交換機將各服務器連接起來,組成一個局域網.利用帶外管理軟件來管理和運維,這樣既可以快速發現故障也減少了許多的 作量。
2.1.3 操作系統
操作系統是一管理電腦硬件與軟件資源的程序,同時也是計算機系統的內核與基石。操作系統身負諸如管理與配置內存、決定系統資源供需的優先次序、控制輸入與輸出設備、操作網絡與管理文件系統等基本事務。操作系統是管理計算機系統的全部硬件資源包括軟件資源及數據資源、控制程序運行、改善人機界面、為其它應用軟件提供支持等,使計算機系統所有資源最大限度地發揮作用。目前操作系統的種類繁多,但所有的操作系統具有并發性、共享性、虛擬性和不確定性四個基本特征,根據這些特征,我們制定了各類操作系統的巡檢制度,并結合網管軟件將錯誤日志等通過短信或郵件發給維護人員,使我們能夠及時快速的發現和處理故障策略探討·Strategies Discussed保證業務系統的正常運行。
2.2應用/服務的管理
應用和服務的管理主要是對各種應用支持軟件如數據庫、中間件、群件以及各種通用或特定服務的監控管理.而我們維護主要對數據庫進行日常管理和維護。數據庫是應用軟件的核心,數據庫日常維護工作是系統管理員的重要職責,熟悉數據庫的維護方法對于計算機技術人員解決日常工作中的問題來說是很有幫助的。我們主要從幾個方面對數據庫進行維護。
2.2.1監視系統運行狀況,及時處理系統錯誤
我們通過觀察監視當前用戶以及進程的信息、目標占用空間情況、監視Server的統計數據等對數據庫進行日常巡檢和管理。
2.2.2備份和恢復數據庫數據
利用IBM 公司的TSM 軟件和Acronis軟件.對各系統的數據庫定期進行備份、恢復和歸檔,并定期進行數據庫優化工作。
2.2.3保證系統數據安全。定期更改用戶口令
2.3業務管理
我們的業務系統分為數據采集、綜合展示和短信系統等部分.我們通過HP的采集軟件將網絡設備和服務器設備進行監控,并通過報表和短信系統展示出來,逐漸從傳統的人工監管向利用軟件自動監管的方向過度,并將出現的故障寫入服務流程單,進行總結和歸檔,為以后的維護提供原始資料。
2.4數據/存儲/容災的管理
存儲已經從網絡基礎架構外的一部分發展為網絡的重要組成.從直接連接到服務器上的一塊磁盤到龐大的網絡存儲。存儲管理之所以復雜,是因為它管理的對象龐大而且層次不齊。從廣義上講,凡是一個企業的網絡環境中有數據存放的地方都是存儲,這就包括了數據庫、服務器、用戶終端,甚至鏈接的線路都和存儲發生著緊密的關聯.此外還有那些時而離線時而連線的筆記本電腦、移動硬盤、優盤、閃存等。狹義地講,存儲就是指光盤、磁盤陣列、磁帶庫、NAS、SAN系統等,而無論是廣義概念上的存儲管理還是狹義概念上的存儲管理,都不是一件容易的事情,尤其是在大型的異構網絡環境之中。我們使用的存儲設備是HP StorageWorks Storage系列,利用IBM 的TSM 軟件根據各應用系統的要求制定存儲策略。通過TSM 靈活的策略管理功能,定制數據備份、恢復和存檔,規定哪些數據需要備份或存檔、存儲在哪里以及保存多長時間等。TSM 的調度特性也消除了人工備份和跟蹤的需求.促進了存儲操作向非高峰時間的調度,從而優化了網絡資源和性能。
2.5資源資產管理
資產管理包括所有IT相關的硬件軟件的資產清單、匯總、報表及異常情況報告等管理,資產管理功能從兩個方面實現。
一是管理的資產類別,包括PC機、交換機、服務器等硬件和操作系統、應用軟件等軟件這兩個方面。資產管理不僅可以實時監視資產的當前運行狀況,資產變動,而且對于一些非IT的設備,或者一些無法直接獲取數據的設備也應納入管理范圍,允許用戶手工增加編輯這些設備。對于資產的類別,IT運維管理系統也應允許用戶自由添加、編輯和刪除類別信息,如可以允許用戶增加一個“存儲陣列柜”的資產類別,用戶可以自己編輯相關的屬性。這樣可以實現一個完整的資產管理。
二是基于生命周期的資產管理,資產的生命周期,主要是指資產的采購、入庫、領用、正常使用、維修、庫存、報廢等一系列資產的生命狀態。資產是個動態的概念,我們要隨時掌握當前有哪些設備是正常運行的,哪些處于維修或者庫存狀態。基于生命周期的管理可以全面的考查資產的全面信息。
我們現在根據ITIL流程中的配置流程和更改流程,利用HP的Service Manager軟件將硬件、網絡設備等管理起來,通過管理可以很清楚地知道我們有哪些基礎設施,用在哪里,怎樣合理的使用這些資源等,這樣既可以節約成本也可以提高效率。
2.6信息安全管理
BS 7799信息安全管理體系標準強調風險管理的思想。指導組織建立信息安全管理體系ISMS。ISMS是一個系統化、程序化和文件化的管理體系,基于系統、全面、科學的安全風險評估,體現預防控制為主的思想,強調遵守國家有關信息安全的法律法規及其他合同方要求,強調全過程和動態控制,本著控制費用與風險平衡的原則合理選擇安全控制方式保護組織所擁有的關鍵信息資產,使信息風險的發生概率和結果降低到可接受水平,確保信息的保密性、完整性和可用性,保持組織業務運作的持續性。
3 結論
基于以上的理解,有必要建立一套完善的IT運維管理系統,使得信息管理部門能隨時掌握了解企業信息平臺發生的各種情況,在第一時間感知系統出現的故障和問題,同時應建立響應的快速反應計劃,在出現故障的時候迅速采取措施.恢復網絡或系統的正常運行.一套好的IT運維管理系統可以大大提高工作效率.保障企業各業務系統能夠穩定、高效的運行,為企業創造更大的經濟和社會效益。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:淺談IT運維管理的應用與實踐
本文網址:http://www.guhuozai8.cn/html/consultation/10839410219.html