萊鋼寬厚板廠的生產和管理由MES 信息系統來支撐,當MES 系統出問題時,維護人員才查找、解決問題。這種運行維護模式非常被動,已經不能適應企業生產管理的需求。為此,基于ITIL 管理理念和遵循面向對象的設計結構,融合網絡、主機系統、應用服務、業務管理等因素,從業務視角出發,為實現各項管理數據的共享集中、互通互融,開發了萊鋼MES 信息系統的運行維護管理系統。
1 ITIL簡介
ITIL(Information Technology Infrastructure Library,信息技術基礎設施庫)是IT 服務管理的國際標準,提供了IT 服務管理的知識框架體系,主要用于IT 服務運營階段。IT 運維服務是IT 管理的核心和重點部分,信息部門內部日常運營管理,涉及IT業務系統和運維人員2 部分,主要包括7 項管理服務內容:1)設備管理,對網絡設備、服務器設備、操作系統運行狀況進行監控和管理。2)應用/服務管理,對各種應用支持軟件如數據庫、中間件、群件以及各種通用或特定服務的監控管理,如Tuxedo、Oracle、Web 等的監控與管理。3)數據/存儲/容災管理,對系統和業務數據進行統一存儲、備份和恢復。4)業務管理,包含對企業自身核心業務系統運行情況的監控與管理,對于業務的管理,主要關注該業務系統的CSF(關鍵成功因素)和KPI(關鍵績效指標)。5)目錄/內容管理,該部分主要對于企業需要統一發布或因人定制的內容管理和對公共信息的管理。6)資源資產管理,管理企業中各IT 系統的資源資產情況,這些資源資產可以是物理存在的,也可以是邏輯存在的,并能夠與企業的財務部門進行數據交互。7)信息安全管理,目前信息安全管理主要依據的國際標準是ISO 17799,該標準涵蓋了信息安全管理的10 大控制方面、36 個控制目標和127種控制方式,如企業安全組織方式、資產分類與控制、人員安全、物理與環境安全、通信與運營安全、訪問控制、業務連續性管理等。
2 運行維護管理系統
2.1 系統架構
系統架構模型如圖1 所示。模型通過建設有效的組織目標管理,規范的運維流程體系,并且提供豐富的運營監控技術手段,確保萊鋼網絡及系統運行維護中心提供IT 服務的可用性、連續性,保障寬厚板MES 業務應用系統的穩定、高效運行。
圖1 萊鋼MES 運維管理系統架構模型
萊鋼MES 系統組成:1)硬件:小型機、PC 服務器、PC 機、路由器、交換機、防火墻、存儲設備、不間斷電源、機房空調及視頻監控等設備;2)軟件:AIX、HACMP、Oracle、Tuxedo、Xcom、MES 系統平臺等。
萊鋼寬厚板MES 系統運維平臺主要包括監控管理子系統和服務流程管理子系統2 部分,通過監控管理子系統的設備拓撲自動發現,實現對網絡設備、鏈路流量、服務器系統、PC 終端、數據庫系統、應用系統、機房環境和業務系統等進行全面的監控和管理;通過故障監控和性能監控,經過事件統一處理分析平臺,將故障、性能越限和配置變動信息進行集中監控管理,重要的信息形成工單傳遞到流程管理子系統;服務流程管理子系統控制IT 運維中的業務保障服務流程,使運維流程符合ITIL 標準;在系統的展現層,提供運維管理門戶,將運維管理的事件、故障、性能、配置、工單、報表等集中在一個平臺綜合展現。
2.2 系統功能
萊鋼MES 運維管理系統分為系統監控管理、運維服務管理、信息安全管理和報表系統等模塊,系統組成見圖2。運維管理系統以流程為導向,從設備、應用到服務的全方位管理,對萊鋼MES 所維護的設備、操作平臺、應用軟件和業務系統進行監控和管理。
圖2 萊鋼MES 運維管理系統邏輯結構
1)系統監控平臺。監控管理實現對Cisco 網絡設備、IBM P550、Oracle、Tuxedo、MES 服務等進行集中統一的管理。監視網絡設備、網絡安全設備的在線狀態、CPU 利用率、內存大小、設備日志、設備路由表信息、設備配置文件的監控。監視對AIX、Windows等操作系統的主機系統的運行狀況監控,包括主機的在線狀態、CPU 利用率、內存大小及利用率、磁盤空間大小及利用率、所提供的關鍵服務狀態、主機的網絡接口流量、丟包和錯包率等信息。監視Oracle 數據庫運行狀態,包括數據庫進程、數據庫鎖、數據庫日志等信息;對數據庫資源監視,包括數據庫CPU、數據庫CATCH 等信息;對數據庫Session監控等信息。實現對Tuxedo 等中間件的運行狀態監控,監控服務啟動、關閉時有無錯誤信息,服務消耗的CPU、內存和線程數等信息。
2)運行維護服務管理。運維服務管理通過規范化和流程化的服務管理,提供事件管理、問題管理、變更管理、知識庫管理、值班管理等功能,建立流程的閉環管理,提高故障處理的效率和質量。事件管理包括接受和記錄事件、確定優先級、知識庫關聯、事件處理、和關閉事件。問題管理為事件管理找到原因和解決辦法,徹底解決該類故障。電子化值班管理,規范值班管理制度,包括交接班的處理和記錄、記錄值班過程中的事務、為績效管理提供考核數據。知識庫作為故障解決方案中心,提供運維知識信息的檢索等。
3)信息安全管理。應用防火墻,保證網絡隔離;建立桌面管理系統,管理維護用戶PC;建立全網的補丁分發及病毒防治,保障系統的安全;應用備份系統,保證數據安全。
4)報表系統。針對事件、問題處理完成情況,對個人、部門工作情況進行詳細的統計和分析。
3 結語
基于ITIL 的運維管理系統投運后,集成現有的管理流程,減少手工重復性操作的成本,提升操作控制性能,規范IT 運行維護部門關鍵業務流程,并能評估技術人員和流程的性能,從而提高了萊鋼網絡及系統運行維護中心的服務水平和效率,變被動響應為主動服務,降低了運營成本,保障了寬厚板MES 業務應用系統的穩定、高效運行。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:ITIL在萊鋼MES系統運行維護中的應用