一、引言
近年來,隨著各類應(yīng)用系統(tǒng)建設(shè)速度迅猛發(fā)展,信息化技術(shù)人員的數(shù)量、維護能力和知識水平日顯不足,在實際工作中只能等到設(shè)備及應(yīng)用系統(tǒng)出現(xiàn)問題造成故障時才進行維護,并且IT設(shè)備和信息系統(tǒng)多而復(fù)雜關(guān)聯(lián)性日益增強。運維人員有效地降低系統(tǒng)運行的風(fēng)險,主動的發(fā)現(xiàn)并及時解決系統(tǒng)運行故障,這些都給企業(yè)IT運維服務(wù)管理水平提出了更高的要求,也是當(dāng)前IT系統(tǒng)運維服務(wù)管理與ERP運維普遍面臨的巨大挑戰(zhàn)。面對如此高的要求和壓力,目前的信息化應(yīng)用平臺單靠人工管理已經(jīng)變得不現(xiàn)實,因此,通過采取IT運維服務(wù)管理系統(tǒng)來輔助信息部門進行半自動化管理,使信息系統(tǒng)更加適應(yīng)業(yè)務(wù)持續(xù)變化的需求。
二、運維服務(wù)與ITIL理念
IT運維服務(wù)主要包括基礎(chǔ)設(shè)施維護服務(wù)、系統(tǒng)運行維護服務(wù)和系統(tǒng)運營支持服務(wù)。基礎(chǔ)設(shè)施維護服務(wù)是指對基礎(chǔ)環(huán)境、硬件、基礎(chǔ)軟件的故障診斷和修復(fù)等服務(wù)。系統(tǒng)運行維護服務(wù)是指通過使用監(jiān)控、服務(wù)管理工具等方式,保障系統(tǒng)正常運行的服務(wù)。系統(tǒng)運營支持服務(wù)是指為提升業(yè)務(wù)有效性所提供的評估、數(shù)據(jù)管理、數(shù)據(jù)分析、業(yè)務(wù)流程管理等服務(wù)。
20世紀(jì)80年代,英國政府為了提升信息化設(shè)備和系統(tǒng)的運行效率,指定當(dāng)時的英國政府計算機與通信局,研究開發(fā)一種方法,用于指導(dǎo)全國政府部門高效、經(jīng)濟地運營信息化設(shè)備和系統(tǒng),結(jié)果產(chǎn)生了信息技術(shù)基礎(chǔ)架構(gòu)庫(Information Technology Infrastruc-ture Library-ITIL)。ITIL供組織內(nèi)部進行IT服務(wù)管理的參考經(jīng)驗,它匯集了IT服務(wù)業(yè)內(nèi)的最佳實踐,是指導(dǎo)如何在運維管理中定義人員、流程、服務(wù)活動及其之間關(guān)系的指導(dǎo)框架。
ITIL的框架包括業(yè)務(wù)管理、服務(wù)管理、IT基礎(chǔ)架構(gòu)管理、安全管理、應(yīng)用管理、IT服務(wù)管理規(guī)劃等,其中最核心的是服務(wù)管理中的服務(wù)支持和服務(wù)提供。IT主管部門可能更關(guān)心服務(wù)支持,服務(wù)支持主要包括:服務(wù)臺、故障管理、問題管理、配置管理、變更管理和發(fā)布管理等六個模塊。
為使企業(yè)的運維服務(wù)更加有效、持續(xù)和穩(wěn)定發(fā)展,引進最先進的ITIL管理理念和ISO 20000國際標(biāo)準(zhǔn),結(jié)合制造業(yè)在IT運維服務(wù)管理情況,提高IT運維服務(wù)管理的效率和規(guī)范性,保障業(yè)務(wù)系統(tǒng)的持續(xù)穩(wěn)定運行。
三、企業(yè)對于IT服務(wù)管理的需求分析
制造業(yè)信息化通過多年的建設(shè),形成了眾多的信息系統(tǒng),如何使信息系統(tǒng)穩(wěn)定、可靠、安全的運行,IT運維服務(wù)管理工作步入一個有序的、規(guī)范的層,成為數(shù)據(jù)中心的一個長期的業(yè)務(wù)目標(biāo)。
一方面,數(shù)據(jù)中心面對的管理工作的范圍也越來越大,從核心的網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫、應(yīng)用系統(tǒng)到終端計算機。對各種IT基礎(chǔ)架構(gòu)設(shè)施的具體配置、運行狀態(tài)、故障、性能進行了集中監(jiān)控,及時發(fā)現(xiàn)故障并報警,同時對運行性能歷史數(shù)據(jù)進行深入、定量分析,并提供各種中長期運行趨勢和運維報表,及早發(fā)現(xiàn)網(wǎng)絡(luò)擁塞或系統(tǒng)性能的問題,為IT維護人員提供運維技術(shù)手段和工具,提高IT運行監(jiān)控管理的處理能力的需求越來越迫切。
另一方面,IT系統(tǒng)對于核心業(yè)務(wù)起著決定性的作用,因此IT服務(wù)的可用性以及服務(wù)的質(zhì)量越來越引起重視,并且在未來還將面對越來越多的數(shù)據(jù)業(yè)務(wù),因此對其計算機網(wǎng)絡(luò)、系統(tǒng)及各終端設(shè)備的穩(wěn)定性和故障的快速處理、恢復(fù)能力的要求,建立合適的工作流程,合理安排人員崗位,明確職責(zé),保障在業(yè)務(wù)中斷的第一時間找到相關(guān)負責(zé)人去解決問題,快速恢復(fù)業(yè)務(wù)。
四、IT運維服務(wù)管理平臺設(shè)計
在進行IT運維服務(wù)管理平臺管理設(shè)計時,考慮IT服務(wù)對業(yè)務(wù)帶來的影響,強調(diào)從業(yè)務(wù)目標(biāo)角度出發(fā)來優(yōu)化IT運維服務(wù)管理。
(一)IT基礎(chǔ)設(shè)施管理
IT基礎(chǔ)設(shè)施管理包括網(wǎng)絡(luò)、服務(wù)器、客戶機、數(shù)據(jù)庫、應(yīng)用系統(tǒng)的配置管理、性能管理、故障管理等,系統(tǒng)整體架構(gòu)橫向分為4層被監(jiān)控層、數(shù)據(jù)采集層、匯聚處理層、展現(xiàn)層。
被監(jiān)控層為IT基礎(chǔ)設(shè)施,數(shù)據(jù)采集層通過與被管基礎(chǔ)設(shè)施的接口采集數(shù)據(jù),送到數(shù)據(jù)處理層進行數(shù)據(jù)處理。匯聚處理層包含2個層面:一個層面是IT基礎(chǔ)架構(gòu)運行監(jiān)控,主要實現(xiàn)IT基礎(chǔ)架構(gòu)的各種監(jiān)控功能,如網(wǎng)絡(luò)拓撲、鏈路流量等;另一個層面是業(yè)務(wù)服務(wù)管理,主要針對業(yè)務(wù)層面進行監(jiān)控,包括業(yè)務(wù)故障影響分析、業(yè)務(wù)性能指標(biāo)計算、業(yè)務(wù)應(yīng)用性能監(jiān)控以及業(yè)務(wù)視圖展現(xiàn)等。最頂層是統(tǒng)一展現(xiàn)層,即統(tǒng)一門戶,為不同級別、不同職能的人員提供整合統(tǒng)一的IT運維管理門戶。
(二)IT服務(wù)管理
基于ITIL流程框架,結(jié)合現(xiàn)有實際業(yè)務(wù)需求,遵循“計劃、實施、檢查、改進”的設(shè)計原則,建立切實可行的實施方法和流程,將整個體系劃分為服務(wù)臺、事故處理、問題管理、變更管理、發(fā)布管理、CMDB、知識庫等模塊劃分,運維流程可穿越各個階段進行流轉(zhuǎn)。
五、IT運維服務(wù)管理平臺的實現(xiàn)
(一)IT服務(wù)管理基礎(chǔ)平臺的搭建
IT服務(wù)管理基礎(chǔ)平臺系統(tǒng)由應(yīng)用服務(wù)器、數(shù)據(jù)庫服務(wù)器、客戶機組成,使用分布式部署,減輕核心服務(wù)器的壓力。創(chuàng)建用戶類型、定義安全機制、代碼表配置、組織結(jié)構(gòu)數(shù)據(jù)建設(shè)、人員數(shù)據(jù)建設(shè)、資產(chǎn)數(shù)據(jù)裝載,制作統(tǒng)計報表。
(二)服務(wù)臺建設(shè)
數(shù)據(jù)中心服務(wù)臺負責(zé)全公司服務(wù)請求的處理和轉(zhuǎn)發(fā),技術(shù)上主要是對服務(wù)臺工作人員進行培訓(xùn),掌握全面的運維知識,熟悉服務(wù)臺職責(zé);管理上主要是制定服務(wù)臺運維管理制度,明確服務(wù)臺人員的工作內(nèi)容與操作規(guī)程。服務(wù)臺是用戶申報事故以及獲得事故處理結(jié)論的統(tǒng)一入口,主要工作包括以下幾個方面,一是完成響應(yīng)服務(wù)請求,處理常見的運維事件,將不能解決的事件升級;二是發(fā)布相關(guān)的運維信息,如網(wǎng)絡(luò)、ERP業(yè)務(wù)系統(tǒng)、設(shè)備故障等;三是協(xié)助提高IT部門事故處理質(zhì)量,增加用戶滿意度,形成有效的事故處理和跟蹤的手段。
(三)事故管理建設(shè)
我們借鑒了IT服務(wù)管理的經(jīng)驗,為了靈活實現(xiàn)運維系統(tǒng)各個流程建設(shè),在實踐中簡化了流程以適應(yīng)運維工作的需要。在事故處理流程建設(shè)中,ITN務(wù)管理標(biāo)準(zhǔn)的做法是直接將事故送到服務(wù)臺,由服務(wù)臺負責(zé)處理或者分發(fā),而實際工作中,將業(yè)務(wù)系統(tǒng)的監(jiān)控事件直接送到業(yè)務(wù)管理系統(tǒng)的管理員,服務(wù)臺負責(zé)監(jiān)督事故處理完成的情況。
(四)問題管理建設(shè)
問題管理管理員直接手工新建問題工單,或者由服務(wù)臺或事故管理來觸發(fā)問題工單管理流程。當(dāng)問題由于成本與技術(shù)等原因暫不消除時,可定為已知錯誤,后期可繼續(xù)處理。找到問題的根本原因,并提供臨時措施與根本解決方案,防止問題再次發(fā)生或減少問題的數(shù)量。
(五)配置管理建設(shè)
配置管理數(shù)據(jù)庫(CMDB)儲存與管理企業(yè)rT架構(gòu)中設(shè)備的各種配置信息,它與所有服務(wù)支持和服務(wù)交付流程都緊密相聯(lián),一方面支持這些流程的流暢運轉(zhuǎn)、發(fā)揮配置信息的價值;另一方面,幫助技術(shù)人員受到服務(wù)請求時獲取相關(guān)技術(shù)支持,同時依賴于相關(guān)流程保證數(shù)據(jù)的準(zhǔn)確性。
在建設(shè)初期通過配置項自動發(fā)現(xiàn),整個企業(yè)IT架構(gòu)的配置項(cI)導(dǎo)入配置項,為了保證數(shù)據(jù)的準(zhǔn)確、全面、我們要求業(yè)務(wù)系統(tǒng)、設(shè)備等管理人員提供、核對相關(guān)數(shù)據(jù),保證在運維中能準(zhǔn)確利用數(shù)據(jù)進行運維。
CMDB通過拓撲關(guān)聯(lián)圖展現(xiàn)各個配置項之間的關(guān)聯(lián)關(guān)系,可以清晰的看到各個硬件、軟件間的關(guān)聯(lián)關(guān)系,也能看到IT配置項和IT服務(wù)之間的關(guān)聯(lián)關(guān)系,因此當(dāng)IT服務(wù)出現(xiàn)問題時,可以通過該關(guān)聯(lián)關(guān)系,快速查找IT服務(wù)不可用的根本原因。
將配置項和事故記錄、問題記錄、變更記錄和發(fā)布記錄相關(guān)聯(lián),有利于針對具體的IT設(shè)施進行運維優(yōu)化和改進。
(六)變更管理建設(shè)
確保在IT服務(wù)變動的過程中能夠有標(biāo)準(zhǔn)的方法,以有效的控制變更,降低或消除因為變更對業(yè)務(wù)運營所造成的影響與問題。由專家和技術(shù)顧問組成,對提交的變更請求(RFC)進行評審,并最終裁定是否批準(zhǔn)實施該變更請求。
變更審計管理,通過CMDB定期對配置項進行自動掃描,發(fā)現(xiàn)企業(yè)IT架構(gòu)中的非法變更,管理員根據(jù)變更的信息,選擇變更恢復(fù)或者進入變更流程,幫助管理人員進行變更的審計管理。
(七)發(fā)布管理建設(shè)
通過正式的流程確保只有經(jīng)過完整測試與得到授權(quán)的軟件與硬件才能夠進入正式運行環(huán)境, 以確保變更后生產(chǎn)環(huán)境的質(zhì)量。發(fā)布的最終結(jié)果將會反映到cMDB中。
(八)知識庫建設(shè)
將成熟可行的解決方案錄入知識庫,進行數(shù)據(jù)共享,快速排除故障,從而達到提高用戶“自助式服務(wù)”能力的目的。當(dāng)運維人員進行事故、問題、變更和發(fā)布運維流程時,可以根據(jù)不同資源類型, 自動關(guān)聯(lián)該類型的知識條目,幫助運維人員快速解決問題。知識庫的自身管理,包括建立、審核、分類、評價、訂閱、收藏、搜索知識等,知識需要經(jīng)過知識庫管理員審核后才能進入知識庫。
六、結(jié)束語
通過ITIL在制造業(yè)的實踐,實現(xiàn)對IT系統(tǒng)的集中、統(tǒng)一的監(jiān)控管理,設(shè)計和建立基本的IT服務(wù)管理流程和技術(shù)支撐平臺。IT運維服務(wù)管理信息化是信息部門自身工作信息化的一個標(biāo)志性環(huán)節(jié),不但意味著管理的標(biāo)準(zhǔn)化、規(guī)范化,也提高了對外的服務(wù)能力與質(zhì)量,提升了運行管理水平及故障應(yīng)急處理能力,實現(xiàn)了知識經(jīng)驗的積累和共享,并且把工作量化,為考評提供依據(jù)。
實現(xiàn)IT服務(wù)管理體系涉及到很多方面,實施過程中要考慮企業(yè)的文化特點和對變化的接受能力,立足現(xiàn)有的組織分工和人員結(jié)構(gòu),分期設(shè)計、實施,建立配套的管理制度等。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:制造企業(yè)IT運維與ERP運維管理實踐與研究
本文網(wǎng)址:http://www.guhuozai8.cn/html/consultation/1083932429.html