1 基于ITIL的IT服務管理引言
二十世紀八十年代末形成的IT lnfrastruclure Library (信息技術基礎架構庫,簡稱ITIL)已經在全世界成為事實上的IT服務管理的最佳實踐和標準。基于ITIL的IT服務管理作為一種新的IT管理模式,它以流程為導向、以客戶服務為中心,提升了企業IT運營效率和客戶對IT部門服務的滿意度。這種IT管理模式在歐洲和北美等國家和地區得到了廣泛的應用.近年來在我國也得到了越來越多的關注和應用。
ITIL服務器管理主要由服務支持(Service suppon)和服務交付(Service Dilevery)組成,這兩者是整個ITIL框架的核心。ITIL服務支持主要論述客戶和用戶如何獲得恰當的服務來支持他們的活動和業務,以及這些服務怎樣得到支持。它主要是由下列模塊組成:事故管理,問題管理,配置管理,變更管理和發布管理,外加一個服務臺。
2 應用于ERP系統的事故管理流程概述
事故管理是服務支持中應用得最為廣泛,也往往是第一個被實施的模塊在ERP系統服務管理中也同樣如此。本文針對ERP系統的特點和業務運作對ERP系統要求的特殊性,根據大型跨國公司ERP服務部門的IT服務管理的經驗和實踐來具體談談事故管理在ERP應用系統中的應用流程和最佳實踐,特別是其不同于IT基礎設施事故管理的特點。
這里假設大型跨國公司采用基于ITIL的IT服務管理系統來支持IT服務管理流程。同時為敘述方便,我們采用一些ITIL和業界通用術語來表述觀點。
1)一般用戶:運用ERP系統進行業務操作的普通業務用戶。
2)關鍵用戶:對所分擔的業務有較深的專業知識和業務能力,同時對ERP操作比較嫻熟,既能解決和業務相關的問題,也能解決一般用戶碰到的常見的ERP操作問題的用戶。
3)事故單:由關鍵用戶通過IT服務系統提出的事故解決請求記錄。
4)事故經理:負責處理事故的ERP功能支持人員。每一個事故均有一個事故經理。
5)工作單:有些事故需要其它ERP模塊支待組或其它應用系統支持組參與解決,故在事故單下由事故經理發出工作單去尋求合作支持。
隨著ERP系統的不斷發展和完善,現在ERP系統已經滲透到整個公司的所有業務運作中了,ERP系統出現的問題有時候會嚴重影響到公司業務的運作。系統的復雜性和業務部門對ERP系統的高度依賴性使得ERP系統的事故解決其有以下兩個特點:
1)要盡可能快地解決事故,這就要求整個事故管理流程簡練快捷,盡可能減少從用戶到相關ERP支持人員的中間環節;
2)事故的解決過程中ERP支待人員需要和用戶從技術和業務層面不斷溝通和互動,這就要求ERP系統的支持人員不僅需要具備相關模塊的ERP系統技術,同時也要有相關業務領域扎實的業務知識。
在實踐中,應用于ERP系統的事故管理一般有三種流程,如圖1所示,不同的公司會根據需要選擇不同的流程。
圖1 事故管理在ERP系統中的三種流程
流程1:采用傳統的事故管理流程,即用戶向IT服務臺尋求幫助,IT服務臺判斷事故的類別,若是和ERP系統相關,則轉發到二線ERP服務臺,再由二線ERP服務臺判斷并轉發到相關的ERP功能支持組去分析和提供事故的解決方案。設立二線ERP服務臺的原因是因為ERP系統的復雜性使得普通的IT服務臺難以準確判斷某一事故該由哪個ERP功能支持組去負責解決。
這種流程的優點是該流程和應用于基礎設施的流程基本吻合,強調了事故管理流程在整個IT服務管理中的統一性。而缺點則是顯而易見的,IT服務臺和二線ERP服務臺職能重疊,從而延長了ERP功能支持人員對事故的響應時間。
流程2:設立關鍵用戶,在流程中跳過IT服務臺,由關鍵用戶判斷事故是否屬于ERP范疇。若是和ERP系統相關,則聯系二線ERP服務臺,再由二線ERP服務臺判斷并轉發到相關的ERP功能支持組去分析和提供事故的解決方案,流程2顯然是流程1的改進版,取消了IT服務臺,從而一定程度上加快了響應時間。但關鍵用戶和二線ERP功能支持組之間依然沒有直接對話,從而影響了關鍵用戶和ERP功能支持人員的直接互動。
流程3:設立關鍵用戶,在流程中跳過TT服務臺,不再設立二線ERP服務臺,由關鍵用戶判斷事故是否屬于ERP范疇。若是和ERP系統相關,則直接聯系相關的ERP功能支持組,由該ERP功能支持組去分析和提供事故的解決方案。
無疑,流程3是最為快捷有效的,也最適合ERP應用系統的特點和業務要求,充分發揮了關鍵用戶的作用。許多對ERP系統的時效性和依賴度比較高的行業普遍采用這種流程。
本文以流程3為基礎講述應用于ERP系統的事故管理流程的最佳實踐及應用特點。
3 事故管理流程在ERP系統中的最佳實踐及應用特點
由于ERP系統與業務運作緊密相關,為提高IT部門的響應速度和與用戶的溝通效率,協調IT內部各支持部門的合作,應用在大型跨國公司ERP系統中的事故管理最佳實踐流程如圖2所示,它是前面提到的流程3的具體化。該流程具有下列特點:
圖2 事故管理在ERP系統中的最佳實踐流程
A.充分發揮關鍵用戶的作用
在用戶中設置關鍵用戶,一般用戶在碰到ERP方面的問題時,先求助于關鍵用戶,若關鍵用戶解決不了,則由關鍵用戶直接在IT服務管理系統中登記一個事故單,然后直接轉到相關的二線IT ERP支持組。一般用戶不直接聯系ERP支持組。
在這里關鍵用戶起著一線支持的作用,他們不僅能回答諸如如何操作系統等和培訓相關的問題,還能幫助IT部門解決簡單的ERF相關的常見事故或是更快地判斷事故類別并向相關的ERP支持組尋求幫助。可以說關鍵用戶不僅是一般用戶和ERP支持人員間的橋梁,而且幫助IT部門解決了一些常見問題從而使IT部門能更好地集中精力處理復雜的事故。
B.強調單點聯系
當用戶遇到和ERP相關的問題時,根據用戶自己所在的部門和業務范疇,自然而然地把事故單提交給相對應的IT ERP支持組,但由于ERP系統的復雜性和各ERP功能支持組的分工不同,有些事故的解決可能需要其它ERP功能組參與解決其中某一部分的問題。對此類情況一般有兩種處理方法:方法:1是把事故單直接交給另一個ERP功能組去負責解決.即事故經理隨著事故單在不同的ERP功能支持組的轉移而變化;方法2則采用單點聯系,即始終由第一個接到事故單的事故經理負責該事故的最終解決和與用戶的溝通,同時協調所需的相關ERP功能組共同解決事故。
從用戶的角度來說,用戶要求的是所碰到的問題能盡快得到解決,并不關心在IT內部是怎么解決的。方法1可能會給用戶一個被“踢皮球”的感覺,這顯然會影響客戶的滿意度。從IT服務的角度來說.單點聯系簡化了支持流程,明確了責任,避免了可能出現的“踢皮球”現象,從而提高了IT運作效率。故而方法2從目前來說是一種最佳實踐。
既然面對用戶的事故經理保持不變,則需要由事故經理通知參與的其他功能組可能需要做什么,及希望什么時候完成。在IT服務管理系統中,事故經理可以運用工作單的方式來通知相關的其他功能組協助事故的解決。一個事故單可以帶多個工作單,工作單約定的最遲解決時間不應遲于事故單根據事故的緊急性定義而要求的最遲時間,不然的話會影響服務級別協議(SLA)。只有在某一事故單下的所有工作單都關掉后,該事故單才有可能被關掉。工作單的負責人只對事故單的事故經理負責和溝通,這樣既使用戶不用跟多個部門的人溝通,又使事故單的事故經理能完個了解和協調事故的解決。
當然,單點聯系并不意味著凡是第一個接到事故單的ERP支待人員必須是該事故的事故經理〔若關鍵用戶把事故單指派給了錯誤的ERP支持組,經過分析應第一時間把事故單轉移出去,并通知相關的關鍵用戶。
C.事故的影響度和緊急性的判斷以及事故優先級劃分
事故的影響度和緊急性是事故的基本屬性。緊急性指的是業務或用戶可接受的解決事故的耽擱時間,它直接和SLA相關。影響度由該事故對業務的影響程度決定,亦即事故可能或已經引起對所約定或期望的服務水平造成的偏離程度。事故的優先級取決于事故的緊急性和對業務的影響度,它決定事故處理的先后次序。
緊急性的級別可以根據公司的業務需求來定義,一般可分為五個級別,每個級別定義解決事故的目標期限、對事故的第一響應時間和對用戶的溝通頻度等服務級別協議。影響度則一般分為高中低三級。由緊急性和影響度組成的優先級矩陣如表1左邊部分所示,表1右邊部分為簡化的服務級別協議。
表1 事故的優先級矩陣及服務級別協議
表1中帶斜線部分的組合不存在,優先級I(組合H/l)是最高的優先級,優先級2,4,5(組合M/l ,M/2, L/2)是高級別的優先級,它們都需要PT相關服務部門做出7x24小時的全天候響應。優先級6-II(M/3,L/3, M/4,L/4, M/5,L/5)是正常的服務模式。優先級3(Il1)是一個特殊的優先級,一般僅為公司VIP成員而設。從表1中可以看到,緊急性決定事故解決的目標期限,影響度決定了解決緊急性相同的事故的先后次序。
在具體判斷事故的影響度和緊急性時,一般有共種方法一是由IT支持人員決定;二是由關鍵用戶決定;三是由關鍵用戶和IT支持人員共同決定。
由于ERP系統與業務運作緊密相關方法一一般只適用于與基礎設施相關的事故管理。方法二有一定的局限性,有時用戶會不恰當地提高事故的優先級。因為用戶總是希望任何事故都能解決得越快越好,但這會增加IT部門的工作強度,從而最終增加公司的運營成木。而作為ERP支持人員、他們具有足夠的業務知識去判斷事故可能引起的業務影響,而且能判斷有沒有應急備案。因此關鍵用戶和ERP支持人員共同商量決定事故的影響度和緊急性可以達到服務和成本的最佳平衡。所以在本文中我們推薦用方法三。
D.事故危機管理
在實踐中,有時候會發生優先級為1的嚴重事故,例如ERP系統宕機,大量用戶無法登陸ERP系統關鍵的系統接口或ERP模塊不工作等。這類事故的很大部分往往是由相關的基礎設施或其他應用系統的嚴重事故引起的,例如服務器、操作系統、網絡、數據庫、接口等意外地不能正常工作等。因此這類突發性且產生大范圍重大業務影響的事故的解決往往需要同ERP相關的幕礎設施或其他應用系統各職能部門密切配合了決速解決。為達此目的,需要馬上啟動危機管理。危機管理的目的是以最快速度調動所需要的資源盡快解決事故,最大限度地降低事故對業務的影響,并和相關的業務部門及時和定時地通報事故對業務運作的影響和事故解決的進程,可能的話提供臨時備案以使重要的業務運作能進行下去。
在這類危機管理中,ERP支持部門一般依然擔當事故經理。事故經理需要其有非常有效的協調能力、溝通能力及快速決策能力,故而危機管理中的事故經理往往由ERP部門的相關主管或經理來擔任,他們所要做的工作是:
1)緊急聯系可能與此事故相關的各lT職能部門負責人組成危機處理小組,主持召開緊急會議討論產生事故的可能原因,制定行動計劃并馬上付諸行動。
2)及時和定時地與相關的業務負責人及關鍵用戶溝通事故對業務的影響和解決進程。
3)評估事故對ERP系統的影響,制定行動計劃以便在事故解決后馬上對系統進行處理,以最快速度恢復業務的正常運作。
為有效實施危機管理,事先建立一個具體的可執行的操作流程和與相關部門的聯系方法是至關重要的,它能使事故經理在處理危機時根據流程作出快速有效的反應。
4 總結
在設計應用干ERP系統管理的事故管理流程時,應充分考慮ERP系統的特點和業務部門對ERP系統的要求,不能直接照搬應用于基礎設施的流程。
應用于ERP系統管理的基于ITIL的事故管理流程的特點總結起來是:
1)支持流程要簡練快捷;
2)充分重視和發揮關鍵用戶的作用,關鍵用戶和ERP功能支持組直接溝通;
3) ERP支持人員作為事故經理和用戶保持單點聯系;
4)由關鍵用戶和IT支持人員共同決定事故的緊急性、影響度和優先級;
5)必須有良好的反應快捷的事故危機管理機制。
本文作者創新點:根據ERP系統的特點和業務對ERP系統的高度依賴性,提出一套基于ITIL.方法論但又適合ERP系統要求的事故管理流程,該流程提升了企業IT運營效率和客戶對IT部門服務的滿意度。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文網址:http://www.guhuozai8.cn/html/consultation/10820015954.html