計算機系統在為企業各類應用系統提供強大支撐的同時,無時無刻不面臨著系統崩潰的危險。計算機硬件故障、病毒侵害、人為誤操作、自然災難等情況的發生都會讓系統變得極其脆弱,一旦系統癱瘓,通常的解決辦法只能是購置設備(配件)、重裝系統、安裝應用軟件、完成配置操作等等繁瑣的工作,可見系統在短時間內是無法恢復正常使用的。但作為一個企業的生產系統.必須保證生產業務不中斷、不受影響,因此適合的應急恢復技術是保證系統穩定運行的關鍵。中國石油油氣生產信息系統是油田生產業務重要的信息系統之一。為保證系統的穩定運行,采用了目前計算機系統恢復技術中較為先進的冗災恢復技術和方法。本文通過對中國石油油氣生產信息系統是如何實現對生產系統的快速恢復和異地冗災的闡述,論述應急恢復技術在企業信息系統中的應用。
1 信息系統現狀與需求
中國石油油氣生產信息系統是管理油氣田勘探與生產過程的重要信息系統之一,系統建設范圍覆蓋了中國石油總部和各油氣田分公司,是集數據采集、存儲、傳輸、處理、分析、發布和服務于一體的現代化勘探開發信息管理系統。系統自建設完成,保證7×24h不間斷運行,全面服務于油氣田油氣生產。
油氣生產信息系統前端應用層服務器使用windows2003操作系統,之上安裝有TWs、LPM、CDMT、Dss等多種油氣生產管理專業軟件,后臺使用0racle9i數據庫,同時,系統掛接有磁盤存儲系統和帶庫系統等共同組成完整的架構體系。系統穩定運行離不開完備的應用程序架構和軟件產品,同時建立合理、完善的備份與應急恢復機制是確保系統安全、穩定運行必不可少的前提條件。各類災害以及人為誤操作導致計算機系統崩潰、數據丟失的情況屢見不鮮,面對災難和故障做好系統和生產數據的快速恢復工作就顯得尤為重要。為增強油氣生產信息系統應對各種風險的恢復能力,對該系統部署實施了應急恢復子系統,應急恢復子系統的建成保證了油氣生產信息系統的安全、穩定、高效,同時為中國石油打造了一個堅實的油氣生產信息平臺。
2 應急恢復技術實現
2.1應急恢復系統方案設計原則
應急恢復系統方案設計必須遵守以下原則:高可用性的原則;運維簡捷,容易操作,可管理性高的原則;以不犧牲原系統的強壯性原則;保證生產系統正常運行原則;系統層、應用層具有高強容錯能力設計的原則。同時,需要保證生產系統生產數據任何情況下不丟失,本地備份與異地災備相結合的原則。當災難發生時應急恢復系統恢復正常工作時間<10min,在線恢復回寫系統和數據時間<4h,災難發生時系統管理員能遠程控制切換操作,快速恢復系統正常工作。
2.2應急恢復系統方案設計
根據信息系統現狀與需求,結合當前災備恢復技術進行分析論證,系統采用集中災備模式。由于信息系統的前端應用層和后臺數據庫層在運行方式、備份需求與內容上有很大的不同,為了做到有針對性的災備與恢復.我們對應用層系統采用“網絡盤存儲鏡像”備份技術,對數據庫層系統采用“遠程數據庫準同步”備份技術。
整個應急恢復系統架構設計實現本地系統數據保護和異地冗災接管的功能。系統總體設計框架如圖1所示。
圖1系統總體設計框架
“網絡盤存儲鏡像”(注:硬件設備+軟件系統)技術主要是將windows操作系統及其上的應用軟件、數據庫等在系統運行正常時保存在“網絡盤存儲鏡像”中,并可多版本快照保存。當災難發生時,服務器可以拋開本地(內置)硬盤不用,直接從“網絡盤存儲鏡像”啟動操作系統、應用軟件和數據庫系統,這種啟動方式所掛的“網絡盤存儲鏡像”盤是可讀寫的,也就是說它完全可代替原應用服務器工作,快速恢復生產應用。然后再利用生產空閑時間將當前版本寫回主應用服務器系統,使主服務器恢復正常工作。“網絡盤存儲鏡像”的另一優勢還可多版本存儲Windows操作系統,可根據實際需求回滾到之前存儲過的任何一個windows版本。
對應用層windows系統,在每個油田部署一個(組)“網絡盤存儲鏡像”系統,各油田的應用服務系統都備份在“網絡盤存儲鏡像”中,并可多版本快照保存。然后在北京總部再部署一組“網絡盤存儲鏡像”系統,在油田“網絡盤存儲鏡像”系統與總部“網絡盤存儲鏡像”系統之問做一個實時增量數據同步,從而做到各個油田的應用系統實時備份到總部。當油田系統出現故障不能從當地啟動時,可以由總部服務器從總部備份系統啟動代替各油田的服務器應用系統。
對0racle數據庫系統,利用部署好的“網絡盤存儲鏡像”系統,使用遠程數據庫準同步方案,所有備份數據都直接放在總部,利用數據復制同步軟件技術實現總部數據與各油田數據準實時同步。
2.2.1應用層服務器系統恢復
利用“網絡盤存儲鏡像”技術將windows操作系統及其上的應用軟件、系統服務等在系統正常運行時實時的保存到“網絡盤存儲鏡像”設備中,并可進行多版本快照保存。但是過多的快照會影響系統L/O讀寫性能,占用一定量的系統資源,根據各油田使用油氣生產信息系統的使用頻度和使用峰值時段,每6h定制一個快照,共4個快照即可滿足業務需求,同時備份體保存64d(256/4)。“網絡盤存儲鏡像”的一個優勢是可多版本存儲,可根據實際需要回滾到任何一個“干凈”版本,理論上它能防止任何操作系統故障、應用軟件故障、數據庫故障以及人為的誤操作等引起的系統或者軟件故障。
當故障引起的系統崩潰在短時間(4h)內無法修復生產系統時,服務器可以拋開本地硬盤不用,直接從“網絡盤存儲鏡像”啟動操作系統、應用軟件,從而快速恢復生產系統。整個恢復過程根據流程進行恢復、接管硬盤及軟件系統故障:應用服務器因病毒、操作系統、應用軟件、硬盤發生故障時,只需從本地網絡重啟服務器就會接替原應用服務器系統工作。然后再利用生產空閑時間將當前版本寫回主應用服務器系統,使主服務器恢復正常工作。其他硬件故障如:服務器主板、網卡等非硬盤故障時,由后備服務器從網絡盤存儲鏡像設備網絡啟動,接替原服務器工作。主服務器修理后,根據硬盤數據情況再決定是否采用回寫方式恢復系統。
由于北京總部和各油田應急恢復系統是進行實時增量同步的,所以當油田出現故障不能從油田本地啟動,或是油田系統在長時問(4h以上)無法恢復,如:機房整體搬遷、機房停用、地震、地質災害等均可啟用異地冗災接管,即啟動總部的備份來接管故障油田應用。
2.2.2生產數據恢復
生產數據使用遠程數據庫準同步方案,利用數據復制同步純軟件技術進行準實時同步,各油田所有生產數據復制到北京總部,時間差應在180s以內。生產數據數據庫采用軟件方式,需要在各個油田的數據庫服務器上安裝同步軟件,在總部需要建立相應存儲,并安裝同步軟件,實現數據同步。
當生產數據服務器發生故障時,因這種方式是將生產數據寫入遠程的總部數據系統中,這樣無論是主服務器的硬件、操作系統、數據庫系統出現故障,還是存儲硬件、軟件出現故障,總部數據庫備份系統均能很快接替它,使其快速恢復生產數據應用。
2.3應急恢復系統特點
冗災系統的建設具有技術復雜、需求依賴性高的特點,各類技術方案不僅要實現冗災復制,還要按照業務需求實現各類災難的快速恢復,同時還要對現有的生產系統和網絡環境具有適應性,不產生負面的后果。
系統采用虛擬化技術在信息整合、信息復制、信息備份等多個方面的獨特能力,為各種應用系統提供有效的數據保護,實現“實時備份+多版本快照+瞬間恢復+遠程災備”,具體表現在以下方面:
1)實現生產數據遠程復制和本地時問點保護,使系統在本地快速恢復和遠程冗災接管有機結合,實現既具有冗災能力又提供本地快速恢復能力的冗災系統。
2)256個在線多版本自動快照供選擇。256個快照相當于256個全備份,利用快照.一旦發生任何一類故障,管理員都可以找到最近或特定的快照版本,進行立即恢復,從快照中恢復數據只是幾分鐘的事情。多版本快照支持應用系統的系統盤和數據盤的全面地實時保護,從而實現操作系統和應用數據的同步保護。
3)“塊增量+壓縮+加密”的網絡傳輸特性,支持基于塊增量的遠程數據復制功能,節省用于遠程復制的網絡帶寬,加密的遠程網絡傳輸功能,保證數據體傳輸的快捷與安全。
4)利用網絡盤啟動操作系統和回滾啟動功能,可瞬間恢復系統。
5)支持指定目錄和指定文件的選擇性恢復。根據需要,利用實時鏡像和多點快照,在任意時間恢復任意目錄和文件。
6)集成多點自動快照技術的冗災系統,實現了由人為誤操作類“災難”的防范及糾錯功能。
7)全面保護數據庫系統和windows操作系彩應用系統。傳統的備份系統主要針對數據系統提供保護,而該系統是一體化快速恢復系統和災備系統,對Windows操作系統、生產業務應用系統和數據庫系統提供實時的數據保護和一鍵式快速恢復機制。
3 結論
通過應急恢復技術在中國石油油氣生產信息系統的應用研究實例可以看出.采用“網絡盤存儲鏡像”技術的災備系統可以為企業信息系統提供一個開放的、易于擴展的存儲平臺,他不僅幫助我們構建了一個高效的遠程異地冗災系統,同時也為我們提供了本地實時備份系統和快速恢復系統,構建了一個可以應對各種系統故障和災難恢復的安全體系,為企業生產打造一個安全穩定的系統平臺。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:企業信息系統應急恢復技術應用研究
本文網址:http://www.guhuozai8.cn/html/consultation/1083934289.html