1 背景
黨中央和國務院十分重視信息安全工作。2003年,中辦發[2003127號文《國家信息化領導小組關于加強信息安全保障工作的意見》,要求各基礎信息網絡和重要信息系統建設要充分考慮抗毀性與災難恢復,制定和不斷完善信息安全應急處置預案。2004年,國家網絡與信息安全協調小組辦公室發12004]11號文《關于做好重要信息系統災難備份工作的通知》。明確指出,提高抵御災難和重大事故的能力,減少災難打擊和重大事故造成的損失、確保重要信息系統的數據安全和作業連續性,避免引起社會重要服務功能的嚴重中斷,保障社會經濟的穩定。2005年,國務院信息化工作辦公室出臺了《重要信息系統災難恢復規劃指南》,為災難恢復工作提供了一個操作性較強的參考思路。
2007年,國家標準《信息系統災難恢復規范》(GB/T20988—2007)正式頒布,這是災備建設中具有里程碑意義的重要大事。該標準對災難備份、災難恢復相關術語進行了規范和梳理,指明了災難恢復工作的流程,明確了災難恢復的等級和相關要素,制訂了災難恢復工作的主要環節及各環節具體工作等。在2010年召開的第五屆中國災難恢復行業高層論壇上,提出了我國將全面啟動災難恢復體系建設,制定強制性災備建設規范,完善災備標準體系并及時出臺災難恢復服務資質管理辦法,以促進政府相關部門、行業用戶、企業災難恢復保障體系的發展。目前,許多政府部門和重要行業已經開始積極有序進行應急管理、災難備份與恢復體系的建設工作。
近十年來,國土資源信息化建設發展十分迅猛,數據積累不斷豐富,政務信息系統日漸增多,其安全性和穩定性顯得愈來愈重要。一旦發生人為或自然等突發性災難,造成數據丟失或信息系統嚴重故障或癱瘓,將會直接影響到國土資源管理工作的正常運轉以及一些企業和廣大民眾的利益。災備工作將成為國土資源信息化建設的一項十分重要的工作。本文對目前的災備主流技術進行綜述。
2 災備指標和類型
災難事件一般包括:自然災難(如風、火、水、雷電和地震等)、人為災難(如人為失誤、非授權操作等偶然故障,病毒入侵、駭客及人為破壞等Byzantine故障、恐怖襲擊和戰爭等)和技術災難(設備故障、軟件錯誤、電信網絡中斷和電力故障等)。統計資料表明自然災難(包括人為的戰爭和恐怖襲擊等)僅占災難的3%,人為災難占災難的39%(其中。偶然故障和Byzantine故障分別占32%和7%),而技術災難占到災難總數的58%。
根據《信息系統災難恢復規范》,災難被定義為.由于人為或自然的原因,造成信息系統嚴重故障或癱瘓,使信息系統支持的業務功能停頓或服務水平不可接受、達到特定的時間的突發性事件。通常導致信息系統需要切換到災備中心運行。災難恢復指的是,為了將信息系統從災難造成的故障或癱瘓狀態恢復到可正常運行狀態、并將其支持的業務功能從災難造成的不正常狀態恢復到可接受狀態,而設計的活動和流程。災難備份指的是,為了災難恢復而對數據、數據處理系統、網絡系統、基礎設施、專業技術支持能力和運行管理能力進行備份的過程。
廣義地理解,災難備份(簡稱災備)是指利用技術、管理手段以及相關資源確保關鍵數據、關鍵數據處理系統和關鍵業務在災難發生后可以盡可能多且快地恢復的過程,包括災難備份和災難恢復兩層含義。不僅包括災難發生前對數據的備份和日志,信息系統構建過程中容災體系結構的設計、提前制定的災難應急預案與恢復計劃等,而且涵蓋了災難發生后災備中心或者備份系統的業務接管,數據、系統、服務遷移過程中的安全管理、系統災難損失評估等內容。災備的目的就是確保關鍵業務持續運行以及減少非計劃宕機時間。
衡量災備系統的兩個重要指標是:恢復時間目標(RTO,recovery time object)和恢復點目標(RPO,recovery point object)。
RTO:恢復時間目標,以時間為單位.即在災難發生后。信息系統或業務功能從停止到必須恢復的時間要求。RTO標志系統能夠容忍的服務停止的最長時間。系統服務的緊迫性要求越高,RTO的值越小,災備能力就越高。
RPO:恢復點目標,以時間為單位,即在災難發生時,系統和數據必須恢復到的時間點要求。RPO標志系統能夠容忍的最大數據丟失量。系統容忍丟失的數據量越小,RPO的值越小。若RPO等于0,相當于沒有任何數據丟失。否則,就需要進行業務回復處理,對丟失數據進行修復。
RPO針對的是數據丟失。RTO針對的是服務丟失,兩者必須在進行風險分析和業務影響分析之后根據業務的需求來確定。
一般而言,災備分為三個級別:數據級、應用級和業務級。其中數據級、應用級都屬于IT系統范疇之內,而業務級則考慮到IT系統之外的業務因素,包括備用辦公場所、辦公人員等。
數據級災備的關注點在于數據,即災難發生后可以確保用戶原有的數據不會丟失或者遭到破壞。較低等級的數據級災備可將備份的數據通過人工方式保存到異地實現,如將備份的磁帶(盤或光盤)定時運送到異地保存就是方法之一。而較高級的數據災備方案則依靠基于網絡的數據復制工具,實現生產中心不同備份設備之間或是生產中心與災備中心之間的異步/同步的數據傳輸,如采用基于磁盤陣列的數據復制功能。
應用級災備是在數據級災備的基礎上,對應用系統進行復制,也就是在異地災備中心再構建一套應用支撐系統。支撐系統包括數據備份系統、備用數據處理系統、備用網絡系統等部分。應用級災備能提供應用系統接管能力,即在生產中心發生故障的情況下,災備中心便能夠接管應用,從而盡量減少系統停機時間,提高業務連續性。
業務級是最高級別的災備系統。它包括很多非IT系統,如辦公地點等。當大的災難發生時。用戶原有的辦公場所都會受到破壞.用戶除了需要原有的數據、原有的應用系統外,更需要工作人員在一個備份的工作場所能夠正常地開展業務。實際上,業務級容災還關注業務接入網絡的備份,不僅考慮支撐系統的服務提供能力,還考慮服務使用者的接入能力、甚至備份的工作人員。
在災備系統建設中,選擇不同的類型.應該綜合考慮數據與應用系統的重要性、業務關聯度、技術成熟度、基礎設施條件、成本和管理維護等一系列因素。
3 災備技術與發展趨勢
一般來講,災備系統可以分為數據級容災、應用級容災和業務級容災。數據容災是基礎和前提,只有保證數據能及時、完整地備份或復制到災備中心,才能在災難發生時及時恢復受災業務。數據級容災可以允許系統在一定時間內的數據量丟失,只要系統能夠通過備份或復制的數據將系統恢復起來。數據容災的技術包括數據存儲技術、數據復制技術和數據管理技術等。應用級的容災要求從應用層面上實現對系統容災,要求對數據的丟失量為零,實現信息系統保持業務連續性、不間斷服務,因而對系統的軟、硬件的要求都比較高,是一種比較高的容災方案。應用容災包括災難檢測技術、系統遷移技術和系統恢復技術等。業務級容災則對技術和其它方面的要求更高。本文針對數據級容災介紹主流的災備技術。
3.1數據存儲技術
災難備份的一項主要技術是數據存儲技術。數據存儲備份就是把數據從生產系統備份到存儲備份系統中的存儲介質的過程。因此,存儲優化是提高災難備份系統性能的重要指標之一。目前,比較通用的技術有NAS(Network Attached Storage,網絡附加存儲)和SAN(Storage Area Network,存儲區域網絡)。
NAS是將存儲設備連接到現有的網絡上,提供數據和文件服務。NAS服務器一般由存儲硬件、操作系統以及其上的文件系統等幾個部分組成。NAS實現簡單,建立方便,設備不依賴于操作系統,數據的存儲和處理功能分離,價格較低。SAN是通過特定的互連方式連接的若干臺存儲服務器組成一個單獨的數據網絡。SAN的硬件基礎設施是光纖通道,由3部分構成:存儲和備份設備(包括磁盤陣列和磁帶庫等)、光纖通道網絡連接部件(包括交換機、HBA卡、光纜線、集線器、光纖通道與SCSI間的橋接器等)和應用管理軟件(包括備份軟件、存儲資源管理軟件、設備管理軟件等)。SAN是一種特殊的高速網絡,連接網絡服務器和諸如大磁盤陣列或備份磁帶庫的存儲設備,SAN不依賴于LAN,允許任何服務器連接到任何存儲陣列,可以提供大容量的存儲數據服務。與NAS相比,SAN的成本較高。NAS、SAN的技術成熟、優缺點也很明顯,不再贅述。
近來日趨發展的IP存儲(storage over IP,SOW)技術,在IP網絡中傳輸數據,使得服務器可以通過IP網絡連接SCSI設備,將IP技術與SAN網絡結合起來,使IP SAN可以和IP網絡完全整合。
3.2數據復制技術
數據復制技術即數據鏡像技術。與數據存儲技術相比,數據復制技術則是通過不斷將生產系統的數據復制到另外一個不同的備份系統中,以保證在災難發生時,生產系統的數據丟失量最少,它是災備的核心和主流技術。
根據數據復制的層次,數據復制技術的實現可以分成以下幾種:
(1)基于存儲(磁盤)系統的數據復制:通過存儲系統內建的固件(firtnware)或操作系統,利用IP網絡或DWDM、光纖信道等傳輸接口連接,將數據以同步或異步的方式從本地的存儲系統復制到遠端的存儲系統。主要產品包括EMC的SRDF、HDS的TrueCopy、IBM的PPRC等。這種方式優點是獨立于主機平臺和應用,適合于主機和業務系統很多、較復雜的環境,具有較高的性能和可靠性,其缺點是成本昂貴,而且還要受制于單一的設備廠商,通常必須采用同一廠家的存儲平臺,甚至是同一系列的存儲產品。
(2)基于主機(操作)系統的數據復制:利用生產、災備中心主機系統通過IP網絡建立數據傳輸通道,通過主機數據管理軟件實現數據的遠程復制。主要產品包括主機廠商和一些第三方軟件公司提供基于主機的數據復制方案,如IBM的XRC軟件、BakBone的NetVault Replicator和Verims的wR軟件等。主要優點是不依賴于底層存儲平臺,可提供多種不同的方案,基于網絡而沒有距離限制:主要局限性是需要同種主機平臺,占用大量的主機的資源,不太適合多個系統、多種應用的災備等,效率和管理上也存在一定問題。
(3)基于數據交換層的數據復制:這種方式的復制技術是伴隨著SAN的出現引入的,即在SAN的交換層上實現數據復制。實現方式可以通過專有的復制服務器實現,也可以通過存儲局域網(SAN)交換機,將數據同步的復制到遠端存儲系統中。這種方式正在發展之中。
(4)基于數據庫的數據復制:利用數據庫自身提供的復制模塊,通過本地和遠程主機間的日志歸檔與傳遞來實現兩端的數據一致。比如Oracle的Data Guard和SQL Server的Mirror等。優點是不依賴于其它軟件和底層存儲平臺,有較好的兼容性,無需增加額外硬件設備,可支持異構環境的復制等,缺點是對數據庫的版本和操作系統平臺有特定要求,不能以一種技術實現多種應用的數據復制。另外,因本地應用程序向遠端復制的是日志文件,需要遠端應用程序重新執行和應用才能生產可用的備份數據。
上述幾種技術除了基于數據庫的數據復制外,其他技術都具有同步和異步兩種復制方式。同步數據復制就是將本地生產系統的數據以完全同步的方式復制到備份系統中。由于發生在生產系統的每一次I/0操作都需要等待遠程復制完成才能返回,這種復制方式雖然可能做得數據的零丟失,但是對系統性能有很大的影響。異步數據復制則是將本地生產系統中的數據在后臺異步的復制到備份系統中。這種復制方式會有少量的數據丟失,但是對生產系統的性能影響較小。在災備中心的建設過程中,應根據應用需求和數據復制技術的優缺點選擇不同的災難備份策略。
3.3技術發展趨勢
隨著信息化的深入發展,存儲容量的急劇膨脹。數據和信息的重要性已經遠遠超越了系統設備的重要性。在當前數據量劇增的情況下,災備技術也呈現不斷發展的態勢,取得一些新的進展,體現在以下幾方面。
(1)存儲虛擬化(Storage Virtualization)技術。該技術是將系統中各種異構的存儲設備映射為一個單一的存儲資源,對用戶完全透明.達到屏蔽存儲設備異構和主機異構的目的。通過虛擬化技術。用戶可以利用已有的硬件資源,把SAN內部的各種異構的存儲資源統一成對用戶來說是單一視圖的存儲池(Storage Pool),而且采用Striping、LUN Masking、Zoning等技術.用戶可以根據自己的需求對這個大的存儲池進行方便的分割、分配.保護了用戶的已有投資,減少了總體擁有成本(TCO)。另外也可以根據業務的需要,實現存儲池對服務器的動態而透明的增長與縮減。
通過存儲虛擬化技術可實現數據的遠程復制,以確保災備中心與生產中心的數據保持同步以實現數據容災。存儲虛擬化技術可以在不同層面實現,如在智能交換機層面、存儲層面或增加第三方設備來實現。采用虛擬存儲技術進行數據復制同樣也可以有同步復制方案和異步復制方案,需要根據具體的需求選擇合適的產品。
(2)重復數據刪除技術。該技術通過尋找不同數據塊中的冗余數據并刪除這些重復的數據來對數據進行壓縮。某些重復數據壓縮技術甚至實現了20:1的壓縮比。通過重復數據刪除技術不但能解決單數據中心中多副本占用空間的問題,還可以減少傳輸備份數據所需要的帶寬。重復數據刪除技術主要分為基于軟件的重復數據刪除和基于硬件的重復數據刪除兩種方式。這種技術已經應用于災備存儲中,如EMC的Avamar和Veritas的NetBackup等。
(3)持續數據保護(CDP)技術。CDP是一種在不影響主要數據運行的前提下,實現持續捕捉或跟蹤目標數據所發生的任何變化,并且能夠恢復到此前任意時間點的方法。CDP系統能夠提供塊級、文件級和應用級的備份,以及恢復目標的無限的任意可變的恢復點。目前該技術尚處于發展階段,隨著技術的不斷成熟和完善,將會具有強大的生命力。
4 結語
在信息化大發展的今天,數據(信息)的價值已經遠遠超過了計算機系統本身,同時,提供連續服務能力已經成為災備系統發展的核心問題。隨著人們對災備問題的越來越重視以及信息技術的發展,災備技術取得了較大的進展。應用范圍和領域也越來越廣泛。總體而言,災備建設是一項復雜的、長期的系統工程.開展國土資源信息系統的災備建設,既要考慮政策法規導向和規范制度建設,也要根據實際需要選擇合適技術方案,這將在后續文章中進一步探討。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:信息系統災難備份技術綜述