1、引言
隨著計算機網絡的發展,原來的集中式信息系統逐漸轉變成了分布式的網絡信息應用系統。同時人類社會對分布式網絡系統的依賴程度、可靠性要求也越來越高。特別是稱之為關鍵信息系統的,如金融、電信這樣的行業,其企業信息系統往往承載了企業的整個運作過程,因此就對業務系統的可靠性、數據的完整性以及業務的連續性要求很高。據有關報告顯示:只有6%的公司在數據丟失后生存下來,43%的公司再也無法重新開業,超過50%的公司會在兩到三年后消失。為了保證企業關鍵數據的完全性和完整性,建立一套完備的容災系統是企業關鍵數據的最可靠保證。本文針對數據容災理論及相關的技術進行分析和研究。
2、容災的理論
2.1容災的概念
容災(disaster tolerance)是一個范疇廣泛的概念,從廣義上,任何提高系統可靠性與可用性的努力都可稱為容災。從狹義上,容災是通過在異地建立和維護一個備份存儲系統,利用地理上的分離來保證系統和數據對災難性事件的抵御能力。當災難發生時,如何能夠在最短的時間內使系統恢復正常,保證數據最少丟失,都是容災技術研究的內容。
2.2容災的分類
因為災難所包含的內容較廣,容災所涉及的內容也較多,所以可以從多個角度對容災進行分類。從距離角度分為木地容災,近距離容災,遠距離容災。這三種類型所能容忍的災難也是不相同的,這與備用系統和生產系統的距離是密切相關的。
從應用角度,容災系統的實現可分為兩個層次:數據容災和應用容災。數據容災指建立一個異地的備份數據系統,備份本地關鍵應用數據,即數據的異地備份。應用容災是在數據容災的基礎上,在異地建立一套完整的與本地生產系統相當的備份應用系統(可以互為備份,可以共同工作)。在災難出現后,遠程備份系統迅速接管業務運行。數據容災是應用容災的基礎,應用容災是更高層次的容災系統。
2.3容災系統的評價指標
容災系統需要考慮多方面的因素,如備份和恢復數據量大小、災難發生時數據的丟失量、應用數據中心和備援數據中心之間的地理距離和數據傳輸方式、災難發生時所要求的恢復速度和恢復層次、備援中心的管理及投人資金等。根據這些因素和不同的應用場合,容災備份中心自動異地遠程恢復被定義有7層,其中包含了2個技術指標。
一般是以數據丟失量和數據恢復時間作為標準進行評價的,所公認的評價標準是RTO和RPO。
①RPO(Recovery Point Objective):即數據恢復點目標,主要指的是業務系統所能容忍的數據丟失量;
② RTO(Re-coverty Time Objective):即恢復時間目標,主要指的是所能容忍的業務停止服務的最長時間,也就是從災難發生到業務系統恢復服務功能所需要的最短時間周期。RPO針對的是數據丟失,而RTO針對的是服務丟失,二者沒有必然的關聯性。
RTO和RPO的確定必須在進行風險分析和業務影響分析后根據不同的業務需求確定。對于不同企業的同一種業務,RTO和RPO的需求也會有所不同。
3、關鍵技術的分析
用于容災系統的關鍵技術主要包含:數據存儲管理、數據復制、災難檢測、系統遷移和系統恢復五個方面。在這里只介紹最重要的兩個方面。
3.1數據存儲管理
數據存儲管理,是指對與計算機系統數據存儲相關的一系列操作(如備份,歸檔,恢復等)進行的統一管理,是建立一個容災系統的重要組成部分。數據存儲管理工作包括數據備份、數據恢復、備份索引、備份設備及媒體和災難恢復等與數據備份相關的所有管理。
(1)數據備份,是指為防止系統出現操作失誤或系統故障導致數據丟失,而將全系統或部分數據集合從應用主機的硬盤或陣列復制到其它的存儲介質的過程,數據備份是容災的基石。
(2)數據歸檔,是將硬盤數據復制到可移動媒體上。與數據備份不同的是,數據歸檔在完成復制工作后將原始數據從硬盤上刪除,釋放硬盤空間。
數據備份,是數據存儲管理中的一個重要部分。數據備份的評價標準包括備份速度、恢復速度以及數據恢復點。提高數據備份管理的透明性和自動化,管理好各種存儲設備,也是需要解決的一個重要問題,而存儲虛擬化技術通過將各種異構的存儲系統整合成為能夠作為單一資源易于管理的單一存儲池解決這個問題。
3.2數據復制
數據復制是容災系統的核心技術,是將一個地點的數據拷貝到另外一個不同的物理點上的過程。數據復制一般分為同步數據復制和異步數據復制。同步數據復制是通過將本地生產數據以完全同步的方式復制到異地,每一本地IO交易均需等待遠程復制的完成方予以釋放,其特點是基本可以做到零數據丟失;異步數據復制指將本地生產數據以后臺同步的方式復制到異地,每一本地IO交易均正常釋放,無需等待遠程復制的完成。其特點是在災難發生時,會有少量數據丟失,與網絡帶寬、網絡延遲、I/O吞吐量相關。
實現數據的異地復制,有軟件方式和硬件方式兩種途徑。軟件方式,是通過主機端軟件來實現。即在主系統和容災系統的主機上,安裝專用的數據復制軟件。其優點是與硬件無關,成本較低。缺點是效率較低和可管理性較差。硬件方式,是數據直接在存儲設備之間傳輸,并不依賴主機的管理。這種方式要求在主系統和容災系統配置上支持這種功能的專用存儲設備,所以成本較高。根據復制數據的層次可以分為四種類型:
①硬件級的數據復制;
②操作系統級的復制;
③數據庫級的復制;
④業務數據流級復制。
容災數據復制的性能和網絡帶寬、復制距離、數據傳輸方式、數據塊打包方式、系統處理能力有關。可以看出,其中通訊問題是影響遠程復制效率的最關鍵因素。
4、容災系統的實現方式
4.1基于主機的容災
通過在主機上安裝軟件實現數據在服務器之間的復制。這種方式對存儲系統沒有限制,支持異構存儲系統,不需要增加硬件,同時可以在服務器層增加應用遠程切換功能軟件,從而構成完整的應用級災備方案。但這種方式對軟件要求高,生產中心和災備中心的每一臺應用服務器上都需要安裝專門的軟件,隨著服務器數目的增加,成本也線性增加。同時存儲目標數據的邏輯卷不能被業務系統直接使用。由于需要在服務器上運行軟件,對服務器兼容性和性能也會有所影響。
4.2基于存儲設備的容災
通過存儲控制器實現的設備級數據遠程鏡像或復制,是傳統災備中最高效最可靠的方式。基于存儲設備的容災與服務器平臺無關,遠程復制由生產中心和災備中心的存儲系統完成,對應用服務器完全透明。設備往往采用的是一些專用的設備和通信方式,安裝維護都比較復雜。由于兩個中心之間必須有專用的網絡連接作為數據通道,使得該系統對通信線路的要求較高,初期成本非常昂貴。
4.3基于網絡級的容災
主要是指基于虛擬化存儲技術的災備。這種方式無需在應用服務器上安裝任何軟件,遠程復制過程不會對應用服務器產生影響。存儲設備可以完全異構,不同廠商不同接口的陣列可以混合使用,而且完全不用考慮現有的存儲設備是否支持遠程數據災備,大大降低了方案復雜程度和實施難度。但是數據的寫入必須由虛擬化數據管理產品進行轉發。
5、小結
通過建立容災系統,提供了高可靠的數據保護環境,降低災難發生造成的損失,提高系統的安全性和可恢復性。容災系統并不是在設計完成后就不必再管理的項目,它不僅僅是技術,更是一項工程。另外,如何將基于磁盤設備或者操作系統的數據復制轉移到從網絡業務數據流層次進行數據復制,怎樣提供一個通用的應用接口將多樣化的存儲設備靈活且透明的組織起來,將是以后的研究方向。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:淺析中小企業數據容災理論和技術
本文網址:http://www.guhuozai8.cn/html/consultation/1083952229.html