引言
災難備份是指為了災難恢復而對數據、數據處理系統、網絡系統、基礎設施、技術支持能力和運行管理能力進行備份的過程。目前許多用戶為降低信息化建設和管理成本,采用集中方式進行信息系統的建設。而集中模式對應的風險就是一旦中心機房的網絡、電源、計算機等出現故障,或者業務系統本身出現問題,以及發生火災、地震、洪水等自然災害,將導致相關業務系統癱瘓,影響系統的正常運行,甚至影響單位業務的正常開展,造成不可估量的損失。在遭遇一場災難時, 信息系統恢復的首要目標是保障企業關鍵服務。災難備份目前在政府、金融、電信、交通、能源、公共服務業及大型制造零售業等對信息化依存程度高的行業應用極其廣泛。它的主要作用是政府或企業的信息數據生產中心遭遇自然災難或人為侵害時,啟用同城或異地建立的備份數據中心, 提供不間斷的數據信息服務。
一、災備需要考慮的問題
1.數據丟失的多少、以用災難恢復時間目標和恢復點目標衡量的業務能容忍的停機時間是選擇實現特定備份策略的兩項主要因素。還有就是留存周期,即定義了業務需要備份復制的持續時間。有些數據需保存數年而另外一些只需臨時保存幾天。
2.文件的位置、大小以及數量會影響備份的過程,也是需要考慮的問題。對于將要備份的數據,所存放的位置是非常重要的考慮因素,很多組織機構具有非常多的異構平臺以支持復雜方案。文件大小也會影響備份過程,備份多個小文件比備份相同數據量的單個的大文件要花費更多的資源,小文件在備份和恢復的過程中也將占用更多的時間。同理,備份文件數量也會影響備份進程。
3.備份粒度的選擇。備份粒度的選擇依賴于業務需要以及對恢復時間目標和恢復點目標的要求。根據粒度不同,可分為全備份、累計備份和增量備份。一般都是三種備份的組合來完成整個備份工作。全備份指在某時間點上對所有數據進行完整備份,增量式備份復制自上次全備份或最近的增量式備份以來修改的數據,由于只備份修改的數據,因此備份速度快,但恢復數據耗時。累積式備份復制最后一次全備份以來修改的數據,備份時間長但恢復速度快。
4.備份方法的選擇。備份有熱備份和冷備份兩種方式。冷備份時應用需要停止,當數據庫無法關閉時,就需要采用熱備份,熱備份應用仍處于運行狀態,通過數據庫備份代理來實現,不足在于備份代理會影響到整體應用的性能。
5.備份拓撲結構的選擇。在備份環境中有三種基礎的拓撲結構:直接連接備份、基于局域網的備份和基于SAN備份。在直接連接備份中,備份設備直接連接到客戶端,只有元數據通過局域網發送到備份服務器,使得局域網從備份的數據流中解脫出來。而基于局域網備份,所有服務器通過局域網互聯并且所有存儲設備直接連到存儲節點上,要備份的數據在局域網上從備份客戶端傳送到備份設備,會影響網絡性能。基于SAN備份也被稱為無局域網備份,在客戶端間共享備份設備的時候SAN備份是最佳方案。
6.備份介質,有備份到磁帶、備份到磁盤和備份到虛擬磁帶庫。磁帶的優點就是成本低,但是數據讀寫是串行,使得備份和恢復都很慢;由于磁盤性能優異,成本低質量高,已經成為目前主流備份設備。
二、備份策略的選擇
一方面用戶運行的數據一定要做備份,而備份又是非常耗費資源的操作,因此用戶希望備份對信息服務的影響越小越好。所以需要通過備份策略來找到最好的平衡點。備份策略有以下幾個規則。
需要備份的數據有哪些。有效的備份策略應當可以區分很少變化的數據和經常變化的數據,并且對后者的備份要比對前者的備份更頻繁。
備份時間的選擇。管理員必須平衡可以接受的最長備份周期。以及備份資源消耗對信息服務的影響之間的關系,因為持續熱備份會消耗大量的處理器資源、輸入輸出、網絡容量以及大量存儲空間。
備份策略的全局考慮。備份策略的參數有備份的客戶端、文件和目錄列表、介質服務器、介質類型和設備組以及信息排程。
三、對備份的一些優化措施
避免使用磁盤鏡像來代替備份。磁盤鏡像可以防止在線存儲設備發生故障,但是如果文件被意外刪除或者文件本身損壞,鏡像磁盤上的文件也將是無法使用的,并且若鏡像存儲上的文件損壞,就相當于所有鏡像都損壞。文件恢復只能從備份拷貝中恢復。
定期測試。無法讀取的備份是沒有意義的,備份磁盤應當定期測試其可讀性和可恢復性,以保證需要恢復時的備份實時有效。
用多個拷貝保護重要的數據。用于購買、寫入、運輸和維護備份磁盤的成本要比數據丟失后重建數據的成本小得多,從災難發生后的恢復性考慮,重要數據的備份至少有一份保存在遠離主要數據中心的恢復站點是十分可靠謹慎的做法。
加密備份數據。如果客戶端和介質服務器之間的網絡路徑不安全,正在備份的數據在網絡中傳輸時,有可能被未經授權的第三方讀取或修改。為杜絕這種可能性,應對重要敏感的數據進行加密。
盡量避免恢復的發生。通過統計,大多數情況是單個文件或者部分文件的恢復,而不是整個文件系統的恢復。對文件系統定期快照,可能不需要使用備份磁盤就可以恢復被刪除的文件,但是快照并不能替代備份,備份是防止文件系統發生災難的不可或缺的方法。
四、對數據庫的災備
數據庫的備份必須是數據庫在某一時間點的鏡像,鏡像中需要沒有未完成的事物處理。可以通過數據庫的冷備份實現。因為冷備份沒有正在進行的事務處理。缺點是備份過程因為是冷備份,應用程序在備份時無法使用數據庫。當然數據庫備份也可以熱備份,在熱備份時,備份程序必須保證備份是數據庫的一致性鏡像。.
冷備份通過關閉數據庫然后進行文件的備份,實現簡單安全。但在實踐中讓數據庫關閉然后備份很難實現,尤其是需要被全天候訪問的用戶。
目前大多數數據庫都可以實現熱備份。有兩種基本方法,邏輯熱備份和物理熱備份。邏輯熱備份是復制數據庫的邏輯單元對象,而不是復制該對象的容器文件的內容,它通常與恢復、修復應用合并使用,產生錯誤備份的風險很小。缺點是不能使用存儲快照技術來減少備份對應用的影響。邏輯熱備份在備份過程中會很大程度的影響系統性能,所以不適用頻繁使用的數據庫。而物理熱備份復制了數據庫所包含的容器文件的內容。數據庫容器文件并不是可以隨時都可以復制,因為數據庫管理系統在不斷更新容器文件。使用中的文件的副本很可能包含只是部分完成的事務處理,而且也不能將數據庫恢復到一致性狀態。要確保一致性容器文件備份,數據庫必須處于某個靜止狀態,沒有正在進行的事務處理且沒有數據正寫入緩存。當備份完成后,數據庫重新進行激活。也就是說這種備份運行時數據庫無法使用,跟離線備份一樣高效。
用戶的數據庫對可用性要求很高且內容是不斷增長的,使得數據庫全備份在很多情況下無法完成。可以通過增量備份縮短備份時間。
通過定期備份并將其保存到安全的地方,數據庫就能從大多數災難中恢復過來。恢復首先合并使用備份和日志,恢復數據庫的基準鏡像。對于無法預知的物理性災難,在數據庫基準鏡像上執行數據庫的完全恢復,可以使恢復點盡可能接近災難發生時刻。而對人為或應用導致的邏輯災難,被恢復鏡像可以恢復到數據損壞前的那個時刻。
五、結語
備份是用戶防止重要數據丟失的最后一道防線。在發生意外時,即使未作任何級別的數據防護,導致了重要文件丟失或刪除,甚至發生整個數據中心損壞的災難,備份都可以避免數據丟失帶來的不利影響。在規劃數據中心建設時,一定要重視數據災備,不能把它作為最低的優先級來考慮,相反,可靠的定期備份必須是任何信息服務災難恢復策略的最高優先級。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:淺議數字信息的災難備份