為了確保ERP系統(tǒng)持續(xù)穩(wěn)定運(yùn)行,并滿足金融監(jiān)管部門等對(duì)歷史數(shù)據(jù)的查詢需要,數(shù)據(jù)備份管理面臨更高的要求。數(shù)據(jù)中心作為銀行信息系統(tǒng)的核心,有效的數(shù)據(jù)備份管理尤為重要。因其數(shù)據(jù)具有來源復(fù)雜、數(shù)據(jù)量大的特點(diǎn),要做好大型數(shù)據(jù)中心的備份管理,需關(guān)注以下幾個(gè)問題。
(1)數(shù)據(jù)備份策略制定的合理性。數(shù)據(jù)備份策略是指數(shù)據(jù)備份的基本規(guī)則和約定,合理的備份策略應(yīng)符合以下要求:一是滿足數(shù)據(jù)有效恢復(fù)的需要;二是盡量降低備份的成本和時(shí)間。
(2)數(shù)據(jù)備份策略部署的合規(guī)性。由于數(shù)量龐大,備份策略需部署到備份工具中,由其自動(dòng)調(diào)度執(zhí)行。策略部署的合規(guī)性是指,備份策略各個(gè)要素在工具中的部署正確無誤。
(3)數(shù)據(jù)備份策略執(zhí)行的準(zhǔn)確性。受系統(tǒng)資源、網(wǎng)絡(luò)環(huán)境等影響,備份策略可能出現(xiàn)執(zhí)行錯(cuò)誤,錯(cuò)誤類型主要有未執(zhí)行、執(zhí)行失敗和執(zhí)行超出時(shí)間窗口等。策略執(zhí)行的準(zhǔn)確性要求應(yīng)盡量避免問題發(fā)生,并在問題發(fā)生后能及時(shí)處理。
(4)數(shù)據(jù)備份管理工作的可控性。可控性是指,一方面通過一定的工具和手段確保備份管理工作符合上述三點(diǎn)要求;另一方面建立相應(yīng)的指標(biāo),對(duì)備份情況進(jìn)行統(tǒng)計(jì)度量。對(duì)于大型數(shù)據(jù)中心,一般需要采用自動(dòng)化的工具實(shí)現(xiàn)。
一、數(shù)據(jù)備份策略的制定
1. 備份策略的要素及分類
數(shù)據(jù)備份策略應(yīng)包括備份內(nèi)容、備份頻率、備份方式、保存期限、備份時(shí)間窗口、備份介質(zhì)、介質(zhì)存放地點(diǎn)等要素。為了易于執(zhí)行、維護(hù),各個(gè)要素的內(nèi)容應(yīng)精確、可操作。
2. 影響因素分析
制定備份策略需要綜合考慮一些因素,詳見表1。
表1 備份策略要素的影響因素
3. 策略制定的原則及規(guī)范
制定合理的備份策略,需要遵循兩個(gè)原則:一是滿足業(yè)務(wù)數(shù)據(jù)查詢或系統(tǒng)恢復(fù)的需要,包括恢復(fù)內(nèi)容要求、恢復(fù)時(shí)間點(diǎn)要求、恢復(fù)效率要求等;二是在滿足恢復(fù)需求的前提下,盡量減少備份冗余,以節(jié)約成本、降低耗時(shí)。比如通過降低備份頻率,可以降低系統(tǒng)和網(wǎng)絡(luò)的使用率,同時(shí)減少存儲(chǔ)介質(zhì)消耗。
為了實(shí)現(xiàn)對(duì)海量備份需求的統(tǒng)一管理,可根據(jù)以上原則編制《備份策略制定規(guī)范》,以明確對(duì)于給定的備份需求,如何確定各項(xiàng)備份要素。比如,對(duì)于數(shù)據(jù)庫(kù)的備份,可編制如表2所示規(guī)范。
表2 數(shù)據(jù)庫(kù)備份策略規(guī)范示例
二、數(shù)據(jù)備份策略的部署
備份策略制定完成后,需部署到備份管理軟件中,由其集中調(diào)度,實(shí)現(xiàn)自動(dòng)備份。本文以目前主流的Veritas NetBackup(NBU)軟件為例加以說明。
1. 策略部署存在的問題
根據(jù)合規(guī)性要求,備份策略的各項(xiàng)要素均需正確部署。然而,對(duì)于大型數(shù)據(jù)中心而言,由于策略數(shù)量龐大且涉及的系統(tǒng)、網(wǎng)絡(luò)及設(shè)備等環(huán)節(jié)較多,部署過程中難免出現(xiàn)操作失誤;同時(shí),若備份策略沒有隨應(yīng)用版本升級(jí)等環(huán)境變化及時(shí)調(diào)整,也可能導(dǎo)致部署錯(cuò)誤。常見的部署錯(cuò)誤類型見表3。
表3 備份策略部署問題類型
表4 備份策略執(zhí)行問題類型
2. 解決措施
為了規(guī)避上述問題發(fā)生,可對(duì)備份策略的部署情況進(jìn)行檢查,并及時(shí)整改發(fā)現(xiàn)的問題。一般來說,可采用定期檢查、非定期檢查結(jié)合的方式;如果技術(shù)條件成熟,可采用實(shí)時(shí)檢查的方式。
定期檢查主要針對(duì)因環(huán)境變化導(dǎo)致的部署錯(cuò)誤。檢查周期根據(jù)環(huán)境變化的速度而定,一般可采用較長(zhǎng)周期內(nèi)全面檢查、期間進(jìn)行抽樣檢查的方式。非定期檢查主要針對(duì)策略部署過程中的操作失誤,一般在備份策略變更后進(jìn)行。實(shí)時(shí)檢查采用自動(dòng)化檢查工具,對(duì)策略的部署情況實(shí)時(shí)監(jiān)控。該方式可第一時(shí)間發(fā)現(xiàn)問題,確保策略部署的合規(guī)性。
三、數(shù)據(jù)備份策略的執(zhí)行
部署在NBU中的備份策略,一般可由NBU調(diào)度自動(dòng)執(zhí)行;但受系統(tǒng)資源、網(wǎng)絡(luò)環(huán)境等影響,備份策略可能出現(xiàn)執(zhí)行錯(cuò)誤。以下簡(jiǎn)單介紹主要的錯(cuò)誤類型及處理措施。
1. 策略執(zhí)行存在的問題
備份策略在執(zhí)行可能發(fā)生如表4 所示問題。
2. 解決措施
要解決策略執(zhí)行錯(cuò)誤的問題,降低因此帶來的負(fù)面影響,主要應(yīng)采取以下兩方面的措施:①及時(shí)處理。NBU軟件可以提供備份策略執(zhí)行的日志,根據(jù)表4中的判斷依據(jù)對(duì)日志進(jìn)行分析,即可發(fā)現(xiàn)執(zhí)行錯(cuò)誤問題,進(jìn)而及時(shí)進(jìn)行手工補(bǔ)備。②根源分析及隱患整改。通過對(duì)執(zhí)行出錯(cuò)問題的統(tǒng)計(jì)、根源分析,定位問題的根本原因,并采取措施避免類似問題的再度發(fā)生。
四、備份管理工作的自動(dòng)化及度量指標(biāo)
通過上述分析可見,僅采用備份工具NBU尚不能保障備份工作的可控性,因此需引入自動(dòng)化工具,加強(qiáng)對(duì)策略的部署、執(zhí)行等環(huán)節(jié)的控制,并通過一定的指標(biāo)進(jìn)行度量。
1. 策略的維護(hù)及發(fā)布
功能介紹:將制定的備份策略表導(dǎo)入工具,并提供編輯(增刪改)、查詢、篩選及導(dǎo)出等功能;同時(shí)可作為官方工具,將備份策略在數(shù)據(jù)中心范圍內(nèi)發(fā)布。該功能將便于管理人員從整體上把握備份策略,同時(shí)為后續(xù)的功能提供基礎(chǔ)數(shù)據(jù)。
2. 策略部署情況自動(dòng)檢查
功能介紹:自動(dòng)檢查備份策略在NBU中的部署是否正確,并列出部署錯(cuò)誤的策略。檢查項(xiàng)目包括是否已部署、服務(wù)器IP、備份內(nèi)容、備份時(shí)間窗口、備份頻率及保存周期等。
實(shí)現(xiàn)方法:通過自定義腳本,定期(如每日)導(dǎo)出NBU中的策略部署信息,與備份策略表進(jìn)行比對(duì)。需要指出的是,兩組數(shù)據(jù)格式上可能有差異,在比對(duì)時(shí)需要先進(jìn)行轉(zhuǎn)換。比如備份策略表中的備份周期是“每日備份”,則NBU中部署為“每月1日、每月2日...每月31日”。
3. 策略執(zhí)行出錯(cuò)分析
功能介紹:自動(dòng)生成執(zhí)行出錯(cuò)策略清單,并提供接口供操作人員錄入后續(xù)處理信息。
實(shí)現(xiàn)方法:通過自定義腳本,定期(如每小時(shí))導(dǎo)出NBU 中的策略執(zhí)行日志,并根據(jù)本文前面介紹的方法進(jìn)行分析。
4. 策略執(zhí)行情況統(tǒng)計(jì)
功能介紹:匯總所有備份策略的執(zhí)行情況(包括執(zhí)行時(shí)間、備份數(shù)據(jù)量、執(zhí)行出錯(cuò)信息等),以便進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)問題隱患。
實(shí)現(xiàn)方法:通過對(duì)NBU 策略執(zhí)行日志的分析,記錄返回碼、數(shù)據(jù)量、執(zhí)行時(shí)間等要素,按照表5 格式生成報(bào)表。
表5 備份策略執(zhí)行情況報(bào)表設(shè)計(jì)
5. 備份情況指標(biāo)設(shè)計(jì)
(1)備份策略執(zhí)行準(zhǔn)確率。該指標(biāo)用于評(píng)價(jià)備份策略執(zhí)行的準(zhǔn)確性,其基礎(chǔ)數(shù)據(jù)來自備份策略執(zhí)行情況報(bào)表,計(jì)算方法為:備份策略執(zhí)行準(zhǔn)確率=(計(jì)劃執(zhí)行的備份策略總數(shù)-執(zhí)行出錯(cuò)的備份策略數(shù))/計(jì)劃執(zhí)行的備份策略總數(shù)。
備份策略執(zhí)行準(zhǔn)確率越高,需要后續(xù)人工處理的工作量就越小,備份工作的自動(dòng)化程度也就越高。要提高該指標(biāo),一方面需要確保備份策略部署的合規(guī)性;另一方面需要通過對(duì)歷史出錯(cuò)情況的深入分析,對(duì)系統(tǒng)、網(wǎng)絡(luò)等環(huán)境進(jìn)行優(yōu)化。
(2)備份數(shù)據(jù)恢復(fù)準(zhǔn)確率。該指標(biāo)用于評(píng)價(jià)已備份數(shù)據(jù)在后續(xù)使用(即數(shù)據(jù)恢復(fù))時(shí)的有效性,其基礎(chǔ)數(shù)據(jù)來自于備份數(shù)據(jù)的恢復(fù)驗(yàn)證結(jié)果,計(jì)算方法為:備份數(shù)據(jù)使用正確率=(數(shù)據(jù)恢復(fù)總次數(shù)-無法正常恢復(fù)的次數(shù))/數(shù)據(jù)恢復(fù)總次數(shù)。
備份數(shù)據(jù)恢復(fù)正確率從事后驗(yàn)證的角度綜合反映了備份管理的工作水平,它不僅體現(xiàn)了備份策略的執(zhí)行結(jié)果,也與備份介質(zhì)的保管情況密切相關(guān)。但由于是抽樣指標(biāo),其可靠程度依賴于樣本總?cè)萘浚磾?shù)據(jù)恢復(fù)總次數(shù))的大小。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:大型數(shù)據(jù)中心數(shù)據(jù)備份管理的方法與實(shí)踐
本文網(wǎng)址:http://www.guhuozai8.cn/html/support/1112152502.html