容災是指系統具有在嚴重災難發生后的恢復能力。容災是通過在相當距離的異地,建設一套功能和處理能力與正常生產系統相當的備份系統,以確保當主系統發生意外災難或有計劃的長時間停機的情況下,備份系統能夠在短時間內接替、延續主系統的生產任務。容災系統對以下情況具有恢復能力:
①自然災害及其它不可抗力的災難;長時間無法修復性停電等機房外設的損壞;
②主機升級、檢修等計劃性宕機等長時間機房設備無法正常工作;
③主機系統、數據信息被嚴重破壞等人為失誤造成的災害。
容災系統的設計和實現主要有兩種方式,一是基于應用軟件的容災備份方式,是根據應用系統本身的特點,選擇將主系統處理過程中收集或使用的與備份系統不同的信息(即增量和變化信息),通過網絡傳輸到備份系統。其特點是:對應用程序須要作一定的改造,將主、備同步機制嵌入到應用程序中去,使主系統能將同步數據生成并傳輸到備份系統,而備份系統能根據收到的同步數據進行處理,從而產生與主系統相同的處理結果,達到主、備系統的一致性。應用軟件級容災的優點是所需網絡帶寬較小,對主、備系統距離沒有限制,但其缺點是對于軟件系統的改造和維護工作量較大。另一種是基于共享磁盤的硬件級同步,是將主系統在共享磁盤上執行底層“寫”操作,然后通過網絡發送到備份系統跟從執行,從而達到主、備系統的數據一致性。其特點是:對應用程序基本透明,無須對應用軟件作較大的改造,便可以實現容災。但是它對于網絡帶寬的要求也較高,對于主、備系統的距離也有一定限制,這是因為當兩地距離超過一定長度后,網絡由于信號中斷引起的延時會對主系統的性能造成較大的沖擊。
1 硬件級容災方案設計
硬件級容災方式是利用存儲服務器的遠程數據復制軟件來實現主數據中心和備份中心的操作系統、文件系統、數據庫的實時拷貝復制。主、備份中心磁盤陣列本身就可以通過陣列上的微處理器完成數據的實時同步,不需要主機干涉。即實現遠程容災方案。無須對數據庫配置和應用系統進行任何改動,可以做到災難發生的同時實現應用處理過程的恢復,遠程備份系統的重新啟動可以做到像一般電源故障后的重新啟動那么簡單。
將主機服務器的操作系統、數據庫及應用程序安裝在獨立的具有備份功能的磁盤陣列上,并將磁盤陣列上的數據進行遠程鏡像,同樣可以實現主機操作系統的遠程容災。當在生產系統上對操作系統參數、數據庫配置文件和應用程序參數進行修改時,同時也復制到備份中心,無需系統管理員在備份系統的操作系統磁盤上手工重復這些配置參數的修改,一旦生產中心發生突發性故障,備份中心使用備份陣列上的外掛操作系統盤鏡像,與主中心相同的系統配置參數迅速引導主機,恢復業務系統的運行。
2 存儲區域網絡
2.1 網絡存儲技術
隨著光纖通道技術的出現和網絡技術的發展,存儲的底層技術逐漸向網絡存儲方向發展。網絡存儲可以實現數據的安全存儲管理,實現不同平臺之間的數據共享,為用戶提供不問斷的數據訪問。
存儲區域網絡是網絡存儲技術發展的主流方向,它是以Gb帶寬實現計算機和存儲器之間的通訊,結合了I/O通道技術、局域網模型、大容量存儲器的技術優點。它消除了服務器傳輸處理的瓶頸。適合大數據量傳輸、實時數據處理。獨立于服務器網絡系統之外,幾乎擁有無限存儲能力的高速存儲網絡,這種網絡采用高速的光纖通道作為傳輸媒體。存儲區域網絡SAN(Storage Area Network,SAN)可使服務器與存儲設備之間進行“any to any”的連接通信,實現多服務器獨立地共享一個陣列子系統、共享—個自動庫,實現數據的共享和集中的管理,進而完成快速、大容量和安全可靠的數據存儲。
2.2 SAN的拓撲結構
SAN的組成包含了存儲介質(磁盤陣列、磁帶庫等)、存儲連接器件(光纖交換機、適配器等)、SAN管理服務器(見圖1)。網絡連接包含SAN網絡連接和以太網局域網連接兩部分。
采用SAN架構時,如果采用l臺光纖交換機和多臺使用SAN的應用服務器相連,光纖交換機就成了系統中的單點故障隱患點。為了提高存儲系統的安全性和冗余性,在實際應用中采用2臺光纖交換機。所有需要接人SAN存儲子系統的應用服務器都配置兩塊光纖卡,每臺服務器和兩臺光纖交換機之間都有物理連接,整個存儲子系統形成了一個全冗余的架構。當有某塊光纖卡或某臺光纖交換機發生故障現象時,整個存儲子系統不會癱瘓。
3 容災系統的結構和實現
基于SAN的硬件級異地容災系統包括生產數據中心(主)和備份數據中心(備)兩部分組成(見圖2),分別位于不同的地理位置(同城異地)。兩個數據中心的數據存儲都是基于SAN的,通過光纖通道交換機將本地磁盤陣列和異地容災磁盤陣列組成SAN網絡存儲。整個系統中的網絡環境包括兩部分:
①是公網部分(見圖2上半部分所示),主要承擔服務器與服務器之間、服務器與客戶機之間的網絡通訊;
②是SAN管理網段,主要承擔SAN網絡存儲中光纖交換機與設備之間、異地交換機之間的網絡通訊。
主數據中心采用高可靠性集群解決方案設計,通過安裝高可靠性管理軟件組成多機高可靠性環境。數據存儲在主數據中心的磁盤陣列中,磁帶庫作為日常備份使用。主數據中心還要配置一臺備份管理服務器,直接連接到存儲磁盤陣列和磁帶庫,用來管理和控制系統的日常數據的備份。類似主數據中心,在異地備份數據中心配置相同結構的存儲環境。兩個數據中心之間采用高性能骨干網,為兩個數據中心提供高帶寬、高可靠的連接通道。通過使用容災軟件自動實現主數據中心存儲數據與備份數據中心數據的實時完全備份。在本地數據及整個應用系統出現災難時,系統至少在異地保存有一份可用的關鍵業務的鏡像數據,該數據是本地生產數據的完全實時拷貝。
在方案實現上,主要分為以下幾個步驟:
①在備份數據中心,采購和生產數據中心一致的光纖交換機和存儲設備,構成SAN環境;
②生產數據中心和備份數據中心之間通過裸光纖連接起來;
③在每個需要容災的應用服務器主機上,部署容災軟件;
④通過容災軟件提供的跨陣列磁盤鏡像技術,實現同城異地間的數據容災。
4 容災系統的災難處理
一個完備的容災系統,除了在數據災難發生時完成容災備份的使命,還要考慮系統本身的可維護性和可操作性,以及對系統盡可能快的恢復。
當生產中心的磁盤系統發生故障(災難),導致應用服務器無法訪問本地數據,容災系統會自動隔離生產中心的磁盤,讓應用服務器直接對備份數據中心的數據進行訪問。應用和數據庫不會因為生產中心的磁盤系統故障而停止;更重要的是,避免了發生數據庫損壞(數據一致性風險)的可能。當備份數據中心或生產數據中心到備份數據中心的光纖鏈路發生故障,導致了鏡像的破壞,容災系統將自動只與狀態健康的磁盤陣列繼續工作,與生產數據中心發生故障時的處理是相同的。這樣,即使在無人值守的情況下,也能夠確保業務系統全天候的正常運行。
磁盤系統故障修復之后,要盡可能快的將遠程鏡像系統恢復起來,實現鏡像的重新同步,以確保容災的功能繼續得以實現,這也是容災方案是否成功的關鍵因素。目前鏡像同步的技術大多是基于日志功能的,當因故導致鏡像被破壞時,災難恢復軟件會通過日志記錄此后發生變化的業務數據;一旦故障被修復,會根據日志記錄的情況,將更新的業務數據(變化量)增量同步到災難端,從而實現鏡像的完全同步。在鏡像快速同步的過程中,用戶的應用始終可以正常工作。整個同步過程的發起,管理員只需要執行簡單命令即刻完成。
5 結束語
本系統適用于備份數據中心和主數據中心的近距離容災(距離小于100公里),容災級別相對較低。但投資規模較小,日常維護費用少,并且可以將已有的投資與長期的存儲解決方案結合起來。當主、備機房的距離更遠(位于不同城市)時,光纖連接則需要加上光纖延伸器。儲存上則需要專用的存儲服務器,如IBM TotalStorage系列產品,容災費用大,僅適用于大型企業。
在企業將來有更高的容災需求時,只需對現有系統結構進行部分擴充,就可以實現。擴充的內容主要包括網絡、應用及數據庫服務器、IP等資源,以及各資源之間的良好協調。這樣,在備份數據中心建立一套完整的與生產數據中心相當的備份應用系統,從而實現更高級別的應用級容災。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:基于SAN存儲模式的異地容災系統