一、容錯技術的意義
容錯的含義比較寬泛,這種不確定性容易引發歧義,增加理解上的難度。從概念上來說,容錯是指服務器對于錯誤的容納能力,是應用過程中對于服務器穩定性追求的一個目標。服務器的容錯技術一般是指由于種種原因在系統中出現了數據、文件損壞或丟失時,系統能夠自動將這些損壞或丟失的文件和數據恢復到發生事故以前的狀態,服務器還具備繼續工作的能力,使系統能夠連續正常運行的一種技術。容錯系統一般有兩種,既有因具備熱備份方案而允許出錯的系統,也有對出錯非常敏感的系統。這里的“出錯”既有人為因素,也有非人為原因。
雖然在一般情況下,信息系統的故障不會給企業運作帶來什么影響,但在某些關鍵時刻,系統的故障就會給企業帶來不可挽回的影響和損失,這對醫院、報社、工廠、金融機構等而言,尤其重要。容錯技術的產生和應用正是在這種客觀需求下應運而生的。容錯技術的逐步成熟,使得具備容錯功能的服務器具備了更高的可用性和可維護性,而且容錯服務器還可以降低用戶的總體擁有成本,更多的企業開始把目光從雙機熱備轉向了具有容錯技術的服務器平臺。
具備容錯技術的服務器是通過對服務器的關鍵部件采用冗余配置的模式,當出現操作失誤或系統故障時,服務器的容錯機構可以及時發現、及時補救所出現的系統故障,以保護文件、恢復并保持系統的正常運行。而專業的容錯服務器則能夠自動分離故障模塊,在不中斷運行的情況下,進行模塊調換,對損壞的部件進行維護,并且在一切物理故障消除后,系統會自動恢復同步運行。容錯服務器在“可靠性、可用性、可管理性、可維護性、可兼容性、可擴展性”等設計方面得到了更好的保障。
二、如何保護服務器
在容錯服務器領域,通常采用以下三種方式保護服務器,一是把兩臺服務器共享磁盤陣列柜做成集群,二是在兩臺服務器間安裝雙機容錯軟件,三是單機容錯。它們各自所對應的容錯級別也是從低到高的,也就是說,服務器群集技術容錯級別最低,而單機容錯技術級別最高。
(一)雙機熱備份技術所采用的是兩臺配置完全一樣的服務器系統,操作系統的應用程序安裝在兩臺服務器的本地系統盤上,整個網絡系統的數據是通過磁盤整理集中管理和備份數據的。數據集中管理是通過雙機熱備份系統,將所有站點的數據直接從中央存儲設備讀取和存儲,并由專業人員進行管理,保護了數據的安全性和保密性。
(二)單機容錯服務器則是通過CPU時鐘鎖頻,通過對系統中所有硬件的備份,包括CPU、內存和I/O總線等的冗余備份,通過系統內所有冗余部件的同步運行,實現真正意義上的容錯。任何系統部件的故障都不會造成系統停頓和數據丟失。
(三)雙機熱備的容錯模式和單機容錯服務器的定位稍有不同,雙機熱備一般可以實現99.9%的可用性,單機容錯卻可以實現99.999%的可用性。這樣,雙機熱備份大多應用在業務連續性不是很嚴格的行業,比如公安系統或者個別的制造企業,這些行業的應用允許數據有一小段時間的中斷。而如電信、金融、證券和醫療等要求高的行業則是容錯服務器的天下。
另外,雙機熱備容錯方式由于至少需要2臺服務器,導致在軟件采購(操作軟件、中間件、雙機備份軟件等)、系統維護升級、系統硬件升級都需要比單機容錯方式多1倍的額外投入,而且在雙機熱備份軟件出現故障時,其維修的難度較高,會給客戶帶來較大的困難。因此,雖然單機容錯服務器的硬件成本高于雙機備份方式的硬件投入,而其總成本卻遠遠低于雙機備份方式的成本。
三、容錯系統應用
進入21世紀以來,制造、中小企業、能源、交通等領域對服務器,特別是中低端IA服務器的需求激增,過去僅僅可以應用在RISC平臺、HP-UX環境下的容錯產品也面臨著新的挑戰。另一方面,企業越來越依賴信息系統來完成關鍵業務的應用,同時他們不可能配備更多的專業人員來進行專職維護。雙機熱備、集群服務器遇到難題。尤其對24小時不間斷,長期工作負責核心的服務系統,需要具備容錯服務。
在煉鋼的L2控制層當中,采用的是四臺Stratus容錯ftServer4300服務器,分別作為預處理、電路/轉爐、煉爐及連鑄數據庫服務器,容錯服務器的二級PCS系統具備如下特征:
系統開放性:容許哦服務器一般應用的是工業行業標準設計,系統具備良好的開放性,采用的是RedHat Linux操作系統,數據庫應用的是oracle,今后軟件的移植、系統的升級均很方便。
系統的可靠性:容錯服務器應用部件級冗余,因此關鍵的核心組件都是冗余的,采用美國容錯公司的專有的硬件時鐘同步技術,冗余的容錯硬件的部件在同一時鐘周期下執行相同的運算,在一個部件出現故障的情況下,其冗余部件就像激活了備份一樣,繼續正常工作;服務器系統的零切換時間保證了實時數據的完整性和可靠性,結合容錯的故障安全軟件及主動服務體系結構,從而保證了系統的99.999%的可用性。
經過對于現有硬件平臺的分析,鋼鐵廠熱軋生產線二級過程控制系統與數據庫系統選用了Stratus ftServer容錯系統。此系統應用的是緊密封裝的機架或機柜配置,且第三代容錯系統繼承了ftServer技術的可靠性,再加上精細的行業標準模塊化部件設計,結合相關操作系統的可用性、高性能、安全特點,這樣完全能夠滿足生產的需要。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:容錯系統意義及其在鋼鐵廠的應用分析
本文網址:http://www.guhuozai8.cn/html/consultation/1083935704.html