引言
信息集成是消除企業內信息孤島、實現信息共享、提供決策支持的核心技術,而數據中心是信息集成系統的基礎,具有重要的學術和應用價值,一直是近年來的研究熱點,也是電力企業在堅強智能電網關鍵設備(系統)研制規劃中力爭解決的重點問題之一。
為了實現信息共享和應用集成,電力企業正在研究建立智能變電站數據中心、電力調度中心統一數據平臺、配電網信息集成平臺以及企業信息平臺等。國家電網公司在公司總部和各個網省公司構筑了由數據中心、數據交換、應用集成、企業門戶等部分組成的一體化企業級信息集成平臺,并于2011年5月在北京、上海、西安建設了集中式信息系統災備中心,以保障數據安全。電力數據中心和災備中心作為電力企業信息資源的存儲、處理和備份中心,對于實現信息的縱向貫通和橫向共享起到至關重要的作用,但是,目前的電力數據中心還遠未達到智能電網與新一代數據中心所要求的海量數據存儲與計算、自動化管理、節能環保與高可用性的水平。
電力數據中心目前日均新增數據記錄5000萬余條,還尚未完全接入企業資源計劃、調度自動化、狀態監測、空間地理、氣象等系統的數據,特別是隨著可再生能源以及分布式電源的不斷接入,電力數據中心的數據量將劇增,對海量智能電網信息的存儲與處理將提出更高的要求。數據量的劇增,將造成電力數據中心規模的增大,帶來的問題是碳排放和耗電量的不斷激增,全球權威機構Gartner調查顯示,信息技術行業每年的二氧化碳排放量約為3500萬t,占全球總排放量的2%,數據中心成為碳排放大戶,而數據中心服務器的資源利用率普遍很低,平均在10%~30%之間,因此綠色高效與高可用性已經成為電力數據中心應重點解決的問題之一。另外,目前電力數據中心采用總部與網省公司的兩級分布式結構,面對數據中心數據大集中的發展趨勢,應進一步聚合數據資源,解決數據交換瓶頸問題,提供統一的數據中心監控管理平臺,降低管理成本。
自從Google首次提出云計算概念后,亞馬遜、微軟和雅虎等公司相繼提出了各自的云計算解決方案,美國、韓國、中國等政府相繼宣布了國家云計算發展戰略,將云計算提升到前所未有的高度,云計算技術已經成為近年來國內外的熱點研究問題。由于云計算可以滿足新一代數據中心對網絡、存儲與計算的業務需求,并能提供豐富的應用服務,數據中心已成為云計算發展最快的領域,部分大型企業相繼開展各自云計算數據中心的研發,例如中國移動的“大云”、中國電信的“e云”與中國聯通的“互聯云”等。
本文在分析現有電力數據中心的邏輯結構與功能的基礎上,研究了服務器虛擬化與虛擬機的實時遷移,并對現有電力數據中心的服務器等資源進行虛擬化,提高資源利用率。設計了基于Hadoop的電力數據中心云計算平臺,為智能電網的業務系統、數據挖掘與輔助支持等高級應用提供海量數據存儲、管理與高性能計算環境。為保障現有電力數據中心向云計算平穩過渡,提出分階段的過渡策略。
1 現有的電力數據中心
現有電力企業數據中心的核心功能主要包括數據獲取、數據存儲與管理、數據訪問,其邏輯結構如圖1所示。
圖1 現有電力企業數據中心的邏輯結構
數據獲取層通過提取、轉換和加載(ETL)提取來自安全生產、營銷管理、物資管理、財務資金、人力資源、協同辦公、項目管理以及綜合管理等業務系統的數據,轉換為規范的、無冗余的基礎數據,加載到主題數據庫。數據存儲與管理層對主題數據庫進一步進行ETL,生成多維度的分析性數據存儲在數據倉庫中,并實現數據編碼和元數據的管理。數據訪問層提供統一的數據展現界面,實現查詢統計、聯機分析處理(OLAP)、數據挖掘與輔助決策等功能。
各個網省公司和直屬單位的數據中心根據國家電網公司的典型設計,在滿足基本功能和關鍵指標的基礎之上,根據自身的安全生產與設備管理等業務特點與需要來進行建設。由于各個省的業務系統存在較大的差異性,數據中心在建設過程中,服務器、網絡、存儲、電力、監控和環境調節等設備以及數據庫與數據倉庫等軟件系統難以避免地存在較大差別,同時,軟件、硬件、數據、資源與安全的管理和維護上采用不同的技術和管理工具,眾多的管理工具及設計缺陷導致管理復雜甚至管理功能的缺失,使得數據中心管理與維護成本高。
現有電力數據中心滿足不了未來智能電網對海量全景信息存儲、共享與處理的需要。隨著智能電網的建設,電力數據中心必須涵蓋智能電網中各個新系統所需要的全部海量數據,很難存儲在標準關系型數據庫甚至數據倉庫中。智能電網需要數據中心提供更豐富的信息服務,并為數據挖掘與輔助決策提供高性能的分布式計算環境。
2 基于云計算的新一代電力數據中心
2.1 電力企業云計算數據中心的基礎架構
采用云計算技術對現有的電力數據中心進行改進,建立面向智能電網的新一代電力數據中心,其基礎架構如圖2所示。
圖2 電力企業云計算數據中心的基礎架構
在基礎設施層,利用虛擬機監視器或虛擬化平臺對服務器、存儲設備與網絡設備等硬件資源進行虛擬化,屏蔽各個網省公司和直屬單位千差萬別的硬件資源,以虛擬機為單位進行統一的自動化管理,包括資源抽象、資源監控、資源部署、負載管理與安全管理等,一方面可以提高資源利用率,另一方面使管理維護人員擺脫對服務器等硬件資源、操作系統與中間件的繁重管理工作,專注于虛擬機與業務系統的維護,從而簡化數據中心的管理與維護工作。
在云計算平臺層,以虛擬機為單位構建Web服務器集群、應用服務器集群與數據庫服務器集群,作為數據中心的運行環境。采用云計算的分布式文件系統、分布式數據庫管理系統、分布式數據處理系統、數據倉庫與數據分析工具實現智能電網海量數據的大規模存儲,為數據挖掘與輔助決策等高級應用提供高性能的分布式計算環境。利用現有的企業服務總線實現安全生產、營銷管理、空間地理、狀態監測以及新能源等智能電網業務系統的數據共享與應用集成。
云計算作為一門新興技術,將其應用于電力數據中心需要解決以下關鍵問題。
2.2 服務器虛擬化與虛擬機的實時遷移
服務器是電力數據中心最主要的硬件資源,其資源利用率直接影響電力數據中心性能。Gartner的調查報告指出,當前企業數據中心的絕大多數x86服務器只運行一個應用,服務器的中央處理器(CPU)利用率平均為5%~20%。出于可靠性和性能的考慮,目前電力數據中心的業務系統多是分別運行在不同的物理服務器之上,例如項目管理與綜合管理系統分別運行在各自獨立的物理服務器上,很多情況下服務器資源利用率低。在新型電力數據中心,對服務器進行虛擬化,將一個服務器虛擬成若干個虛擬機,以提高服務器的資源利用率,圖3給出了一個電力數據中心服務器虛擬化的示例。
圖3 電力數據中心服務器虛擬化示例
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:基于云計算的電力數據中心基礎架構及其關鍵技術(上)
本文網址:http://www.guhuozai8.cn/html/consultation/1083976750.html