近年來,云計算、大數據和智慧城市成為了后互聯網時代標志性的IT技術和應用。云計算、大數據作為智慧城市的支撐,從技術和模式上為實現智慧城市打下了基礎。智慧城市在應用上迎合了現代對城市精細化運作的需求。在一定程度上,云計算成為了大數據和智慧城市的核心技術及使能技術。缺乏云計算的支撐,大數據和智能城市的實現將會面臨極大的技術與管理上的挑戰。
1.歷史發展推動的技術變革
在后互聯網時代,人類社會面臨著越來越復雜的問題,需要越來越強大的計算系統來協助解決。由此,IT基礎設施的規模越來越大,形成了大量的規模在萬個節點以上的數據中心和集群系統。如此龐大的基礎設施,其管理成本和復雜度遠遠超越傳統小型數據中心的成本與復雜度。要有效地利用如此大規模的基礎設施,必須要有一個高效的方法,能夠對大規模基礎設施以及相關的資源進行自動化的、動態的管理和控制。
同時,復雜的問題和大規模的基礎設施,必然意味著更加復雜的計算以及更加大體量的數據。當前很多復雜的問題以及海量的數據,都超越了單體高性能計算設備的能力。也就是說,目前已經構建的單體計算設備,其配備的計算能力、存儲能力或者數據處理能力難以應對這些復雜問題或者如此體量的數據。
大規模、分布式基礎設施以及橫向擴展的系統在這種情境下成為了一個必然的趨勢,由此推動了云計算的形成。
2.云計算的本質
巨型的IT基礎設施帶來多方面的挑戰,從技術層面看,其挑戰有2個:
(1)如何有效地管理和整合超大規模IT基礎設施,形成高效運作、具有超大資源和能力的系統?
(2)如何高效地利用集群系統應對復雜問題,特別是海量數據的處理?
從運營層面看,其挑戰也有2個:
(1)如何完成資源和能力的交付?
(2)如何實現資源和能力的高效運轉與運營?
云計算的形成,針對性地響應了上述挑戰:
在技術層面,云計算通過利用虛擬化技術等,管理IT基礎設施,構造由中央管控、集中調配的資源池,實現IT資源的高效運作;通過特定的應用平臺或者框架,實現資源和任務的自動管理與調度、透明的并行化處理等,支持對海量數據的存儲和處理。
在運營層面,云計算通過按需索取的形式在運營層面進行資源分配,利用虛擬化服務的形式交付資源和能力。利用云計算,小規模企業可以避免大規模基礎設施的投資門檻,以租賃的形式獲得大規模基礎設施的使用權,構造自身的業務系統;大規模企業可以通過基礎設施的集約化建設和集中管理,提升資源的利用效率。
3.運營商辦公云架構
結合移動通信運營商的業務背景,云計算可以支撐移動通信運營商的內部辦公業務、通信業務、基礎設施管理業務以及增值業務等。
從內部辦公業務角度看,移動通信運營商雇傭有大量的工作人員。這些工作人員的主要辦公都是基于信息化的手段,通過計算機和網絡實現無紙辦公與網絡協同。因此,移動通信運營商的辦公過程中,需要有大量的桌面辦公電腦支撐。由此帶來的問題有以下幾個:
(1)大量、分散的桌面辦公設備的日常維護工作量大。桌面辦公電腦的配置、地理上的分散以及其數量帶來了大量的日常維護工作,日常的維護無法高效、自動化地完成。
(2)分散的桌面電腦容易引起安全問題。桌面辦公設備的權限管控等難以完全統一實施;同時,分散在桌面電腦上的數據的保護,如私密性和完整性等,都難以開展;對于桌面電腦上的數據備份容災就更難。
(3)大部分的桌面電腦的利用率低下。大部分桌面電腦主要是用來應對辦公的文書處理、資料錄入和檢索等簡單信息化應用,由此大部分桌面電腦的計算和存儲資源被大大地浪費。
利用云計算,可以有效地解決上述問題,具體的架構如圖1所示:
圖1 業務智能運維架構圖
運營商辦公云通過對物理資源進行虛擬化處理,把物理資源構造為兩個資源池:一個是辦公虛擬機池,一個是虛擬服務器池。其中辦公虛擬機池主要承載終端辦公的計算業務和臨時存儲業務,以及承載面向外部接入的應用發布系統;虛擬服務器池主要承載后臺業務系統。
4.辦公云的智能運維
在運營商辦公云中,資源的分配需要完成動態的調整才能夠實現高效的利用。運營商辦公云需要對資源池內各個獨立資源的使用情況進行有效的監控,了解該資源承載的用戶和系統的狀態,并對這些狀態進行實時的分析挖掘,然后根據相應的決策模型進行決策,形成相應的調整方案,最終通過相應的運維接口來完成資源的調整。
智能自動優化方案貫穿監控、分析、決策、運維四大流程,涉及用戶狀態監控、系統狀態監控、運維數據分析挖掘、資源自適應調度模型、智能運維模型、故障恢復模型和應激式自動化運維等核心模塊。
(1)用戶狀態監控
在虛擬化平臺核心部件和資源池主機中部署用戶狀態監控探針,實時采集與用戶狀態和用戶體驗密切相關的資源信息,包括虛擬機的用戶登錄時間、使用時間、使用習慣、用戶資源性能指標(CPU、內存、磁盤I/O、網絡等)。
采集的監控數據根據多個維度進行分類(如用戶的級別或權限、資源所屬的集群、用戶接入模式等),方便形成不同維度的用戶狀態性能指標基線。
(2)系統狀態監控
在虛擬化平臺各個系統部件中部署系統狀態監控探針,實時采集與系統狀態密切相關的資源和狀態信息,其中包括:
1)虛擬化平臺關鍵部件的性能監控(CPU 、內存、存儲、網絡等核心參數);
2)虛擬化平臺提供服務的各Windows應用服務器的性能監控(CPU、內存、磁盤I/O、網絡等核心參數)。
采集的監控數據根據多種維度進行分類(如系統部件所屬的層次、按服務時段等),方便形成不同維度的系統狀態性能指標基線。
(3)運維數據分析挖掘
通過監控模塊獲得的大量非結構化運維信息數據,作為本模塊的輸入,然后進行數據分析和挖掘,挖掘流程可以分成四個層次依次執行。詳細層次結構如表1所示。
表1 挖掘層次機構表
根據運維信息的級別,本模塊使用不同的響應流程:
1)對于級別為“ 故障”、“ 錯誤”類的運維信息,本模塊會立即進行相關數據檢測,在確認非誤報的情況下,形成“故障”消息包,傳遞到決策模塊的故障恢復模型。
2)對于級別為“預警”類的用戶狀態運維信息,本模塊會進一步收集與用戶資源彈性調整相關的信息,形成“用戶預警”數據消息包,傳遞到決策模塊的資源自適應調度模型。
3)對于級別為“預警”類的系統狀態運維信息,本模塊會進一步收集與資源彈性調整及資源精細化整合相關的信息,形成“系統預警”數據消息包,傳遞到決策模塊的智能運維模型。
4)對于級別為“日志”類的狀態運維信息,本模塊會將信息轉儲,并定期啟用海量數據分析引擎,對日志類狀態運維信息進行篩選過濾處理,主要實現以下需求:
◆運維規律預測:根據對大量歷史數據的分析,可以對未來的系統運行規律進行預測,從而有針對性地在運維策略上做出提前響應,輸出相關知識模型到智能運維模型。
◆基線對比修正:對采集到的性能日志數據與當前定義的基線進行對比,如果發現平臺及系統狀態未能達到基線定義要求,可以觸發預警信號,通知人工對性能基線做出調整,或重新增加資源達到當前定義的基線要求。
◆資源整合發起:在用戶空閑時段(例如晚上),對當前系統及用戶行為的空閑規律進行分析,當閑置的資源達到特定條件(臨界值)時,觸發資源調整回收的信號,通知對應消息到決策模塊的智能運維模型。
(4)資源自適應調度模型
統一桌面云智能優化需要建立一個自適應資源調度模型,依據該模型,系統可以進行資源分配決策,實現資源供給的自動調整,以適應用戶的業務負載和資源消耗的需求。
(5)智能運維模型
云智能優化需要建立一個智能運維模型。依據該模型,系統可以根據狀態感知,在資源占用達到一定閾值時(如資源需求低谷,或局部資源占用過量導致其他用戶可能達不到性能基線要求時),對自身管理的資源進行重新規劃和部署調整。其主要實現在保證當前服務質量的前提下,提高資源利用率。
(6)故障恢復模型
云智能優化需要建立一個故障恢復模型。根據該模型,系統能夠在接收到各種“錯誤”、“異常”類消息時,使用既定的模式,執行一系列的故障恢復動作,最后對是否恢復做后續的跟蹤檢查。
(7)應激式自動化運維
應激運維自動化模塊主要是維護一個自動化運維腳本,以適應各種虛擬化平臺或用戶資源的運維需求。
該模塊的主要任務是接收決策模塊的指令集,并執行對應的自動化運維動作。
5.云計算在運營商應用的遠景
本文僅從運營商辦公云的角度來介紹云計算以及在運營商辦公領域的應用。實際上,云計算在通信領域有著更多的應用,限于篇幅,本文不一一敘述。筆者認為,云計算在通信領域的應用未來將著重在兩個方面:
(1)云計算作為基礎設施以及IT服務交付手段,協助運營商完成業務系統以及增值服務的快速部署。特別是在移動互聯網應用中,運營商需要承載數量龐大的應用的后臺服務,這些后臺服務需要具備充足的彈性并能夠抓緊市場時機進行快速部署。云計算將是最主要的技術手段。
(2)云計算作為使能技術,協助運營商構建大數據中心。移動通信受益于其龐大的用戶群體、豐富的業務應用以及完備的基礎設施,能夠持續不斷地產生大量有潛在價值的數據,運營商需要利用大數據技術充分挖掘利用這些數據來提升自身的競爭力。云計算將作為大數據的核心技術和承載平臺,推動移動通信的進一步發展。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:移動通信運營商辦公云
本文網址:http://www.guhuozai8.cn/html/consultation/10839713244.html