一、云運維與傳統數據中心運維比較
“云是數據中心的新IT形態”,云與傳統數據中心的建設目標是一致的,都是為企業提供IT服務。運維人員的職責都是保障IT服務的質量,圍繞服務等級協議SLA展開各種運維活動。然而在運維技術、管理模式、財務流程、服務分級、業務要求、運維職責劃分等方面兩者又有所不同。
· 相對于傳統的數據中心,云數據中心的服務特征更加明顯,云數據中心將基礎設施(IaaS)、平臺(PaaS)、軟件(
SaaS)以服務的形式提供給最終用戶,它利用虛擬化、SDN等技術將網絡、計算、存儲以及應用等資源池化,通過自動化技術按需為用戶分配IT資源。因此在云運維中IT請求交付(Request Fulfillment)流程的地位不斷突出,也使得云運維顯示出明顯的運營性質。
· 云也改變了傳統數據中心的
財務管理模式和采購模式,傳統數據中心原來的采購流程變為了服務審批流程。要申請云數據中心資源,面向云業務的計費系統也應運而生。云計費除了用于真正的收費場景外,更多的時候應用于企業內部,通過內部核算,也就是經濟杠桿去有效約束IT資源需求,形成在服務質量和IT資源間的平衡,有效提升IT資源利用率。
· 云數據中心對IT服務交付速度提出了更高的要求,然而云數據中心的基礎結構卻比傳統數據中心更加復雜,手工交付難以滿足云服務交付的速度要求,更容易發生故障,自動化交付就成為了云服務交付的必要手段。
在傳統數據中心,運維人員需要關注基礎設施的維護,而在在混合云和公有云應用場景中,應用管理的地位更加突出。運維人員不必關心部署在公有云上的業務所依賴的基礎設施,而業務監控的職責也轉移給公有云提供商。公有云提供商不但要保障IT基礎設施本身,還要更加關注承載業務的運行狀態。
二、云數據中心運維簡介
在云數據中心維護過程中,云服務請求交付系統、計費組件以及自動化部署組件已經從云運維系統中剝離出來,形成相對獨立的運營平臺—云平臺。云平臺提供了服務目錄、自助服務臺、云服務自動部署、以及一體化的計費和核算功能,因此云平臺對云數據中心的正常運轉至關重要。
而傳統的網絡監控、服務器監控、機房監控、業務監控、事態管理、變更管理、問題管理、配置管理對云數據中心而言依然不可或缺。
云平臺是云數據中心的對外服務和展示窗口,是云租戶對云數據中心的直觀體驗。云數據中心運維是云服務水平的后臺保障,二者就像客機上的空乘和地勤一樣,在云數據中心缺一不可。
1、云運維過程中需要關注哪些問題?
在云運維過程中主要需要關注如下幾個問題:
· 選擇開放架構
云雖然已經到達了可實際部署階段,但是云平臺架構、計算虛擬化技術、網絡虛擬化技術、云與大數據的配合等技術依然發展迅速。為保障云運維的持續發展,應該優先選擇正在不斷演進的開放平臺作為基礎架構。
· CMDB作用愈加明顯
在私有云和混合云應用場景中,高度集中的業務、高度集中的設施、廣泛應用的虛擬化技術、眾多的云設施和軟件供應商、多樣的云服務消費者,以上這些因素組合在一起,使云運維的復雜度成指數級增長。云數據中心的設備信息、應用信息、策略信息、維保信息、組織信息、負責人等各維度的信息交織成復雜的關系網,實際運維時如果能從這張關系網中將所關注的信息抽絲撥繭,將大幅提升云運維的效率。反之如果沒有有效手段管理這些關系,云運維可能會變得混亂和無序,運維效率低下,使云服務體驗大打折扣。設計合理的CMDB(配置管理數據庫)恰恰是解決這個問題的最佳途徑。CMDB自動同步配置項信息,將割裂的各維度信息關聯在一起,幫助云運維人員全面、準確和及時地了解業務相關的組織、資源、環境和服務等不同維度信息,使運維人員快速準確地了解事件影響范圍,作出正確的決策。
· 使用必要手段全局監控業務質量
在混合云應用場景中,部分開放的業務會部署到公有云上,企業運維人員無法有效的監控到公有云的基礎設施,在這種情況下,公有云的服務等級SLA就成了一個黑盒,無從監控。所以必須要有有效的手段全局監控業務質量,從而間接評價公有云服務等級SLA。
· 明確云架構下各機構的責任主體
由于企業組織架構是按照傳統的網絡、應用、計算來劃分的,而在混合云場景中,云服務商與企業運維人員也不屬于同一組織機構,所以當部署在云上的業務出現故障時,容易出現組織間的推卸責任的問題,從而延長了問題的定位和解決周期。因此企業運維人員要有手段基于業務按照網絡、計算、應用等不同維度的出具資源健康度報告,明確問題責任主體。
· 云場景下如何有效控制開銷
云應用場景中還有另外一個問題,就是如何使用最小的開銷(公有云資源),最大限度地保障業務的質量。為了保障業務的穩定運行,企業運維人員通常為每個業務申請一定的資源余量,然而過多的余量會增加財務成本,如何確定這個量,就成企業運維人員關注的問題。一份能將業務運行時所需要的CPU、內存、磁盤等歷史信息進行有效分析的可度量的業務容量分析報告,將對企業運維人員非常有用。如果在資源不足發生前,有工具能夠提前預警,給企業運維人員充分時間調整資源分配策略,將有效節省公有云開銷。
· 使用可控的自動化手段提升管理效率
云數據中心的資源規模、業務規模、組織規模遠遠超過傳統數據中心。新設備的快速部署、快速上線、納管監控、資源編排、定期巡檢、升級和配置變更這些原本就頗為復雜的工作在規模和速度的雙重壓力下都變得更加艱巨。傳統的手工方式效率低下,出錯風險高,自動化手段逐步成為云運維的首選。隨著虛擬化、PXE、SDN、Overlay、服務鏈等技術不斷廣泛應用,自動部署、自動編排、自動巡檢、自動升級等自動化手段越來越多應用于云運維。然而自動化仍然要在可控、可跟蹤、可審計、可回退的前提下進行,避免單個錯誤的擴大化。雖然自動化還存在一定風險,云運維的自動化趨勢已經不可逆轉。
2、如何選擇有效運維工具
運維工具產品種類繁多,每種運維工具都有自己適合的應用場景。云數據中心架構復雜,業務集中,應該如何選擇適合云運維工具產品呢,下面將展開詳盡的分析。
大集中的云數據中心降低了IT整體維護成本,也增加了業務風險。精密空調故障、UPS故障、火災、漏水任一風險如果不能及時處置都可能給整個云數據中心造成無法修復的大面積損壞。這種損害影響程度遠遠大于單設備的故障。所以實時的機房監控工具對于云數據中心運維依然非常重要。
對于云運維而言,如果仍然按照傳統的網絡、計算、存儲、虛擬化、應用去分別管理,對云運維人員講,不但頭緒繁多、而且效率低下。最好能選擇一套工具,能夠將應用、網絡、計算、存儲、虛擬化等IT資源的性能及告警信息綜合分析,通過簡潔易懂的界面,直觀呈現業務健康水平。當出現故障時,能夠先從全部業務的宏觀視角,確定關聯和影響,再通過智能鉆取和故障定位技術,縮小故障定位范圍是在計算、應用還是網絡,從而明確問題職責,幫助IT管理員準確定位業務故障位置。
選擇合適的數據中心容量管理對數據中心運維也非常重要,容量管理工具要能從業務、集群、機房等多個角度分析數據中心容量趨勢,預測容量風險,指導資源優化,為IT投資提供量化依據。業務容量管理要能根據業務負載及資源消耗趨勢,預測系統資源瓶頸,為管理者提供容量預警和擴容建議。集群容量管理應該全面監控集群內物理和虛擬化資源,智能分析資源超配比例,指導資源配置。
選擇合適的CMDB工具會給云運維帶來事半功倍的效果。CMDB工具讓云運維人員全面、準確和及時地了解業務相關的環境、資源、組織、服務信息,有效幫助云運維機構消除信息孤島,提升信息關聯性和透明度。
云運維監控工具除了上述特性方面的考慮外,還需要注意工具的廣泛的資源監控能力。只有具備監控各種應用、多個廠家的網絡設備、不同服務器款型、不同虛擬化產品等IT資源的能力,才能進一步作到融合分析和統一運維。如果沒有廣泛的適配能力,云運維工具就成了中看不中用的花架子,難以產生真正的價值。
運維工具在選擇時還要注意一點,不能將運維工具想象成萬能的,所有問題都依賴工具解決。運維工具是配合云運維規劃、企業組織架構和企業管理制度一起來保障云服務質量的,它僅僅是云運維的一個組成部分。云運維仍然需要遵從PDCA(計劃、執行、檢查、行動)的規律不斷改進和優化。隨企業的業務要求變化、管理體質調整和技術發展,運維工具也需要不斷演進、不斷優化,所以云運維工具的選擇也應循序漸進,不能一口吃個胖子。
結束語
云運維是個復雜的系統工程,選擇好的云運維工具無疑會使云運維變得輕松,高效。然而選擇這樣的工具前,首先需要考慮云運維的組織應該如何更好的為云服務,清晰的組織劃分,明確的責任定位,完善的流程規劃,能夠幫助確定云運維工具的軟件定位,從而使快速找到合適的運維工具事半功倍。云運維工具仍然依托于傳統的IT設施監控和應用監控,沒有這個基礎云運維將變成空中樓閣。在此基礎上,云運維工具更加重視系統級的業務監控,更加重視業務、資源、服務和人之間的關聯性,更加重視智能排障能力,更加重視容量管理,更加重視自動化能力。有了合適的運維工具軟件,云運維自然變得簡單。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:如何讓云運維變得簡單
本文網址:http://www.guhuozai8.cn/html/consultation/10839719126.html