最近在負責公司內部私有云的建設,一直在思考怎么搞云計算,怎么才能夠把云架構設計得好一些。本文盡量全面的列出了云架構建設和選型的考量因素。
我們主要從五個層面逐步評估云架構的建設和選型,分別是:
1. 行業生態
2. 企業需求
3. 云計算的能力
4. 潛在的挑戰
5. 如何建設
一、行業生態
計算機云經過多年的發展,由一開始的概念,慢慢發展成熟并能夠推向市場,提供多種多樣的服務,市場空間非常之大。
在云的發展過程中,亞馬遜經過多年的深耕積累,發展成為了云行業的標桿企業,甚至可以說是建立了云解決方案的標準。之后,Google、IBM、思科、Oracle、HP、Intel、華為等IT巨頭先后參與進來,在軟件和硬件方面提供專門的面向企業的解決方案,紛紛打著云計算、大數據、智能等概念來吸引客戶,拓展市場。
另外一方面,基于大數據、存儲、云服務等,市場上也先后出現一些創新企業,如Dropbox、Rackspace,國內的七牛、青云、UnitedStack等。
當前的IT世界有一個常見的現象,就是只要某一個領域有一套成熟的商業軟件,就同時也會有一套開源的解決方案,如Windows之于Linux,Google的MapReduce、GFS、大表之于Hadoop等。在云領域也存在相應的開源解決方案,目前最為著名的有Openstack和Cloudstack。開源行業的領導者RedHat此前
在企業操作系統的市場已經做的很好,RHEL的各個版本在企業級系統市場有相當高的市場份額。現在的RedHat特別重視云的發展,并將云操作系統作為未來10年的發展戰略重點,在最近兩年先后收購了Gluster以及Ceph等存儲企業,以壯大自己在云領域的影響力。
隨著云領域的發展,市場上也逐漸形成了面向企業提供硬件和軟件產品的提供商、面向企業提供服務的提供商、面向市場初創企業提供基礎服務的提供商、面向個人提供業務服務的提供商等一系列行業生態。
圖 1 云行業服務生態
二、企業需求
需求是什么,也就是what people need這個問題。我們所說的people,即人或者公司實體,該對象的劃分并不單純,可粗淺的從三個角度來進行分類:
從企業角度看:
1)小型企業
小型企業的技術儲備不多,人員缺乏,沒有獨立的IT部門,但是在構建自己的IT系統過程中需要購置各種產品和服務,包括服務器、網絡、CDN等等,而要完成這樣的工作,需要投入大量的人力和財力。通過購買云服務可以更加方便快捷,簡單的完成系統的搭建。
2)中型企業
中型企業有一定的規模,需要在信息化、管理方面有所注重,一般內部都設立IT部門,但是和小型企業一樣,IT部門大多數都是為了解決自身需求,很難能夠有一個完整的解決方案。這樣在服務器、網絡、CDN、企業管理軟件等等的需求還是比較大的。
3)大型企業
大型企業人數規模在萬人以上,特別是高新企業,都有一個實力不錯的IT支撐部門,通過部門就可以完善對企業內部信息化建設。
從企業性質范圍來看:
1)傳統行業企業
傳統行業大多數是以服務業、制造業、生產性企業為主,在IT信息化方面相對比較落后,屬于重資產行業。
2)互聯網企業
互聯網行業是基于IT作為解決方案的
3)IT服務企業
以銷售軟件、硬件、以及技術咨詢服務為主的企業。
針對市場中存在的企業、個體等的需求特點,市場上一般對軟件服務進行如下分類:
1. 提供軟件的服務,解決企業內部信息化問題,如ERP系統、進銷存管理系統、人力資源管理系統、行政系統、財務系統等等。(SaaS)
2. 提供平臺服務,解決行業共性問題,將SaaS遷移到云端,提供平臺類的服務。如淘寶的開放平臺、Facebook的開放平臺、基于Salesforce的銷售系統、云筆記、云盤等。(PaaS)
3. 提供基礎設施服務。基礎設施包括軟件和硬件方面的,包括存儲、虛擬機、網絡、防火墻、緩存、負載均衡、數據庫等等。(IaaS)
從企業內部人員角色來看:
企業內部,尤其是互聯網企業內部,一般將角色分為如下幾類:
1. 開發
2. 測試
3. 運維
4. DBA
5. 產品
6. 項目管理人員
7. 客服
8. 業務人員(銷售、市場、BD、人力資源、行政等等)
不同的角色對于軟件服務的需求也是不同的,下圖大致描繪了互聯網行業各個角色對云平臺的需求:
圖 2 互聯網行業各個角色對云平臺的需求
三、云計算的能力
云計算能夠解決什么,也就是what cloud offer這個問題。目前的云計算在應用中主要提供了以下八個能力:
1. 封裝:將計算能力和軟件放在云端,可以減少重復建設,將通用的服務封裝起來,達到重用,減少資源的浪費,提高生產效率,并提供成熟的解決方案。在云端,云提供商可以建立軟件的標準,提供發布包的方式,用戶可以通過軟件包的方式進行購買使用,譬如目前開源領域的Docker。
2. 安全:云計算將數據和存儲,軟件邏輯都集中于云端,更能方便的統一構建安全體系,通過Iptables實現網絡過濾,并在服務端做安全組件實現安全策略,并能夠通過海量集群應對DDOS攻擊等。
3. 靈活:云計算提供靈活的軟件和服務端架構,用戶不再需要自己構建應用運行環境,對資源的使用能夠按需購買,并能夠升級,并自由組合。舉例來說:用戶可以選用不同的存儲方式(mysql、oracle,文件系統,kv等等)
4. 性能:通過集群的能力和云端的集成能夠提高集群的性能處理,通過專業的云解決提供商,在云端的性能擴展更加方便,技術上更加專業。譬如服務端可以在用戶毫不察覺的情況下完成添加機器、存儲擴容等操作。
5. 伸縮能力:在存儲和計算能力方面提供彈性的資源管理,能夠按需使用,在使用過程中,可以通過動態的添加和減少物理資源,來提高響應能力或節約成本。
6. 運維:云計算在IaaS角度來看,重要的是運維,能夠將運維更加集中化管理,并完全智能化,大大降低人力成本
7. 充分利用物理資源:通過云建設,能夠將物理資源進行虛擬化處理,屏蔽物理硬件底層,并能夠完成物理資源軟化進行邏輯管理和分配調度
8. 大數據:大數據保存于云端,能夠提供數據分析和智能處理
當然,云計算還有很多很多好處,給我們帶來很多想像空間和IT技術的革命。
公有云與私有云
行業內將云分為“公有云”和“私有云”。在我們之前的需求分析過程中,大致了解了云的需求,“公有云”和“私有云”的差別最大的是需求的差異,因為需求的差異,導致了技術方案和產品決策的差異。
公有云需求上由于用戶多種多樣,導致需求存在不一樣,特別需要更多的定制化,譬如:
1. 存儲個性化
云存儲方面大概分為塊存儲和對象存儲,塊存儲適合于vm運行環境,對象存儲提供了KV的訪問方式提供了海量擴展存儲文件的能力,用戶可以根據自己的需求選擇不同的存儲方式,選用不同的容量。在存儲物理介質方面來說,因為存在不同的物理介質,對性能和安全的要求,可以采用傳統的SATA硬盤,或者SSD存儲等。
2. 內存使用
內存方面,需要提供動態擴展內存的方式,用戶能夠自由擴展
3. 網絡的定制化
公有云用戶需要能夠構建自己的內部網絡,并能夠自動組網
4. 數據庫使用
公有云的用戶分屬不同的公司團體,各自的技術差異存在,因而有不同的數據庫類型,譬如mysql,sqlserver,oracle等等。并能夠定義存儲大小,內存運行大小等等。并提供數據備份、恢復、高可用服務等
5. 緩存使用
公有云的用戶可以選擇不同的緩存方式,譬如增加CDN,采用不同的KV緩存方式并選擇容量。
6. 安全問題
公有云對于云的安全和私有云差別較大,私有云大多數在安全問題上不需要公有云那么嚴格,大多數是內部系統之間的交互
以上僅限于IaaS層面的考慮,當然對于公有云來說還有很多細化的個性化需求,例如:數據分析,業務對接服務等等。
四、潛在的挑戰
計算機自從誕生以來,一直按照馮.諾伊曼的體系發展在硬件的基礎上的操作系統,也分為網絡協議體系的實現、內存管理、文件管理體系等等。大致的抽象圖如下:
圖 3 計算機體系抽象圖
要建設云,有幾個重要的問題需要解決:
1. 管理問題
云計算的實施首先要解決運維的問題,在云環境下后端是大規模數量的物理節點的集群,對于同時維護數以千計算的計算節點,以及部署結構的復雜,需求的變化,光靠增加人力也難以解決復雜的問題。從而需要構建高效的計算資源管理系統,能夠靈活簡單的管理運系統,并能夠及時的發現問題。
2. 計費問題(公有云)
對于公有云而言,因為是面向公眾的,必然產生費用的問題,常用的收費方式多種多樣,也因為產品的不同而計費方式不同,譬如:網絡、存儲、cpu、數據庫容量等等
3. 資源隔離問題
云計算運行在云端,是通過虛擬化體系建立的,虛擬化是建立在硬件之上,多個虛擬化資源同時運行于同一節點(host)中,存在著資源的共享爭用問題,
這樣就存在著資源使用的公平性問題,導致同一Host上的資源使用相互影響。為了使得彼此資源使用相互獨立,我們要建立相應的隔離機制。資源的隔離包括:存儲、內存、cpu、數據庫、網絡等,其中網絡是最難控制的。
4. 安全問題
在云端的應用和基于客戶端的安全,面臨的環境不一樣,客戶端方面大多數是病毒問題引起的,而在云端,也存在一些服務器攻擊的問題,以及數據相互獨立相互影響的問題,以及一些服務端編程的安全問題等。
5. 性能問題
對于云來說,需要保證云端的性能問題,包括CPU處理性能,IO處理能力,資源的就近訪問,資源數據同步的速度,還需要解決系統底層的性能問題,包括文件處理Cache,存儲介質的優化,采用SSD等,或者采用SATA+SSD的混合方式節約資源和降低成本。
6. 存儲問題
對于云來說,由于云端是將客戶端的數據和運算轉移到云端,必須要有足夠的存儲能力以及足夠穩定的存儲系統,保證用戶數據的安全,對于存儲來說,有提供VM虛擬機運行環境的block device(塊存儲),以及提供KV方式的對象訪問存儲,這些都需要保證數據復制、數據讀寫訪問的性能和數據永久可用的能力
7. 網絡問題
對于公有云以及私有云的一些應用場景,需要能夠提供網絡的邏輯隔離(SDN)或物理隔離,以及對網絡的訪問靈活問題。構建虛擬化網絡,由于物理條件的限制,我們不得不從L2-L4層進行處理,我們常用的方式是:bridge,vlan,gre,sdn(openflow,opendaylight),以及一些廠家的產品等等。
8. 高可用問題
高可用問題是在分布式系統中必須要處理的問題,正因為集群的問題,我們必須要從多方面考慮解決的問題,包括保證云管理系統的高可用性,存儲介質的高可用性,網絡的高可用性,虛擬機高可用問題等等。
9. 提高資源利用率問題
對于物理資源的虛擬化,我們有很多種解決方法,KVM、Vmware、xen、Hyperv、LXC等等,在HVM的方式下,對于VM本身的啟動需要占用大量的內存、cpu和存儲資源,導致系統內存和cpu使用有一定的浪費,基于LXC的解決方案因為是機基于Host OS進程,通過namespace的方式進行隔離的,是一種輕量級的實現,能夠在資源初始化,資源利用率方面能夠最大化,對于各個應用場景來說,我們可以選用合適的解決方案。
五、如何建設
58同城經過多年的發展,探索了一條適合自身發展的技術架構體系。隨著業務和技術的發展,團隊規模不斷壯大,在技術和管理上面臨越來越多的挑戰。在項目需求管理,開發效率、代碼管理和質量建設,測試,線上發布,運維管理等方面需要有一套完整的解決方案,來提升公司的協作能力和整體能效。
58同城目前所有的應用在線上都是跑在物理機器上,采用物理機的方式,一方面會導致服務器資源得不到充分和合理的使用,譬如:有些物理機器cpu使用長期在10%以下,有些內存使用剩余很多;另外一方面,由于互聯網的特點,存在著時段內的訪問高峰問題,需要解決資源使用的伸縮問題;基于以上問題,架構部對現有的技術體系進行梳理和分析,采用資源虛擬化的方式進行私有云的建設,并在這基礎上,完善公司整體技術體系,包括:開發、測試、上線、運維等一系列自動化和智能化方面的建設。
私有云的目標
1. 提高物理資源的利用率
2. 一套云管理系統,降低運維的復雜度,提高運維工作效率
3. 構建靈活的開發、測試集成環境
4. 提供海量的存儲體系
5. 建立完善的監控體系
6. 建立基礎應用環境、方便測試
7. 統一架構
8. 智能資源調度
實施方案:OpenStack
對于云計算來說,也存在著多種解決方案,如CloudStack和OpenStack等。在兩種方案的比較之后,我們最終選擇了OpenStack的解決方案。主要是出于以下幾點原因:
1. OpenStack的社區成熟度:OpenStack經過幾年的發展,社區已經越來越成熟,很多大公司都參與進來幫助完善,紅帽公司未來十年也將OpenStack作為發展的戰略重點。
2. 架構設計的選擇:OpenStack采用了Python語言編寫,并且設計上采用組件化的方式,各個組件獨立發展,并相互解耦
3. OpenStack提供了更加完整成熟的方案,能夠滿足多樣的需求,同時已經有不少公司采用,已經經過生產上的驗證
4. 文檔問題:OpenStack文檔化做的不錯,網上能夠找到多種多樣的問題處理辦法
5. 人員招聘問題,經過多年的發展和市場的培育,了解OpenStack的人越來越多,對于開發維護的人才建設和招聘相對成熟一些。
6. 發展比較迅速
下圖是我們大致的架構規劃
圖 4 OpenStack建設方案架構規劃
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:云架構建設和選型的思考
本文網址:http://www.guhuozai8.cn/html/consultation/10839715818.html