一 引言
云計算作為當前業界的熱點,其主要功用之一是處理急劇增長的海量數據信息,而它之所以能夠做到這一點是因為其背后擁有著強大的云存儲技術的有效支持。類似于云計算,云存儲也是基于網絡的能夠高效可靠地按需為用戶提供存儲服務。云存儲與存儲虛擬化具有密不可分的關系。為了做到動態按需分配,云存儲需要在網絡中擁有充足的資源以位置透明的方式提供給用戶,這就需要依賴于存儲虛擬化技術屏蔽掉底層存儲硬件對上層應用的影響,使得存儲資源能夠以一個“無窮無盡”的資源池的方式展現給用戶。
二 存儲虛擬化
存儲虛擬化的三種技術類型:基于網絡附加存儲(NAS)、存儲區域網絡(SAN)和Google文件系統(GFS)。
傳統的存儲虛擬化主要基于網絡附加存儲(Network Attached Storage,NAS)和存儲區域網絡(Storage Area Network,SAN)等存儲系統技術,通過在物理存儲系統和服務器之間增加一個虛擬層,實現對分散的、不同品牌、不同級別的多個存儲系統的整合。NAS和SAN都是基于網絡為用戶提供存儲資源的技術,但不同點在于NAS是采用文件系統管理硬件存儲資源,并通過網絡協議(例如NFS協議和CIFS協議)為用戶提供文件級的存儲訪問,它可以支持異構客戶端的共享訪問;而SAN是采用專用的存儲網絡設備連接存儲資源硬件為用戶提供塊級的存儲訪問,對它的訪問需要依賴于客戶端文件系統。這兩種技術都使用專用的存儲設備作為底層硬件資源,但NAS采用網絡協議會降低傳輸過程中的有效載荷比從而性能不高,而SAN采用專用存儲網絡具有較高的傳輸性能但是價格較貴。另外,NAS中存儲的文件能夠被異構客戶端共享訪問,而SAN卻很難做到這一點。
雖然基于NAS和SAN的存儲虛擬化方法得到了廠商的廣泛支持,在以往的存儲系統中多有應用,但是面對云計算的海量、高可擴展、高可靠、高性能等存儲需求,這些傳統的存儲虛擬化技術普遍存在著缺陷。于是,一類以Google文件系統(Google File System,GFS)為代表的新興的以分布式文件系統為基礎的存儲技術引起了業界的關注,并已經在云存儲領域取得了比較好的效果。
類GFS的存儲系統普遍采用主到從架構,由一個或幾個管理節點和多個分布的存儲節點組成。不同于基于專用存儲設備的傳統存儲技術,系統中的節點采用了遵循統一標準的既具有計算能力又具有存儲能力的PC服務器。每個存儲節點利用自己的文件系統對本地存儲資源進行管理,再由管理節點通過部署在各個節點上的分布式文件系統為系統中所有的存儲資源提供統一的文件名字空間,構成虛擬的存儲資源池,因此這類系統具有良好的可擴展性,能夠應對海量數據的存儲和管理。同時也具有較低的價格。在系統中,數據的存取以文件為單位,每個文件被采用分塊的方式保存并且存有多個副本。因此,同一文件的多個數據塊可以分布在不同的存儲節點上,這使得隸屬于同一文件的多個數據塊可以被并行地存取,具有較高的吞吐性能。另外,文件數據塊副本的分布式存儲提高了文件訪問的可靠性,避免了某個節點出現故障對文件正常存取的影響。同時,當某個存儲節點出現問題時,管理節點會及時發現并將故障節點中的數據重新分布到其它正常節點中,保證節點級的可靠性。
與傳統的存儲虛擬化比較,類GFS的基于分布式文件系統的存儲虛擬化技術能夠更好地滿足云計算的需求,在業界有著非常廣闊的應用前景。但是這類系統也具有局限性,例如不適合實時要求高的隨機數據訪問、管理節點容易成為系統瓶頸、缺少POSIX兼容接口增加應用難度等等。
三 云存儲服務的三種模式
存儲虛擬化是云存儲的基礎,但是云存儲并不僅僅是一個技術名詞,它更代表了新興的服務理念和運營思路。類似于云計算的基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)三類服務模型,云存儲服務的模型也可以被細分為存儲資源即服務(Storage as a Service)、數據即服務(Data as a Service)、信息即服務(Information as a Service)等三類服務。在不同的服務中采用合適的存儲虛擬化技術作支撐,往往可以獲得事半功倍的效果。
存儲資源即服務是為用戶提供存儲空間的服務。當用戶提出存儲空間請求時,云存儲系統會在存儲資源池中劃分出用戶所需的空間供其進行相關的存儲應用開發,這一點類似于云計算的IaaS服務。存儲資源即服務將底層硬件存儲資源進行整合,構建出統一的資源視圖,然后按需分配給用戶使用,并做到動態彈性縮放,能夠有效地提高存儲資源利用率,降低用戶的存儲設備投資和管理成本。存儲資源即服務是存儲虛擬化技術的設計目標之一。因此無論是傳統的存儲虛擬化技術還是新興的類GFS虛擬化技術均能較好地滿足功能需求,特別是類GFS虛擬化技術因為其采用的存儲設備具有統一的標準,因此可以具有更優的擴展性。另外,在功能需求被滿足的前提下,不同存儲系統技術在成本和性能上會有些許差異。
數據即服務是為用戶提供計算數據的服務。與存儲資源即服務不同,它提供的服務是存儲的內容而并非存儲空間本身。根據用戶的需求,數據即服務及時地將計算所需的數據提供給計算單元,達到數據存儲為計算服務的目的,這一點類似于云計算的PaaS服務。對于這類服務,類GFS虛擬化技術具有更優的效能,這是因為這類系統中的存儲節點和計算節點往往復用同一節點(例如Google的GFS文件系統和MapReduce計算模型),有效地減少了計算過程中的數據傳輸。而在傳統的存儲虛擬化系統中,需要額外的通道將虛擬化存儲中的數據傳輸到計算單元中,具有較高的延遲。但是類GFS虛擬化技術具有一定的局限性,它要求計算過程能夠并行化,計算步驟可以散布到存儲節點上,因此它并非適用于所有應用場合。
信息即服務是為用戶提供應用信息的服務。與數據即服務不同,它提供的服務是數據經過處理后的能夠直接交付給用戶直接應用的信息,這一點類似于云計算的SaaS服務。提供這類服務,除了前文提及的信息存儲過程外,更重要的是服務提供方式,最常見的就是為用戶提供信息查詢。對于存儲系統而言,高效的查詢過程的實現需要借助數據庫系統,因此無論是傳統的存儲虛擬化技術還是新型的類GFS虛擬化技術,對數據庫的支持將非常重要。在這一點上,天生依賴于文件系統的存儲系統(例如NAS存儲系統和類GFS系統)因為其數據庫應用必須構建于文件系統之上從而會導致額外的開銷,而那些能夠直接對塊存儲設備直接操作的系統(例如SAN系統)則具有一定的性能優勢。
綜上所述,存儲虛擬化技術類型與云存儲服務方模式也在不斷地發展嚴禁之中。云存儲核心技術的選擇必須建立在針對實際業務需求的全面評估的基礎之上,切不可盲目跟風,否則不但會使得云存儲的效果事倍功半,還會進一步引起云計算相關領域的連鎖不良反應。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:海量信息的存儲和使用
本文網址:http://www.guhuozai8.cn/html/consultation/1083974482.html