確保存儲(chǔ)卷的扇區(qū)對(duì)齊一直是服務(wù)器性能優(yōu)化的重要部分。近些年,由于服務(wù)器虛擬化和重復(fù)數(shù)據(jù)刪除技術(shù)的廣泛應(yīng)用,扇區(qū)對(duì)齊變得更為重要。本文講述在虛擬數(shù)據(jù)中心應(yīng)用扇區(qū)對(duì)齊的必要性。
扇區(qū)對(duì)齊與重復(fù)數(shù)據(jù)刪除
在討論虛擬化技術(shù)之前,我先談一下在物理數(shù)據(jù)中心,扇區(qū)對(duì)齊對(duì)重復(fù)數(shù)據(jù)刪除過(guò)程的影響。
扇區(qū)對(duì)齊是基于存儲(chǔ)邏輯塊與物理磁盤(pán)扇區(qū)匹配的思想。大多數(shù)較新的物理硬盤(pán)都使用4KB大小的扇區(qū),同樣地,像NTFS這樣的文件系統(tǒng)使用的存儲(chǔ)塊大小也為4KB。而問(wèn)題是,并不是所有的操作系統(tǒng)都能將存儲(chǔ)塊對(duì)齊到下層的扇區(qū)。除非存儲(chǔ)塊恰好對(duì)齊到一個(gè)扇區(qū),否則會(huì)跨兩個(gè)扇區(qū)。這就給重復(fù)數(shù)據(jù)刪除過(guò)程帶來(lái)了問(wèn)題。
市場(chǎng)上重復(fù)數(shù)據(jù)刪除產(chǎn)品著實(shí)不少,它們采用各種技術(shù)以實(shí)現(xiàn)存儲(chǔ)的重復(fù)數(shù)據(jù)刪除。一個(gè)最通用的重復(fù)數(shù)據(jù)刪除方法就是刪除冗余的存儲(chǔ)塊。
有一點(diǎn)需要注意到的是,扇區(qū)不對(duì)齊并不影響單個(gè)存儲(chǔ)塊的內(nèi)容。也就是說(shuō),無(wú)論文件系統(tǒng)是否對(duì)齊到物理存儲(chǔ),存儲(chǔ)塊仍包含相同的數(shù)據(jù)。同樣地,無(wú)論一個(gè)卷的扇區(qū)是否對(duì)齊,塊級(jí)重復(fù)數(shù)據(jù)刪除均以相同的方式運(yùn)行,至少?gòu)膭h除冗余存儲(chǔ)塊的角度看是這樣。
重刪一個(gè)扇區(qū)不對(duì)齊的卷,最主要的問(wèn)題在于重復(fù)數(shù)據(jù)刪除過(guò)程可能會(huì)帶來(lái)更為密集的I/O。一個(gè)卷如果扇區(qū)不對(duì)齊,那每一個(gè)存儲(chǔ)塊會(huì)跨越兩個(gè)物理扇區(qū),那么每次讀。ɑ?qū)懀┮粋(gè)塊時(shí),底層硬件就會(huì)讀兩個(gè)扇區(qū),而扇區(qū)對(duì)齊時(shí)則不會(huì)。這在很大程度上關(guān)乎性能,但如果磁盤(pán)中有很多碎片或存儲(chǔ)塊跨越的兩個(gè)扇區(qū)不相鄰就難說(shuō)了。重復(fù)數(shù)據(jù)刪除原本就是一個(gè)I/O密集型的處理,但扇區(qū)不對(duì)齊會(huì)使I/O負(fù)擔(dān)更重。
虛擬化和重復(fù)數(shù)據(jù)刪除
以上討論的理論也適用于虛擬數(shù)據(jù)中心,但由于虛擬硬盤(pán)的使用,需要考慮一個(gè)額外的抽象層。如果沒(méi)能正確規(guī)劃,使用虛擬硬盤(pán)的方式可能會(huì)嚴(yán)重影響重復(fù)數(shù)據(jù)刪除效果。
集群共享卷
不再有硬性需求,Hyper-V和VMware集群可以像以前那樣,部署在共享存儲(chǔ)上。這也就意味著可以把虛擬機(jī)構(gòu)件(包括虛擬硬盤(pán))部署到存儲(chǔ)區(qū)域網(wǎng)(SAN)中,這樣它們就可以被虛擬集群中的所有結(jié)點(diǎn)訪(fǎng)問(wèn)。
如果采用基于SAN的共享存儲(chǔ),那就要確保共享卷對(duì)齊到底層的存儲(chǔ)硬件上。還要確保所使用的重復(fù)數(shù)據(jù)刪除方法能與共享存儲(chǔ)兼容。
舉個(gè)具體的例子來(lái)證明兼容的重要性,考慮在Hyper-V集群中共享存儲(chǔ)的工作方式。集群節(jié)點(diǎn)通過(guò)邏輯映射(C:\clusterstorage\volume)來(lái)訪(fǎng)問(wèn)共享存儲(chǔ)。但問(wèn)題是一些重刪軟件不會(huì)對(duì)服務(wù)器的系統(tǒng)卷進(jìn)行重復(fù)數(shù)據(jù)刪除。即便Hyper-V共享存儲(chǔ)的確不在系統(tǒng)卷上,邏輯映射卻使之在系統(tǒng)卷上。結(jié)果就會(huì)有有一些重復(fù)數(shù)據(jù)刪除軟件(包括微軟自家的本地文件系統(tǒng)重刪工具)并不能與共享存儲(chǔ)兼容。
如果共享存儲(chǔ)的重復(fù)數(shù)據(jù)刪除過(guò)程在你的應(yīng)用環(huán)境中存在問(wèn)題,你可以通過(guò)使用硬件重刪(假設(shè)你的SAN支持該特性)來(lái)解決這個(gè)問(wèn)題,這樣就可以規(guī)避掉操作系統(tǒng)的限制。
虛擬硬盤(pán)架構(gòu)
另一個(gè)影響重復(fù)數(shù)據(jù)刪除過(guò)程的因素是,虛擬硬盤(pán)擁有類(lèi)似于物理硬盤(pán)的結(jié)構(gòu)。換句話(huà)說(shuō)就是,虛擬硬盤(pán)也劃分成扇區(qū)和磁道,而虛擬機(jī)文件系統(tǒng)是基于這種劃分來(lái)使用存儲(chǔ)塊的。
虛擬硬盤(pán)實(shí)際上是物理服務(wù)器中真實(shí)存在的文件;谶@個(gè)前提,假設(shè)你有兩個(gè)完全相同的虛擬硬盤(pán),但一個(gè)是扇區(qū)對(duì)齊的,一個(gè)不是。扇區(qū)對(duì)齊與否的區(qū)別,導(dǎo)致這兩個(gè)虛擬硬盤(pán)文件在結(jié)構(gòu)上并不相同,即使二者有完全相同的數(shù)據(jù)。
如果你要進(jìn)行主機(jī)層的重復(fù)數(shù)據(jù)刪除,這種結(jié)構(gòu)上的不同可能會(huì)導(dǎo)致被重刪的數(shù)據(jù)減少。虛擬硬盤(pán)內(nèi)扇區(qū)不對(duì)齊對(duì)于重刪過(guò)程來(lái)說(shuō)是否存在問(wèn)題,取決于你的重刪軟件是否只進(jìn)行主機(jī)層的存儲(chǔ)塊重刪,還是能足夠智能地深入到虛擬硬盤(pán)內(nèi)部。
結(jié)論
要對(duì)虛擬化的主機(jī)進(jìn)行重復(fù)數(shù)據(jù)刪除,需要考慮很多問(wèn)題。就實(shí)踐上來(lái)講,最好確保物理磁盤(pán)和虛擬磁盤(pán)是扇區(qū)對(duì)齊的。另外,盡量不要使用精簡(jiǎn)配置,因?yàn)樗鼤?huì)影響性能,在某些情況下還會(huì)影響重復(fù)數(shù)據(jù)刪除過(guò)程。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:扇區(qū)對(duì)齊如何優(yōu)化虛擬機(jī)重復(fù)數(shù)據(jù)刪除
本文網(wǎng)址:http://www.guhuozai8.cn/html/news/1051559353.html