在談到大數據時代的現狀時,英特爾中國有限公司存儲產品市場經理亢海峰認為,需要尊重實踐,需要找出大數據面前大家面臨的關鍵問題,從中尋求更佳的解決之道。
CSF2012:英特爾中國有限公司存儲產品市場經理亢海峰
當前我們所面臨的數據和信息是變化的,數據生命周期已經完全改變了。那么在傳統的數據中心方面,大家面臨什么樣的問題,如何應對和解決?在未來的云的數據中心方面,會面臨什么樣的問題,大家又如何來解決?
在做存儲行業趨勢分析時,亢海峰指出,“來自IDC的數據顯示,未來幾年間數據量從2011年的1.8ZB,在2015年會增長為35個ZB。十年前,大家還在使用3.5英寸的盤,5.5英寸的盤,后來有了光盤和DVD,不同的介質,存儲的數據越來越多。
那么這些數據來源于什么?來源于個人和企業用戶不斷的膨脹的存儲需求。現在隨便一個手機就差不多八百萬象素攝像頭,意味著什么?大家每拍一張照片,就會上傳到網上,與朋友以不同形式的分享,類似這些數據不斷累計就形成了當今爆炸性的數據時代。有越來越多的數據中90%是非結構化的(主要是圖片和視頻為主)。
來自IDC的報告顯示,從2010年到2016年四種類型數據的增長情況來看,首先傳統的結構化數據,也既是說數據中心里面常見的數據庫,運行核心的業務,核心的交易。那么,這一類稱之為傳統的結構化數據
其次是傳統的非結構化數據,也就是企業里面有共享的文件和文檔,大家需要文件服務器,可以在一個系統里面共同分享知識。
再次,在數據備份方面,業務的數據量越來越大了,備份也增長很快。很多數據是大家由于長期歸檔的訴求所存在的。
最后就是共有云的數據。那么對于這種不同類型的四種數據哪一個增長最快,肯定是公有云,也是大的數據領域的范疇。存儲的目的是為了滿足以上不同類型數據的存儲需求。
重新定義的數據生命周期
什么叫做重新定義的數據生命周期?以前大家探討的是什么?信息生命周期.“說你有一個信息,它產生出來,你創建了這個信息,過一段時間,達到了一個價值的高峰,大家對這個信息訪問都很頻繁,都喜歡這個信息。然后過了一段時間,這個信息過時用不到了,就把數據刪除,這是傳統的生命周期,從出生,到高潮,到低谷,到刪除。”亢海峰說道。
而現在的數據,隨著數據的累積,隨著時間的推移,相應的數據越來越多得到的信息就越來越多。新一輪數據量的積累之后就獲得新的數據價值,稱之為價值的排浪,它會呈排浪的形式逐漸從數據中挖掘出信息,這一切取決于取決于大家對于信息的理解和積累。
對于存儲來講怎么劃分這種周期?“最下面的存儲介質大家基本上放在磁帶上需要長期的歸檔.或者放在磁盤庫上,或者是大容量的,低成本的介質上.對性能又一定需要的數據就用高速的磁盤,性能要求再高的用閃存盤,SSD等等的數據。
數據的生命周期已經截然的改變了。今天對于數據的劃分是邏輯的劃分。第一,大量的不常訪問的數據,通過磁盤的介質進行長期的歸檔。第二,這一層的數據一定要滿足不斷的增長,因為沒有時間去刪除,更何況是要挖掘出來大家以前沒有的,看不到的價值。第三以后要查詢數據時就要快速讀取,能不能把長期存起來的數據迅速找到,拿到一個快速的數據層,使得實現數據挖掘的價值,從數據變成信息,從信息變成決策,影響未來的發展。
可見,存儲所面臨的問題和挑戰,首先是數據太多,其次難以管理。第三是運營支出。最后是資源鎖定利用率不高等。
在傳統的數據中心,大家看到了交易型的數據庫,如何來解決這樣的問題,通過網絡連到了一個存儲,然后為了保證這個存儲的可用性,把數據備份,而后多數據中心做實時容災,這是非常經典的存儲架構。,但是對于數據的存儲方面,目前主流的四個需求已經呈現出來,第一個是重復數據刪除:比如每天大家生活中最常見的發郵件,大家會抄送給很多人,我們的郵件服務器上會有很多重復的郵件副本,這些數據也會占用大量空間第二:實時的壓縮:剛剛說兩個數據中心以前產生一百兆的數據,通過千兆和萬兆傳出去,沒有問題,如果你有5個TB的,你通過網上傳輸,還不如拿著硬盤坐飛機過去來得快,因為受制于網絡帶寬。可不可以把數據進行壓縮后再傳過去,這也是一個解決的方式。
第三個是分層存儲,大家談到了在一個存儲里面,這個數據是不是說一開始并不是熱點的數據,后來的由于某種需求變熱,而后變冷,存儲的介質要求一定是不一樣的,如何按照需求來移動冷熱數據到對應的存儲層上這也是一個存儲的需求。,
第四:是自動精簡配置也將是存儲的需求之一。
所有這些存儲功能,都需要計算的能力,要想知道什么是重復的數據,必須先要計算哪些塊是一樣的,你要想刪除的話,就要進行大量的重復數據刪除,也要進行計算,分層的存儲也要知道哪一些數據塊熱,什么時候熱,怎么樣遷移到對應的層次上,這些都需要用計算來感知。,現在的存儲完全和以前不一樣了不僅僅是一個倉庫需要更為智能,更為精細的管理員,需要管理的流程和方式,這都是需要運用計算來實現的。
通過計算來實現的存儲看到可以達到什么樣的目的,數據壓縮可以節省80%的空間。數據重復刪除的備份量可以減少95%,數據的精簡配置大家可以釋放40-60%的空間。通過計算能力的增強,將大幅度提升存儲的有效性。
所以對于傳統的數據中心而言,不斷豐富存儲的功能是大家解決很多問題的行之有效的方法,而這些方法基于存儲的計算的能力,基于CPU所提供的智能化的管理和存儲的能力。
那么,未來的數據中心如何,在未來的數據中心里面大家看到其實有不同的數據,有一部分是實施業務的數據庫在運行,還有一部分是長期歸檔的海量數據。“舉一個簡單的例子,國外的某一個數據中心,或者國內的大網站,運營商,你走到他的數據中心里面,分不清哪些是存儲,哪些是服務器,全部是標準的機架服務器,甚至是密度更高的服務器,壞了怎么辦,換下來,拿走。換新的。整個的存儲服務都是靠軟件+標準化的硬件來提供服務的。”
這些服務器集群擁有超大的容量,大家可以看到達到百P甚至是上到EB的級別,所以在大數據的領域橫向擴展的存儲,也是未來的一個發展方向。過去大家都說存儲是存儲,服務器是服務器。到了今天希望通過融合的架構,標準的架構,既可以做存儲,又可以做服務器,唯一的區別是應用模式場景不同,大家采用的配置不同。對于性能需求大的,配置更高CPU更大的緩存,對于存儲需求較大的配置更大的硬盤等。
最終的目的,對各種應用模式和場景提供經濟的高效的擴展平臺。
如果大家采用更多的計算能力,大家完全可以用智能化的存儲,減少四十到五十的存儲空間,采用重復的數據刪除可以節省95%的備份數據。
目前英特爾不僅擁有存儲、網絡、計算、也擁有大數據分析,管理,安全等相應的解決方案、涵蓋了大家在整個行業里面的方方面面。但是,因特爾的角色是跟大家一起來共建這個生態環境,和前端有硬件廠商,存儲廠商,軟件服務器,行業方案解決提供商,一起攜手將最好的,最優勢的方案提供給客戶。這才最終是我們的價值所在。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:亢海峰:大數據時代的智能存儲