今日,“TGG(中國)2016年高峰論壇”在京召開,TGG(中國)理事長,微軟-數據中心戰略規劃-首席基礎設施工程師汪剛博士在會上做主題為“美國數據中心能耗——綠色的進步和挑戰”的演講。以下是演講實錄:
今天和大家分享一個信息,美國能源部今年發布的一個對美國數據中心行業能耗進行全面評測和進行分析,回顧了過去也對將來做了一個展望。大家可以看到數據中心第一耗電量非常大,第二我們已經做了很多的努力,把數據中心的能耗控制在了一個可持續性的范圍之內。當然如果大家看一個絕對的數值,這個數值還是很大的。
TGG(中國)理事長,微軟-數據中心戰略規劃-首席基礎設施工程師,汪剛博士
在2006年的時候,美國也做了一個同樣的全國性的評測,把數據中心整個的能耗做了一個評測,2006年全年用于數據中心的電耗是610億度電。在那個時間段他做了一個預測,如果說按照現在這樣的發展趨勢,十年以后會是怎么樣,如果說我在技術上進行改進以后又是怎么樣。右邊的虛線是在各種場景下,他在預測說今后會是怎么樣的,已經過了十年了,我們來看看現在又是怎么樣的。這十年中發生了什么樣的變化,我們目前所經歷的又是什么樣的,這些數字是什么,90%,我們現在仍為所有數據的90%是在兩年之內積累的,從人類有記錄開始到2014年,只不過是我們所有數據量的10%。0.5%是我們現在所收集的所有的數據里面,只有0.5%我們進行了初步的分析,如果把這0.5%增加到1%或者10%,我們需要的計算量需要增加多少,我們需要的數據中心又是多少,我們需要的能耗又會是多少。谷歌搜索,每秒鐘全球谷歌搜索55000條,如果你在谷歌搜索里面打進去,我們現在所有的數據量有多少,它在0.4秒鐘之內可以給你回復出11億條信息,速度之快,搜索的范圍之廣,這里面的計算量、存儲量、數據中心數量、功耗能耗,大家可想而知。每天我們全球所產生的郵件,每秒鐘250萬條,4億是什么,如果說現在大家都在講的很熱鬧的東西IoT
物聯網,如果說預測到2020年,按照目前的設想,我們所有的
物聯網,把
物聯網所采集到的數據,需要進行我們所預想到的可以分析的手段,全球需要4億臺服務器,4億臺服務器很粗略估算一下,就是1萬億度電,剛才看到2006年是610億度電,到了那個時候,你需要1萬億度電,我們整個的供電,我們整個的能源是不是能夠支撐這樣一個物聯網的需求,所以面對整個行業的挑戰是非常巨大的。
云計算的發展,公有云整個全年的大家花費在上面的費用,五年之內會增加一倍多。這個就給大家一個概念,數據中心從2006年在美國的數據中心作為一個基準點,我們已經經歷了十年了,我們還要往前走,我們所面臨的挑戰是非常巨大的。
今年出版了第二次美國能源部對全美的數據中心行業能耗的分析,拿2014年做一個截止點,2006年是610億度電,2014年是700億度電,這個增長,剛才講到我們需求的增長非常快,但是數據中心的能耗在美國這樣一個地域范圍里面增長是相當有限,增長的幅度大家可以看一下,從2000年到2006年增長90%,然后慢慢減緩,最近從2010年到2014年只增長了4%,我們預計在今后的四年時間我們還能保持在4%的增長,是根據我們對需求的預測以及我們所能夠采用的技術,當然這個路還是很長,現在整個IT行業的發展變化的速度很快,這個里面有很多的不確定因素,所以我們不能滿足于數據中心能耗只增長4%。怎么樣才能夠讓我們從原來的610億度電到今天這樣700億度,再按照4%的增長,需要各個技術領域、各個層面有創新,需要有節能的措施。大家可以看到各種各樣的虛線代表了不同的場景下你的技術的革新步伐有多快,服務器也好,網絡也好,基礎設施也好,都會有不同的變化。如果我們對未來預測基本準確,也許我們會按4%的增長率到全美數據中心總能耗700億度電,如果說按照最理想的節能技術發展的情況,我們是有可能把能耗控制在更低的水準。
講回到PUE,這個報告里說了,PUE在不同的數據中心規模里會是怎樣的情況,超大規模的數據中心的PUE明顯要比企業級的或者其他的數據中心要高一籌,比如網上的公開信息表示微軟、谷歌,Facebook的PUE都達到了1.07、1.06這樣的水平。從服務器占比,在企業級數據中心還是超大規模的數據中心里面,這個占比大家可以看到,到2020年,在超大規模的數據中心里面的服務器的占比相當高。剛才講到的4%的發展也是考慮到對云計算這樣一個大環境下,服務器巨大的IT設備的數量都是在超大數據中心里,超大數據中心又是能夠達到1.2或者更低的PUE,所以說這個耗量量的增長是根據這樣的預測來推出。
能耗數據分析,如果你把服務器、網絡、儲存和基礎設施分一下,大家可以看到在過去2000年的時候,PUE平均是1.9,到了2020年,全美國的平均值差不多在1.3左右。這個大家已經很熟悉,在基礎設施上,特別是在冷卻和供電這個部分,我們到底采用了一些什么樣的措施,可以讓我們的PUE降低,這個是不同的階段我們所采用不同的技術手段來把我們的數據中心的能耗壓到最低。
接下來看一下PUE驅動微軟怎么把效率來提高,大家可以看到演變的過程。PUE概念非常簡單,大家可能因為講得太多,聽得太多,把PUE最初的初衷是什么,可能很多人已經模糊了。綠色網格第一次提出PUE的時候,明確提出PUE使用的一個要點,那就是不要把一個企業的數據中心的PUE和另外一個企業的數據中心PUE進行比較。PUE是為一個企業做自我衡量評估,你自己作為一個企業,我來衡量一下我自己的數據中心今天的基準線在哪里,然后采取了提高數據中心能效的一些措施,明年、后年,五年以后我再來平衡一下,看看我的PUE是不是降低了。
數據中心是為了支撐行業企業的商業行為,一家銀行的數據中心跟互聯網數據中心完全沒有可比性,或者說你一家建在挪威的數據中心跟一家建在新加坡的數據中心,也沒有可比性,因為地域不一樣,氣候環境不一樣,或者說商務用途不一樣,所以這個比是沒有意義的。
整個行業可以說谷歌是走在最前面的,這邊花俏的圖是用AI管理PUE的結果,他在做什么,把所有和PUE相關的東西包括軟件的運行,包括地域環境,包括外界氣候,包括你采用的制冷,供電配電的方法,做一個這樣機器學習的過程。因為他的軟件、他的搜索,他的工作負荷可以從一個地區轉到另外一個地區,比如這個地區今天特別熱,他就可以自動把這一部分的工作量轉到另外一個區域去,就不用在這個區域里面打開機械制冷,就可以使用另外一個區域的自然制冷,從而把PUE控制在最低。右邊這個圖,藍線是模型所預測的,如果說這樣做了以后PUE會怎么樣,黃線是實測的PUE數字。如果說你是一個企業,你是一個銀行,你能做到這樣嗎,你有多少個數據中心可以這樣來切換,你的速度能趕上嗎。谷歌可以做的你不一定可以做,但是谷歌給大家提供了一個這樣的概念,讓機器學習來看你為了滿足你的商務需求的情況下,你有什么可以做,怎么樣利用現在最新的技術,AI也好,或者其他的冷卻技術也好,怎么在你的大框架下怎么樣達到最有效的利用能耗。
這個是Facebook,上面1.06是實時的PUE,下面1.09是全年平均的PUE。對Facebook很有意義,今天1.06,明天如果說到了1.1的話,可以看一下到底是什么原因造成的,是外界的氣溫升高了還是由于其他的原因。這個是對他有直接的影響。
大家一直在講PUE,左邊是2007年美國能源部的一個報告,PUE提到了10次,今年提到了50次。雖然大家都知道PUE是一個不完善的提法,有很多缺陷或者說應用上如果應用不當會有誤導,但是總體來說是需要我們的用戶對PUE有一個深刻的理解,怎么樣有效的使用它,來幫助我們提高能效。
革命尚未成功,綠色尚未成功,任重道遠,未來幾年大家可以猜測一下云計算會是怎么樣的情況,但是我估計沒有人能夠明確說今后會是怎么樣,這個技術發展實在太大。我們作為一個行業里面大家對綠色關心的這樣一群同行,怎么樣來想辦法把這個工作做好,不能完全依賴以前成功的經驗,要往前看。
一開始的時候我講到,PUE這樣一個東西或者說能效這樣一個成果,像一棵樹上結的果子,這個果子在比較低的地方容易被人踩掉的地方,已經踩得差不多了,接下來的任務很艱難。今年我們綠色網格在全球論壇上,有一個白皮書,在歐盟地區他做了一個測試,他挑選了幾百家企業,對他們進行詢問,說你們企業有沒有把數據中心節能作為一個任務或考核指標,50%被詢問企業回答說“沒有”,這是一個巨大的數字。就問了,節能對環境有好處,第二對你的企業,可以省錢為什么他們對節能不感興趣?這就讓我們綠色網格對這個做了一個深深的反省。第一,大家要想到,一個企業建造一個數據中心,目的是什么,他的目的不是為了節能,沒有一個企業說我去建造一個數據中心是為了節能,建造數據中心是為了支撐企業的業務,對數據進行分析也好,做財務報表也好。讓數據中心負責人晚上睡不著覺的是什么,數據中心的安全,有沒有擴容能力,我明天要增加10個機柜,我這個數據中心里面供電夠不夠,供冷夠不夠,可持續性、省電也是一個很重要的東西,大家同意這個觀點,這個省電肯定不是最高的要求,你不會因為沒有省電而被你老板干掉,這是一個很現實的問題。怎么樣把企業對數據中心真正關注的東西,我們把它跟節能聯合起來,只有這樣聯合起來,我們作為綠色網格,我們的宗旨就是要節能,在數據中心里面怎么樣把所有資源的利用率提高到最好,我們要做的就是怎么樣來把數據中心最關心的事跟節能聯合起來。
這個是綠色網格最近發表的一篇白皮書,等一下張粲總會跟大家做一個更詳細的介紹。這里簡單說一下,以前我們要提高PUE,今天的PUE我們是在1.5,明天到了1.4,那我們就成功了。這個是什么意思,它給你一個方法論,如果說我對我的數據中心進行一定的改造,讓它的能效提高了,PUE從1.6,如果說我換了一個制冷設備,或者說利用了外面的新風,或者水側自然冷卻,我預計我的PUE降低了。在降低的同時,我是不是影響其他兩個維度呢,對我的擴容性有沒有影響,這是一個更全面的。我們有銀行,或者大家跟金融行業打過交道的,就很清楚,你幫我省錢沒用,你怎么幫助我提高我的可用性、在線率、可擴容性,如果能把這幾個問題解決,再來談能效,他就愿意來接受這個談法。這個方法論給大家提出的是怎么樣來把一個數據中心跟制冷相關的東西,怎么樣來全面衡量,或者說我要提高在線率,在線率提高以后我對PUE的影響是什么,在我執行之前需要有一個概念,我是把PUE變高了還是變低了,這個工具給大家提供這樣一個方法論,對數據中心牽涉到冷卻的做一個全面的評估。第一,你可以說我的基線在哪,第二,我今后如果說做某些方面的改進也好,或者說機柜增加也好,對這三個維度的影響是什么,而不是說盲目對機房加了設備、減了設備或者進行一些改進,這樣我們對整個的數據中心綜合性的評估,最終可以讓我們PUE的值變得更低。
剛才講了,一開始我們的關注點就是PUE,剛才一個三角,把運維這方面的東西也引進來。還一個基礎設施,基礎設施里面大家所熟悉的,比如說在講到數據中心的等級,是一級的二級的三級的四級的,所謂講到四級,我們現在只是講四級,而不是說在線率是四個9還是五個9。其實真正要講的是我這個數據中心建造的時候需要它的在線率是多少,在線率是目的,這么實施是手段。由于數據中心等級已經使用了很長時間,從90年代就開始的東西,我們已經本末倒置了,我們不說目的而只說手段了。應該換位思考,其實我要的是五個9還是六個9還是四個9,至于我用什么樣的手段并不重要,可以用的手段很多。一個數據中心,把手段和目的等同起來,現在有很多新的技術,太陽能也好,風能也好,燃料電池也好,自然冷卻也好,各個方面的技術,我們沒有辦法用現有的等級標準對我們的數據中心做一個在線率的評判,它沒有辦法做。綠色網格現在做一個OSDA,開放性的開放標準,就是說要把數據中心的在線率變成一個公開的平臺,給你提供一個工具,比如我要用燃料電池了,我把燃料電池相關的數據輸入進去,最后輸出是幾個9,或者這幾個9跟我數據中心的能效有什么關系,對數據中心做一個綜合的評估,而不是單獨的說我的供電是到了多少。
OSDA的一個目的是怎么樣來推動這個行業大膽的創新,大膽的采用新技術,而不是很盲目的。你要去采用新技術,你對你的領導說,我要采用這個新技術,領導說你這個是uptime幾級,uptime沒有辦法評,領導肯定不讓你做,所以說這個就是對新技術的開發、新技術的應用變成一個障礙,我們就是要把障礙給去掉。
這是一個很簡單的,用燃料電池雙路供電,做一個小小的修改,整個數據中心供電這一塊從五個9變到了六個9,在這之前我們是沒有辦法做這個事。
我們現在在做白皮書也好,在做一個工具也好,這是一個很初步的時間線。我們非常希望大家來積極參與,如果您對這方面有興趣,不要等到游戲規則出來了我來接受這個游戲規則,如果說您的企業是一個很大的企業,有影響力的,您來加入制定游戲規則的行列,十把跟您企業有直接關系的產品也好、應用也好,有直接關系的,把您關心的東西加入到這個里面。希望大家積極參與。
回到原來的話題,面臨的挑戰很多,如果說要考慮到2020年有4億臺服務器的話,我們該怎么辦,還有很多的路要走,希望我們大家共同努力,來讓我們這條線變得越來越平穩或者降低。
謝謝大家。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:美國數據中心能耗——綠色的進步和挑戰
本文網址:http://www.guhuozai8.cn/html/news/10515520171.html