項目介紹
國家超級計算中心IT4Innovations是捷克共和國VŠB——奧斯特拉瓦技術大學(VŠB-TUO)中的一個研究機構,由歐盟運作項目“創新研究與開發”資助。來自捷克共和國各大主要科研機構的數以百計的研究人員在利用該中心進行計算工作。自2011年起,IT4Innovations便加入了享負盛名的歐洲PRACE超級計算中心網絡,為來自歐洲其他國家的研究人員提供計算資源。
挑戰
IT4I國家超級計算中心正在建造一臺獨一無二的超級計算機,用以支持該中心的用戶所進行的前沿計算研究。這臺超級計算機由兩部分構成:一部分是從2013年6月投入運行的集群計算機系統Anselm,另一部分是將于2015年初投入運行的更大規模的集群計算機系統,后者有望躋身于全世界超級計算機一百強榜單。
Anselm系統現已是捷克最大的集群計算機系統,它作為DECI TIER-1系統,是PRACE的一部分。有關這些系統的詳細信息,請訪問www.it4i.cz/hardware/en。
IT4I國家超級計算中心主要有六個研究方向,分別使用計算流體動力學(CFD)和有限元分析/有限元法(FEA/FEM)等方法處理多種計算問題,包括實時交通分析/管理、洪水建模/預測、空氣污染建模/預防、分子動力學仿真和新材料建模等。
面對形形色色的用戶和應用,IT4I意識到他們需要為超級計算中心用戶提供一種可靠、高性能的作業負載管理產品。在采購過程中,IT4I要求提供高級作業調度程序和資源管理器以及高級應用分析工具。在硬件供應商Bull的投標中,捆綁了滿足這些要求的產品。
在采購過程中對于作業負載管理器設定的標準是:較高的計算資源效率和利用率;穩健的批量作業和交互作業運行;支持使用GPU/協處理器卡進行節點調度;支持作業依賴性和作業陣列;確保操作的容錯性和高可用性;具有用于調度與作業執行的靜態和動態資源,包括軟件許可證等外部動態資源;支持資源預留;支持回填;可向用戶通知作業生命周期事件;可對用戶/用戶組和資源進行限制或定額配給;擁有記錄完備的高質量API,支持C和Python等常見編程語言;以及許多其它特定技術要求。
“無疑我們需要一款高質量的調度程序——所有的超級計算中心都需要這樣的程序,因為確保資源利用率達到最高是計算中心成功的關鍵,”計算中心主任Martin Palkovi說道。“當你投入如此多的時間、資源和精力來打造一個超級計算系統來支持數以百計的用戶需求時,就應當確保作業負載管理系統可靠無誤,能夠提供你需要的性能。”
“PBS Professional實施起來迅速簡單,使用戶可以快速投入工作,具備了我們對調度程序所要求的強大商用功能。此外,Altair提供的高水準支持正是我們這樣的機構極度需要的。”
Branislav Jansík
IT4I超級計算服務部總監
IT4I國家超級計算中心內的集群計算機系統
解決方案
IT4I國家超級計算中心使用PBS Professional管理其新型Bull超級計算機,該超級計算機由200多位計劃用戶所共享。PBS Professional易于實施和使用,具有極高的可靠性,這些都是使其脫穎而出的關鍵優勢。該中心還采用了PBS Analytics,并計劃隨著集群機使用規模的擴大,對更多的產品進行考察評估。
為滿足調度程序的嚴格采購要求,Bull的專家對很多商用開源產品進行了評估,最后決定推薦Altair PBS Professional®作為作業負 載管理器。
“要實現高質量大規模的作業負載管理,PBS Professional是極佳的選擇,”Bull的ISV聯盟主任 Olivier David說道,“我們將PBS Professional和bullx超級計算機套裝緊密集成,配以經過優化的bullxMPI,可保證用戶應用在bullx超級計算機上的高效利用。Bull和Altair兩家公司長期以來都為HPC市場呈獻了很多廣受贊譽的解決方案,這次聯袂為客戶提供的解決方案不但彰顯了高性能和高穩健性,而且適用于規模龐大的配置。”
IT4I超級計算服務部總監Branislav Jansík對該決策進行了肯定,他說:“我們有很多選擇,但是PBS Professional提供的解決方案是最為先進成熟的方案之一,我們很高興Bull選擇在其產品中使用這款調度程序。”
Jansík補充道:“我們已經能夠熟練使用PBS Professional對我們在大學的HPC集群進行作業調度。不過,由于我們現在運作的系統的規模巨大,我們想要重新開始,讓供應商提供的新系統能夠搭載他們能想到的最好的調度程序。令人高興的是,PBS依然脫穎而出。”
憑借以往使用PBS Professional的經驗,IT4Innovations超級計算服務部的專家為所需的新調度程序定義了功能標準。Branislav Jansík解釋說:“PBS Professional在功能性上設定了一個高標準,我們選用的調度程序在功能上至少不能遜于此標準。”
最終,由于PBS Professional易于實施和使用,供應商決定選擇PBS Professional。“PBS Professional易于安裝和使用,而且它能滿足我們全部的功能要求,”Branislav Jansík說道,“現在我們的用戶可以完全依靠這套作業負載管理系統,而我們可以充滿自信地應對系統規模的擴張。”
目前,該中心的所有研究人員都使用PBS Professional來分配和利用Anselm超級計算機的計算資源,Anselm是Bull提供的一款x86集群計算機,運算速度峰值約為94萬億次浮點運算/秒。
PBS Professional由Bull以預安裝的形式提供,所以中心的用戶可以迅速開始工作。IT4I能夠在項目初期階段分析用戶和運行需求,然后根據用戶的需要對該產品輕松地實施定制。
“有了PBS Professional,我們可以快速創建插件和序言/結語腳本,確保最佳資源使用率,增強安全性以符合規范要求,并使計算節點在作業使用后仍保持原始、一致的狀態,”IT4I超級計算服務部副總監兼高級管理員Filip Staněk說道。“為滿足客戶需求,我們需要完成高度復雜的定制工作,而PBS Professional讓這些變得易如反掌。”
IT4I國家超級計算中心還實施了PBS Analytics,該軟件隨解決方案進行預安裝,用于用戶分析和報告。“對于每個超級計算中心來說,有必要準確掌握用戶和項目所消耗的分配資源并相應地收取費用。PBS Analytics 提供的高級分析和報告功能可讓我們更好地了解資源使用細節和項目未來的負載,”Martin Palkovi說道。
結論
用IT4I國家超級計算中心管理員的話來說,選擇PBS Professional最大的好處在于操作人員能夠迅速輕松地適應和使用這款程序。“用戶可以很快熟悉并上手使用PBS Professional,”Filip Staněk說道,“我們清楚,是Altair讓我們有機會獲得一流的支持服務,而這也是PBS Professional與SLURM或Torqueover等開源替代產品相比所具有的獨特優勢。”
目前,在IT4I國家超級計算中心的用戶中,有超過100名活躍用戶只通過PBS Professional這一種途徑分配和使用集群計算資源。Anselm集群上每天都要安裝新的應用程序,所以該中心計劃對Altair的其它技術進行評估,以備未來擴展之用。
PBS Professional運行的大部分應用程序均為用戶編寫的代碼,或是像OpenFOAM、ParaView和Octave這樣的開源軟件。但系統中現已部署了ANSYS、EnSight、LS-DYNA、MATLAB和COMSOL等商用軟件。除此之外,該中心還計劃部署VASP、Wien2K等其它軟件。
該中心主管Martin Palkovi說道:“我們確信PBS Professional就是我們超級計算系統的正確選擇。”
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:PBS Professional助力捷克國家超級計算中心的作業負載管理
本文網址:http://www.guhuozai8.cn/html/solutions/14019313802.html