挑戰
伴隨中國“智”造戰略的持續進行,研發計算軟件已經成為企業研發體系中不可或缺的重要組成部分。與此同時,管理層迫切希望核心研發計算資源整合形成統一、安全、高效的企業研發云平臺。
企業級計算中心成為這一建設重任的直接負責部門,承擔著規劃、選型、實施、運維、改進、擴容等一系列任務。然而,在企業研發云的實踐過程中,局限于網絡規劃、硬件購置、系統集成等傳統建設辦法的計算中心發展思路已捉襟見肘,主要體現在以下方面:
無法適應計算資源的動態變化
新軟件、新版本的安裝、升級、配置以及上線周期越來越短,計算中心必須高度重視軟件資源,配合應用軟件以及研發需求而“隨需應變”;
·無法滿足應用部門的自服務需求
由于研發任務繁雜、缺乏培訓時間,應用部門迫切希望自助獲取計算服務,計算中心必須在統一化管理資源的前提下大幅提升服務便利性;
·無法保障信息部門的管理安全
研發計算資源的大規模集中化進程,針對計算中心在硬件運維、軟件監管、用戶監控乃至數據安全等領域的管理手段提出了更高要求;
·無法支持領導層的決策數據分析
領導層迫切需要研發計算資源利用情況的實時狀態、歷史數據以及變化動態,計算中心必須實時監控資源利用信息數據,進而可持續優化資源配置。
作為戰略性研發資源運維管理方,企業級計算中心該如何應對這些新問題、新挑戰?如何切實利用研發計算資源為企業創新工作提供全面、便捷、高效的服務?企業級計算中心如何以計算資源服務的角色融入研發流程體系,從而實現戰略轉型?
定位
在探討企業級計算中心戰略轉型方案的過程中,我們非常有必要對計算中心在現代企業中的職能、角色、功能范圍等進行更為明確的定位。
通過走訪大量的具備自主研發業務的制造業企業以及科研院所的信息化管理部門、科研管理部門,我們發現信息技術已經成為研發業務中不可缺少的支柱型資源,通過進一步梳理,我們可將信息技術資源分為兩大類:
·數據業務資源
這類業務以數據處理為核心,以數據庫為載體,主要覆蓋企業中的辦公協同、流程管理等業務。目前該業務發展較為成熟,大多已然形成穩定可靠的企業級數據中心。在新的建設時期,數據中心的升級改造手段多為服務器虛擬化技術。
·計算業務資源
這類業務以計算能力為核心,載體(應用軟件)多樣化且數據格式難以統一,主要覆蓋研發過程中非常重要的三維建模、數值仿真等業務。該類業務專業要求高且前期投入巨大,目前迫切需要集中化管理軟件針對計算業務資源進行全面管控。
由以上的粗略分析不難看出,計算中心與數據中心相比存在較大業務差異性,管理手段成熟度也存在巨大差距。計算中心若能有效承擔管理計算業務資源的職責,并與數據中心緊密協作,即可成功構建企業信息化體系的雙核引擎,共同驅動企業研發創新。
技術
由于承載的研發計算類應用的特殊性,計算中心的技術特點也與數據中心存在著巨大差異。經過對制造業常用設計、研發軟件的分析、歸納與推演,我們總結出未來計算中心必須具備三大核心能力:
·計算
即高性能計算能力。
高性能計算能力是計算中心建設的重點課題,大多數企業級計算中心建設的首期任務就是建立包括服務器集群、高速網絡、作業調度軟件、應用軟件族在內的一系列基礎型計算資源,但是卻往往忽視了高性能計算能力的管理架構、服務門戶設計,從而導致高性能計算平臺在易用性、可擴展性、易維護性等方面存在嚴重問題,直接影響了計算中心的服務表現并制約其良性化發展。
·圖形
即高清圖形處理能力。
高清圖形處理能力是計算中心建設的新課題,圖形處理設備長期處于分散狀態,并直接導致了研發數據“碎片化生存”狀態,難以保障研發數據的安全監管以及版本控制問題。新一代計算中心應該集中監管高清圖形處理設備,同時允許用戶通過安全認證機制遠程訪問交互類應用軟件,用戶可獲得高清、流暢的本地化體驗。高清圖形處理能力的集中化管理技術體現了信息化管理部門對研發業務安全規則的積極響應,也是計算中心基礎架構發展的必然趨勢。
·存儲
即海量數據存儲能力。
海量數據存儲能力是計算中心建設過程中不可避免的課題,計算資源集中化的進程必然導致數據集中化存儲,而存儲系統的性能、容量、架構將直接影響計算中心的服務表現。研發數據的生命周期直接受制于研發項目周期,因此傳統的時間戳、配額制等存儲管理機制必然無法適應新型計算中心的數據管理需求。發展高性能、多層次、智能化的海量數據存儲能力以及相關接口技術,可將計算中心資源作為數據生產服務組件整合融入整體研發流程管理體系。
實踐
SimCloud仿真云計算平臺是上海泛云信息科技有限公司(“泛云科技”)自主研發的軟件產品,經過多年的探索與發展,SimCloud仿真云平臺在多家大中型企業及科研機構直屬計算中心進行了成功實踐,成為面向研發計算業務的企業級私有云解決方案。
日前,在用戶與合作伙伴的高效協作之下,SimCloud成功研發推出V3版本,為計算中心的三大核心能力管理工作引入了一系列創新特性:
·支持Windows+Linux混合架構HPC集群
應用軟件的多樣性決定了高性能計算集群無法長期保持單一操作系統的生態環境,泛云科技快速響應用戶需求,在SimCloud V2的基礎之上重點攻關了Windows與Linux混合架構集群統一調度管理技術,巧妙克服了Windows與Linux系統的用戶認證機制難以兼容的問題。
SimCloud V3通過內置中科院軟件所研制的Speedup Cluster Suites,成功實現了Windows+Linux混合架構條件下的統一用戶認證、數據管理、軟件配置、作業管理、權限配置、調度策略、集群管理、資源監控以及系統資源分析報表等功能。
·改進混合云彈性計算服務模式
企業級計算中心建設目標是滿足常規性研發計算需求,但是在運營過程中不可避免的遭遇計算服務高峰請求,安全接入以國家級超級計算中心為代表的公有云或者上級集團的集團云,將是解決這一問題的有效途徑。
SimCloud V3在微軟云計算部門、上海超級計算中心的幫助下,改進發展了互信友群協作模塊,支持提交至私有云的用戶作業自動遷移至公有云(集團云)進行計算,結果數據將在計算成功后自動回遷。SimCloud V3在保障用戶體驗與私有云模式基本一致的前提下,為管理員增加了作業轉發策略配置、轉發任務統計等混合云管理手段。
·擴展軟件許可證管理機制
軟件許可證管理技術呈現多樣化趨勢,SimCloud繼全面支持FlexLM技術之后,擴展支持LMX許可證管理,同時在計算資源部署實踐中成功實施了多許可證服務器、冗余許可證服務器等管理模式。經過改進后的SimCloud V3軟件架構,針對許可證服務已然具備更為強大的解析、監控與統計能力。
·兼容支持動漫渲染應用
應設計院用戶的效果圖、動畫短片制作需求,SimCloud V3在支持傳統MPI并行計算應用的基礎上,擴展支持了MAYA、3DSMAX等三維場景設計/渲染軟件,在同一個計算資源平臺內實現工程數值仿真、動畫短片制作等服務場景。
·發展管理員角色配置機制
計算中心管理員角色的單一性已經嚴重影響了資源服務表現,SimCloud V3創新發展用戶自定義管理員角色配置工具,有效區分硬件運維、軟件部署、報表統計、作業監控、研發指導等角色功能。通過合理的管理員角色配置,計算中心可大幅縮短了平臺服務響應時間,提升計算用戶滿意度。
針對中國國防工業信息安全相關規定,SimCloud V3繼續改進發展了安全/審計模塊,通過內置的管理員、安全員、審計員角色功能配置及相應審查監管流程,達到全面監控研發計算資源的管理目標。
·優化虛擬應用預約管理
高清圖形處理能力是計算中心的有限資源,并且長期處于供不應求的狀態。針對這一現狀及發展態勢,SimCloud V3優化設計了虛擬應用的預約、排隊及管理機制,通過用戶優先級、軟件使用權限、預約時間等參數進行資源調控,在保障用戶高清交互體驗的前提下,大幅提升了計算資源利用率。
致謝
由于部門設置、管理機制等多種因素,中國企業無法照搬照抄外國企業計算中心的建設模式,甚至難以模仿國家級超級計算中心的管理方式,企業級計算中心戰略轉型過程注定是一段坎坷的道路。泛云科技正努力而堅定的踐行“創新、整合”的自主研發理念,勇于開拓并克服這段漫長征途中的種種艱難險阻,攜手中國企業一舉拿下這一場研發計算資源整合的攻堅戰役。
最后,我們需要特別感謝上海汽車集團股份有限公司技術中心、國家核電上海核工程研究設計院、中船重工第七〇一研究所、中國電子第十二研究所、浙江水利河口研究院、中石化上海石油化工研究院等戰略級用戶及合作伙伴,正是由于這些企業及科研院所管理團隊為我們持續注入創新理念與管理思路,方才促使SimCloud仿真云計算平臺不斷煥發出新生的力量。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:企業級計算中心戰略轉型之路