云計算 VS 大數據
有人說云計算和大數據是雙胞胎,兩個是不同的個體,互相依賴又相輔相成,也有人說大數據是來攪局的。
對此,IBM全球高級副總裁、系統與科技部(STG)總經理Rod Adkins認為,當前全球IT領域有了令人振奮的發展趨勢和挑戰,現在每天有大量數據和信息生成,這為大數據分析提供了機會;數據中心的挑戰也為IT提供了新機會,比如云計算,能降低數據中心成本;IBM希望通過智慧的運算,實現智慧的地球的愿景。
英特爾亞太研發有限公司總經理、軟件與服務事業部中國區總經理何京翔認為,大數據本身其實是信息革命的一個新引領。在未來幾年隨著物聯網的發展,可能會有2100億個RFID或者集群,在我們的環境之中,如果未來的移動互聯、物聯網如果變成現實,我們的生活會被傳感器、會被數據采集裝置所擁抱,這時候數據量將更大。這些數據量僅僅是數據,并不能解決問題,它要從數據變成信息、變成智能、變成商業價值,這才能夠體現出真正的大數據的價值。
VMware全球高級副總裁范承工認為,在過去三年當中,看到大數據的發展從無到有,市場上大家說大數據的趨勢,三年前可能還沒有人說這個詞,現在已經如火如荼。然而,現在除了數據本身發生了改變,云計算也使數據變得更加分散,在這樣的趨勢下,傳統數據庫對于海量數據的需求、快的需求、開發者數據多樣化的需求難以滿足,使各種各樣的解決方案大行其道。
EMC的大數據和存儲專家、EMC資深產品經理李君鵬認為,大數據本身就是一個問題集,云技術是目前解決大數據問題集最重要有效的手段。云計算提供了基礎架構平臺,大數據應用在這個平臺上運行。目前公認處理大數據集最有效手段的分布式處理,也是云計算思想的一種具體體現。
對于大數據給云計算帶來的影響,Teradata技術總監Stephen Brobst表示,公有云架構對數據倉庫沒有影響,因為企業的CIO不會無緣無故把財務數據或者客戶數據放到云上,那樣很危險。然而,是私有云架構確實有影響:第一,通過私有云,可以鞏固數據集市,減少利用率不足的問題;第二,可以通過靈敏的方式將數據集成,實現業務價值。
大數據和云計算應用各不同
其實云計算與大數據的不同之處在于應用的不同,主要在兩個方面:
第一,在概念上兩者有所不同,云計算改變了IT,而大數據則改變了業務。然而大數據必須有云作為基礎架構,才能得以順暢運營。
第二,大數據和云計算的目標受眾不同,云計算是賣給CIO的技術和產品,是一個進階的IT解決方案。而大數據是賣給CEO、賣給業務層的產品,大數據的決策者是業務層。由于他們能直接感受到來自市場競爭的壓力,必須在業務上以更有競爭力的方式戰勝對手。
大數據不僅僅是Hadoop
Hadoop是Apache基金會發起和研發的,是目前業界公認的開放平臺之一。授權公司可以發布自己相應的Hadoop版本。以Hadoop為代表的分布式系統,是大數據系統必要組成部分。必要性體現在現在的大數據中很多數據是機器產生的數據,或者是物聯網各種各樣的探測器、電腦產生的日志,這些是人為產生的,而且數量巨大,不適合把它直接放到數據庫中去,而Hadoop就提供了全新的方式,可以輕松進行平面擴展,把這些數據放在庫里進行任意的數據分析。Hadoop成功的建立了這個環境,使得圍繞Hadoop的軟件能夠提供各種各樣的功能,完成智能分析工作。
然而,大數據不僅僅是Hadoop,在對數據進行分析時,用戶可以把數據放池子里,Hadoop則把這些數據分成幾百個、幾千個節點,這是在特定的某些應用場景必須進行的部分。但是更多的應用場景是需要實時的反應,互動的反應,這時候就需要其他技術,包括內存類檢索技術,甚至在數據產生時要進行實時反應的技術。這些技術都結合在一起,才是一個完整的大數據處理系統。
各大廠商應對大數據
不論大數據時代是否真的來臨,作為企業級服務廠商都應該走在受眾的前面,應對大數據。
1.IBM:4V理論+大數據分析平臺
IBM基于大數據提出了規模性(Volume)、多樣性(Variety)、高速性(Velocity)和真實性(Veracity)的“4V理論”,幫助企業直觀認知和準確把握大數據特質。
IBM早在2007年11月就推出了藍云計算平臺,“藍云”基于IBMAlmaden研究中心(AlmadenResearchCenter)的云基礎架構,包括Xen和PowerVM虛擬化、Linux操作系統映像以及Hadoop文件系統與并行構建。
此外,IBM還有大數據分析平臺——InfoSphere。InfoSphere是IBM進軍大數據領域的強有力武器,其包括 BigInsights和Streams,二者互補,Biglnsights基于Hadoop,對大規模的靜態數據進行分析,它提供多節點的分布式計算,可以隨時增加節點,提升數據處理能力;而Streams采用內存計算方式分析實時數據。InfoSphere大數據分析平臺還集成了數據倉庫、數據庫、數據集成、業務流程管理等組件。
2.英特爾:硬件+軟件 火力很猛
硬件上,英特爾從CPU、存儲、內存一切的技術考慮怎么樣使得新一代的系統架構,以及數據中心的解決方案能夠更適合大數據的要求。
軟件上,英特爾提供優化的中間件。以Hadoop為例,英特爾在Hadoop系統,在Hbase、HDFS上都做了增強和優化,使它們在英特爾的平臺上,在英特爾的硬件上性能得到顯著的提高,并推出了Intel Hadoop Manager2.0。
據介紹,Intel Hadoop Manager2.0 優化了Hadoop的處理能力,把擬數據采集到數據處理縮短到近于實時處理,且在英特爾平臺上性能會成倍增長。
3.VMware:虛擬化架構+云平臺
VMware公司大中華區總裁宋家瑜認為,云的平臺才是唯一能解決爆炸性大數據使用的需求,把關鍵應用移到云平臺已經是一個必然趨勢。因此,VMware把嘗試著把大數據應用到虛擬環境的云端。
VMware推出的開源項目Serenget,支持企業在云端和虛擬環境中,在vSphere上部署和管理Hadoop。據介紹,在這樣的環境下,Hadoop部署時間可以從很多天縮短到10分鐘。
此外,VMware在統一的vSphere虛擬化架構之上,提供GemFire實時處理、GreenPlum交互處理及Hadoop批處理三種模式,滿足用戶的海量、快速及靈活的大數據處理需求,并為開發者、數據分析師、數據科學家和商務用戶提供數據分析及可視化的數據展示。VMware還公布了一個大數據分析平臺 UAP(Universal Analytics Platform),其中包括Greenplum database、Hadoop和Chorus分析軟件,幫助客戶同時分析處理結構化和非結構化的數據。
4.EMC:EMC HADOOP
EMC發布了EMC HADOOP版本,它主要進行實時、非結構化的數據處理。EMC的產品系列在HADOOP包括三個方面:Greenplum HD社區版;Greenplum企業版;Greenplum HD Data Computing Appliance。
據介紹,在Greenplum HD中有一些核心的技術創新:可插拔I/O,可以用Isilon OneFS奪存儲系統,也可以用Atmos等,提高效率和性能;實時處理可以實時數據交互和分析處理;在容錯方面,消除名稱節點的單點鼓掌,作業跟蹤其及其他關鍵組件方面有很多優化。它最大的亮點是Greenplum Database與Apache HADOOP強強聯合,這樣的一個一體機實現了結構化、非結構化數據之間無縫的集成。
此外,甲骨文也推出了大數據機,為企業提供一種處理海量非結構化數據的方法,集成了硬件、存儲和軟件,包括Apache Hadoop軟件的開源代碼分發、新的甲骨文NoSQL數據庫和用于統計分析的R語言開源代碼分發。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:CIO:云計算VS大數據 應用各不相同
本文網址:http://www.guhuozai8.cn/html/consultation/10839711299.html