伴隨著平板電腦、智能手機、微博、SNS網站的出現,越來越多的諸如語音、視頻等非結構化數據充斥著人們的生活。
傳統商業智能系統在向縱深應用拓展的同時,商業決策已經越來越依賴于數據。而對于任何企業來說,數據都是為其帶來商業價值的關鍵因素。沃爾瑪就是最早通過利用大數據而受益的企業之一。
通過對消費者的購物行為等非結構化數據進行分析,沃爾瑪成為最了解顧客購物習慣的零售商,并創造了“啤酒與尿布”的經典商業案例。早在2007年,沃爾瑪就建立了一個超大的數據中心,其存儲能力高達4PB以上。
根據IDC的報告,未來十年全球大數據將增加50倍。如何存儲這些快速增長的、海量的數據?如何對大數據進行分析處理,挖掘出價值?相關的一系列問題成為了所有企業面臨的共同挑戰。獨立企業數據集成軟件提供商Informatica中國區首席產品顧問但彬認為,2012年隨著云計算應用部署的加快,大數據帶來的挑戰將更加嚴峻。
一 是什么樣的大背景、大環境催生了大數據這種新型的數據模式?
但彬:一個大規模生產、分享、應用數據的時代正在開啟,我們每個人都成為了數據的創造者和使用者,微博、社交網絡都是最好的例子。代表著大數據時代Apple、Facebook、Amazon等公司正成為這場變革的推動力量。同時新企業也層出不窮,比如2007年才成立的Dropbox公司,創始人不到27歲,估值已經超過40億美元,這是一家提供文件備份及共享服務的公司,允許用戶在不同平臺和設備之間同步并共享文件,Dropbox用戶數量超過2500萬,每天存儲的文件數量2億多個,蘋果公司曾出價8億美元想收購它,但未成功。
二 大數據浪潮正在愈演愈烈,那么大數據的商業價值又是什么?
但彬:企業用以分析的數據越全面,分析的結果就越接近于真實。大數據分析意味著企業能夠從這些新的數據中獲取新的洞察力,并將其與已知業務的各個細節相融合。不同企業之間最大的顯著差別在于新數據類型的引入。那些沒有引入新的分析技術和新的數據類型的企業,不太可能成為其行業的領軍者。
三 大數據可以幫助客戶做哪些事情?通過大數據進行用戶行為的分析在哪些行業體現得最為成功?
但彬:通過大數據進行用戶行為分析只是大數據在一個行業的體現。舉例來說,沃爾瑪是最早通過利用大數據而受益的企業之一,一度擁有世界上最大的數據倉庫系統。一般看來,啤酒和尿布是顧客群完全不同的商品。但是沃爾瑪多年來數據挖掘的結果顯示,在消費者中尿布賣得好的店面啤酒也賣得很好。沃爾瑪因此被公認為促進了商業領域數據挖掘的誕生。
而在其他領域,比如美國國家海洋和大氣局嘗試利用大數據業務協助進行對氣候、環境、天氣的研究和商業性探索,美國宇航局利用大數據業務進行航天和其他領域的探索。制藥企業和能源企業則借助大數據業務進行更多實實在在的研發,藥品實驗和地球物理分析。《紐約時報》將“大數據”作為一種工具,進行文本分析和網絡開發。迪斯尼公司利用它對店面、主題公園和網絡資產中的數據進行分析,研究消費習慣的相關性。
四 大數據常和云計算聯系到一起,這兩者之前的關系是什么?
但彬:大數據意味著大資源,這是云計算與大數據的交集,其實也就是意味著,云計算與大數據的關系是兩個方向,云計算可以承載大數據,大數據也是可以通過云計算架構和模型來提供解決方案。這樣我們就可以清晰地知道,大數據在管理和應用的方向上,可以通過云計算的資源共享、高可擴展性、服務特性來搭建和運營。
現在,各類機構的數據量正在快速增長,這些數據每天在其系統內流動;同時,云中的數據量也日益增加。隨著數據量的增加,實時處理這些數據的能力已成為大數據的重要挑戰之一。2012年,隨著云計算應用部署的加快,大數據帶來的挑戰將更加嚴峻。
五 大數據時代,云計算如何解決數據在云端的集成與分享、個人數據的無縫連接、數據的跟蹤分析和挖掘?
但彬:隨著云計算的發展,云數據集成將成為關注重點。而隨著越來越多的企業機構轉向混合型IT架構,以及云集成任務的業務關鍵性和復雜性的增加,云數據集成的企業級特性對客戶的成功意義非凡。
六 從去年開始,眾多廠商開始進軍大數據并希望從中掘金,但是從目前的態勢來看,由于大數據的技術門檻較高,在大數據領域展開競爭的IT公司,大都仍然是在數據存儲、分析等領域有著傳統優勢的廠商,比如IBM、Oracle等。那么Informatica是在什么基礎上來做大數據的?
但彬:Informatica有一套完善的技術,可以支持多項復雜的企業級數據集成計劃,包括:企業數據集成、數據質量控制、主數據管理、B2B Data Exchange、信息生命周期管理、復雜事件處理、超級消息和云數據集成。通過Informatica單一、完整、開放且經濟的數據集成平臺,企業機構可以在改進數據質量的同時,訪問、發現、清洗、集成并交付數據,來提高運營效率、降低運營成本。
七 Informatica數據集成平臺上的應用是由合作伙伴提供還是自行開發?
但彬:Informatiea平臺是全球第一個專為數據集成設計的全面、統一、開放式軟件平臺。這一開放式跨平臺軟件可以訪問幾乎所有類型的數據,并且讓這些數據變得可以訪問、有意義而且有用處,滿足相關人員和流程的需要。通過促進整個企業協作的產品,Informatica不僅可以幫助客戶降低成本、加速獲得成果,而且能夠通過擴展處理各種規模或復雜程度的數據集成項目。2011年6月,Informatica成功地推出了創新的Informatica 9.1 for Big Data,這是全球第一個專門為大數據而構建的統一數據集成平臺。
八 Hadoop是一個能夠對大量數據進行分布式處理的軟件框架,Hadoop意味著開源,那么在這種開源的前提下廠商如何盈利?
但彬:用戶希望能夠以更經濟的方式、更好的性能來處理數據,從而能夠經濟有效地利用快速增長的數據推動業務創新。在這樣的背景下,Hadoop獲得了快速發展。
Hadoop有兩個重要特性,一是經濟性,二是可擴展性。2008年,一家電信運營商試著用36萬元搭建一個基于x86架構和Hadoop架構的云計算評估平臺。在與已有的270萬元商用系統跑同樣的應用進行性能比較后,他們驚喜地發現,Hadoop平臺的數據處理性能增加了約30倍,數據挖掘性能增加了約9倍,而且成本優勢將隨著數據處理規模的增加而更具優勢。
隨著企業不斷尋求更高的數據回報,對Hadoop開發者將會有更高的需求,技能短缺將繼續且很可能加劇。2012年,Hadoop將繼續獲得牽引力,但在2015年前都不會成為真正的主流。
九 除了Hadoop軟件架構,元數據和主數據管理也是大數據時代令人較為關注的話題。那么應如何區分兩者?它們分別在企業中的作用分別是?
但彬:元數據通常稱為“關于數據的數據”,是有效管理、共享和存儲信息的一個最重要的成功因素。事實上,元數據管理是數據集成的基礎。根據IDC的定義,主數據是指系統間共享數據(例如,客戶、供應商、賬戶和組織部門相關數據)。
主數據管理是一系列的規則、應用和技術,目的是為了協調和管理與企業的核心業務實體相關的系統記錄和系統登錄中的數據和元數據。盡管不少公司針對IT體系架構接受以數據為中心的方法并將數據作為一種資產來進行處理,但許多公司未能充分利用他們的數據集成投資從元數據管理中獲得額外價值。有效的元數據管理將引導開發整體數據集成的最佳實踐。
整個企業范圍內不同系統中存在著不同格式的關鍵業務數據(例如客戶、產品、合作伙伴和供應商數據),這種不一致和重復的數據可能會阻礙戰略性業務決策的實施。憑借MDM(主數據管理),企業可以獲得整合而可靠的數據,從而更易于獲得和留住客戶,充分發揮高效運營的競爭優勢,加快實現并購所帶來的價值,支持企業范圍內的明智決策。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:大數據帶來大挑戰