為什么更大并不總是意味著更好
討論的中心大部分是關于Hadoop。這個讓人費解的分布式計算技術的集合可能是開源的, 但是它既不便宜, 也并非友好,盡管有著可愛的大象標志。事實上,對于大存儲和大硬件供應商來說Hadoop和大數據看起來像是夢想入場券,他們中的許多人已經讓昂貴的收購進入這個有利可圖的市場。
但是在我們擔心會錯過洞察力金磚而開始在企業中保存每一個廢棄的數據之前,我們不應該關注我們已擁有的東西嗎?當然, 真正的目標是使企業中更多的人在增加新的待定相關和質量的數據之前,用現有的數據做更多的事情。也許更有意義的事情是離開大數據浪潮,并專注于讓業務用戶更有效地使用已有的數據,而不是喂養大象及其高懸的生態系統。
通常,大數據的討論被限定在一個隱含的前提之下,越大越好,且增加更多的數據自然會獲得的洞察力。你相信這樣的宣傳嗎?大數據項目帶來的是在復雜的計算系統上的大投資并有專業技能來處理他們。更糟的是,他們負擔了眾所周知的長部署時間和糟糕的性能。
你不需要更多的死數據
也許一些大企業和政府部門需要大數據,但是對于我們其他人呢?收集更多的數據真有幫助嗎? 也許吧。但你必須首先回答: 從已有的數據中我獲得有用的、及時的答案了嗎?我有合適的原則去執行洞察力,并測量他們對業務的影響力了嗎? 如果答案是否定的,你并不是唯一的。據Freeform Dynamics最近的一項研究表明, 只有15%的企業認為他們在決策上充分利用了傳統的數據庫信息。
似乎大多數已經存儲的數據并未充分用于分析。關于這一點,
數據倉庫之父Bill Inmon稱95%的數據倉庫處于“休眠”之中。在你未能充分利用的數據倉庫中再添加TB或PB級的非結構化數據能改變這一情況嗎?可能不會。事實上,它更增加了數據休眠、死亡數據的機會。
企業所需要的不是休眠或死亡數據。他們需要數據幫助他們獲得運營的洞察力, 使他們現有的業務運營得更好。他們需要數據讓他們的業務用戶能夠更高效、更具創造性。他們需要仰仗“快速”數據而不是休眠或死亡數據。如果這對你有意義, 你該如何?
有大的目標,但從小處著手
首先, 盤點一下你已經擁有的:不只是數據,還有知識和技能。選擇一個項目, 你可以在現有的資源上證明改進的提高。如果你需要雇傭, 考慮一下業務分析師, 而不是技術專家, 因為用于回答一個業務問題的錢是一種投資, 而一個用于支持這個過程的專業IT技能是沉沒成本。
第二,考慮更敏捷的現成工具,它能夠讓你放眼大數據,但是從小處著手,并迅速擴展?紤]易用的工具, 你現有的工作人員都可訪問到。這種方法在目前會帶來更多的業務洞察力而且許多這樣的工具擴展性好,除非是面對最極端大數據問題的考驗。解決方案應該允許業務經理可擴展性的直觀使用以支持有經驗的分析師更復雜的挖掘。對基礎數據結構或處理平臺的知識不應是必要的。
分析引擎應該運行在沒有專有的硬件或特定配置、數據庫模式的標準服務器上,或調整需要以實現所需的性能。因為將數據加載到分析數據庫會成為最耗時的工作, 連接到數據源應該基于行業標準和設計來大大簡化多種格式的數據加載。
最后,采用敏捷的,迭代的方法,不要在大數據上大爆炸。成功的分析計劃是基于與數據意義的持續對話中,有一套問題的答案是在下一輪的發現中。對每個周期更多了解數據所呈現的什么,與什么相關,需要添加什么以及有多少歷史數據是值得添加的。從你的數據中(無論大或。┦斋@價值的最關鍵因素是快速的回答時間。
也許大數據分析總有一天會變成每個企業所必備的,但不要確信僅僅因為管理顧問和主要供應商正投入百萬美元在“不使用大數據分析會錯失什么?”的訊息上就認為它是目前的案例。更可能,你不會遺漏任何事情而你的時間和金錢更好用于讓更多業務用戶手中擁有已有的數據,并給他們工具做更深、更快的分析。
進化向我們展示的一件事情是,小型敏捷物種往往比大的特別的物種做的更好。也許我們應該對我們的數據運用同樣的思維?
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:大數據:生者與死者
本文網址:http://www.guhuozai8.cn/html/consultation/10839712510.html