信息時代的到來,使得人們在實踐中積累的數據越來越多。大量信息給人們帶來方便的同時也帶來一大堆問題,如信息過載,難以消化;信息形式不一致,難以統一處理;信息真偽難辨等等,導致了“信息爆炸而知識缺乏”、“信息孤島”等現象。激增的數據背后隱藏著許多重要的信息,人們希望能夠對其進行更高層次的分析,發現數據中存在的關系和規則,根據現有數據預測未來的發展趨勢,獲得更準確全面的信息幫助管理層決策。面臨著這些新問題和挑戰,人們開始考慮和解決如何舍棄那些不必要的信息,從大量的數據中提取有用的信息,提高信息的利用率,數據挖掘技術此時應運而生。
數據挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的和隨機的數據中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數據挖掘是一門廣義的交叉學科,它匯聚了不同領域尤其是數據庫、人工智能、數理統計、可視化、并行計算等方面的知識。數據挖掘技術從一開始就是面向應用領域,它不僅是面向特定數據庫的簡單檢索查詢調用,而且,要對數據進行微觀、中觀乃至宏觀的統計、分析、綜合和推理,以指定實際問題的求解,企圖發現事件間的相互關聯,甚至利用已有的數據對未來的活動進行預測。
圖1 數據挖掘的流程
數據挖掘的任務是從大量數據中發現知識,可分為描述性挖掘,隱藏性挖掘和預測性挖掘三類,如圖2所示。描述性挖掘是刻畫出數據倉庫中數據的某一特性,解釋發現了什么;隱藏性挖掘找出以前無法探知,隱藏于業務數據中的信息,解釋為什么;預測性挖掘則是在但前數據上進行推理,做出預測,解釋將會發生什么。
數據挖掘與傳統的數據分析(如查詢、報表、聯機應用分析)的本質區別是數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識數據挖掘所得到的信息應具有事先未知,有效和可實用三個特征。先前未知的信息是指該信息是預先未曾預料到的,即數據挖掘是要發現那些不能靠直覺發現的信息或知識,甚至是違背直覺的信息或知識。
圖2 數據挖掘類型
數據挖掘方法有很多種,其中比較典型的有分類、關聯、序列模式、聚類等,本文在后面將詳細介紹其分析模式及算法。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:商務智能體系介紹——數據挖掘相關理論
本文網址:http://www.guhuozai8.cn/html/consultation/1083932967.html