引言
數據倉庫和數據挖掘技術是作為兩種獨立的信息技術出現的。數據倉庫是從數據庫技術發展而來的,為決策服務的數據組織、存儲技術;數據挖掘是通過對數據庫、數據倉庫中的數據進行分析,獲得有用知識和信息的一系列方法和技術。它們都可以完成對決策過程的支持,如將它們兩者結合起來集成到一個系統中,可以更加有效地提高系統的決策支持能力。
在國外,數據倉庫和數據挖掘技術己迅速發展起來,逐漸成為決策支持的新手段。
2決策支持系統
決策支持系統是一種幫助中高層管理人員進行決策的計算機系統,這種系統綜合運用了信息論、人工智能、信息經濟學、管理科學、行為科學等學科的理論、方法和技術。企業可根據自已的實際情況實施不同的DSS應用,其主要應用包括以下幾個方面:銷售支持、客戶分析、市場研究、財務分析、運籌和戰略計劃等。
傳統的決策支持系統以模型庫為主體,通過定量分析進行輔助決策,F在數據倉庫可以把網絡不同站點的商業數據集成到一起為決策提供各種類型的有效的數據分析。
3數據倉庫
3.1 數據倉庫的定義及特點
WH.lnmon對數據倉庫定義為:數據倉庫是一個面向主題的、集成的、穩定的、不同時間的數據集合,用以支持經營管理中的決策制訂過程。數據倉庫具有的4個基本特征為:數據倉庫是面向主題的,主題意指一個分析領域,是在一個較高層次上對數據進行組織、歸類的標準。例如為商場營銷建立的數據倉庫,所選主題可能有商品、供應商、顧客等;數據倉庫中的數據是集成的,數據倉庫的數據的來源可分為外部和內部數據,它需經過清洗,變換成統一的數據結構進入數據倉庫;數據倉庫是穩定的,數據倉庫保存的是大量經集成、加工的綜合型數據,而不是聯機數據:數據倉庫是隨時間變化的,為了適應DSS進行趨勢分析,數據倉庫內的數據隨著數據倉庫的刷新和數據的增加,它的內容也是變化的。數據倉庫中的數據與事務處理系統的數據比較如表1所示。
體系化環境的層次反映了數據與應用邏輯的抽象程度,可很好地與企業實際部門組織結構對應起來,提高企業應用數據的效率。體系化環境的層次如圖1所示。
圖1.體系化層次環境
數據倉庫系統由數據倉庫、數據倉庫管理系統和數據倉庫工具3個部分組成。數據倉庫系統的體系結構如圖2所示。
圖2.數據倉庫體系結構
數據倉庫包含了早期細節級、當前細節級、輕度綜合級、高度綜合級的數據,是整個數據倉庫系統的核心。數據倉庫管理系統負責整個系統的運行,包括從OLTP的數據庫中抽取、清洗、變換數據、維數劃分以及數據的安全、備份和恢復等工作。數據倉庫工具通過OLAP分析工具和數據挖掘工具實現數據分析,以提供決策支持信息來輔導領導決策儀。
3.2數據倉庫的設計方法
數據倉庫的開發方法不同于OLTP系統。其開發過程是一個數據驅動的過程,它的開發過程要經過以下幾個步驟:
(1)分析決策需求,確定數據來源;
(2)定義數據的綜合、轉化過程,使系統能自動將數據從不同的數據源中提取出來后存放到數據倉庫中;
(3)建立數據倉庫:
(4)建立能使用戶從數據倉庫中獲取所需決策信息的工具,使之能進行有效的數據訪間和應用開發,并同時為用戶建立適用于決策支持的數據倉庫界面和應用軟件。
4數據挖掘技術
數據挖掘是一個決策支持過程,它通過對數據庫中的數據進行分析做出歸納性的推理,從中挖掘出潛在的模式,以幫助決策者做出正確的判斷和決策。它涉及到統計學、機器學習、數據庫、模式識別、人工智能和神經網絡等學科內容。數據挖掘的方法有神經網絡、統計方法、決策樹方法、粗集方法等。
在當前,大多數數據倉庫的應用都是進行統計、建立多維以及OLAP的分析工作。隨著數據挖掘研究的深入,已經有了OLAP”和數據挖掘相結合的方法。例如在MicrosoftSQLServer2000的數據倉庫解決方案中就實現了OLAP和數據挖掘相結合。
數據挖掘過程一般分為3個主要階段:數據準備、挖掘操作、結果表達和解釋。如將數據倉庫和數據挖掘協同工作,則可以簡化數據挖掘的步驟,從而大大提高數據挖掘的效率。所以,數據倉庫和數據挖掘相結合是決策支持的有效解決方案。
5聯機分析處理(OLAP)
OLAP是決策支持系統的核心技術之一。OLAP是將數據倉庫中的數據轉移到多維結構中,并且調用多維數據集來執行有效且非常復雜的查詢。在多維結構中,維即觀察的角度,它用超立方體或多立方體結構來描述。在關系型的數據倉庫中,數據的多維視圖主要是通過星型模式和雪花模式等來實現的:星型模式:中央的對象是事實表,周圍的對象是維表。事實表的字段通常是一組主鍵,而主鍵的值依賴于周圍的維表。其結構如圖3所示;雪花模式:對星型模式的維表進一步層次化,對維的屬性進行了多層次的劃分。其結構如圖4所示。
圖3.星型模式
圖4.雪花模式
6利用SQLServer2000開發基于DW和DM的決策支持系統
Microsoft SQLsever2000提供了一套全新的綜合分析服務工具,它集成了OLAP和數據挖掘功能。其中,OLAP的分析服務提供了最完整、最具集成性的、可支持WEB的分析服務;Analysis Service集成了數據挖掘技術,它提供了兩種數據挖掘算法:Microsoft決策樹模型、Microsoft聚集挖掘模型。
數據挖掘技術可幫助用戶分析關系數據庫和多維OLAP數據集中的數據,以獲取發展模式,并對企業未來的趨勢進行預測。我們利用Microsoft SQLserver2000的強大功能來開發企業的信息系統。
6.1企業的管理系統平臺
(l)各種事務處理系統平臺:服務器操作系統為WindowsServer2000;數據庫管理系統采用Mierosoft SQLServer 2000;前臺開發工具為Delphi7.0:運行環境為win98或其它Windows環境。
(2)為實現決策支持系統,系統還增加的平臺為:分析服務器:SQLServer 2000 Analysis Serviee。它可在SQLServer 2000安裝完成后裝入。OLAP開發工具:visual Basie6.0。
6.2基于Dw+DM的決策支持系統的開發
基于DW十DM的決策支持系統,就是以數據倉庫作為底層的數據源,再加上各種數挖掘技術來構成決策支持。我們利用SQLserver 2000可建立如圖5所示的數據倉庫和數據挖掘技術的應用模式。在這種應用模式中,我們討論的重點放在決策部分。
圖5.客戶機/服務器應用模式
其開發過程如下:進行數據倉庫的主題設計、確定邏輯模型和完成事實表和維表的設計;在SQLserver 2000中創建數據倉庫物理數據庫,其中包括事實表和維表:利用DTS數據轉換服務將數據源經過數據驗證、數據遷移、數據清理和數據轉換4個過程進入第2步所創建的數據倉庫;在分析服務器AnalysisSerVice中新建分析數據庫使其連接SQLserver2000中的數據倉庫:在分析服務器Analysis Service創建OLAP多維數據集;利用數據挖掘技術分析多維數據集中的數據;開發客戶端分析程序。
在Microsoft SQLServer 2000 Analysis Serviee中能支持來自在關系數據源和多維數據集這兩者的數據挖掘,并且其擴展性能與第3方工具一起使用。Microsoft決策樹算法是基于分類概念的算法構造樹,它以樹的結構顯示分類的形式。其聚集算法是一種期望方法,它使用完善技術將記錄分組到附近區域,以展示相似和可預測的特征。在客戶端應用分析程序中,可通過ADOMD數據對象接口和MDX語法以及OLEDBforOLAPServer來讀取多維數據集的數據。構建MDX語句是生成OLAP對象鏈接和嵌入式數據庫(OLEDB)的關鍵。SQLServer2000中把MDX語句作為T-sQL語句的擴充部分。其語法格式如下:
SELECT<axis_speeifieation>[,<axis_sPeeifieation>]
FROM<eube一sPeeifiation>
WHERE<slieer--sPeeifieation>
其中:
axis-specification:取代傳統的數據列列表,它是指定所要顯示的維。
cube--specifiatinn:取代傳統的表,它是指定所要查詢的多維數據集。
slicer--specification:指定所要查詢維中的成員列出來的過濾條件。
VisualBasic是功能強大的面向對象的可視化的程序開發工具,我們可以將MDX語句嵌入到Vosual Basic中來開發客戶端分析程序。
7結束語
數據倉庫+數據挖掘技術為DSS研制與開發提供了一種有效、可行的體系化解決方案。數據倉庫和數據挖掘技術在企業決策支持系統中的應用將隨著現代社會商業模式的變革而進一步普及和深入。
在未來大規模定制經濟環境下,數據倉庫將成為企業獲得競爭優勢的關鍵武器。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文網址:http://www.guhuozai8.cn/html/consultation/10819416342.html