引 言
目前,各個行業都面臨著激烈的競爭,及時、準確的決策已成為企業生存與發展的生命線。隨著信息技術在企業中的普遍應用,企業產生了大量富有價值的電子數據。但這些數據大都存儲于不同的系統中,數據的定義和格式也不統一,商務智能系統能從不同的數據源搜集的數據中提取有用的數據,并對這些數據進行清洗、轉換、重構等操作后存入數據倉庫或數據集市中;再運用適合的查詢分析工具、數據挖掘工具、聯機分析處理(OLAP)工具等管理分析工具對信息進行處理,使信息變為輔助決策的知識, 并以適當的方式呈現在決策者面前,供決策者運籌帷幄。
1 商務智能(BI)簡介
1.1 商務智能的概念
商務智能(Business Intelligence,BI)的定義眾說紛紜。 Gartner Group 認為“商務智能是將數據轉換成信息的過程, 然后通過發現將信息轉化為知識”;商務智能大師利奧托德認為“商務智能是將存儲于各種商業信息系統中的數據轉換成有用信息的技術,它允許用戶查詢和分析數據庫,可以得出影響商業活動的關鍵因素, 最終幫助用戶做出更好更合理的決策”。
1.2 商務智能系統的主要技術
美國數據倉庫研究院把商務智能比作 “數據煉油廠”,它將商務智能的應用過程描述為“數據-信息-知識-計劃-行動”的過程。 由商務智能系統的基本架構可以看出, 商務智能的實現涉及到軟件、硬件、咨詢服務及應用等方面,其基本技術包括數據倉庫、聯機分析和數據挖掘 3 個部分。
2 聯機分析處理(OLAP)概述
聯機分析處理(OLAP)的概念最早是由關系數據庫之父 E.F.Codd 于 1993 年提出的:OLAP 是使分析人員、管理人員或執行人員能夠從多角度對信息進行快速、一致、交互地存取,從而獲得對數據的更深入了解的一類軟件技術。OLAP 的目標是滿足決策支持或者滿足在多維環境下特定的查詢和報表需求,是多維數據分析工具的集合。OLAP提供了在不同的數據子集和不同的抽象層數據上進行上卷、下鉆、切片、切塊、旋轉等多維分析操作,提高了數據分析的能力和數據顯示的靈活性。
3 OLAP 在商務智能系統中的應用
作為商務智能系統的關鍵技術,OLAP 可以在使用多維數據模型的數據倉庫或數據集市上進行,充分發揮 OLAP 的聯機分析的功能和特性。 將OLAP 與數據挖掘進行結合,能夠為數據挖掘提供基礎數據支持,提高數據挖掘的效率,而且還可以實現聯機分析數據挖掘的功能。用戶常常希望穿越數據庫,選擇相關數據,在不同的粒度上進行分析,并以不同的形式顯示結果。聯機分析數據挖掘提供了在不同的數據子集和不同的抽象層上進行數據挖掘的工具,在數據立方體和挖掘的中間結果數據上進行下鉆、上卷、旋轉、切片、切塊等操作,提高數據挖掘探測性的數據分析能力和靈活性。
3.1 OLAP 數據庫設計
進行 OLAP 分析首先要根據分析主題選取分析的維度,設計 OLAP 數據庫模型。OLAP 數據庫的實現主要有 3 種方式:一是 MOLAP(基于多維數據庫的 OLAP),它是建立專有的多維數據庫來存儲 OLAP 所分析的數據,性能好、響應速度快,支持計算復雜的跨維計算和多用戶的讀寫操作計算;二是 ROLAP(基于關系型數據庫 OLAP),它是利用現有的關系數據庫技術通過建立中間表來模擬多維數據, 通過 SQL 實現詳細數據與概要數據的存儲;三是 HOLAP,它將 ROLAP 和 MOLAP 的功能結合在一起,增強了數據庫的適應性。
在中國, 大多數企業的數據都是采用關系型數據庫的方式進行存儲的, 并且存在著格式不統一,存儲不集中等多種弊病。 在企業商務智能系統建設的過程中,無法拋棄以往的數據重新構建,只能對其進行優化處理。 首先將原始數據 ADB 通過應用抽取、清洗、轉換、加載等數據倉庫技術建立企業級的數據倉庫 LDB(基于關系數據庫);然后根據部門或分析主題的要求, 創建部門級和主題級數據集市 RDB(ROLAP);最后在數據集市的基礎上創建多維立方體數據模型進行多維分析和預測(MOLAP)。 常規的分析、匯總等工作只需在數據集市中進行, 而決策分析和支持工作在多維立方體中進行實現。 基于以上分析,在本系統的設計上采用了 HOLAP 的設計方式對數據進行管理,數據庫總體架構如圖 1 所示。
圖1.OLAP總體架構
ROLAP(RDB)的設計一般采用星型模型或雪花模型來表達設計結果。 本文以數據集市中產品庫存變動為例, 分析表明宜采用雪花模型進行設計。 通過包含主題的事實表(存貨異動事實表)和 3個包含事實的維度表(產品維表 comProduct,倉庫維表 comWarehouse,產品記錄維表 comProdrec)來支持各種復雜的查詢和決策分析。 產品維度事實表向外連接了產品類型類別表 comProductClass,產品記錄維度事實表向外連接了產品批號類別表comProdBatch, 類別表是對事實表進行詳細的描述,通過這種方式可以縮小事實表,提高查詢的效率。建立的庫存變動主題雪花模型如圖 2 所示。
圖2.庫存變動主題雪花模型
圖 2 中, 事實表存貨異動與維表 comProduct,comWarehouse,comProdrec 通 過 各 維 表 的 主 鍵(ProdId 產品代碼 、WarehouseId 倉庫代碼 、BillNo表單記錄號、RecNo 產品記錄號、Flag) 建立關聯,維表再通過各自的外鍵與詳細類別表建立關聯,構成雪花模型。 這個模型的基本分析維有 3 個:時間維、產品維和倉庫維;維層次分別為時間維(年,季度,月),產品維(產品類別,產品編號),倉庫維(倉庫編號);分析度量值則定為各種變動數量(入庫數量、在庫數量、出庫數量等)。
以確定的維度為基礎,創建多維立方體。 將事實表中的 BillDate 字段進行提取分析得到時間維數據 (以年季月進行三級分割, 提供三級數據鉆取),以 ClassID 字段為基礎進行下鉆操作,提供產品維數據, 用 WareID 字段來提供倉庫維數據,度量值分別由 BuyInAmount,AdjustAmount 和SaleOutAmount 三個字段值來提供,并根據各維度和度量值創建多維立方體。
3.2 OLAP 多維數據分析
建立好了多維立方體, 就可以對立方體進行多維數據分析。 OLAP 基本的分析操作包括切片、切塊、旋轉、鉆取等。 以度量值為 AdjustAmount 為例組織起來的三維立方體數組表示為(時間、產品類型、倉庫、在庫數量)。切片: 切片操作在給定的數據立方體的一個維上進行選擇,形成一個子方。 例如在倉庫維上選擇一個維成員, 就得到了在倉庫維上的一個關于時間和產品類型的切片; 在產品類型維上選定一個維成員,就得到一個關于時間和倉庫的切片。
切塊: 切塊操作在給定的數據立方體的某一個維上選定某一區間的維成員或在二個維或多個維上分別選取一個區間的維成員形成的一個子方。 例如在倉庫維上選擇維成員“02”,同時在時間維上選擇 2005 年的 4 個季度,就可得到一個數據切塊,如圖 3 所示。
圖3.三維數據切塊
鉆取:鉆取有向上鉆取(上卷 roll-up)和向下鉆取(下鉆 drill-down)操作。 上卷操作就是通過一個維的概念分層向上攀升,在數據立方體上進行聚集;下鉆是上卷的逆操作,通過沿維的概念分層向下從而得到更詳細的數據,鉆取的深度與維所劃分的層次相對應。 以在產品類型維上執行下鉆操作為例,獲得更詳細的信息如圖 4 所示。
圖4.三維數據下鉆
旋轉:旋轉是一種目視操作,通過旋轉可以得到不同視角的數據,提供數據的替代表示。 旋轉包含了交換行和列, 或者把某一行維移動到列維中去,或是把頁面顯示中的一個維和頁面外的維進行交換,令其成為新的行或列中的一個。
通過以上各種操作, 增強了數據的透明度和可讀性, 幫助用戶從不同的角度和深度去理解和分析數據, 方便用戶從大量數據中獲取有用的信息,穿越數據迷霧。
4 結束語
本文對 OLAP 在商務智能系統中進行多維分析所涉及的多維數據結構進行了設計, 并將多維數據分析技術與實例相結合進行了研究和探討。事實表明, 利用商務智能技術能幫助企業深入全面地分析業務數據, 從不同的角度審視業務的經營情況,給企業管理和決策者提供更全面、客觀的信息,有利于提高企業的經營管理水平,使企業信息系統的建設更上一層樓。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:OLAP 技術在 BI 系統中的應用
本文網址:http://www.guhuozai8.cn/html/consultation/10819915934.html