隨著不同的管理信息系統(MIS與ERP)在企業不同部門的大規模應用及企業對數據管理不斷提出新的要求,不僅要求能實現傳統的聯機事務處理,而且越來越多的要求是各種應用系統能夠在企業不斷積累的以及從企業外部獲取的豐富信息資源的基礎上,把這些分散的、不一致的、凌亂的信息資源加以利用,即更多地參與數據分析和決策支持,由此出現了一種用于數據分析處理和決策支持的數據存儲和組織技術,即數據倉庫技術。
1、什么是數據倉庫
數據倉庫是面向主題的、集成的、具有時間特征的、穩定的數據集合,用以支持經營管理中的決策制定過程。數據倉庫提供用戶用于決策支持的當前和歷史數據,這些數據在傳統的操作型數據庫中很難或不能得到。
面向主題是指數據倉庫中的數據是按照一定的主題域進行組織。主題是一個抽象的概念,是指用戶使用數據倉庫進行決策時所關心的重點方面,一個主題通常與多個操作型信息系統相關。集成的是指數據倉庫中的數據是在對原有分散的數據庫數據抽取、清理的基礎上經過系統加工、匯總和整理得到的,必須消除源數據中的不一致性,以保證數據倉庫內的信息是關于整個企業的一致的全局信息。
數據倉庫的體系結構分數據源、數據轉換、數據倉庫、數據集市和用戶幾部分。數據源,包括企業內部的業務數據、遺留數據、其它業務系統數據及相關WEB 數據等;數據轉換是數據倉庫構建的重要環節,主要是對各種復雜的數據源進行抽取、轉換、裝載及其他處理,同時要實現數據質量跟蹤監控以及元數據抽取與創建等工作;數據倉庫主要實現對各種數據的組織、存儲及管理等;數據集市是為不同業務而單獨設計的數據倉庫系統,即開發者為企業內部的不同用戶群定制特殊的數據倉庫子系統。用戶部分,即具體面向使用者的應用部分,主要是指數據倉庫存取與檢索為用戶提供了訪問數據倉庫或數據集市的功能,其中分析與報告為用戶使用數據倉庫提供了一組工具,用于幫助用戶對數據倉庫或數據集市進行聯機分析或數據挖掘等。
2、數據倉庫構建方法
2.1 普通數據倉庫構建方法。對于普通數據倉庫的構建,企業在對整個系統的建設綜合各種因素的基礎上,將整個項目的實施分階段、分步驟實施,可以在每一階段建設的基礎上分階段納入不同的業務系統,逐步建立起一個綜合的、專題較為完善的、適合部門、子單位使用的完整的數據倉庫系統,從而才能使投資盡快獲得收益。
在數據倉庫的構建過程中,利用模糊數學可實現數據倉庫內數據的語義表示,豐富數據加工的手段,提高分析處理的能力。數據倉庫的構建,一般采取先構建數據集市,最后將各個數據集市整合在一起形成數據倉庫的漸進模式;通過概念層、邏輯層、物理層建模,確定相關主題域的數據集市并對其進行聯機分析處理。構建數據倉庫模型一般采用以下幾種:
2.1.1 星型模型:星型模型是最常用的數據倉庫設計結構的實現模式。使數據倉庫形成了一個集成系統,為用戶提供分析服務對象。該模型的核心是事實表,圍繞事實表的是維度表。通過事實表將各種不同的維度表連接起來,各個維度表都連接到中央事實表。
2.1.2 星系模型(也稱雪花模型):雪花模型對星型模型的維度表進一步標準化,對星型模型中的維度表進行了規范化處理。同時也是對星型模型的擴展,每一個維度都可以向外連接到多個詳細類別表。在實際應用中,用戶的需求多種多樣,數據來源可能為多個事實表,故可采用多個事實表共存,之間通過公用的維表相關聯的星系模型,也稱為事實星座。
2.1.3 原子級數據模型和匯總級數據模型并存:堅持原子級數據模型和匯總級數據模型并存,而且要盡可能地細化原子級數據。
2.1.4 設立代理鍵:代理鍵是維表中一些沒有業務含義的字段,只是一個由數據倉庫加載程序時建立的數字。
2.2 空間數據倉庫構建方法。隨著GIS(地理信息系統)在各行業的廣泛應用,最初面向事務處理為主的空間數據庫信息系統已不能滿足需要,信息系統開始從管理轉向決策處理,空間數據倉庫就是為滿足這種新的需求而提出的空間信息集成系統。尤其是地理信息決策支持系統中,空間數據倉庫系統顯得尤為重要。
空間數據倉庫具有普通數據倉庫的普遍特征,但其本身有一些特殊性。并且空間數據倉也并不是空間數據庫的簡單集合。與空間數據庫比,空間數據倉除支持數據庫外,還支持數據文件、文本文件、應用程序等眾多數據源;另外空間數據倉庫中的數據有時間數據、空間數據、屬性數據及異構數據等多種數據;其次空間數據倉庫中還包括了數據處理規則、算法等;再次空間數據倉庫的數據是對原始數據進行加工、處理、集成等轉換,是對數據的增值和統一;空間數據庫還引入了時間縱的概念,它是以時間為基準來管理數據,可以截取不同時間尺度上的信息,從瞬態到區段時間直到全體,空間數據倉庫是依賴于時間維的數據結構,它可以根據不同的需要劃分不同的時間粒度等級,以便進行各種復雜的趨勢分析。當然,不言而喻,它還包含了空間維的方位數據。正因為空間數據倉庫與普通數據倉庫的不同,并且它以空間數據倉庫完全不是相同的概念,一般空間數據倉庫以如下體系結構分為四大功能模塊,分別是源數據、數據變換工具、空間數據倉庫、客戶端分析工具。源數據它不僅指那些常見的空間數據庫,還包括文件、網頁、知識庫、遺留系統等各種數據源。數據變換工具與具有普通數據倉庫數據變換相同的提取轉換功能,但它還包括了特有的空間變換等?臻g數據倉庫以立體、多維的方式來組織和顯示數據。但最基本的空間維和時間維是其反映客觀世界動態變化的基礎,空間數據倉庫技術最關鍵要點也就是時間維和空間維數據組織方式。目前空間數據倉庫已成為國、內外GIS(地理信息系統)研究的熱點并取得了較大進展。要把空間信息融合進企業現有的數據倉庫中,在原有系統不作較大改動的前提下,一般采用三種模式構建企業空間數據倉庫:(1)把空間信息作為多維模型中的空間維引入;(2)把空間信息作為研究主題引入;(3)在維和度量中都包含空間信息。因此,計算并存儲所有空間度量是不現實的。一般使用空間索引樹(如R-tree)在最細空間粒度上構建分組層次,作為空間維的分層,每個空間維需要建立一棵空間索引樹。
3、結束語
總之,數據倉庫構建是數據倉庫技術的關鍵,ERP系統數據倉庫技術是一項基于數據管理和利用的綜合性技術和解決方案,尤其是現在空間數據倉庫在GIS 中的廣泛應用,它成為數據庫市場的新一輪增長點,同時也成為下一代信息系統的重要組成部分。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:ERP系統數據倉庫構建技術