基于DW的DSS的構建
基于該企業現有內部網(Intranet),針對一般企業用戶范圍廣、流動性大和面對市場需求分析工作量大的特點,基于數據倉庫的決策支持系統框架結構模型如圖1所示。
圖 1:基于DW的DSS系統框架結構圖
本系統應用模型是瀏覽器/服務器(B/S) 3 層結構形式,即客戶端、應用服務器和數據源服務器。
(1)數據倉庫的采集單元(pump)負責定期的通過企業內部網通信干線分布在網絡各站點上的有關數據庫收集最新的數據,并完成數據的凈化與變換。考慮到 DW 中數據對象較為復雜且數量巨大,決策支持系統其他單元對 DW 的訪問是通過 OLAP 服務器來完成的。使用 OLAP 服務器的目的是為了得到完善的多維數據管理,并提供簡便快速且性能有保證的多維數據查詢和分析,大大地降低了系統的數據傳輸量,提高了數據挖掘和決策分析效率。
(2)知識庫中的知識除了在系統建立之初輸入之外,還由系統的數據挖掘單元不斷地進行補充, 與傳統的 DSS 體系結構不同。在數據挖掘單元中,盡量使用已有的一些數據挖掘軟件工具,如SAS,IBM Intelligent Mines等。
(3)在中間層設置 Web 服務器和知識服務器。用戶通過 HTTP 協議訪問Web服務器上的HTML 格式的頁面,而Web服務器則根據頁面設置與用戶要求向知識服務器提出決策需求。知識服務器是處理用戶決策需求的綜合服務單元,它根據用戶需求向知識庫和數據庫要求相應的知識和數據,經處理后以Web頁面的形式提供給用戶。
(4)在客戶端,用戶通過 Web 瀏覽器訪問Intranet上的Web服務器來進行決策咨詢。本系統的用戶可分為兩類:一類是一般人員,他們只需要了解一下企業總體情況以及決策支持系統對具體的一般性建議,服務器上的靜態 Web 頁面就可以滿足他們要求。另一類是企業高層管理決策人員,他們除需了解各部門情況與相關統計以外。
數據倉庫的設計
數據倉庫與數據庫雖然過程都要經歷概念模型、邏輯模型和物理模型3個設計階段,但在各個設計階段所采取的方法卻截然不同。根據上述系統數據倉庫采用面向主題,即面向對象自上而下的設計方法。下面分別介紹3個模型設計階段采用的建模技術。
1 概念模型的設計
超立方體(Hypercube)可用超出三維的表示來描述一個對象(對象可以是客戶、產品、營銷策略等),它完全可以滿足 DW 的多維特性。使用自上而下的方法設計一個超立方體的步驟如下:
(1)確定模型中需要抓住的關鍵過程。
(2)確定需要捕獲的值。
(3)確定數據的粒度,即需要獲取最低一級的詳細信息。
當維數超過三維后,超立方體在表現上缺乏直觀性,因此我們采用一種稱為信息包圖(Information packed picture)的方法在平面上展開超立方體。使用信息包圖設計概念模型的具體步驟如下: 1確定指標:指標是訪問DW的關鍵所在,是用戶最關心的信息。它是表示在維度空間衡量商務信息的一種方法。2確定維度:維度提供了用戶訪問DW的信息途徑,對應超立方體的每一面,位于信息包圖的第一行的每個欄目中。3確定類別:類別是在一個維度內為了提供詳細的分類而定義的,而其中的成員又是為了辨別和區分特別數據而設的,它表示一個維度包含的詳細信息。一個維度內最低層的可用分類可以又稱為詳細類別。
2 DW邏輯模型的設計
根據 DW主要提供的是查詢操作,選擇星型圖作為其邏輯模型,從 DW 的概念模型(信息包圖模型)轉換成 DW 的邏輯模型(星型圖模型)的過程,可以分為以下幾個步驟:
(1) 指標實體:指標實體位于星型圖的中心,是用戶最關心的基本實體和查詢活動的中心,為用戶的商務活動提供定量數據。每一個指標實體代表一系列相關事實,完成一項指定的功能,在一般情況下代表一個現實事物的綜合水平,僅僅與每個相關維度的一個點對應。
(2) 定義維度實體。一個維度實體對應指標實體中的多個指標,用戶使用維度實體來訪問指標實體,其實質是對應著邏輯數據實體。一個維度實體對應信息包圖中的一個列。
(3) 定義詳細類別實體。一個詳細類別的實體與現實世界的某一個實體相對應。
(4) 定義邏輯模型。定義邏輯模型的最后一步是將星型模型轉換成雪花模型。限于篇幅,轉換過程與圖示從略。
3 DW物理模型的設計
根據星型模型或雪花模型,就可以方便地定義出DW的物理數據結構。一般將指標實體和詳細類別實體轉變為一個具體的物理數據庫表,稱為事實表。維度實體通常也轉化為數據庫表,稱為維表,它包括其每一層次的主碼和對應的值。維表和事實表通過維關鍵字相關聯。在物理模型設計階段,需要確定以下的內容:
(1)規定數據質量指標,規范數據倉庫中的各種數據。
(2)定義實體、實體特征以及實體所具有的一切屬性。
(3)定義規模,確定數據容量和更新頻率。為了獲得物理模型設計階段完整的文檔資料,可利用自動定義軟件工具進行數據管理。
基于數據倉庫的醫院決策支持系統
1 醫院決策支持系統的體系結構
基于數據倉庫的醫院決策支持系統體系結構如圖2:
圖2:基于數據倉庫的醫院決策支持系統體系結構圖
(1)底層為數據獲取層,數據源主要包括患者信息、 藥品信息、門診信息、住院信息以及一些外部數據。外部數據主要包括競爭數據及國家的相關政策法規等,其它信息來自醫院信息系統 HIS。為保持數據一致性,必須對數據源中的數據進行清理、抽取、轉換,生成綜合性統一的數據類型存入醫院DW。
(2)數據存儲層主要用來存儲和管理加工處理后的面向決策主題的綜合性數據,并按決策主題的需求進行重新組織 ,為決策支持提供大量的數據依據。
(3)數據處理層包括模型庫、數據挖掘、OLAP 及其相應的管理系統部分。通過 OLAP 與 DM 從DW中得出有用的信息和知識。
(4)數據訪問層為決策者提供與系統交互的入口。把數據處理層得到的信息和知識通過人機交互界面展現給用戶 ,主要包括用戶交互、格式化查詢及報表和統計圖的生成等。
2 醫院決策支持系統的數據倉庫設計
(1)數據建模
在設計DW之前 ,必須先確定主題。主題是一個在較高層次將數據歸類的標準 ,它能反映出分析對象所涉及的各項數據以及相互聯系。經過對醫院業務的仔細分析 ,我們確定了三個基本主題:患者主題、 藥品主題、 費用主題,其中每個主題又可以劃分為若干個子主題。根據不同的分析主題確定描述各個主題中可用于分析與決策支持的相應指標 ,即多維數據模型的事實表 ,并根據各個指標的約束因素 ,確定多維數據模型的各個維。以 “門診費用” 主題為例 ,它含有時間維、 科室維、 疾病維、 費用類別維四個維 ,形成了 “門診費用” 分析的不同角度(某段時間、 某個科室、 某種疾病和某類收費) 。事實表由這四個維的主鍵和一個度量值即 “門診應付費用總計” 組成。一個事實表與四個維表聯系起來構成了一個四維分析空間。醫院決策支持系統的數據倉庫的邏輯模型采用星型模型 ,每個子主題對應一個星型模型結構。星型模型由一個事實表和多個維表構成。
(2)數據集成
確定了DW的數據模型之后 ,下一步就是把源數據集成到DW 中 ,具體的分為數據抽取、 數據清理、 數據轉換和數據加載這四個步驟。其中數據抽取主要是通過網絡把從 HIS中提取出的數據傳輸到系統 DW 中。要完成以上工作 ,需利用 Microsoft SQL Server 2000 的數據轉換服務 DTS 包組件 ,在包中指定源數據與目標數據間的映射關系 ,把數據轉換和導入導出過程保存在存儲過程中 ,讓服務器自動、 定期的執行。
總結與展望
現在很多企業己經開始建立數據倉庫系統。但是,數據倉庫建設的問題出現在兩頭,即:一方面是數據,國內數據庫系統中數據積累還不夠,作為數據倉庫系統沒有數據積累是沒有意義的。另一方面是工具,無論是OLAP還是數據挖掘,都不太好用,不夠大眾化,另外由于建設數據倉庫的費用巨大,相當數量的企業無法承受。如何研制一整套適合我國企事業單位的數據倉庫整體解決方案,使企事業單位投入一定的經費,就有一定的收益,即邊投入邊產出,這是一個值得考慮的問題。
對于網絡蓬勃發展的今天,如何將數據挖掘的思想引入網絡信息處理領域,在WWW上進行信息挖掘,這是極具誘惑和挑戰的領域,是對互聯網上信息再分析和利用的巨大貢獻。在Internet上建立DM和KDD服務器,與數據庫服務器配合,實現數據挖掘,加強對各種非結構化數據的挖掘,如文本數據、圖形圖像數據、多媒體數據,這些都能更好的為決策者提供技術支持。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:基于DW的決策支持系統
本文網址:http://www.guhuozai8.cn/html/consultation/10820611141.html