基于DW的DSS的構(gòu)建
基于該企業(yè)現(xiàn)有內(nèi)部網(wǎng)(Intranet),針對(duì)一般企業(yè)用戶(hù)范圍廣、流動(dòng)性大和面對(duì)市場(chǎng)需求分析工作量大的特點(diǎn),基于數(shù)據(jù)倉(cāng)庫(kù)的決策支持系統(tǒng)框架結(jié)構(gòu)模型如圖1所示。
圖 1:基于DW的DSS系統(tǒng)框架結(jié)構(gòu)圖
本系統(tǒng)應(yīng)用模型是瀏覽器/服務(wù)器(B/S) 3 層結(jié)構(gòu)形式,即客戶(hù)端、應(yīng)用服務(wù)器和數(shù)據(jù)源服務(wù)器。
(1)數(shù)據(jù)倉(cāng)庫(kù)的采集單元(pump)負(fù)責(zé)定期的通過(guò)企業(yè)內(nèi)部網(wǎng)通信干線分布在網(wǎng)絡(luò)各站點(diǎn)上的有關(guān)數(shù)據(jù)庫(kù)收集最新的數(shù)據(jù),并完成數(shù)據(jù)的凈化與變換。考慮到 DW 中數(shù)據(jù)對(duì)象較為復(fù)雜且數(shù)量巨大,決策支持系統(tǒng)其他單元對(duì) DW 的訪問(wèn)是通過(guò) OLAP 服務(wù)器來(lái)完成的。使用 OLAP 服務(wù)器的目的是為了得到完善的多維數(shù)據(jù)管理,并提供簡(jiǎn)便快速且性能有保證的多維數(shù)據(jù)查詢(xún)和分析,大大地降低了系統(tǒng)的數(shù)據(jù)傳輸量,提高了數(shù)據(jù)挖掘和決策分析效率。
(2)知識(shí)庫(kù)中的知識(shí)除了在系統(tǒng)建立之初輸入之外,還由系統(tǒng)的數(shù)據(jù)挖掘單元不斷地進(jìn)行補(bǔ)充, 與傳統(tǒng)的 DSS 體系結(jié)構(gòu)不同。在數(shù)據(jù)挖掘單元中,盡量使用已有的一些數(shù)據(jù)挖掘軟件工具,如SAS,IBM Intelligent Mines等。
(3)在中間層設(shè)置 Web 服務(wù)器和知識(shí)服務(wù)器。用戶(hù)通過(guò) HTTP 協(xié)議訪問(wèn)Web服務(wù)器上的HTML 格式的頁(yè)面,而Web服務(wù)器則根據(jù)頁(yè)面設(shè)置與用戶(hù)要求向知識(shí)服務(wù)器提出決策需求。知識(shí)服務(wù)器是處理用戶(hù)決策需求的綜合服務(wù)單元,它根據(jù)用戶(hù)需求向知識(shí)庫(kù)和數(shù)據(jù)庫(kù)要求相應(yīng)的知識(shí)和數(shù)據(jù),經(jīng)處理后以Web頁(yè)面的形式提供給用戶(hù)。
(4)在客戶(hù)端,用戶(hù)通過(guò) Web 瀏覽器訪問(wèn)Intranet上的Web服務(wù)器來(lái)進(jìn)行決策咨詢(xún)。本系統(tǒng)的用戶(hù)可分為兩類(lèi):一類(lèi)是一般人員,他們只需要了解一下企業(yè)總體情況以及決策支持系統(tǒng)對(duì)具體的一般性建議,服務(wù)器上的靜態(tài) Web 頁(yè)面就可以滿(mǎn)足他們要求。另一類(lèi)是企業(yè)高層管理決策人員,他們除需了解各部門(mén)情況與相關(guān)統(tǒng)計(jì)以外。
數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)庫(kù)雖然過(guò)程都要經(jīng)歷概念模型、邏輯模型和物理模型3個(gè)設(shè)計(jì)階段,但在各個(gè)設(shè)計(jì)階段所采取的方法卻截然不同。根據(jù)上述系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)采用面向主題,即面向?qū)ο笞陨隙碌脑O(shè)計(jì)方法。下面分別介紹3個(gè)模型設(shè)計(jì)階段采用的建模技術(shù)。
1 概念模型的設(shè)計(jì)
超立方體(Hypercube)可用超出三維的表示來(lái)描述一個(gè)對(duì)象(對(duì)象可以是客戶(hù)、產(chǎn)品、營(yíng)銷(xiāo)策略等),它完全可以滿(mǎn)足 DW 的多維特性。使用自上而下的方法設(shè)計(jì)一個(gè)超立方體的步驟如下:
(1)確定模型中需要抓住的關(guān)鍵過(guò)程。
(2)確定需要捕獲的值。
(3)確定數(shù)據(jù)的粒度,即需要獲取最低一級(jí)的詳細(xì)信息。
當(dāng)維數(shù)超過(guò)三維后,超立方體在表現(xiàn)上缺乏直觀性,因此我們采用一種稱(chēng)為信息包圖(Information packed picture)的方法在平面上展開(kāi)超立方體。使用信息包圖設(shè)計(jì)概念模型的具體步驟如下: 1確定指標(biāo):指標(biāo)是訪問(wèn)DW的關(guān)鍵所在,是用戶(hù)最關(guān)心的信息。它是表示在維度空間衡量商務(wù)信息的一種方法。2確定維度:維度提供了用戶(hù)訪問(wèn)DW的信息途徑,對(duì)應(yīng)超立方體的每一面,位于信息包圖的第一行的每個(gè)欄目中。3確定類(lèi)別:類(lèi)別是在一個(gè)維度內(nèi)為了提供詳細(xì)的分類(lèi)而定義的,而其中的成員又是為了辨別和區(qū)分特別數(shù)據(jù)而設(shè)的,它表示一個(gè)維度包含的詳細(xì)信息。一個(gè)維度內(nèi)最低層的可用分類(lèi)可以又稱(chēng)為詳細(xì)類(lèi)別。
2 DW邏輯模型的設(shè)計(jì)
根據(jù) DW主要提供的是查詢(xún)操作,選擇星型圖作為其邏輯模型,從 DW 的概念模型(信息包圖模型)轉(zhuǎn)換成 DW 的邏輯模型(星型圖模型)的過(guò)程,可以分為以下幾個(gè)步驟:
(1) 指標(biāo)實(shí)體:指標(biāo)實(shí)體位于星型圖的中心,是用戶(hù)最關(guān)心的基本實(shí)體和查詢(xún)活動(dòng)的中心,為用戶(hù)的商務(wù)活動(dòng)提供定量數(shù)據(jù)。每一個(gè)指標(biāo)實(shí)體代表一系列相關(guān)事實(shí),完成一項(xiàng)指定的功能,在一般情況下代表一個(gè)現(xiàn)實(shí)事物的綜合水平,僅僅與每個(gè)相關(guān)維度的一個(gè)點(diǎn)對(duì)應(yīng)。
(2) 定義維度實(shí)體。一個(gè)維度實(shí)體對(duì)應(yīng)指標(biāo)實(shí)體中的多個(gè)指標(biāo),用戶(hù)使用維度實(shí)體來(lái)訪問(wèn)指標(biāo)實(shí)體,其實(shí)質(zhì)是對(duì)應(yīng)著邏輯數(shù)據(jù)實(shí)體。一個(gè)維度實(shí)體對(duì)應(yīng)信息包圖中的一個(gè)列。
(3) 定義詳細(xì)類(lèi)別實(shí)體。一個(gè)詳細(xì)類(lèi)別的實(shí)體與現(xiàn)實(shí)世界的某一個(gè)實(shí)體相對(duì)應(yīng)。
(4) 定義邏輯模型。定義邏輯模型的最后一步是將星型模型轉(zhuǎn)換成雪花模型。限于篇幅,轉(zhuǎn)換過(guò)程與圖示從略。
3 DW物理模型的設(shè)計(jì)
根據(jù)星型模型或雪花模型,就可以方便地定義出DW的物理數(shù)據(jù)結(jié)構(gòu)。一般將指標(biāo)實(shí)體和詳細(xì)類(lèi)別實(shí)體轉(zhuǎn)變?yōu)橐粋(gè)具體的物理數(shù)據(jù)庫(kù)表,稱(chēng)為事實(shí)表。維度實(shí)體通常也轉(zhuǎn)化為數(shù)據(jù)庫(kù)表,稱(chēng)為維表,它包括其每一層次的主碼和對(duì)應(yīng)的值。維表和事實(shí)表通過(guò)維關(guān)鍵字相關(guān)聯(lián)。在物理模型設(shè)計(jì)階段,需要確定以下的內(nèi)容:
(1)規(guī)定數(shù)據(jù)質(zhì)量指標(biāo),規(guī)范數(shù)據(jù)倉(cāng)庫(kù)中的各種數(shù)據(jù)。
(2)定義實(shí)體、實(shí)體特征以及實(shí)體所具有的一切屬性。
(3)定義規(guī)模,確定數(shù)據(jù)容量和更新頻率。為了獲得物理模型設(shè)計(jì)階段完整的文檔資料,可利用自動(dòng)定義軟件工具進(jìn)行數(shù)據(jù)管理。
基于數(shù)據(jù)倉(cāng)庫(kù)的醫(yī)院決策支持系統(tǒng)
1 醫(yī)院決策支持系統(tǒng)的體系結(jié)構(gòu)
基于數(shù)據(jù)倉(cāng)庫(kù)的醫(yī)院決策支持系統(tǒng)體系結(jié)構(gòu)如圖2:
圖2:基于數(shù)據(jù)倉(cāng)庫(kù)的醫(yī)院決策支持系統(tǒng)體系結(jié)構(gòu)圖
(1)底層為數(shù)據(jù)獲取層,數(shù)據(jù)源主要包括患者信息、 藥品信息、門(mén)診信息、住院信息以及一些外部數(shù)據(jù)。外部數(shù)據(jù)主要包括競(jìng)爭(zhēng)數(shù)據(jù)及國(guó)家的相關(guān)政策法規(guī)等,其它信息來(lái)自醫(yī)院信息系統(tǒng) HIS。為保持?jǐn)?shù)據(jù)一致性,必須對(duì)數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行清理、抽取、轉(zhuǎn)換,生成綜合性統(tǒng)一的數(shù)據(jù)類(lèi)型存入醫(yī)院DW。
(2)數(shù)據(jù)存儲(chǔ)層主要用來(lái)存儲(chǔ)和管理加工處理后的面向決策主題的綜合性數(shù)據(jù),并按決策主題的需求進(jìn)行重新組織 ,為決策支持提供大量的數(shù)據(jù)依據(jù)。
(3)數(shù)據(jù)處理層包括模型庫(kù)、數(shù)據(jù)挖掘、OLAP 及其相應(yīng)的管理系統(tǒng)部分。通過(guò) OLAP 與 DM 從DW中得出有用的信息和知識(shí)。
(4)數(shù)據(jù)訪問(wèn)層為決策者提供與系統(tǒng)交互的入口。把數(shù)據(jù)處理層得到的信息和知識(shí)通過(guò)人機(jī)交互界面展現(xiàn)給用戶(hù) ,主要包括用戶(hù)交互、格式化查詢(xún)及報(bào)表和統(tǒng)計(jì)圖的生成等。
2 醫(yī)院決策支持系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)
(1)數(shù)據(jù)建模
在設(shè)計(jì)DW之前 ,必須先確定主題。主題是一個(gè)在較高層次將數(shù)據(jù)歸類(lèi)的標(biāo)準(zhǔn) ,它能反映出分析對(duì)象所涉及的各項(xiàng)數(shù)據(jù)以及相互聯(lián)系。經(jīng)過(guò)對(duì)醫(yī)院業(yè)務(wù)的仔細(xì)分析 ,我們確定了三個(gè)基本主題:患者主題、 藥品主題、 費(fèi)用主題,其中每個(gè)主題又可以劃分為若干個(gè)子主題。根據(jù)不同的分析主題確定描述各個(gè)主題中可用于分析與決策支持的相應(yīng)指標(biāo) ,即多維數(shù)據(jù)模型的事實(shí)表 ,并根據(jù)各個(gè)指標(biāo)的約束因素 ,確定多維數(shù)據(jù)模型的各個(gè)維。以 “門(mén)診費(fèi)用” 主題為例 ,它含有時(shí)間維、 科室維、 疾病維、 費(fèi)用類(lèi)別維四個(gè)維 ,形成了 “門(mén)診費(fèi)用” 分析的不同角度(某段時(shí)間、 某個(gè)科室、 某種疾病和某類(lèi)收費(fèi)) 。事實(shí)表由這四個(gè)維的主鍵和一個(gè)度量值即 “門(mén)診應(yīng)付費(fèi)用總計(jì)” 組成。一個(gè)事實(shí)表與四個(gè)維表聯(lián)系起來(lái)構(gòu)成了一個(gè)四維分析空間。醫(yī)院決策支持系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型采用星型模型 ,每個(gè)子主題對(duì)應(yīng)一個(gè)星型模型結(jié)構(gòu)。星型模型由一個(gè)事實(shí)表和多個(gè)維表構(gòu)成。
(2)數(shù)據(jù)集成
確定了DW的數(shù)據(jù)模型之后 ,下一步就是把源數(shù)據(jù)集成到DW 中 ,具體的分為數(shù)據(jù)抽取、 數(shù)據(jù)清理、 數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)加載這四個(gè)步驟。其中數(shù)據(jù)抽取主要是通過(guò)網(wǎng)絡(luò)把從 HIS中提取出的數(shù)據(jù)傳輸?shù)较到y(tǒng) DW 中。要完成以上工作 ,需利用 Microsoft SQL Server 2000 的數(shù)據(jù)轉(zhuǎn)換服務(wù) DTS 包組件 ,在包中指定源數(shù)據(jù)與目標(biāo)數(shù)據(jù)間的映射關(guān)系 ,把數(shù)據(jù)轉(zhuǎn)換和導(dǎo)入導(dǎo)出過(guò)程保存在存儲(chǔ)過(guò)程中 ,讓服務(wù)器自動(dòng)、 定期的執(zhí)行。
總結(jié)與展望
現(xiàn)在很多企業(yè)己經(jīng)開(kāi)始建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。但是,數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的問(wèn)題出現(xiàn)在兩頭,即:一方面是數(shù)據(jù),國(guó)內(nèi)數(shù)據(jù)庫(kù)系統(tǒng)中數(shù)據(jù)積累還不夠,作為數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)沒(méi)有數(shù)據(jù)積累是沒(méi)有意義的。另一方面是工具,無(wú)論是OLAP還是數(shù)據(jù)挖掘,都不太好用,不夠大眾化,另外由于建設(shè)數(shù)據(jù)倉(cāng)庫(kù)的費(fèi)用巨大,相當(dāng)數(shù)量的企業(yè)無(wú)法承受。如何研制一整套適合我國(guó)企事業(yè)單位的數(shù)據(jù)倉(cāng)庫(kù)整體解決方案,使企事業(yè)單位投入一定的經(jīng)費(fèi),就有一定的收益,即邊投入邊產(chǎn)出,這是一個(gè)值得考慮的問(wèn)題。
對(duì)于網(wǎng)絡(luò)蓬勃發(fā)展的今天,如何將數(shù)據(jù)挖掘的思想引入網(wǎng)絡(luò)信息處理領(lǐng)域,在WWW上進(jìn)行信息挖掘,這是極具誘惑和挑戰(zhàn)的領(lǐng)域,是對(duì)互聯(lián)網(wǎng)上信息再分析和利用的巨大貢獻(xiàn)。在Internet上建立DM和KDD服務(wù)器,與數(shù)據(jù)庫(kù)服務(wù)器配合,實(shí)現(xiàn)數(shù)據(jù)挖掘,加強(qiáng)對(duì)各種非結(jié)構(gòu)化數(shù)據(jù)的挖掘,如文本數(shù)據(jù)、圖形圖像數(shù)據(jù)、多媒體數(shù)據(jù),這些都能更好的為決策者提供技術(shù)支持。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:基于DW的決策支持系統(tǒng)
本文網(wǎng)址:http://www.guhuozai8.cn/html/consultation/10820611141.html