數據倉庫技術的出現為解決企業信息系統中存在的“海量數據”和“信息貧乏”的不利境況提供了一種較好的解決方案。然而隨著信息技術的發展,對數據倉庫的應用提出了更高的要求。傳統的兩層C/S結構已經不能適應日益增長的跨地域、跨平臺的信息分析的需要,暴露出諸多問題,具體表現在以下幾個方面:
1)客戶服務器體系結構的建立和維護成本很高,而且系統的協調性、兼容性不好;
2)單一用戶界面不足以支持眾多用戶的使用;
3) 隨著Internet/Intranet的發展, 越來越多的人希望借助于Internet/Ineranet訪問數據倉庫,獲得必要的信息支持,而傳統的C/S結構無法滿足這一需求;
4)對客戶端的要求高。客戶端需要預裝許多支持軟件,使得系統較依賴于客戶端平臺。因此系統的可移植性、伸縮性不好Internet的廣泛應用使傳統的商務模式發生了巨大轉變,基于Web的數據倉庫技術改變了最終用戶對數據倉庫的使用模式。人們可以不再局限于通過局域網(LAN)使用數據倉庫,而是可以通過Internet/Intranet遠程訪問數據倉庫,所得的分析結果也可以借助Web服務器迅速發布。
1 Web技術特點
Web技術是目前Internet上發展最快也是最重要的信息發布與檢索手段,它提供了一種全球范圍的信息共享方式。通過Web方式可以充分地共享和應用現有的各類信息,Web技術已成為信息技術發展的一種趨勢。交互式動態頁面的實現需要以大量數據資源為基礎,于是出現了Web數據庫技術。Web數據庫技術的主要內容包括超文本傳輸協議(HTTP),超文本標記語言(HTML),以及Web與數據庫的接口技術:通用網關接口CGI方式,服務器API方式等。將Web技術與數據庫技術結合,開發動態的Web應用程序,實現了傳統的數據庫應用程序在Internet領域共享信息的要求,為Internet開辟了廣泛的應用前景。
2 數據倉庫技術特點
數據倉庫本質上是一個建立在數據庫系統之上的數據管理系統,該系統中的數據來自若干分布的、異質的數據源,數據倉庫除了具有數據庫系統的特點之外,還具有如下特點:
1)面向主題且集成的。數據倉庫將相關的問題集中于某一領域進行分析,將與主題有關的因素利用多維表表現出來,而主題是在一個較高層次對數據集成的標準,每一個主題基本對應一個宏觀的分析領域。
2)數據應當是良構的、一致的。由于數據倉庫是將不同異質的、分散的數據集成在一個系統平臺上,所以系統一開始就必須考慮將不同的數據進行一致化和標準化的問題。而為了滿足決策者的需求,對這些數據進行結構上的重組也是必要的。
3)時間性。時間性是數據倉庫的一個顯著特性。數據倉庫中的數據是隨時間變化的,這些數據都是一系列某一時刻所生成數據的快照,每個數據單元都與時間有關。數據倉庫一般都包括對長時間歷史數據的存儲,存儲時間一般為5—10年,用于進行長期的趨勢分析。
3 基于Web的數據倉庫系統結構及其實現
基于Web的數據倉庫系統由表示層、應用層和數據層所組成。這種結構更易于構造基于三層邏輯結構的應用系統。它允許同一層的不同應用交互使用,并且它們可以互相支持相鄰層的相同接口。每一層都對其上一層提供服務,對下一層則作為一個客戶端應用而存在。
1)表示層。即瀏覽器層。在Web頁面中嵌入用戶查詢信息所需的表單(FORM)。一方面,用戶填寫表單后,通過HTTP協議傳送至Web服務器。另一方面,用戶接受從應用層根據用戶需求組成相應形式后傳來的數據。
2)應用層。應用層包括傳統意義上的Web服務器和位于Web服務器與數據倉庫服務器之間的應用服務器。應用服務器一般存放各種應用程序軟件包。主要有:EIS查詢工具,OLAP工具,DM工具,以及用于構建數據倉庫的數據抽取、轉換和集成的工具。
3)數據層。即后臺數據倉庫(DW)。它是一個信息物理存儲層,用于存儲來源于數據庫或其他信息源(如日志文件)的數據。其主要的數據來源于www站點的半結構化數據。這些數據根據各自的主題區域被分布到不同的物理存儲空間。數據層處理來自應用層的SQL語句,完成相應的信息查詢,并把查詢結果反饋給應用層。
表示層,應用層和數據層三者相互協作,每一層既作為上一層的服務端,同時又作為下一層的客戶端,共同完成分布在不同地域,不同平臺的用戶對異地數據倉庫的信息訪問。
4 結論
基于Web的數據倉庫系統較好地解決了C/S結構對數據倉庫使用的局限性,擴展了數據倉庫的應用范圍。使終端用戶通過瀏覽器可以高效、方便地訪問數據倉庫。信息訪問者不必安裝另外的客戶軟件(僅需Web瀏覽器),具有良好的跨平臺能力;為在www環境下信息的收集、存儲以及數據倉庫的訪問提供了一條便捷的途徑,可以極大地提高人們使用和查詢數據倉庫的效率,有助于信息資源的更好利用;具有統一的接口,同一類的頁面,數據處理相對獨立和透明。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:基于Web的數據倉庫的探討