數據倉庫:數據倉庫是一個支持管理決策的數據集合。數據是面向主題的、集成的、不易丟失的并且是時間變量。數據倉庫是所有操作環境和外部數據源的快照集合。它并不需要非常精確,因為它必須在特定的時間基礎上從操作環境中提取出來。
數據集市:數據倉庫只限于單個主題的區域,例如顧客、部門、地點等。數據集市在從數據倉庫獲取數據時可以依賴于數據倉庫,或者當它們從操作系統中獲取數據時就不依賴于數據倉庫。
事實:事實是數據倉庫中的信息單元,也是多維空間中的一個單元,受分析單元的限制。事實存儲于一張表中(當使用關系數據庫時)或者是多維數據庫中的一個單元。每個事實包括關于事實(銷售額,銷售量,成本,毛利,毛利率等)的基本信息,并且與維度相關。在某些情況下,當所有的必要信息都存儲于維度中時,單純的事實出現就是對于數據倉庫足夠的信息。我們稍后討論有關缺無事實的情況。
維度:維度是用來反映業務的一類屬性,這類屬性的集合構成一個維度。例如,某個地理維度可能包括國家、地區、省以及城市的級別。一個時間維度可能包括年、季、月、周、日的級別。
級別:維度層次結構的一個元素。級別描述了數據的層次結構,從數據的最高(匯總程度最大)級別直到最低(最詳細)級別(如大分類-中分類-小分類-細分類)。級別僅存在于維度內。級別基于維度表中的列或維度中的成員屬性。
數據清洗:對數據倉庫系統無用的或者不符合數據格式規范的數據稱之為臟數據。清洗的過程就是清除臟數據的過程。
數據采集:數據倉庫系統中后端處理的一部分。數據采集過程是指從業務系統中收集與數據倉庫各指標有關的數據。
數據轉換:解釋業務數據并修改其內容,使之符合數據倉庫數據格式規范,并放入數據倉庫的數據存儲介質中。數據轉換包括數據存儲格式的轉換以及數據表示符的轉換(如產品代碼到產品名稱的轉換)。
聯機分析處理(OLAP Online Analytical Processing ):OLAP是一種多維分析技術,用來滿足決策用戶在大量的業務數據中,從多角度探索業務活動的規律性、市場的運作趨勢的分析需求,并輔助他們進行戰略發展決策的制定。按照數據的存儲方式分OLAP又分為ROLAP、MOLAP和HOLAP。在客戶信息數據倉庫CCDW的數據環境下,OLAP提供上鉆、下鉆、切片、旋轉等在線分析機制。完成的功能包括多角度實時查詢、簡單的數據分析,并輔之于各種圖形展示分析結果。
數據挖掘:在數據倉庫的數據中發現新信息的過程被稱為數據挖掘,這些新信息不會從操作系統中獲得。
切片:一種用來在數據倉庫中將一個維度中的分析空間限制為數據子集的技術。
切塊:一種用來在數據倉庫中將多個維度中的分析空間限制為數據子集的技術。
星型模式:是數據倉庫應用程序的最佳設計模式。它的命名是因其在物理上表現為中心實體,典型內容包括指標數據、輻射數據,通常是有助于瀏覽和聚集指標數據的維度。星形圖模型得到的結果常常是查詢式數據結構,能夠為快速響應用戶的查詢要求提供最優的數據結構。星形圖還常常產生一種包含維度數據和指標數據的兩層模型。
雪花模式:指一種擴展的星形圖。星形圖通常生成一個兩層結構,即只有維度和指標,雪花圖生成了附加層。實際數據倉庫系統建設過程中,通常只擴展三層:維度(維度實體)、指標(指標實體)和相關的描述數據(類目細節實體)超過三層的雪花圖模型在數據倉庫系統中應該避免。因為它們開始像更傾向于支持OLTP 應用程序的規格化結構,而不是為數據倉庫和OLAP應用程序而優化的非格式化結構。
粒度:粒度將直接決定所構建倉庫系統能夠提供決策支持的細節級別。粒度越高表示倉庫中的數據較粗,反之,較細。粒度是與具體指標相關的,具體表現在描述此指標的某些可分層次維的維值上。例如,時間維度,時間可以分成年、季、月、周、日等。數據倉庫模型中所存儲的數據的粒度將對信息系統的多方面產生影響。事實表中以各種維度的什么層次作為最細粒度,將決定存儲的數據能否滿足信息分析的功能需求,而粒度的層次劃分、以及聚合表中粒度的選擇將直接影響查詢的響應時間。
度量值:在多維數據集中,度量值是一組值,這些值基于多維數據集的事實數據表中的一 列,而且通常為數字。此外,度量值是所分析的多維數據集的中心值。即,度量值是最終用戶瀏覽多維數據集時重點查看的數字數據(如銷售、毛利、成本)。所選擇的度量值取決于最終用戶所請求的信息類型。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:數據倉庫術語說明