| 當前位置：拓步ERP資訊網 >>管理咨詢 >>CIO技術專欄 >>CIO云計算

如何進行分布式大數據應用調優

發布日期：2014-03-17 8:10:36 來源：www.guhuozai8.cn 編輯：拓步ERP資訊網瀏覽：評論

摘要：分布式環境通常是與數據庫服務器相分離的。而DBA的工作就是監視這些環境并配置和優化數據庫服務器以滿足多種需求。大數據的出現加劇了DBA的問題。 原標題：如何進行分布式大數據應用調優 原作者：發表時間：2014/2/17 張亮亮來源：機房360

大數據的出現加劇了DBA的問題，因為現在多個分布式應用需要訪問一個非常龐大的數據存儲。那么在DB2的環境下，有哪些可用調優的方法呢?

　　DBA必須首先解決常見的應用性能瓶頸。如果數據可用性或性能已經很差，那么面向高性能訪問大數據就會出現問題。這里是一份常見的調優問題列表，DBA要確保數據庫存在這些流程以減輕這些潛在的問題。

　　數據訪問模式的糟糕設計

　　如果表中某個記錄集訪問頻繁，那么它們便可成為一個“熱點”。比如一個按訂單號排序的訂單表。最近的訂單會在它們處理的時候更加活躍。由于多個應用程序和工具訪問少量記錄，那么數據訪問的影響就會集中在數據庫中的一個小范圍內。當某些事務鎖定或聲明數據時，而其他應用程序或工具試圖對它們進行訪問，這通常就會導致性能問題。

　　這樣的熱點可以在數據庫設計階段加以預測。DBA可以在數據庫中嵌入空白空間來分散數據，這樣就降低了在一個物理點活動的集中程度。其他選項包括分配記錄到整個數據庫的方法。在我們以上的訂單表例子中，DBA可能會實現以地理位置進行排序而非按訂單號排序的表。這樣，新訂單就不會彼此相鄰，而是分布于整個物理表。

　　過度加鎖

　　在DB2環境中有兩個流程級別可以“存儲”數據：SQL流程和數據庫工具。SQL流程包括應用程序發布靜態SQL語句和動態發布的SQL語句。SQL會發布針對數據的鎖，并且這些鎖通常會避免數據正在被讀取的時候并發更新。此外，加鎖會避免諸如Load之類的工具加載數據，這會導致取代或是覆蓋正在被讀取的數據。工具會發布針對數據的聲明。一條聲明類似于數據庫鎖，是因為它可以通過實體來保留數據以供訪問并避免某些并發的SQL訪問。一般來說，加鎖會強制聲明去等待，而聲明會強制SQL操作去等待。這就允許數據庫管理系統可以管理多個諸如Load或是Image Copy之類的并發工具，而不用受到SQL語句的干擾。

　　最常見的加鎖問題是SQL語句鎖定太多的數據。一條SQL語句讀取一條記錄通常會在此SQL語句執行期間鎖定多條記錄為只讀。這種行為在多個地方是受控的，包括語法，數據庫定義，以及通過應用程序提交語句的用法。DBA應該審查SQL語句加鎖行為來確保鎖定最小量的數據。了解鎖定對象的大小和應用是如何訪問數據的。

　　長期運行的應用程序可能會長時間鎖定數據，從而降低了數據可用性。考慮記錄級別的鎖定來最小化SQL的影響，盡管這可能會導致用于管理加鎖的CPU時間有所上升。應用程序提交邏輯同樣應該加以審查，提交會釋放鎖定并允許數據訪問。此外，DBA應該審查應用程序和工具的調度。例如，驗證諸如Image Copy這類工具在應用程序做數據庫更新的時候沒有在并發運行。

　　大數據應用調優

　　大數據通常意味著一個需要高速數據分析軟件的大型數據存儲。很多時候這些大數據部署與企業數據倉庫共存。這意味著DBA人員必須與數據倉庫人員進行協作以保證良好的性能。下面提到的一些點需要我們充分考慮：

　　置于一個專門的軟硬件一體化設備中的大數據必須經常由數據倉庫表同時進行訪問。這通常是利用SQL連接語句加以實現的。DBA必須協調大數據設備的加載和數據倉庫的ETL流程以確保所有數據在查詢階段是可用的。

　　存儲于非常大的DB2表中的大數據可能會有特殊的恢復需求�？紤]一個要每天進行分析的事務數據的大型存儲。業務管理者可能會認為此分析對日常生產至關重要，從而指定此數據為關鍵任務。如果發生故障，這些數據要怎樣才能恢復呢?對于一個數據倉庫最佳的做法就是指定數據在恢復上為低優先級的。

　　存儲在DB2表中的大數據可能需要DBA去降低或是最小化數據上索引的數量。雖然通常來說可以添加多個索引到一個表來改善查詢性能，而對于非常大的表其索引也會很大。磁盤存儲限制可能會阻止DBA創建某些索引。此外，更多的索引會減緩數據插入性能，同樣還會讓任何數據庫恢復過程運行更長的時間。

數據倉庫訪問優化

　　數據倉庫的ETL流程有其自身獨特的性能問題。數據提取流程通常會作為多個并行數據查詢流程加以執行。數據倉庫團隊可能會使用高速網絡來加速這一流程。由于可操作數據可能不是以易于分析的形式呈現的，因此數據轉換需要編程技能。常見問題有空值，缺失或未知數據，甚至是諸如日期值為“99/99/9999”的無效數據。加載流程通常包括多個針對倉庫表并發加載的工具。加載通常是長期運行和資源密集型的。

　　由于分布式應用試圖訪問大數據，它們也不可避免的會訪問數據倉庫數據。再次，DBA必須將此過程與數據倉庫ETL過程加以協調。常見的方法是架設有兩個分區的表，活動和非活動分區。目標表物理上被分為數據集和分區。一個分區被指定為活動分區，而一個控制表或參數被設置用來指示哪個分區是活動的。分布式查詢現在可能訪問活動的數據，允許加載流程把數據加載到非活動分區。一旦加載完畢，活動和非活動標記就會切換。

　　分布式處理和大數據

　　優化分布式訪問性能的一個最佳實踐是使用資源約束分析。DBA會在收集性能數據的時候監視諸如磁盤子系統和CPU之類的資源。甚至查詢和工作運行時間也可以被當做是資源。當DBA發現某項資源受限時，他們會平衡其他資源以進行彌補。

　　大數據可能意味著大的性能問題，并且通過分布式應用程序進行訪問會將這些問題進一步復雜化。DBA可以通過考慮以下方面來主動了解這些問題：

　　·數據庫設計選項；

　　·執行資源約束分析；

　　·利用Explain優化分布式查詢；

　　·協調大數據訪問和數據倉庫訪問；

　　分布式應用程序對于DBA來說可能會是個挑戰。通過解決當前以及潛在的數據可用性問題作為開始，尤其是那些企業數據倉庫中的問題。一旦這些擔憂得以緩解，那么DBA就可以開始管理對大數據的分布式數據訪問。

核心關注：拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用，蘊涵了豐富的ERP管理思想，集成了ERP軟件業務管理理念，功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理，全面涵蓋了企業關注ERP管理系統的核心領域，是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。

轉載請注明出處：拓步ERP資訊網 http://www.guhuozai8.cn/

本文標題：如何進行分布式大數據應用調優

本文網址：http://www.guhuozai8.cn/html/consultation/10839712549.html

關鍵詞標簽： 如何進行分布式大數據應用調優,大數據分布式環境 DB2 大數據調優數據倉庫,ERP,ERP系統,ERP軟件,ERP系統軟件,ERP管理系統,ERP管理軟件,進銷存軟件,財務軟件,倉庫管理軟件,生產管理軟件,企業管理軟件,拓步,拓步ERP,拓步軟件,免費ERP,免費ERP軟件,免費ERP系統,ERP軟件免費下載,ERP系統免費下載,免費ERP軟件下載,免費進銷存軟件,免費進銷存,免費財務軟件,免費倉庫管理軟件,免費下載,

本文轉自：e-works制造業信息化門戶網

本文來源于互聯網，拓步ERP資訊網本著傳播知識、有益學習和研究的目的進行的轉載，為網友免費提供，并盡力標明作者與出處，如有著作權人或出版方提出異議，本站將立即刪除。如果您對文章轉載有任何疑問請告之我們，以便我們及時糾正。聯系方式：QQ：10877846 Tel：0755-26405298。

上一篇： “云”數據中心發展趨勢

下一篇：大數據：生者與死者

相關文章

管理咨詢

拓步ERP系統軟件平臺11.5專業版v10.1.2...

拓步ERP系統平臺庫存管理系統培訓視頻教材


	ERP新聞動態拓步新聞行業新聞關注產品觀點縱橫企業管理企業應用

	ERP解決方案按ERP應用行業分類按ERP企業規模分類按ERP管理領域分類按ERP軟件功能分類按ERP系統特性分類用友ERP解決方案金蝶ERP解決方案易飛ERP解決方案速達ERP解決方案其他ERP解決方案

	ERP顧問咨詢 ERP管理咨詢 ERP戰略診斷 ERP流程分析 ERP流程優化 ERP風險分析 ERP可行性研究 ERP整體規劃 ERP選型招標 ERP實施監理 ERP評審驗收 ERP績效評價 ERP基礎知識 ERP課程培訓 ERP培訓教育 ERP視頻教材

	CIO技術專欄 CIO企業應用 CIO網絡通信 CIO信息安全 CIO基礎設施 CIO云計算

	ERP技術支持技術支持知識庫常見問題資料庫在線學習資料庫日常辦公資料庫企業管理知識庫

	ERP系統價格拓步ERP系統價格體系拓步EIS軟件價格體系合作品牌ERP價格體系技術支持服務價格體系

	合作品牌用友UFIDA 金蝶KingDee 神州數碼Digital 速達SuperData 拓步ERP系統成功案例

	代理加盟合作聯盟策略代理合作指南代理聯盟前景聯盟技術支持快速搜索ERP軟件資訊

	關于拓步公司介紹公司愿景企業文化誠聘英才聯系我們在線留言在線訂購意向下載體驗登記

日本高清色本免费现在观看-日本高清色图-日本高清色视频在线观看免费-日本高清免费一本视频在线观看-国产精品电影久久-国产精品对白刺激久久久

ERP顧問咨詢

ERP原理知識

ERP實施培訓

CIO技術專欄

CIO企業應用

CIO網絡通信

CIO信息安全

CIO基礎設施

CIO云計算

即時聯系

服務熱線

快捷互動

猜您喜歡