在電信行業(yè),運(yùn)營(yíng)商構(gòu)建了非常多的應(yīng)用系統(tǒng)為廣大消費(fèi)者提供各種特色服務(wù),有一些系統(tǒng)的功能由于在業(yè)務(wù)操作的上下文中,涉及到多個(gè)業(yè)務(wù)系統(tǒng)的子功能,需要多個(gè)系統(tǒng)共同提供服務(wù)才能正常工作,導(dǎo)致任何系統(tǒng)出現(xiàn)異常都會(huì)影響到其余的系統(tǒng),對(duì)企業(yè)形象和社會(huì)造成非常惡劣的影響。
而各業(yè)務(wù)系統(tǒng)的應(yīng)用日志是了解業(yè)務(wù)系統(tǒng)是否正常運(yùn)行的最直接可靠的窗口,通過統(tǒng)一收集、分類應(yīng)用日志,并實(shí)現(xiàn)日志分析,可實(shí)現(xiàn)如下價(jià)值:
-
加強(qiáng)網(wǎng)絡(luò)運(yùn)營(yíng)效率:收集各類設(shè)備和應(yīng)用的關(guān)聯(lián)行為,分析網(wǎng)絡(luò)通信服務(wù)質(zhì)量,實(shí)現(xiàn)系統(tǒng)運(yùn)維監(jiān)控,提升網(wǎng)絡(luò)工作效率,改善客戶使用體驗(yàn)。
-
合理配置渠道資源:針對(duì)不同類型與喜好特點(diǎn)的客戶群體,按渠道投放差異化的產(chǎn)品和服務(wù),提高渠道利用效率。
-
客戶畫像與精確營(yíng)銷:記錄客戶在各種渠道的行為和接觸信息,預(yù)測(cè)客戶行為動(dòng)機(jī),從而準(zhǔn)確地推送個(gè)性化的服務(wù)和產(chǎn)品。
因此,電信運(yùn)營(yíng)商對(duì)于應(yīng)用日志的監(jiān)控力度非常大,一旦出現(xiàn)異常信號(hào),需要及時(shí)通知操作人員進(jìn)行問題定位與問題解決。但這種方式只能進(jìn)行問題的事后補(bǔ)救處理,不能預(yù)先發(fā)現(xiàn)應(yīng)用系統(tǒng)的隱藏問題。而且由于日志數(shù)據(jù)是典型的文本類半結(jié)構(gòu)化大數(shù)據(jù),傳統(tǒng)的關(guān)系型數(shù)據(jù)庫無法滿足海量日志數(shù)據(jù)的存儲(chǔ)與實(shí)時(shí)查詢分析需求。
1.用戶業(yè)務(wù)需求
-
業(yè)務(wù)問題溯源查詢,響應(yīng)時(shí)間3秒內(nèi)
-
多維度分析結(jié)果的聚集與實(shí)時(shí)展現(xiàn)
2.業(yè)務(wù)與技術(shù)挑戰(zhàn)
原解決方案
如下圖所示,用戶在項(xiàng)目初期基于Hadoop HDFS及Greenplum構(gòu)建日志監(jiān)控系統(tǒng),并將原始日志文件保存在NAS文件系統(tǒng)中。
然后通過流處理引擎將日志中的每個(gè)交易號(hào)對(duì)應(yīng)的日志報(bào)文對(duì)應(yīng)文件的偏移記錄(位置)轉(zhuǎn)換成一個(gè)格式化記錄,并將生成的數(shù)據(jù)保存在 GP(Greenplum) 中。
用戶如果希望查詢某個(gè)交易號(hào)的明細(xì)日志,需要先到GP 庫中查找這個(gè)交易號(hào)對(duì)應(yīng)在哪個(gè)文件中,并且知道了它在文件的偏移情況,打開文件,跳轉(zhuǎn)到對(duì)應(yīng)的偏移上,才能看在完整的明細(xì)日志。
原方案存在問題與不足如下:
-
當(dāng)應(yīng)用日志數(shù)據(jù)量越來越大時(shí),流處理引擎、GP 和NAS 的管理會(huì)越加復(fù)雜、困難。
-
將日志存放在NAS 的方法,Hadoop分布式計(jì)算框架很難與其整合,無法使用簡(jiǎn)單工具(如Hive等)進(jìn)行日志分析。
3.解決方案
用戶基于SequoiaDB數(shù)據(jù)庫+Hadoop框架重構(gòu)了智能日志分析系統(tǒng),在已有日志監(jiān)控系統(tǒng)基礎(chǔ)上增加智能日志分析功能,可自動(dòng)根據(jù)應(yīng)用日志分析錯(cuò)誤隱患,提高應(yīng)用的糾錯(cuò)能力。
如上圖所示,數(shù)據(jù)采集端將新增數(shù)據(jù)實(shí)時(shí)加載到SequoiaDB數(shù)據(jù)庫集群中,系統(tǒng)定時(shí)觸發(fā)程序每隔5分鐘啟動(dòng)Hadoop MapReduce分析程序,分析結(jié)果通過GP進(jìn)行多維分析查詢展現(xiàn),當(dāng)系統(tǒng)出現(xiàn)操作異常或者是用戶違規(guī)操作時(shí),立刻通過進(jìn)行系統(tǒng)操作告警。業(yè)務(wù)人員用戶可在Web操作界面通過SQL接口實(shí)時(shí)查詢應(yīng)用日志,實(shí)現(xiàn)對(duì)錯(cuò)誤信息的實(shí)時(shí)定位。
在此系統(tǒng)架構(gòu)中,SequoiaDB巨杉數(shù)據(jù)庫發(fā)揮三大作用:
-
海量應(yīng)用日志的數(shù)據(jù)存儲(chǔ):大量的原始日志保存到SequoiaDB數(shù)據(jù)庫中,并按時(shí)間、交易號(hào)兩個(gè)字段均勻的分布到五個(gè)節(jié)點(diǎn)服務(wù)器的各自數(shù)據(jù)磁盤中。由于SequoiaDB數(shù)據(jù)庫原生就支持?jǐn)?shù)據(jù)備份功能,保證數(shù)據(jù)安全的同時(shí),解決了數(shù)據(jù)災(zāi)備問題。
-
向Hadoop提供分析的原始數(shù)據(jù):SequoiaDB數(shù)據(jù)庫能與Hadoop深度整合, MapReduce程序能無縫對(duì)接SequoiaDB數(shù)據(jù)源進(jìn)行高效的迭代計(jì)算,也可以通過Hive SQL對(duì)分布的日志數(shù)據(jù)進(jìn)行檢索,完成并行分布式計(jì)算。
-
實(shí)時(shí)SQL查詢:用戶在查詢某個(gè)交易號(hào)的明細(xì)日志,只需以SQL形式提交相應(yīng)的交易號(hào),SequoiaDB數(shù)據(jù)庫即按索引機(jī)制進(jìn)行索引匹配,實(shí)時(shí)反饋出完整的日志報(bào)文,實(shí)現(xiàn)基于交易號(hào)的實(shí)時(shí)查詢,將處理流程大大簡(jiǎn)化。
4.項(xiàng)目成果
智能運(yùn)維監(jiān)控
系統(tǒng)很好地滿足了對(duì)應(yīng)用日志數(shù)據(jù)的實(shí)時(shí)統(tǒng)計(jì)及異常檢測(cè)的功能需求。
實(shí)時(shí)統(tǒng)計(jì)
異常檢測(cè)
運(yùn)維簡(jiǎn)單方便
相比起單純的HDFS文件系統(tǒng),SequoiaDB數(shù)據(jù)庫在實(shí)現(xiàn)了對(duì)應(yīng)用日志數(shù)據(jù)的集中統(tǒng)一存儲(chǔ)的同時(shí),滿足了全量日志實(shí)時(shí)SQL查詢及向分析程序輸送數(shù)據(jù)的需求。
相比于引入HBase,Impala, Storm, Pig等框架的方法,基于SequoiaDB數(shù)據(jù)庫的方案運(yùn)維簡(jiǎn)單,開發(fā)方便,管理快捷,功能完善。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:巨杉案例:基于日志的大數(shù)據(jù)運(yùn)維管理平臺(tái)
本文網(wǎng)址:http://www.guhuozai8.cn/html/solutions/14019320041.html