在電信行業(yè),運(yùn)營(yíng)商構(gòu)建了非常多的應(yīng)用系統(tǒng)為廣大消費(fèi)者提供各種特色服務(wù),有一些系統(tǒng)的功能由于在業(yè)務(wù)操作的上下文中,涉及到多個(gè)業(yè)務(wù)系統(tǒng)的子功能,需要多個(gè)系統(tǒng)共同提供服務(wù)才能正常工作,導(dǎo)致任何系統(tǒng)出現(xiàn)異常都會(huì)影響到其余的系統(tǒng),對(duì)企業(yè)形象和社會(huì)造成非常惡劣的影響。
而各業(yè)務(wù)系統(tǒng)的應(yīng)用日志是了解業(yè)務(wù)系統(tǒng)是否正常運(yùn)行的最直接可靠的窗口,通過(guò)統(tǒng)一收集、分類(lèi)應(yīng)用日志,并實(shí)現(xiàn)日志分析,可實(shí)現(xiàn)如下價(jià)值:
-
加強(qiáng)網(wǎng)絡(luò)運(yùn)營(yíng)效率:收集各類(lèi)設(shè)備和應(yīng)用的關(guān)聯(lián)行為,分析網(wǎng)絡(luò)通信服務(wù)質(zhì)量,實(shí)現(xiàn)系統(tǒng)運(yùn)維監(jiān)控,提升網(wǎng)絡(luò)工作效率,改善客戶(hù)使用體驗(yàn)。
-
合理配置渠道資源:針對(duì)不同類(lèi)型與喜好特點(diǎn)的客戶(hù)群體,按渠道投放差異化的產(chǎn)品和服務(wù),提高渠道利用效率。
-
客戶(hù)畫(huà)像與精確營(yíng)銷(xiāo):記錄客戶(hù)在各種渠道的行為和接觸信息,預(yù)測(cè)客戶(hù)行為動(dòng)機(jī),從而準(zhǔn)確地推送個(gè)性化的服務(wù)和產(chǎn)品。
因此,電信運(yùn)營(yíng)商對(duì)于應(yīng)用日志的監(jiān)控力度非常大,一旦出現(xiàn)異常信號(hào),需要及時(shí)通知操作人員進(jìn)行問(wèn)題定位與問(wèn)題解決。但這種方式只能進(jìn)行問(wèn)題的事后補(bǔ)救處理,不能預(yù)先發(fā)現(xiàn)應(yīng)用系統(tǒng)的隱藏問(wèn)題。而且由于日志數(shù)據(jù)是典型的文本類(lèi)半結(jié)構(gòu)化大數(shù)據(jù),傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)無(wú)法滿(mǎn)足海量日志數(shù)據(jù)的存儲(chǔ)與實(shí)時(shí)查詢(xún)分析需求。
1.用戶(hù)業(yè)務(wù)需求
-
業(yè)務(wù)問(wèn)題溯源查詢(xún),響應(yīng)時(shí)間3秒內(nèi)
-
基于日志的系統(tǒng)問(wèn)題探索和預(yù)警
-
多維度分析結(jié)果的聚集與實(shí)時(shí)展現(xiàn)
2.業(yè)務(wù)與技術(shù)挑戰(zhàn)
原解決方案
如下圖所示,用戶(hù)在項(xiàng)目初期基于Hadoop HDFS及Greenplum構(gòu)建日志監(jiān)控系統(tǒng),并將原始日志文件保存在NAS文件系統(tǒng)中。
然后通過(guò)流處理引擎將日志中的每個(gè)交易號(hào)對(duì)應(yīng)的日志報(bào)文對(duì)應(yīng)文件的偏移記錄(位置)轉(zhuǎn)換成一個(gè)格式化記錄,并將生成的數(shù)據(jù)保存在 GP(Greenplum) 中。
用戶(hù)如果希望查詢(xún)某個(gè)交易號(hào)的明細(xì)日志,需要先到GP 庫(kù)中查找這個(gè)交易號(hào)對(duì)應(yīng)在哪個(gè)文件中,并且知道了它在文件的偏移情況,打開(kāi)文件,跳轉(zhuǎn)到對(duì)應(yīng)的偏移上,才能看在完整的明細(xì)日志。
原方案存在問(wèn)題與不足如下:
-
當(dāng)應(yīng)用日志數(shù)據(jù)量越來(lái)越大時(shí),流處理引擎、GP 和NAS 的管理會(huì)越加復(fù)雜、困難。
-
將日志存放在NAS 的方法,Hadoop分布式計(jì)算框架很難與其整合,無(wú)法使用簡(jiǎn)單工具(如Hive等)進(jìn)行日志分析。
3.解決方案
用戶(hù)基于SequoiaDB數(shù)據(jù)庫(kù)+Hadoop框架重構(gòu)了智能日志分析系統(tǒng),在已有日志監(jiān)控系統(tǒng)基礎(chǔ)上增加智能日志分析功能,可自動(dòng)根據(jù)應(yīng)用日志分析錯(cuò)誤隱患,提高應(yīng)用的糾錯(cuò)能力。
如上圖所示,數(shù)據(jù)采集端將新增數(shù)據(jù)實(shí)時(shí)加載到SequoiaDB數(shù)據(jù)庫(kù)集群中,系統(tǒng)定時(shí)觸發(fā)程序每隔5分鐘啟動(dòng)Hadoop MapReduce分析程序,分析結(jié)果通過(guò)GP進(jìn)行多維分析查詢(xún)展現(xiàn),當(dāng)系統(tǒng)出現(xiàn)操作異;蛘呤怯脩(hù)違規(guī)操作時(shí),立刻通過(guò)進(jìn)行系統(tǒng)操作告警。業(yè)務(wù)人員用戶(hù)可在Web操作界面通過(guò)SQL接口實(shí)時(shí)查詢(xún)應(yīng)用日志,實(shí)現(xiàn)對(duì)錯(cuò)誤信息的實(shí)時(shí)定位。
在此系統(tǒng)架構(gòu)中,SequoiaDB巨杉數(shù)據(jù)庫(kù)發(fā)揮三大作用:
-
海量應(yīng)用日志的數(shù)據(jù)存儲(chǔ):大量的原始日志保存到SequoiaDB數(shù)據(jù)庫(kù)中,并按時(shí)間、交易號(hào)兩個(gè)字段均勻的分布到五個(gè)節(jié)點(diǎn)服務(wù)器的各自數(shù)據(jù)磁盤(pán)中。由于SequoiaDB數(shù)據(jù)庫(kù)原生就支持?jǐn)?shù)據(jù)備份功能,保證數(shù)據(jù)安全的同時(shí),解決了數(shù)據(jù)災(zāi)備問(wèn)題。
-
向Hadoop提供分析的原始數(shù)據(jù):SequoiaDB數(shù)據(jù)庫(kù)能與Hadoop深度整合, MapReduce程序能無(wú)縫對(duì)接SequoiaDB數(shù)據(jù)源進(jìn)行高效的迭代計(jì)算,也可以通過(guò)Hive SQL對(duì)分布的日志數(shù)據(jù)進(jìn)行檢索,完成并行分布式計(jì)算。
-
實(shí)時(shí)SQL查詢(xún):用戶(hù)在查詢(xún)某個(gè)交易號(hào)的明細(xì)日志,只需以SQL形式提交相應(yīng)的交易號(hào),SequoiaDB數(shù)據(jù)庫(kù)即按索引機(jī)制進(jìn)行索引匹配,實(shí)時(shí)反饋出完整的日志報(bào)文,實(shí)現(xiàn)基于交易號(hào)的實(shí)時(shí)查詢(xún),將處理流程大大簡(jiǎn)化。
4.項(xiàng)目成果
智能運(yùn)維監(jiān)控
系統(tǒng)很好地滿(mǎn)足了對(duì)應(yīng)用日志數(shù)據(jù)的實(shí)時(shí)統(tǒng)計(jì)及異常檢測(cè)的功能需求。
實(shí)時(shí)統(tǒng)計(jì)
異常檢測(cè)
運(yùn)維簡(jiǎn)單方便
相比起單純的HDFS文件系統(tǒng),SequoiaDB數(shù)據(jù)庫(kù)在實(shí)現(xiàn)了對(duì)應(yīng)用日志數(shù)據(jù)的集中統(tǒng)一存儲(chǔ)的同時(shí),滿(mǎn)足了全量日志實(shí)時(shí)SQL查詢(xún)及向分析程序輸送數(shù)據(jù)的需求。
相比于引入HBase,Impala, Storm, Pig等框架的方法,基于SequoiaDB數(shù)據(jù)庫(kù)的方案運(yùn)維簡(jiǎn)單,開(kāi)發(fā)方便,管理快捷,功能完善。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:巨杉案例:基于日志的大數(shù)據(jù)運(yùn)維管理平臺(tái)
本文網(wǎng)址:http://www.guhuozai8.cn/html/solutions/14019320041.html