長久以來,日志管理都是IT運維工程師不可回避的工作,它不但可以跟蹤IT基礎設施活動,更是回答故障是否發生、如何發生、何時發生、在何處發生的最佳答案。但不斷增加的設備與網絡行為產生了令人難以控制的海量日志,告警信息更是成百上千,而僅憑人工進行管理,幾乎成了一件不可能完成的任務。
日志監控也有“狼來了”
考慮到日志管理本身所具有的功效,收集日志數據及進行分析,通常被認為是IT運維最具常態的工作之一,更是防禍于未然的有效手段。但這種常態任務一旦超出工作負荷,不但在“量”上面無法完成,還很有可能在“質”上影響IT運維管理的有效性。
趙蒙,某市信息網絡中心的運維工程師,雖說頭頂著IT光環,但他卻備受日志監控的煎熬,過著“苦行僧”一般的生活。網絡中心不但要負責電子政務數十個業務系統的運維保障,還兼管其他委辦局業務系統監控的工作,不論白班或是夜班值守的同事,所有人都有一項工作必不可少,這就是“檢查日志、評估和處理告警事件”。為了提高工作效率,在大家群策群力之下,許多針對操作系統或者是數據庫日志系統的自動處理腳本被一一開發出來。但這并沒有讓運維監控壓力得到緩解,網絡設備、服務器、網絡流量,甚至數據庫的警告信息,成千條日志信息堆積在一起更本沒法判斷問題的根源在哪里?在這種情形下,趙蒙漸漸疲態化,放棄了努力,每次在巡檢表格上胡亂填上幾筆,草草了事。
針對IT運維管理人員這種常態化的工作方式,國內領先的IT運維管理專家北塔軟件認為:“管理人員如果每天只能按部就班的面對每一臺服務器、網絡設備,逐個去檢查它們的狀況,或者從幾千條日志中找到有價值的內容,確實需要耐心、細心和責任心。但由于工作量巨大,很多時候人們開始習慣“狼來了”的心態。此時,如果沒有對某條告警日志背后的隱患徹底查驗,看似正常的業務系統則可能由此轟然倒塌。但是,借助北塔軟件智能化的運維平臺,則可以實現自動處理海量日志、主動挖掘故障線索,不喊“狼來了”,即使“狼”真的來了也不懼怕。“
“兩招”化解日志管理難題
日志用來記錄用戶操作、系統運行狀態,是一個運維系統中重要的核心部分,它直接關系到系統出現問題時定位的速度。對日志的觀察和分析,能提前發現系統可能的風險,避免線上事故的發生。為了幫助趙蒙早日摘掉“日志控”的帽子,北塔軟件運維管理專家傳授他“兩招”最實用的方法,這就是日志管理中的“廣度、深度”。
第一招:用“廣度”拒絕漏網之魚
日志范圍夠不夠廣,是拒絕漏網之魚,走出成功的第一步。為此,趙蒙可以借助北塔BTIM IT綜合管理平臺,將網絡、安全、機房、桌面、服務器、數據庫、中間件、應用、業務等各個方面監控起來,對所有設備的性能、各類數據流進行自動采集。隨后,他可以使用批量告警設置功能,進而屏蔽差異項,在縮短告警規則設置時間的同時,從上百條告警規則中解脫出來,只維護十分之一的告警規則,大幅降低了告警規則維護的復雜度。
第二招:用“深度”追擊故障根源
日志管理不能是孤立的,否則它在主動運維方式中就沒有任何意義。為此,北塔BTIM包含了強大的信息關聯展示、分析能力,管理人員可以在業務管理上綜合不同領域的業務相關“關鍵參數”,判斷具體故障性質、位置,直接調用各個管理組件定位故障點。一旦發現危險事件,TFS管理系統將可以依據業務實際流量路徑,按照分析需要,逐層擴大數據采集的深度和廣度,層層深入,直達故障根源。
事件監控、日志分析,這些IT運維管理中的“自動化”,談起來容易,真正實現卻并不簡單。實際上,整個IT基礎架構,有很多不同的組成部分構成,有很多不同的信息,而自動化也是IT運維管理逐步發展演進的過程。從趙蒙帶領大家編寫自動處理腳步,到對整個IT管理作業流的自動控制,這些技術上的改變都是在追求著:實現智能化的運維,解放人力!
在本案例中,看似只在日志管理上前進了一小步,但恰恰反映出運維體系向著成熟邁出了一大步,擺脫這種低水平的循環,將使得IT 運營更加高效,讓時間變得更有價值。以趙蒙為代表的運維工程師們,從此更可以不再千篇一律,“狼來了”的故事也不再有人提起。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/