隊列在數據結構中是一種線性表,從一端插入數據,然后從另一端刪除數據。本文目的不是講解各種隊列算法,而是在應用層面講述使用隊列能解決哪些場景問題。
在我開發過的系統中,不是所有的業務都必須實時處理、不是所有的請求都必須實時反饋結果給用戶、不是所有的請求/處理都必須100%處理成功、不知道誰依賴“我”的處理結果、不關心其他系統如何處理后續業務、不需要強一致性,只需保證最終一致性即可、想要保證數據處理的有序性;此時你應該考慮使用隊列來解決這些問題。在實際開發時我們經常使用隊列進行異步處理、系統解耦、數據同步、流量削峰、緩沖、限流等。
應用場景
異步處理:使用隊列的一個主要原因是進行異步處理,比如用戶注冊成功后需要發送注冊成功郵件/新用戶積分/優惠券等等、緩存過期時先返回老的數據,然后異步更新緩存、異步寫日志等;通過異步處理,可以提升主流程響應速度,而非主流程/非重要業務可以異步集中處理,這樣還可以將任務聚合然后批量處理;因此可以使用消息隊列/任務隊列來進行異步處理。
系統解耦:比如用戶成功支付完成訂單后,需要通知生產配貨系統、發票系統、庫存系統、推薦系統、搜索系統、風控系統等進行業務處理;而未來需要添加/支持哪些業務是不清楚的,而且這些業務處理不需要實時處理、不需要強一致,只需要最終一致性即可,因此可以通過消息隊列/任務隊列進行系統解耦。
數據同步:比如想把Mysql變更的數據同步到Redis、或者將Mysql數據同步到Mongodb、或者機房間數據同步、或者主從數據同步等,此時可以考慮使用如databus、canal、otter。使用數據總線隊列進行數據同步的好處是可以保證數據修改的有序性。
流量削峰:系統瓶頸一般在數據庫上,比如扣減庫存、下單等;此時可以考慮使用隊列將變更請求暫時放入隊列,通過緩存+隊列暫存的方式將數據庫流量削峰;還有如秒殺系統,下單服務會是該系統的瓶頸,此時會使用隊列進行排隊和限流,從而保護下單服務。通過隊列暫存或者隊列限流來削峰。
比如減庫存,可以考慮這樣設計:
直接在Redis中扣減,然后記錄下扣減日志(FIFO隊列),通過Worker去同步到DB。
實際隊列的應用場景還是非常多的,本文列舉了筆者遇到過比較多的場景。
緩沖區隊列
典型的如Log4j的日志緩沖區,當我們使用log4j記錄日志時,可以配置字節緩沖區,字節緩存區滿時會立即同步到磁盤(flush操作)。Log4j使用BufferedWriter實現的;此模式不是異步寫,在緩沖區滿的時候還是會阻塞主線程。如果需要異步模式可以使用AsyncAppender,然后通過bufferSize控制日志事件緩沖區大小。
通過緩沖區隊列可以實現:批量處理、異步處理。
任務隊列
使用任務隊列將一些不需要與主線程同步執行的任務扔到任務隊列異步處理即可;筆者用的最多的是線程池任務隊列(默認LinkedBlockingQueue)和Disruptor任務隊列(RingBuffer)。如刷數據時,將任務扔到隊列異步處理即可,處理成功后再異步通知用戶;還有如刪除SKU操作,用戶請求時直接將任務分解并扔到隊列,異步處理,處理成功后異步通知用戶即可;還有如查詢聚合,將多個可并行處理的任務扔到隊列然后等待最慢的一個返回。如果使用的是內存任務隊列請記住可能存在系統重啟等問題造成的數據丟失。
通過任務隊列可以實現:異步處理、任務分解/聚合處理。
注:JDK7提供了ExecutorService的新的實現ForkJoinPool,其提供了Work-stealing機制,可以更好地提升并發效率。
在使用Executors.newFixedThreadPool時,其沒有設置隊列大小(默認Integer.MAX_VALUE),如果有大量任務被緩存到LinkedBlockingQueue中等待線程執行,會出現GC慢等問題,造成系統響應慢甚至OOM。因此在使用線程池時候,要指定隊列大小并設置合理的RejectedExecutionHandler;要記錄請求來源的參數方便定位引發問題的源頭。
消息隊列
筆者所在公司使用的是自研的JMQ;開源的有ActiveMQ、Kafka、Redis。使用消息隊列存儲各業務數據,其他系統根據需要訂閱即可。常見的模式是:點對點(一個消息只有一個消費者)、發布訂閱(一個消息可以有多個消費者);而常用的是發布訂閱模式。
比如用戶注冊成功、修改商品數據、訂單狀態變更等都應該將變更發送到消息隊列,從而其他系統根據需要訂閱該消息,然后按照自己的需求進行業務邏輯開發。
在添加新功能時,消息消費者只需要訂閱該消息,然后開發相應的業務邏輯,消息生產者根本不關心你怎么使用消息和你做什么業務處理。
同步調用,添加什么新功能都需要到用戶系統提需求。其中一個服務出現問題了,整個服務就不可用了。
消息隊列,用戶系統只需要發布用戶注冊成功的消息即可,相關系統訂閱該消息,然后執行相關的業務邏輯。相關服務出問題不影響到注冊主流程。
通過消息隊列可以實現:異步處理、系統解耦。
請求隊列
請求隊列是指如在Web環境下對用戶請求排隊,從而進行一些特殊控制:流量控制、請求分級、請求隔離;如將請求按照功能劃分到不同的隊列,從而使得不同的隊列出現問題后相互不影響;還可以對請求分級,一些重要請求可以優先處理(發展到一定程度應將功能物理分離);還有服務器處理能力有限,在接近服務器瓶頸時需要考慮限流,最簡單的限流時丟棄處理不了的請求,此時可以使用隊列進行流量控制。
數據總線隊列
一般消息隊列中的消息都是業務維度的,比如業務鍵或者業務狀態等,比如哪個SKU變更了,而有些訂閱者需要再查一遍來獲取最新的修改數據(比如緩存同步);通過現有的消息隊列方式的缺點是很難只進行修改部分的推送和保證數據有序性。而此種場景比較適合使用數據總線隊列實現。如數據庫數據修改后需要同步數據到緩存,或者需要將一個機房數據同步到另一個機房,只是數據維度的同步,此時應該使用數據總線隊列如canal、otter、databus;使用數據總線隊列的好處是可以保證數據的有序性。
混合隊列
在《構建需求響應式億級商品詳情頁》曾介紹過該方式的隊列,使用混合隊列來解決實際問題。
此處MQ是使用京東自研的JMQ,消息是可靠持久化存儲的;應用會按照不同的維度發布消息到JMQ;下游應用接收到該消息后會放入到Redis,使用Redis List來存儲這些任務;應用將Redis消息消費處理后,會按照不同的維度聚合商品消息然后再次發送出去。
使用Redis隊列的主要原因是想提升消息堆積能力和并發處理能力。另外在使用Redis構建消息隊列時需要考慮網絡抖動造成的消息丟失問題,因為Redis是沒有回滾事務的,或者說是確認機制。我們使用如下方式防止消息丟失:

//發生了網絡異常,需要把processing中的id再放回到waiting queue中

而對于失敗我們會進行重試三次,重試失敗后放入失敗隊列,而失敗隊列是具有防重功能的(從本地隊列和失敗隊列排重),使用的是Redis Lua腳本實現:

Redis作者Antirez開發的內存分布式消息隊列Disque是未來更好的內存消息隊列選擇。
其他
優先級隊列:在實際開發時肯定有些任務是緊急的,此時應該優先處理緊急的任務;所以請考慮對隊列進行分級。
副本隊列:在進行一些系統重構或者上新的功能時,如果沒有足夠的信心保證業務邏輯正確,可以考慮存儲一份隊列的副本(比如1小時、1天的),從而當業務出現問題時可以對這些消息進行回放。
鏡像隊列:每個隊列不會無限制訂閱數量,一定會有一個極限的;當到達極限時請考慮使用鏡像隊列方式解決該問題。
隊列并發數:不同隊列實現,隊列服務端并發連接數是不一樣的;一定不是增大隊列并發連接數消費能力也隨著增加;也不會因為增加了消費服務器消費并發能力也隨著增加,需要根據實際情況來設置合理的并發連接數。
推還是拉:消息體內容不是越全越好,需要根據具體業務設計消息體;如有些系統依賴商品變更消息(只有一個SKU)、有些系統依賴商品狀態消息(SKU、狀態)、有些系統依賴商品屬性變更消息(SKU、變更的屬性)等,如果讓所有系統都消費商品變更消息,那么這些系統都會調用商品查詢服務拉一下最新的商品信息然后進行處理。因此要根據實際情況來決定是使用推送方式(將系統需要的所有信息推過去)還是拉取方式(只推送ID,然后再查一遍)。
消息合并:如果消息寫入量非常大,應該考慮將消息合并寫,可以"寫應用本地磁盤隊列"-->“同步本地磁盤隊列到消息中間件”;同步時可以根據需求制定同步策略,如1秒同步1次。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:高并發系統中隊列術的哪些應用場景
本文網址:http://www.guhuozai8.cn/html/solutions/14019320045.html