@minhbt.it: Trong hệ thống event-driven hoặc message queue, một câu hỏi rất phổ biến là: 👉 Nếu message xử lý fail thì nên làm gì? Nhiều team chọn: ✔ Retry liên tục Nghe có vẻ hợp lý… nhưng đây là lúc vấn đề bắt đầu 😅 ⸻ 💥 Nếu message bị lỗi vĩnh viễn: * Sai format * Corrupted data * Validation fail → Retry sẽ không giải quyết được gì. Thay vào đó: ❌ Queue bị nghẽn ❌ Resource bị tiêu tốn liên tục ❌ System có thể bị overload ⸻ 💡 Đây là lý do DLQ (Dead Letter Queue) tồn tại. * Retry → xử lý lỗi tạm thời * DLQ → cô lập message lỗi lâu dài để investigate sau ⸻ 🔥 Senior engineer không hỏi: “Có retry không?” 👉 Họ hỏi: * Retry bao nhiêu lần? * Backoff strategy là gì? * Khi nào đưa vào DLQ? ⸻ Ví dụ: ✔ Temporary network issue → Retry ✔ Invalid payload → DLQ ⸻ ❓ Câu hỏi cho bạn: Bạn từng gặp retry loop làm system quá tải chưa? #R#RetryD#DLQS#SystemDesignE#EventDrivenArchitectureMessageQueue