دليل الاستجابة
دليل الاستجابة للحوادث
هذه الصفحات مُرتبط بها من قواعد تنبيهات Prometheus. كل دليل مختصر: أعراض، تحقق، إصلاح، ما بعد الحادث.
للحوادث الحيّة: راجع `#ops-alerts` في Slack للنسخة الكاملة من التنبيه، ثم تابع هذا الدليل من الخطوة المناسبة.
سلسلة الدفتر مكسورة — الكتابة معلّقة
فشل تحقق سلسلة الدفتر — كل عمليات الدفع والموافقات معلّقة.
محدِّد المعدل يفشل مفتوحاً
محدِّد المعدل سمح بكل الطلبات لأن Redis غير متاح.
معدل خطأ مرتفع
خدمة ترد بأخطاء 5xx تتجاوز العتبة.
نقطة نهاية عامة لا ترد
نقطة نهاية فشلت في فحوصات الـ blackbox — قد تكون مرئية للعملاء.
تراكم في طابور outbox
طابور outbox يمتلئ أسرع مما يستهلكه الـ consumer.
طابور بلا مستهلك
طابور به رسائل لكن بلا مستهلك متصل — حاوية العامل ساقطة أو منقطعة.
حركة مستمرة على DLX
أحداث تُحال إلى DLX باستمرار — مستهلك في حلقة استثناء.
القرص ممتلئ
وحدة التخزين EBS فوق 85% — قد تُوقف الحاويات.
تجمع اتصال قاعدة البيانات مستنفد
خدمة تفتح اتصالات قاعدة البيانات أسرع مما تغلقها.
Alertmanager مكتوم
التنبيهات مكبوتة عالمياً — تأكّد من عدم وجود كتم قديم متبقٍّ.