30.11.2022

Использование брокера сообщений RabbitMQ для мониторинга с Prometheus и Grafana

Арендуйте выделенные и виртуальные серверы с моментальным деплоем в надежных дата-центрах класса TIER III в Москве и Нидерландах. Принимаем оплату за услуги HOSTKEY в Нидерландах в рублях на счет российской компании. Оплата с помощью банковских карт, в том числе и картой МИР, банковского перевода и электронных денег.

Автор: Senior Devops. Ведущий специалист по инфраструктуре Hostkey Никита Зубарев

В прошлых статьях мы рассказывали об архитектуре ELK-RabbitMQ и сервисе Invapi, который тоже использует брокер сообщений для общения с бэкэндом. В любой отказоустойчивой архитектуре необходим правильный мониторинг со всеми нотификациям. Кроме того, требуется не только мониторить работу кластера RabbitMQ, но и собирать метрики, проверять количество непрочитанных сообщений. Эти данные могут своевременно определить сбой в работе consumer — пользовательском приложении, которое получает сообщения. С версии 3.8.0 RabbitMQ поставляется со встроенной поддержкой Prometheus и Grafana.

Поддержка сборщика метрик Prometheus поставляется в плагине rabbitmq_prometheus. Плагин предоставляет все показатели RabbitMQ на выделенном TCP-порту в текстовом формате Prometheus. Для активации на кластере выполняем:

rabbitmq-plugins enable rabbitmq_prometheus

Появится открытый порт:

http/promethe: 15692
us:

Проверяем метрику:

Добавляем конфигурацию для Prometheus и Alertmanager:

 - job_name: 'RABBIT MQ Prod NL'
	static_configs:
		- targets: ['rabbitnl-app01a.infra.hostkey.ru:15692','rabbitnl-app01b.infra.hostkey.ru:15692','rabbitnl-app01c.infra.hostkey.ru:15692']

Самое главное — целостность кластера и количество непрочитанных сообщений в очереди.

Если в очереди больше одного непрочитанного сообщения, отдаем алерт:

  - alert: rabbitmq_queue_messages
			expr: rabbitmq_queue_messages{job="RABBIT MQ Dev"} > 1
			for: 1m
			labels:
				severity: page
			annotations:
				summary: Critical rabbitmq_queue_messages
	 - alert: unacknowledged messages
			expr: rabbitmq_queue_messages_unacked{job="RABBIT MQ Prod NL"} > 1
			for: 1m
			labels:
				severity: page
			annotations:
				summary: Critical rabbitmq_queue_messages_unacked

Аналогично выставляем алерты на целостность кластера.

Как было рассказано в первой статье по мониторингу, в Grafana есть возможность импортирования дашборда, добавляем id 10991.

Отображаемые показатели:

Идентификация узла, в том числе версии RabbitMQ и Erlang/OTP.
Память узла и диск доступны до блокировки издателей (триггеры тревоги).
Доступны дескрипторы файлов узлов и сокеты TCP.
Готовые и ожидающие сообщения.
Частота входящих сообщений: опубликовано / перенаправлено в очереди / подтверждено / не подтверждено / возвращено / отброшено.
Оценка исходящего сообщения: доставлено с автоматическим или ручным подтверждением / подтверждено / доставлено повторно.
Операция опроса с автоматическим или ручным подтверждением, а также с пустыми операциями.
Очереди, в том числе скорость объявления и удаления.
Каналы, в том числе уровни открытия и закрытия.
Соединения, в том числе открытые и закрытые курсы.

При необходимости недостающие параметры можно добавить (как создавать шаблоны, расскажем в следующих статьях).

Таким образом, инструменты мониторинга RabbitMQ позволяют проверять общие показатели узла, а также ready и unacknowledged messages. Важным преимуществом нашего решения является многоаспектный и оперативный контроль состояния оборудования.

Другие статьи

29.12.2025

Блог

Как настроить свой сервер Mumble для стабильных звонков без блокировок

Когда Zoom и Google Meet не работают, есть простой вариант для защищенной связи: поднимаем свой сервер Mumble за 10 минут и получаем стабильную голосовую связь без блокировок.

17.12.2025

Блог

NVIDIA RTX PRO 2000 Blackwell. На что способен «младшенький GPU» нового семейства профессиональных карт NVIDIA

Тестируем RTX PRO 2000 - 70 Вт, 16 ГБ GDDR7 и Blackwell в Ollama, ComfyUI и Blender. Мы проверили, на что реально способна карта и стоит ли она своих денег.

11.12.2025

Блог

Когда гибридная архитектура лучше чистого облака или выделенного сервера

Сервис теряет производительность в пиковые периоды? Гибридная архитектура позволяет стабилизировать нагрузку и избежать избыточных затрат. Узнайте, когда этот подход работает лучше всего.

05.12.2025

Блог

Разворачиваем Proxmox VE 9: Исчерпывающая инструкция по установке и эксплуатации

Этот гайд поможет быстро и без проблем развернуть Proxmox VE 9. Разбираем все шаги: от первого входа и настройки сети до запуска VM, LXC и автоматических бэкапов. Четкие инструкции, практические советы и решения частых проблем.

03.12.2025

Блог

Пишем LLM бенчмарк для GPU-серверов с картами NVIDIA в Ollama

HOSTKEY разработала свой LLM-бенчмарк для GPU-серверов с NVIDIA. Тест проверяет работу Ollama под нагрузкой, измеряет скорость инференса и выявляет, как разные GPU ведут себя при генерации больших контекстов. Полный скрипт доступен на GitHub.

Все статьи

1 /

Использование брокера сообщений RabbitMQ для мониторинга с Prometheus и Grafana

Другие статьи

Другие темы