01.11.2022

Мониторинг служб Linux c помощью Prometheus

Арендуйте выделенные и виртуальные серверы с моментальным деплоем в надежных дата-центрах класса TIER III в Москве и Нидерландах. Принимаем оплату за услуги HOSTKEY в Нидерландах в рублях на счет российской компании. Оплата с помощью банковских карт, в том числе и картой МИР, банковского перевода и электронных денег.

Автор: Senior Devops. Ведущий специалист по инфраструктуре Hostkey Никита Зубарев

В прошлой статье мы рассказывали, как для мониторинга сервисов с помощью Prometheus настроить сбор метрик и отображение тревог. Однако в процессе эксплуатации возник вопрос, как мониторить отдельные службы на серверах Linux. Например, в одной из прошлых статей мы описывали кейс использования веб-консолей Ovirt c помощью Apache Guacamole. Теперь рассмотрим, как организовать мониторинг работы сервисов на Linux-машинах.

Guacamole — кроссплатформенный шлюз удаленного рабочего стола, для его работы необходимы Apache Tomcat и Guacd.

Открываем сервис, созданный для node_exporter:

/usr/lib/systemd/system/node_exporter.service

[Unit]

Description=Prometheus exporter for machine metrics, written in Go with pluggable metric collectors.
Documentation=https://github.com/prometheus/node_exporter
After=network.target


[Service]

EnvironmentFile=-/etc/default/node_exporter
User=root
ExecStart=/usr/bin/node_exporter $NODE_EXPORTER_OPTS
Restart=on-failure
RestartSec=5s

[Install]

WantedBy=multi-user.target

по дефолту $NODE_EXPORTER_OPTS подгружается из файла :
# /etc/default/node_exporter

При необходимости мы можем либо мониторить отдельные службы, добавив опцию collector.systemd.unit-whitelist:

#NODE_EXPORTER_OPTS="--collector.systemd --collector.systemd.unit-whitelist="(tomcat|guacd).service""

После перезапуска сервиса получаем метрику на node_exporter:

Остается описать правило для алерта:

- alert: guacd_service
	expr: node_systemd_unit_state{name="guacd.service",state="active"} == 0
	for: 1s
	annotations:
		summary: "Instance {{ $labels.instance }} is down"
		description: "{{ $labels.instance }} of job {{ $labels.job }} is down."
- alert: tomcat_service
	expr: node_systemd_unit_state{name="tomcat.service",state="active"} == 0
	for: 1s
	annotations:
		summary: "Instance {{ $labels.instance }} is down"
		description: "{{ $labels.instance }} of job {{ $labels.job }} is down."

Пример алерта на дашборде Alertmanager в Grafana:

Выводы

В этой небольшой статье мы рассмотрели, как выполняется мониторинг работы сервисов на Linux-машинах. Это решение позволяет отслеживать работы любого systemd-сервера и значительно упрощает администрирование серверного оборудования. В следующей статье мы расскажем, как можно не отображать базовые параметры, которые отдает exporter.

Другие статьи

17.12.2025

Блог

NVIDIA RTX PRO 2000 Blackwell. На что способен «младшенький GPU» нового семейства профессиональных карт NVIDIA

Тестируем RTX PRO 2000 - 70 Вт, 16 ГБ GDDR7 и Blackwell в Ollama, ComfyUI и Blender. Мы проверили, на что реально способна карта и стоит ли она своих денег.

11.12.2025

Блог

Когда гибридная архитектура лучше чистого облака или выделенного сервера

Сервис теряет производительность в пиковые периоды? Гибридная архитектура позволяет стабилизировать нагрузку и избежать избыточных затрат. Узнайте, когда этот подход работает лучше всего.

05.12.2025

Блог

Разворачиваем Proxmox VE 9: Исчерпывающая инструкция по установке и эксплуатации

Этот гайд поможет быстро и без проблем развернуть Proxmox VE 9. Разбираем все шаги: от первого входа и настройки сети до запуска VM, LXC и автоматических бэкапов. Четкие инструкции, практические советы и решения частых проблем.

03.12.2025

Блог

Пишем LLM бенчмарк для GPU-серверов с картами NVIDIA в Ollama

HOSTKEY разработала свой LLM-бенчмарк для GPU-серверов с NVIDIA. Тест проверяет работу Ollama под нагрузкой, измеряет скорость инференса и выявляет, как разные GPU ведут себя при генерации больших контекстов. Полный скрипт доступен на GitHub.

28.11.2025

Блог

Когда облако становится дорогим — переходим на выделенный сервер!?

В какой момент логично перейти на выделенный сервер и что вы получите взамен? Рассказываем о реальных цифрах, архитектуре и плюсах перехода.

Все статьи

1 /

Мониторинг служб Linux c помощью Prometheus

Выводы

Другие статьи

Другие темы