AI-платформа Предустановленные языковые LLM-модели на высокопроизводительных серверах с GPU-картами
Серверы
  • Готовые серверы
  • Конфигуратор
  • Серверы с 1CPU
  • Серверы с 2CPU
  • 4 поколение AMD EPYC
  • Серверы с AMD Ryzen и Intel Core i9
  • Серверы для хранения данных
  • Cерверы с портом 10 Гбит/c
  • GPU
  • Распродажа
  • VPS
    GPU
  • Выделенные серверы с GPU
  • Виртуальные серверы с GPU
  • GPU-серверы с Nvidia RTX 5090
  • GPU-серверы с AMD Radeon
  • Распродажа
    Маркетплейс
    Colocation
  • Размещение серверов в дата-центре в Москве
  • Обслуживание серверов в других ЦОД
  • Прокат
    Услуги
  • Аренда сетевого оборудования
  • Защита L3-L4 от DDoS атак
  • IPV4 и IPV6 адреса
  • Администрирование серверов
  • Уровни технической поддержки
  • Мониторинг сервера
  • BYOIP
  • USB диск
  • IP-KVM
  • Трафик
  • Коммутация серверов
  • AI-чат-бот Lite
  • AI-платформа
  • О нас
  • Работа в HOSTKEY
  • Панель управления серверами и API
  • Дата-центры
  • Сеть
  • Тест скорости
  • Специальные предложения
  • Отдел продаж
  • Для реселлеров
  • Гранты для специалистов по Data Science
  • Гранты для научных проектов и стартапов
  • Документация и Частые вопросы
  • Новости
  • Блог
  • Оплата
  • Документы
  • Сообщите о нарушении
  • Looking Glass
  • 31.10.2022

    Мониторинг служб Linux c помощью Prometheus

    server one
    HOSTKEY
    Арендуйте выделенные и виртуальные серверы с моментальным деплоем в надежных дата-центрах класса TIER III в Москве и Нидерландах. Принимаем оплату за услуги HOSTKEY в Нидерландах в рублях на счет российской компании. Оплата с помощью банковских карт, в том числе и картой МИР, банковского перевода и электронных денег.

    Автор: Senior Devops. Ведущий специалист по инфраструктуре Hostkey Никита Зубарев

    В прошлой статье мы рассказывали, как для мониторинга сервисов с помощью Prometheus настроить сбор метрик и отображение тревог. Однако в процессе эксплуатации возник вопрос, как мониторить отдельные службы на серверах Linux. Например, в одной из прошлых статей мы описывали кейс использования веб-консолей Ovirt c помощью Apache Guacamole. Теперь рассмотрим, как организовать мониторинг работы сервисов на Linux-машинах.

    Guacamole — кроссплатформенный шлюз удаленного рабочего стола, для его работы необходимы Apache Tomcat и Guacd.

    Открываем сервис, созданный для node_exporter:

    /usr/lib/systemd/system/node_exporter.service

    [Unit]
    
    Description=Prometheus exporter for machine metrics, written in Go with pluggable metric collectors.
    Documentation=https://github.com/prometheus/node_exporter
    After=network.target
    
    
    [Service]
    
    EnvironmentFile=-/etc/default/node_exporter
    User=root
    ExecStart=/usr/bin/node_exporter $NODE_EXPORTER_OPTS
    Restart=on-failure
    RestartSec=5s
    
    [Install]
    
    WantedBy=multi-user.target
    
    по дефолту $NODE_EXPORTER_OPTS подгружается из файла :
    # /etc/default/node_exporter
    
    При необходимости мы можем либо мониторить отдельные службы, добавив опцию collector.systemd.unit-whitelist:
    
    #NODE_EXPORTER_OPTS="--collector.systemd --collector.systemd.unit-whitelist="(tomcat|guacd).service""

    После перезапуска сервиса получаем метрику на node_exporter:

    Остается описать правило для алерта:

    - alert: guacd_service
    	expr: node_systemd_unit_state{name="guacd.service",state="active"} == 0
    	for: 1s
    	annotations:
    		summary: "Instance {{ $labels.instance }} is down"
    		description: "{{ $labels.instance }} of job {{ $labels.job }} is down."
    - alert: tomcat_service
    	expr: node_systemd_unit_state{name="tomcat.service",state="active"} == 0
    	for: 1s
    	annotations:
    		summary: "Instance {{ $labels.instance }} is down"
    		description: "{{ $labels.instance }} of job {{ $labels.job }} is down."
    

    Пример алерта на дашборде Alertmanager в Grafana:

    Выводы

    В этой небольшой статье мы рассмотрели, как выполняется мониторинг работы сервисов на Linux-машинах. Это решение позволяет отслеживать работы любого systemd-сервера и значительно упрощает администрирование серверного оборудования. В следующей статье мы расскажем, как можно не отображать базовые параметры, которые отдает exporter.

    Арендуйте выделенные и виртуальные серверы с моментальным деплоем в надежных дата-центрах класса TIER III в Москве и Нидерландах. Принимаем оплату за услуги HOSTKEY в Нидерландах в рублях на счет российской компании. Оплата с помощью банковских карт, в том числе и картой МИР, банковского перевода и электронных денег.

    Другие статьи

    21.03.2025

    Дженсен Хуанг, как же так?! Тестируем NVIDIA GeForce RTX 5090 в ИИ задачах

    Новая GeForce RTX 5090 обещала быть прорывом для AI-задач. Мы проверили её в реальных тестах — скорость выросла, но без проблем не обошлось. Узнайте, насколько 5090 оправдала ожидания!

    13.03.2025

    Нейросетевой переводчик в командной строке, или Приручаем API Ollama и OpenWebUI

    Как автоматизировать перевод технической документации без лишних движений? Используем Ollama и OpenWebUI API в командной строке, пишем bash-скрипт, настраиваем промты – и ускоряем процесс локализации!

    22.02.2025

    Как добавить в OpenWebUI генерацию изображений через ComfyUI

    Добавьте поддержку генерации изображений в OpenWebUI с помощью ComfyUI! Подробное руководство по установке, настройке API, загрузке моделей и автоматическому запуску сервиса.

    14.02.2025

    Что нового в OpenWebUI версий 0.5.x

    OpenWebUI 0.5.x — это новый уровень работы с языковыми моделями! Асинхронные чаты, Code Interpreter, генерация изображений прямо из промта, поддержка Google Drive, гибкие настройки прав пользователей и еще масса улучшений.

    31.01.2025

    Памяти много не бывает. Исследуем сервер от GIGABYTE - R283-ZK0-AAL1

    Мы протестировали сервер GIGABYTE R283-ZK0-AAL1 с 48 слотами RAM и выяснили, насколько эффективно он справляется с нагрузками. Экономия на памяти, температурные показатели и тесты производительности – все подробности в нашем обзоре!

    Upload