Серверы AMD EPYC 9354 — от 27000 ₽ в месяц или 45 ₽ в час ⭐ 64 ядра, 2.0 ГГц / 384 ГБ RAM / 2× 1.92 TБ SSD

Site Reliability Engineer ( Инженер по надежности сайта )

 

Что мы предлагаем

  • Стабильную заработную плату от  200 000 ₽ за месяц, на руки,  фиксированный оклад + бонусная система по достижению KPI.

  • Полноценная удаленная работа из любой точки мира.

  • Работа в аккредитованной IT-компании.

  • Полный день 10:00–19:00 МСК, 5/2 (гибкое начало рабочего дня).

  • Интересные высоконагруженные задачи и дружный профессиональный коллектив.

Чем предстоит заниматься:

  • Внедрение SLI/SLO, управление инцидентами, участие в on-call ротации, проведение постмортемов.

  • Построение сквозного мониторинга цепочки Фронт → Бэк → Очередь → WebSocket. Стек: VictoriaMetrics + Grafana + Sentry.

  • Глубокая работа с Kubernetes (сетевые политики, лимиты, отладка подов).

  • Продвинутая настройка Nginx под долгоживущие WebSocket-соединения.

  • Администрирование MinIO в Distributed Mode (Erasure Coding, обновления без простоя).

  • Тюнинг производительности MariaDB / ClickHouse / Redis (индексы, тяжелые запросы, репликация).

  • Эксплуатация RabbitMQ: кластеризация, мониторинг лагов, ретеншн.

  • Развитие GitLab CI/CD (сложные пайплайны, канареечные деплои, blue/green).

  • Участие в миграции PHP-приложения с php-fpm на persistent runtime (RoadRunner / FrankenPHP).

Мы будем рады, если ваши навыки включают:

  • Опыт SRE/DevOps от 3 лет в production-среде с реальной нагрузкой.

  • Kubernetes не на уровне kubectl apply, а с пониманием сетевых политик и отладки проблем.

  • Nginx: уверенное проксирование WebSocket-трафика и балансировка долгих соединений.

  • Уверенный Linux: tcpdump, strace, анализ сетевой подсистемы.

  • Опыт работы с очередями (RabbitMQ / Kafka).

  • Опыт администрирования объектных хранилищ (MinIO / Ceph).

  • Понимание ограничений классического php-fpm и готовность работать с современными рантаймами (RoadRunner, FrankenPHP).

Upload