SLOzy

SLOzy (произносится как "slozy", от SLO + easy & lazy) — это веб-сервис, который позволяет инженерам (и не только) создавать декларативные файлы Service Level Objectives (SLO) в формате OpenSLO с готовыми настройками алертов, не написав ни строчки YAML вручную.

Сервис решает типичную проблему SRE и платформенных команд: ручное написание и поддержка корректных SLO-манифестов, которая требует глубоких знаний синтаксиса и лучших практик. SLOzy автоматизирует этот процесс через простую веб-форму.

Интерфейс представляет собой единую форму, где за несколько кликов задаются все критические параметры: название сервиса, метрика для измерения (доступность, latency, error rate), целевой процент (например, 99.9%) и пороговое значение. Поддерживаются PromQL-подобные запросы для интеграции с существующими системами мониторинга.

🔧 Как это работает

  1. Выберите шаблон (или начните с нуля) — сервис предлагает готовые пресеты для разных систем
  2. Заполните форму — укажите базовую информацию о сервисе, метрики и целевые показатели.
  3. Настройте алерты — определите условия срабатывания предупреждений на основе скорости сгорания бюджета ошибок.
  4. Сгенерируйте и скачайте — сервис упакует готовые OpenSLO и конфигурации алертов в ZIP-архив.

📁 Доступные шаблоны

SLOzy предоставляет широкий выбор готовых шаблонов для различных компонентов инфраструктуры:

  • CI/CD Pipeline (Jenkins, GitLab CI)
  • Kubernetes Infrastructure (API server, nodes)
  • Load Balancer (Nginx, HAProxy, Envoy)
  • Database Service
  • Message Queue (Kafka, RabbitMQ)
  • Cache System (Redis, Memcached)
  • Object Storage (S3, MinIO)
  • IoT Devices и Mobile Application
  • Monitoring System (Prometheus, Grafana)
  • Prometheus Latency SLO — готовый SLO для задержек HTTP-сервисов

📊 Конфигурация метрик и алертов

В форме можно задать ключевые параметры и SLOzy автоматически сгенерирует политики алертинга на основе скорости сгорания error budget (burn rate):

  • Идентификатор и описание SLO.
  • Тип метрики: например, задержка (latency) или доступность (availability).
  • Целевое значение: пороговый процент успешных событий (например, 99.9%).
  • Пороги для алертов: настройка мультипликаторов скорости сгорания бюджета ошибок (например, "в 10x быстрее за 1 час" для алерта).
  • Интеграции: поддерживаются уведомления в Slack, Telegram, PagerDuty, email и через webhook.

Вместо написания многострочных YAML-файлов, пользователь получает готовый, валидный и соответствующий лучшим практикам набор конфигураций, который можно сразу применить в инфраструктуре, поддерживающей OpenSLO (например, с использованием операторов или инструментов вроде Pyrra).

Инструмент идеально подходит для Platform-инженеров, SRE-команд и tech lead'ов небольших и средних компаний, которым важно внедрить практики SRE без необходимости интегрировать монструозные платформы вроде Nobl9 или Datadog SLO Management. Особенно ценен для стартапов и команд с принципом "keep it simple".

Сервис работает полностью в браузере, не требует регистрации для базового использования и поддерживает экспорт конфигураций для последующей интеграции в CI/CD-pipelines.

SLOzy демонстрирует, что управление надёжностью может быть технически строгим и одновременно предельно простым в повседневном использовании.