SLOzy¶

SLOzy (произносится как "slozy", от SLO + easy & lazy) — это веб-сервис, который позволяет инженерам (и не только) создавать декларативные файлы Service Level Objectives (SLO) в формате OpenSLO с готовыми настройками алертов, не написав ни строчки YAML вручную.

Сервис решает типичную проблему SRE и платформенных команд: ручное написание и поддержка корректных SLO-манифестов, которая требует глубоких знаний синтаксиса и лучших практик. SLOzy автоматизирует этот процесс через простую веб-форму.

Интерфейс представляет собой единую форму, где за несколько кликов задаются все критические параметры: название сервиса, метрика для измерения (доступность, latency, error rate), целевой процент (например, 99.9%) и пороговое значение. Поддерживаются PromQL-подобные запросы для интеграции с существующими системами мониторинга.

🔧 Как это работает¶

Выберите шаблон (или начните с нуля) — сервис предлагает готовые пресеты для разных систем
Заполните форму — укажите базовую информацию о сервисе, метрики и целевые показатели.
Настройте алерты — определите условия срабатывания предупреждений на основе скорости сгорания бюджета ошибок.
Сгенерируйте и скачайте — сервис упакует готовые OpenSLO и конфигурации алертов в ZIP-архив.

📁 Доступные шаблоны¶

SLOzy предоставляет широкий выбор готовых шаблонов для различных компонентов инфраструктуры:

CI/CD Pipeline (Jenkins, GitLab CI)
Kubernetes Infrastructure (API server, nodes)
Load Balancer (Nginx, HAProxy, Envoy)
Database Service
Message Queue (Kafka, RabbitMQ)
Cache System (Redis, Memcached)
Object Storage (S3, MinIO)
IoT Devices и Mobile Application
Monitoring System (Prometheus, Grafana)
Prometheus Latency SLO — готовый SLO для задержек HTTP-сервисов

📊 Конфигурация метрик и алертов¶

В форме можно задать ключевые параметры и SLOzy автоматически сгенерирует политики алертинга на основе скорости сгорания error budget (burn rate):

Идентификатор и описание SLO.
Тип метрики: например, задержка (latency) или доступность (availability).
Целевое значение: пороговый процент успешных событий (например, 99.9%).
Пороги для алертов: настройка мультипликаторов скорости сгорания бюджета ошибок (например, "в 10x быстрее за 1 час" для алерта).
Интеграции: поддерживаются уведомления в Slack, Telegram, PagerDuty, email и через webhook.

Вместо написания многострочных YAML-файлов, пользователь получает готовый, валидный и соответствующий лучшим практикам набор конфигураций, который можно сразу применить в инфраструктуре, поддерживающей OpenSLO (например, с использованием операторов или инструментов вроде Pyrra).

Инструмент идеально подходит для Platform-инженеров, SRE-команд и tech lead'ов небольших и средних компаний, которым важно внедрить практики SRE без необходимости интегрировать монструозные платформы вроде Nobl9 или Datadog SLO Management. Особенно ценен для стартапов и команд с принципом "keep it simple".

Сервис работает полностью в браузере, не требует регистрации для базового использования и поддерживает экспорт конфигураций для последующей интеграции в CI/CD-pipelines.

SLOzy демонстрирует, что управление надёжностью может быть технически строгим и одновременно предельно простым в повседневном использовании.