SLOzy¶
SLOzy (произносится как "slozy", от SLO + easy & lazy) — это веб-сервис, который позволяет инженерам (и не только) создавать декларативные файлы Service Level Objectives (SLO) в формате OpenSLO с готовыми настройками алертов, не написав ни строчки YAML вручную.
Сервис решает типичную проблему SRE и платформенных команд: ручное написание и поддержка корректных SLO-манифестов, которая требует глубоких знаний синтаксиса и лучших практик. SLOzy автоматизирует этот процесс через простую веб-форму.
Интерфейс представляет собой единую форму, где за несколько кликов задаются все критические параметры: название сервиса, метрика для измерения (доступность, latency, error rate), целевой процент (например, 99.9%) и пороговое значение. Поддерживаются PromQL-подобные запросы для интеграции с существующими системами мониторинга.
🔧 Как это работает¶
- Выберите шаблон (или начните с нуля) — сервис предлагает готовые пресеты для разных систем
- Заполните форму — укажите базовую информацию о сервисе, метрики и целевые показатели.
- Настройте алерты — определите условия срабатывания предупреждений на основе скорости сгорания бюджета ошибок.
- Сгенерируйте и скачайте — сервис упакует готовые OpenSLO и конфигурации алертов в ZIP-архив.
📁 Доступные шаблоны¶
SLOzy предоставляет широкий выбор готовых шаблонов для различных компонентов инфраструктуры:
- CI/CD Pipeline (Jenkins, GitLab CI)
- Kubernetes Infrastructure (API server, nodes)
- Load Balancer (Nginx, HAProxy, Envoy)
- Database Service
- Message Queue (Kafka, RabbitMQ)
- Cache System (Redis, Memcached)
- Object Storage (S3, MinIO)
- IoT Devices и Mobile Application
- Monitoring System (Prometheus, Grafana)
- Prometheus Latency SLO — готовый SLO для задержек HTTP-сервисов
📊 Конфигурация метрик и алертов¶
В форме можно задать ключевые параметры и SLOzy автоматически сгенерирует политики алертинга на основе скорости сгорания error budget (burn rate):
- Идентификатор и описание SLO.
- Тип метрики: например, задержка (latency) или доступность (availability).
- Целевое значение: пороговый процент успешных событий (например, 99.9%).
- Пороги для алертов: настройка мультипликаторов скорости сгорания бюджета ошибок (например, "в 10x быстрее за 1 час" для алерта).
- Интеграции: поддерживаются уведомления в Slack, Telegram, PagerDuty, email и через webhook.
Вместо написания многострочных YAML-файлов, пользователь получает готовый, валидный и соответствующий лучшим практикам набор конфигураций, который можно сразу применить в инфраструктуре, поддерживающей OpenSLO (например, с использованием операторов или инструментов вроде Pyrra).
Инструмент идеально подходит для Platform-инженеров, SRE-команд и tech lead'ов небольших и средних компаний, которым важно внедрить практики SRE без необходимости интегрировать монструозные платформы вроде Nobl9 или Datadog SLO Management. Особенно ценен для стартапов и команд с принципом "keep it simple".
Сервис работает полностью в браузере, не требует регистрации для базового использования и поддерживает экспорт конфигураций для последующей интеграции в CI/CD-pipelines.
SLOzy демонстрирует, что управление надёжностью может быть технически строгим и одновременно предельно простым в повседневном использовании.