Конференция завершена. Ждем вас на РИТ++ в следующий раз!

Что мы узнали об SRE, когда обработали первые 150к production-инцидентовSRE-практики

Доклад принят в программу конференции
Матвей Кукуй
Grafana Labs

In charge of Grafana OnCall, ex-CEO at Amixr.IO, ex. Cisco CA.

Тезисы

Мы в Amixr.IO пропускаем через свой бэкенд production-инциденты клиентов. Готовы поделиться статистикой, инсайтами о том, как десятки команд по всему миру дежурят, разбирают инциденты, организуют работу и строят надежные системы.

Это вариант вводной лекции по SRE через кейсы из реальной жизни, подкрепленные статистикой и нашим опытом.

Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
,
Менеджмент в эксплуатации
,
Devops / другое
,
Профессиональное развитие инженера

Другие доклады секции SRE-практики