Наш митап про надёжность и отказоустойчивость — как делать сервисы устойчивыми, быстро восстанавливаться, почему инциденты это нормально (и даже хорошо) и чем же всё таки отличается Reliability от Resiliency.
Математика SLO
Вадим Мартынов, лид команды надёжности, Яндекс
На прошлом митапе мы обсудили, как измерять надёжность. А теперь пора её улучшить! Для этого нам пригодится SLO — целевой уровень сервиса. Поговорим о том зачем нужен SLO для надёжности, как его использовать, из чего он может состоять и каким может быть первый шаг для его внедрения у себя в продукте или в своем сервисе.