Postmortem
Postmortem: шаблоны и чек-листы для продуктовых команд
Section titled “Postmortem: шаблоны и чек-листы для продуктовых команд”Что такое postmortem и зачем он нужен
Section titled “Что такое postmortem и зачем он нужен”Определение и быстрые вводные
Section titled “Определение и быстрые вводные”Postmortem — это структурированная встреча и документ после инцидента, релиза или сбоя в продукте. Цель: понять, что произошло, почему, как избежать повторения. Часто встречается в разработке, операциях, службах поддержки за пределами IT. Итог — не поиск виноватых, а улучшение процессов и общая безопасность продукта.
Почему это важно в работе продукта
Section titled “Почему это важно в работе продукта”Если не разбирать ошибки командно и документировать решения, проблемы накапливаются, решения теряются, а одни и те же грабли наступают снова. Грамотные postmortem приучают команду к рефлексии и открытости, формируют устойчивые процессы.
Важно, чтобы postmortem был не поиском виноватых, а инструментом развития и улучшения командной работы
Сьюзан Фаулер, инженер продакшн-инфраструктуры, Incident.io
Пример: после сбоя в подписках SaaS-сервиса команда собирает postmortem: фиксирует, где был сбой (например, ошибка в интеграции платежек), находит причину (недокументированный API-изменение), предлагает контрмеры (механизмы мониторинга, улучшение документации).
Классический шаблон postmortem
Section titled “Классический шаблон postmortem”Базовая структура документа
Section titled “Базовая структура документа”В практике выделяют короткую и расширенную форму postmortem-документа. Минимально структура такая:
- Краткое описание инцидента
- Дата и время события
- Влияние: кого затронуло, как проявилось
- Детальный разбор причин
- Итоговые действия: что сделано для устранения
- Предложения по предотвращению
- Ответственные и сроки
- Открытые вопросы
Пример структуры (адаптируй под свою команду)
Section titled “Пример структуры (адаптируй под свою команду)”- Инцидент: массовый откат оплаты 3 марта, недоступность клиентского кабинета
- Когда: 3.03.2024, с 13:20 до 14:40
- Влияние: 15% пользователей не смогли войти, рост обращений в поддержку
- Причина: merge некорректного фикса без тестов
- Действия: ручное восстановление платежей, обратная связь клиентам
- Предотвращение: обязательные тесты в CI, чек-лист релиза
- Ответственные: команда back-end, сроки внесения изменений до 7.03
Подробнее о шаблонах postmortem (Atlassian)
Чек-лист для качественного postmortem
Section titled “Чек-лист для качественного postmortem”Перед postmortem
Section titled “Перед postmortem”- Зафиксируй факты в хронологическом порядке без оценок
- Подключи всех, кто был вовлечен
- Собери логи, метрики, записи чатов
- Сформулируй, что случилось с позиции пользователя и бизнеса
Во время обсуждения
Section titled “Во время обсуждения”- Говори по фактам, избегай обвинений
- Проверяй все гипотезы на источниках: код, логи, документация
- Записывай каждый шаг: что, когда, кто, почему
- Подмечай, что сработало хорошо — лучшие находки стоит закрепить
После postmortem
Section titled “После postmortem”- Зафиксируй итоги, сделай короткий summary
- Назначь ответственных за изменения
- Сделай публичный выводы, если это политика вашей компании
- Добавь пост-аналитические задачи в трекер
Подробный чек-лист и готовые формы (SRE Google)
Типовые ошибки и антипаттерны проведения postmortem
Section titled “Типовые ошибки и антипаттерны проведения postmortem”Главные ошибки
Section titled “Главные ошибки”- Оценочные суждения и поиск виноватых
- Размытые действия типа “повысить ответственность”
- Недостаток конкретики: нет даты исправления или ответственного
- Проведение ради галочки — документ уходит в стол, не применяется
- Отсутствие обмена итогами с командой
Пример антипаттерна: после падения сервиса команда пишет общие формулировки без конкретики: “улучшить тестирование”, “быть внимательнее”, но не выделяет времени или ресурсов на реальную работу.
Хороший postmortem — это действие и обязательная обратная связь по результату, а не просто заполнил форму и забыл
John Allspaw, CTO Adaptive Capacity Labs, Blameless Postmortems
Как внедрять postmortem-культуру в команде
Section titled “Как внедрять postmortem-культуру в команде”Минимальные шаги
Section titled “Минимальные шаги”- Покажи выгоду для команды: повышение прозрачности, меньше повторов ошибок
- Дай удобный шаблон, сохраняй постморты в общем доступе
- Делай короткие встречи сразу после инцидента (до 1 дня)
- Поощряй открытость: публично разбирай свои ошибки первым
- Начинай с малого: шаблон, чек-лист — и постепенно расширяй практику
Пример внедрения
Section titled “Пример внедрения”В стартапе с 10 разработчиками раньше обсуждали проблемы на летучках устно. После нескольких повторяющихся багов ввели короткий postmortem шаблон, делали встречи после значимых ошибок. Через месяц: команда быстрее находит причины сбоев, меньше разногласий между поддержкой и разработкой, проще защищать решения перед стейкхолдерами.
FAQ по postmortem
Section titled “FAQ по postmortem”Когда считать инцидент достойным postmortem?
Если затронуто значимое число пользователей, нарушены SLA, был финансовый или репутационный ущерб. В команде можно установить минимальные критерии.
Кто должен участвовать в postmortem?
Те, кто был вовлечен в инцидент, а также представители смежных функций (разработка, поддержка, продукт).
Нужно ли делиться результатами postmortem публично?
Не всегда, но внутри команды обязательно. В крупных сервисах часто делятся с клиентами — повышает доверие.
Как не скатиться в поиск виноватых?
Фокусируйся на процессе, а не на персоналиях. Пиши формулировки: не человек совершил ошибку, а процесс не защитил от ошибки.
Сколько занимает подготовка postmortem?
В среднем 1-2 часа плюс встреча, если заранее собрать факты.
Как отследить, что меры из postmortem реализованы?
Вноси задачи в трекер, устанавливай дедлайны, проверяй статус на ретро.