Postmortem

Postmortem: шаблоны и чек-листы для продуктовых команд

Что такое postmortem и зачем он нужен

Определение и быстрые вводные

Postmortem — это структурированная встреча и документ после инцидента, релиза или сбоя в продукте. Цель: понять, что произошло, почему, как избежать повторения. Часто встречается в разработке, операциях, службах поддержки за пределами IT. Итог — не поиск виноватых, а улучшение процессов и общая безопасность продукта.

Почему это важно в работе продукта

Если не разбирать ошибки командно и документировать решения, проблемы накапливаются, решения теряются, а одни и те же грабли наступают снова. Грамотные postmortem приучают команду к рефлексии и открытости, формируют устойчивые процессы.

Важно, чтобы postmortem был не поиском виноватых, а инструментом развития и улучшения командной работы
Сьюзан Фаулер, инженер продакшн-инфраструктуры, Incident.io

Пример: после сбоя в подписках SaaS-сервиса команда собирает postmortem: фиксирует, где был сбой (например, ошибка в интеграции платежек), находит причину (недокументированный API-изменение), предлагает контрмеры (механизмы мониторинга, улучшение документации).

Классический шаблон postmortem

Базовая структура документа

В практике выделяют короткую и расширенную форму postmortem-документа. Минимально структура такая:

Краткое описание инцидента
Дата и время события
Влияние: кого затронуло, как проявилось
Детальный разбор причин
Итоговые действия: что сделано для устранения
Предложения по предотвращению
Ответственные и сроки
Открытые вопросы

Пример структуры (адаптируй под свою команду)

Инцидент: массовый откат оплаты 3 марта, недоступность клиентского кабинета
Когда: 3.03.2024, с 13:20 до 14:40
Влияние: 15% пользователей не смогли войти, рост обращений в поддержку
Причина: merge некорректного фикса без тестов
Действия: ручное восстановление платежей, обратная связь клиентам
Предотвращение: обязательные тесты в CI, чек-лист релиза
Ответственные: команда back-end, сроки внесения изменений до 7.03

Подробнее о шаблонах postmortem (Atlassian)

Чек-лист для качественного postmortem

Перед postmortem

Зафиксируй факты в хронологическом порядке без оценок
Подключи всех, кто был вовлечен
Собери логи, метрики, записи чатов
Сформулируй, что случилось с позиции пользователя и бизнеса

Во время обсуждения

Говори по фактам, избегай обвинений
Проверяй все гипотезы на источниках: код, логи, документация
Записывай каждый шаг: что, когда, кто, почему
Подмечай, что сработало хорошо — лучшие находки стоит закрепить

После postmortem

Зафиксируй итоги, сделай короткий summary
Назначь ответственных за изменения
Сделай публичный выводы, если это политика вашей компании
Добавь пост-аналитические задачи в трекер

Подробный чек-лист и готовые формы (SRE Google)

Типовые ошибки и антипаттерны проведения postmortem

Главные ошибки

Оценочные суждения и поиск виноватых
Размытые действия типа “повысить ответственность”
Недостаток конкретики: нет даты исправления или ответственного
Проведение ради галочки — документ уходит в стол, не применяется
Отсутствие обмена итогами с командой

Пример антипаттерна: после падения сервиса команда пишет общие формулировки без конкретики: “улучшить тестирование”, “быть внимательнее”, но не выделяет времени или ресурсов на реальную работу.

Хороший postmortem — это действие и обязательная обратная связь по результату, а не просто заполнил форму и забыл
John Allspaw, CTO Adaptive Capacity Labs, Blameless Postmortems

Как внедрять postmortem-культуру в команде

Минимальные шаги

Покажи выгоду для команды: повышение прозрачности, меньше повторов ошибок
Дай удобный шаблон, сохраняй постморты в общем доступе
Делай короткие встречи сразу после инцидента (до 1 дня)
Поощряй открытость: публично разбирай свои ошибки первым
Начинай с малого: шаблон, чек-лист — и постепенно расширяй практику

Пример внедрения

В стартапе с 10 разработчиками раньше обсуждали проблемы на летучках устно. После нескольких повторяющихся багов ввели короткий postmortem шаблон, делали встречи после значимых ошибок. Через месяц: команда быстрее находит причины сбоев, меньше разногласий между поддержкой и разработкой, проще защищать решения перед стейкхолдерами.

FAQ по postmortem

Когда считать инцидент достойным postmortem?
Если затронуто значимое число пользователей, нарушены SLA, был финансовый или репутационный ущерб. В команде можно установить минимальные критерии.

Кто должен участвовать в postmortem?
Те, кто был вовлечен в инцидент, а также представители смежных функций (разработка, поддержка, продукт).

Нужно ли делиться результатами postmortem публично?
Не всегда, но внутри команды обязательно. В крупных сервисах часто делятся с клиентами — повышает доверие.

Как не скатиться в поиск виноватых?
Фокусируйся на процессе, а не на персоналиях. Пиши формулировки: не человек совершил ошибку, а процесс не защитил от ошибки.

Сколько занимает подготовка postmortem?
В среднем 1-2 часа плюс встреча, если заранее собрать факты.

Как отследить, что меры из postmortem реализованы?
Вноси задачи в трекер, устанавливай дедлайны, проверяй статус на ретро.