← Процессы

Change Management: управление изменениями по ITIL 4

Change Management (в ITIL 4 переименован в Change Enablement) — процесс контролируемого внесения изменений в IT-услуги и инфраструктуру с целью минимизации рисков для стабильности. Главная задача — не тормозить изменения, а обеспечить, что они внедряются с учётом возможных последствий, согласованы с заинтересованными сторонами и могут быть откачены при проблемах.

12 мин чтения Команда TIQQET
ITILChange ManagementПроцессы
Change Enablement: управление изменениями по ITIL 4 RFC Запрос на изменение КЛАССИФИКАЦИЯ Стандартное Нормальное Экстренное ЖИЗНЕННЫЙ ЦИКЛ 1 Оценка рисков 2 Согласование CAB 3 Планирование окна 4 Внедрение 5 PIR · ретроспектива ПОКАЗАТЕЛИ Успешность 96% Emergency < 5% Rollback < 3% CAB / мес. 2-4

Зачем нужен процесс управления изменениями

Большинство серьёзных инцидентов в IT-инфраструктуре — результат плохо продуманных изменений. Обновили версию библиотеки — легло приложение. Перенастроили firewall — отвалился филиал. Мигрировали БД — сломалась интеграция. По разным оценкам, 60–80% инцидентов в продакшене связаны с недавними изменениями.

Change Management решает эту проблему через формализацию:

В ITIL 4 процесс называется Change Enablement — «разрешение изменений», а не «управление». Смысл: IT не должен быть тормозом для бизнеса. Задача — не запрещать, а обеспечивать возможность внедрять изменения быстро и безопасно.

Три типа изменений

Стандартные изменения

Низкий риск, типовая процедура, предварительно утверждённый шаблон. Не требуют индивидуального согласования каждый раз. Примеры:

Стандартные изменения — 70–80% от общего потока. Чем больше изменений вы можете переводить в эту категорию, тем ниже накладные расходы.

Нормальные изменения

Требуют оценки рисков и формального согласования. Это основной поток «серьёзных» изменений. Примеры:

Для нормальных изменений работает полный цикл: оценка → CAB → планирование → внедрение → PIR.

Экстренные изменения

Проводятся срочно для устранения критичного инцидента или угрозы безопасности. Согласование — в упрощённой процедуре (Emergency CAB или устное согласование CTO/CIO), но обязателен разбор постфактум.

Доля экстренных изменений — важный индикатор. Выше 5% от всех изменений — симптом проблем: либо плохое планирование, либо команда использует «emergency» как способ обойти формальный процесс. Оба варианта требуют вмешательства.

Жизненный цикл RFC

Стандартный поток для нормального изменения включает пять этапов:

  1. Регистрация RFC — заявитель описывает изменение: что, зачем, когда, какие системы затронуты, план реализации, план отката.
  2. Оценка рисков и impact-анализ — назначенный инженер анализирует возможные последствия, затрагиваемые сервисы, необходимые ресурсы.
  3. Согласование CAB (Change Advisory Board) — группа из представителей IT и бизнеса утверждает или отклоняет. Для мелких — упрощённое согласование.
  4. Планирование и выполнение — назначается окно работ (обычно вне рабочего времени), уведомляются пользователи, выполняется изменение.
  5. Post-Implementation Review (PIR) — через 1–7 дней разбор: всё ли прошло по плану, нужна ли корректировка, были ли инциденты.
Жизненный цикл RFC: от заявки до PIR ЖИЗНЕННЫЙ ЦИКЛ ИЗМЕНЕНИЯ RFC Оценкарисков CAB Внедрение PIR От подачи RFC до Post-Implementation Review: 5 этапов с обязательным разбором результата

CAB — Change Advisory Board

CAB — это регулярное совещание, на котором рассматриваются RFC. Типовой состав:

Частота — еженедельно или раз в две недели. Длительность — 30–60 минут. Повестка — список RFC с готовой документацией.

CAB не обязан разбирать каждый RFC. Стандартные изменения проходят без него (шаблон уже утверждён). Нормальные с низким риском — заочное согласование по email. На встрече — только спорные, высокорисковые или требующие координации между командами.

План отката: обязательный элемент

Ни одно изменение не должно приниматься без чёткого плана отката. Минимум вопросов, на которые отвечает rollback-план:

  1. Критерии отката — при каких симптомах принимается решение откатывать.
  2. Триггер решения — кто и в какой момент решает откатывать.
  3. Процедура отката — конкретные шаги, команды, восстановление из бэкапа.
  4. Оценка времени — за сколько физически можно откатиться.
  5. Кто выполняет — конкретные имена дежурных инженеров.

Для сложных изменений план отката репетируется на тестовой среде до выполнения на продакшене.

Окно изменений

Окно изменений (change window) — заранее согласованный интервал времени, в который проводятся работы с возможным downtime. Цели:

Типовые окна:

Критичные системы часто имеют change freeze — периоды, когда изменения запрещены полностью (например, закрытие квартала, чёрная пятница, год).

Post-Implementation Review

PIR — обязательный этап, который большинство команд пропускает. Зря. Это 15-минутный разбор, который отвечает на 5 вопросов:

  1. Достигнуты ли цели изменения?
  2. Соответствует ли фактический результат плану?
  3. Были ли незапланированные downtime или инциденты?
  4. Что сработало хорошо?
  5. Что можно улучшить в следующий раз?

Результат PIR — пополнение базы знаний и корректировка шаблонов для будущих изменений. Подробнее о БЗ — в статье о базе знаний.

Метрики процесса

МетрикаФормулаЦелевое значение
Successful changes(успешные / всего) × 100%≥ 95%
Emergency rate(emergency / всего) × 100%≤ 5%
Rollback rate(откаченные / всего) × 100%≤ 3%
Incidents caused by changesинциденты из-за измененийтренд вниз
Average lead timeот RFC до выполнениязависит от типа
Changes per monthабсолютное количествозависит от масштаба

Типовые ошибки

Поддержка в ITSM-системе

Технологически Change Management требует:

Всё это есть в TIQQET как встроенный workflow.

Вывод

Change Management — это не бюрократия, а страховка от крупных инцидентов. Хорошо выстроенный процесс сокращает количество аварий, связанных с изменениями, на 40–60% в первый же год.

Ключ к успеху — дифференцированный подход. Стандартные изменения проходят на автопилоте, нормальные получают CAB-внимание, экстренные — упрощённую процедуру с обязательным разбором. Лёгкая процедура плюс жёсткий PIR работают лучше, чем тяжёлый формализм плюс саботаж.

Попробуйте TIQQET в деле

On-premise ServiceDesk с полным циклом заявок, SLA-контролем и мобильными приложениями. Развёртывание за 1 день.

Посмотреть демо

Частые вопросы

Чем изменение отличается от сервисного запроса?

Изменение затрагивает услугу или инфраструктуру в целом (меняется конфигурация, обновляется версия, добавляется функциональность). Сервисный запрос — это выполнение стандартной процедуры для одного пользователя (выдать доступ, установить ПО). Если вы выдаёте доступ одному — это запрос. Если меняете политику доступа для всех — это изменение. Подробнее — в статье о классификации обращений.

Нужен ли CAB в небольшой компании?

В формальном виде — нет. Достаточно краткого согласования с руководителем IT. Но принцип остаётся: любое изменение фиксируется как RFC, оценивается риск, утверждается, имеет план отката. По мере роста команды можно ввести регулярные «мини-CAB» на 15 минут раз в неделю.

Что делать с emergency-изменениями в выходной?

Эти изменения проводятся по упрощённой процедуре: устное согласование дежурного руководителя, немедленное выполнение, обязательное оформление RFC постфактум (в течение 1 рабочего дня) и разбор на следующем CAB. Без формализации постфактум emergency превращается в лазейку для любых срочных изменений.

Как автоматизировать стандартные изменения?

Создаются шаблоны: каждый шаблон — один тип стандартного изменения с предзаполненными полями, процедурой, планом отката и предварительным одобрением. Пользователь заполняет форму за 1 минуту, изменение уходит сразу в выполнение, минуя CAB. Пример: сброс пароля, выдача VPN-доступа, установка ПО из каталога.

Сколько людей должно быть в CAB?

5–7 человек для средней компании. Меньше 3 — нет реального разнообразия мнений, больше 10 — встречи превращаются в трату времени. Важен не количественный состав, а наличие представителей: инфраструктура, приложения, безопасность, бизнес.

Что считать успешным изменением?

Три условия: (1) цель достигнута (система обновлена/перенастроена как планировалось), (2) не было незапланированного downtime сверх согласованного окна, (3) в течение 7 дней после изменения не возникло связанных инцидентов. Если одно из трёх нарушено — изменение проходит как частично успешное с разбором причин.