Similar presentations:
Аудит доступность и непрерывность
1.
Аудит процесса Управлениедоступностью
2.
Цель• Оптимизировать возможности
инфраструктуры, сервисов, и
ИТ подразделений для
предоставления бизнесу
эффективного с точки зрения
затрат и постоянного уровня
доступности
3.
Задачи• Определение требований
бизнеса
• Оценка реализуемости
• Планирование
• Согласование, реализация,
мониторинг
4.
• сложность ИТ-инфраструктуры;• надежность компонентов;
Основные
факторы
• способность быстро и эффективно
реагировать на сбои;
• качество обслуживания и качества
работы поддерживающих организаций и
поставщиков;
• качество и границ компетенции
процессов операционного управления.
5.
Среднее время ремонта (Mean Time to Repair – MTTR) – среднее времямежду возникновением сбоя и восстановлением сервиса, также известное
как «простой».
Среднее время между сбоями (Mean Time Between Failures – MTBF) –
среднее время между восстановлением после одного сбоя и
возникновением другого, также известное как «период
работоспособного состояния».
Среднее время между системными инцидентами (Mean Time Between
System Incidents – MTBSI) – среднее время между двумя
последовательными инцидентами. Данная метрика представляет
собой сумму двух метрик MTTR и MTBF.
6.
Время простоя, недоступности услуг.
Время недоступности компонентов.
Время обнаружения инцидента.
Время реагирования на инцидент.
Время восстановления при инциденте.
Время восстановления после инцидента.
Время возобновления обслуживания после инцидента.
Время разрешения инцидента.
Среднее время между системными инцидентами(MTBSI).
Среднее время ликвидации простоя, среднее время восстановления доступности
(MTTR).
Время простоя в критические периоды.
Время недоступности услуг внешнего подрядчика.
Время недоступности компонентов, принадлежащих внешнему подрядчику.
Время возобновления недоступных услуг.
Число повторных сбоев.
7.
Вопросы при аудите процесса управления доступностьюсервисов
Владелец процесса
Его мотивация
KPI
Потребители результата процесса
Их степень удовлетворенности
Что не устраивает?
Что добавить?
Качество реализации всех аспектов процесса
8.
Аудит процессаУправление
непрерывностью
9.
Цель:• Обеспечить
непрерывность
ключевых бизнеспроцессов в
чрезвычайной
ситуации посредством
восстановления
необходимой части
10.
Задачи• Согласование с планом по
непрерывности бизнеса.
• Внедрение (планы
восстановления, резервы).
• Операционное управление
(обучение, тестирование,
тренинги).
11.
Чрезвычайная ситуация (бедствие, катастрофа ) – это событие,которое оказывает такое негативное воздействие на функционирование
сервиса или системы, что требуются значительные, усилия для
восстановления изначального уровня производительности.
12.
Отвечает за:оценку воздействия нарушений в работе ИТ–сервисов после возникновения
чрезвычайной ситуации;
определение критичных для бизнеса сервисов, которые требуют
дополнительных превентивных мер;
определение периода времени, в течение которого сервис должен быть
восстановлен;
принятие мер по предотвращению, обнаружению, подготовке к
чрезвычайным ситуациям или по уменьшению степени их воздействия;
определение общего подхода к восстановлению услуг;
разработку, тестирование и поддержку плана восстановления с достаточным
уровнем детализации, который поможет пережить чрезвычайную ситуацию и
восстановить нормальную работу за заданный период времени.
13.
Введение• Описание структуры плана и предполагаемых средств восстановления.
Обновление
• Описание процедур и соглашений по поддержке актуальности плана и отслеживанию
изменений в инфраструктуре.
Маршрутный лист
• Маршрутный лист показывает, какие разделы плана должны быть направлены в каждую
группу.
Начало восстановления
• Описание времени и условий начала действия плана.
Классификация чрезвычайных обстоятельств
• Если в плане дается описание процедур на случаи различных чрезвычайных обстоятельств,
то они должны быть описаны с точки зрения их серьезности, длительности и уровня
повреждений.
Разделы для участвующих групп специалистов
• План должен быть разделен на шесть разделов по количеству областей действия и
закрепленных на за ними групп специалистов: администрация, ИТ-инфраструктура,
персонал, безопасность, площадки восстановления, возврат к нормальным условиям .
14.
Администрация• Как и когда вводить план в действие?
• Какие руководители и специалисты участвуют в нем?
• Где находится центр управления?
ИТ-инфраструктура
• Техническое обеспечение, телекоммуникационные средства,
соответствующие процедуры, а также неактивированные
(«дремлющие») договоры на закупку новых ИТ-компонентов.
Персонал
• Персонал, необходимый для работы в резервном центре,
возможно, средства транспортировки и размещение персонала.
Безопасность
• Инструкции по защите от краж, ЧС, а также информация о
внешних хранилищах.
Площадки
восстановления
• Информация о договорах, персонале с указанием конкретных
функций в системе безопасности и транспорте.
Возврат к нормальным
условиям
• Процедуры восстановления нормальной инфраструктуры.
15.
РольОтветственность в обычных условиях
Ответственность в кризисных
ситуациях
Совет
директоров
Инициация процесса ВСМ. Выделение персонала и
ресурсов. Выработка политики. Определение
полномочий в рамках процесса.
Руководство действиями в кризисной
ситуации.
Принятие корпоративных бизнесрешений.
Высшее
руководство
Управление процессом ITSCM. Утверждение планов,
отчетов о тестировании и т. д. Коммуникации в
компании и создание осведомленности в компании.
Интеграция процесса ITSCM в процесс ВСМ.
Координация и арбитраж (принятие
окончательных решений).
Предоставление персонала, ресурсов
и финансовых средств.
Руководство
Проведение анализа рисков.
Определение, какие должны быть результаты
работы. Составление проектов договоров.
Руководство тестированием, оценкой и
составлением отчетов.
Приведение в действие механизмов
восстановления и обеспечения.
Руководство командами
непрерывности. Составление
отчетов.
Проработка способов достижения результатов
работы.
Ведение переговоров по предоставляемым услугам.
Проведение тестов, оценок и составление отчетов.
Разработка и внедрение процедур.
Реализация плана восстановления.
Руководители
команд и члены
команд
16.
• Число услуг, не охватываемых планом ITSC.• Задержка с подготовкой/обновлением плана ITSC.
• Задержка с тестированием плана ITSC.
• Число проблем, выявленных при последнем тестировании и еще не решенных.
• Результаты опроса по осведомленности о непрерывности предоставления ИТ-услуг
проведенного выборочно — процент удовлетворительных ответов.
• Число выявленных за данный период проблем, которые ставят под угрозу план
ITSC.
• Число писем, предназначенных для конкретной группы сотрудников.
• Число неверных записей в справочнике группы кризисного контроля.
• Запаздывание готовности резервных мощностей.
• Степень удовлетворенности клиентов.
17.
Вопросы при аудите процесса управлениянепрерывностью сервисов
Владелец процесса
Его мотивация
KPI
Потребители результата процесса
Их степень удовлетворенности
Что не устраивает?
Что добавить?
Качество реализации всех аспектов процесса