Цель проекта
Обеспечить работоспособность и доступность ИТ инфраструктуры в соответствии с SLA за счет комплексной поддержки ЦОД.
Задача. Точка старта
Эксплуатация инженерной и ИТ-инфраструктуры двух корпоративных (ИИ) ЦОД в г. Москва. ЦОДы реализованы в виде отдельностоящих модульных зданий, полностью оснащенных всеми инженерными системами с соблюдением требований к топологии уровня TIER III. ИТ-комплекс реализована с высокой степенью отказоустойчивости и обеспечивает полное взаимное резервирование информационных систем Заказчика. Специфика бизнес-требований и особенности размещения ЦОД предполагают полную поддержку on-site в режиме 24/7, а также минимальное время восстановления и ремонта всех компонентов ЦОД силами внешнего подрядчика.
Состав ЦОД:
- 2 независимых ЦОД каждый емкостью около 80 стоек
- комплексная вычислительная инфраструктура: x86 сервера, СХД, SAN, СРК
- подведенная мощность каждого ЦОД – 1 МВт
- территориально разнесенные объекты
Решение
Сценарий реализации выбран с учетом всех требований Заказчика и лучшими мировыми практиками.
Услуги по эксплуатации ЦОД
В качестве решения была предложена модель комплексной эксплуатации ЦОД, включающая в себя отдельные ИТ и инженерные службы, структурированные согласно функционалу и решаемым задачам:
Служба эксплуатации ИТ инфраструктуры, функционал
24/7 Дежурная смена по эксплуатации ИТ-инфраструктуры
- мониторинг ИТ инфраструктуры
- оперативное сопровождение и обслуживание оборудования и платформы виртуализации
- участие в разрешении инцидентов, проблем, реализация запросов на изменения в части их касающейся
- инвентаризация ИТ активов
- ведение кабельного журнала и рабочей документации по ИТ инфраструктуре
- управление складом ЗИП
- взаимодействие со службами Заказчика и открытие инцидентов в техподдержке вендоров
- подготовка отчетности по результатам работы
Служба администрирования
- анализ ключевых показателей мониторинга
- формирование заданий на обслуживание и внесение изменений для оборудования и платформы виртуализации
- разрешение инцидентов и проблем по ИТ инфраструктуре. Экспертная поддержка дежурной службы
- подготовка рекомендаций по улучшению работы ИТ инфраструктуры
- разработка рекомендаций по развитию ИТ инфраструктуры
- администрирование ИТ инфраструктуры
- оценка производительности и отказоустойчивости ИТ инфраструктуры
Проактивные работы
- Обновление микрокодов оборудования.
- Анализ производительности СХД.
- Выделенная команда поддержки.
- Выделенный ASM менеджер.
- Доступ к центру компетенций.
- Анализ SAN сетей.
- Анализ и настройка производительности серверного оборудования.
Служба эксплуатации инженерной инфраструктуры (ИИ), функционал
24/7 Дежурная смена по инженерной инфраструктуре
- Сопровождение и мониторинг ЦОД в режиме 24/7.
- Эксплуатация ИИ ЦОД.
- Проактивный мониторинг.
- Инцидентное реагирование, купирование аварий.
- Склад ЗИП.
- Базовое плановое обслуживание элементов инфраструктуры.
- Управление изменениями и ведение основных регламентов и процедур.
- Взаимодействие со службами Заказчика.
24/7 Аварийная служба
- Устранение последствий аварий и проведение ремонта (инцидентные выезды).
- Время реагирования – 2 часа.
- Поддержка Дежурной смены при аварийных ситуациях.
- Удаленный мониторинг состояния инженерной инфраструктуры.
5/8 Инженерная служба
- Разработка и внедрение модели и процессов службы эксплуатации ЦОД.
- Экспертное сопровождение и поддержка Дежурной смены.
- Управление эксплуатацией и обслуживанием ЦОД.
Сервисное обслуживание
- Проведение плановых ТО
- Замена и модернизация элементов ИИ (плановые выезды)
Результат
Обеспечена работоспособность и доступность ИТ инфраструктуры в соответствии с SLA за счет комплексной поддержки ЦОД.
Основные параметры сети ЦОД