Условия

  1. Организация системы мониторинга, определение вместе с клиентом критических показателей по проекту.
    1. Критические показатели аппаратного обеспечения (для примера: температура процессора, работа кулеров, «здоровье» жестких дисков в RAID-массиве, SMART-статус жестких дисков).
    2. Критические показатели уровня операционной системы (для примера: нагрузка на CPU, загруженность оперативной памяти, нагрузка на дисковую подсистему).
    3. Критические показатели серверного программного обеспечения (для примера: нагрузка на чтение/запись серверов БД, число запросов в секунду, активных соединений на веб-сервере, заполненность систем кэширования, число сообщений об ошибках в журналах веб-сервера за последнюю минуту).
    4. Критические показатели уровня конечной системы (для примера: число сообщений в журналах конечной системы, время ответа, доступность системы).
    5. Критические показатели уровня бизнес-логики (для примера: число определенных действий пользователя, время, прошедшее с момента оформления последнего заказа, автоматическое тестирование выполнений заданных действий пользователем).
  2. Реагирование в течение 15 минут в случае достижения заданных критических показателей.
    1. Информирование клиента.
    2. В случае, если проблема документирована, последовательность действий зафиксирована и клиент одобрил наши самостоятельные действия — самостоятельное выполнение действий для решения проблемы.
    3. В случае, если проблема находится на стороне хостинг-площадки — выход на связь с хостинг-площадкой, локализация проблемы, контроль процесса решения.
    4. В случае, если проблемы на уровне серверного ПО — локализация проблем, по согласованию с клиентом — применение изменений для решения проблем.
    5. В случае, если проблемы на уровне приложения — связь с разработчиками, совместная работа по локалзиации проблемных мест.
    6. В случае, если проблемы на уровне бизнес-логики — информирование клиента, дальнейшее содействие в локализации проблем.
  3. Аудит серверной инфраструктуры.
    1. Регулярный аудит корректности серверной конфигурации, серверного ПО.
    2. Организация эффективного резервного копирования, регулярная проверка возможности восстановления из резервной копии, оценка рисков потери данных.
    3. Содействие и консультации в организации систем отказоустойчивости, внедрение архитектуры отказоустойчивости, оценка рисков архитектуры.
    4. Консультации по применению эффективных решений в области производительности систем.
  4. Дополнительное системное администрирование.
    1. До 10 часов системного администрирования в месяц (любые другие задачи, не упомянутые в 1-2-3 — установка программного обеспечения, его настройка).
  5. Группа поддержки, взаимодействие с клиентом.
    1. К работе подключаются 2 ведущих инженера, они в курсе всех деталей архитектуры.
    2. 20 дежурных администраторов в круглосуточном режиме следят за мониторингом проекта и реагируют на инциденты.
    3. Тикетная система для долгих задач.
    4. Прием заявок по e-mail, срочных — по телефону.