Организация системы мониторинга, определение вместе с клиентом критических показателей по проекту.
Критические показатели аппаратного обеспечения (для примера: температура процессора, работа кулеров, «здоровье» жестких дисков в RAID-массиве, SMART-статус жестких дисков).
Критические показатели уровня операционной системы (для примера: нагрузка на CPU, загруженность оперативной памяти, нагрузка на дисковую подсистему).
Критические показатели серверного программного обеспечения (для примера: нагрузка на чтение/запись серверов БД, число запросов в секунду, активных соединений на веб-сервере, заполненность систем кэширования, число сообщений об ошибках в журналах веб-сервера за последнюю минуту).
Критические показатели уровня конечной системы (для примера: число сообщений в журналах конечной системы, время ответа, доступность системы).
Критические показатели уровня бизнес-логики (для примера: число определенных действий пользователя, время, прошедшее с момента оформления последнего заказа, автоматическое тестирование выполнений заданных действий пользователем).
Реагирование в течение 15 минут в случае достижения заданных критических показателей.
Информирование клиента.
В случае, если проблема документирована, последовательность действий зафиксирована и клиент одобрил наши самостоятельные действия — самостоятельное выполнение действий для решения проблемы.
В случае, если проблема находится на стороне хостинг-площадки — выход на связь с хостинг-площадкой, локализация проблемы, контроль процесса решения.
В случае, если проблемы на уровне серверного ПО — локализация проблем, по согласованию с клиентом — применение изменений для решения проблем.
В случае, если проблемы на уровне приложения — связь с разработчиками, совместная работа по локалзиации проблемных мест.
В случае, если проблемы на уровне бизнес-логики — информирование клиента, дальнейшее содействие в локализации проблем.
Организация эффективного резервного копирования, регулярная проверка возможности восстановления из резервной копии, оценка рисков потери данных.
Содействие и консультации в организации систем отказоустойчивости, внедрение архитектуры отказоустойчивости, оценка рисков архитектуры.
Консультации по применению эффективных решений в области производительности систем.
Дополнительное системное администрирование.
До 10 часов системного администрирования в месяц (любые другие задачи, не упомянутые в 1-2-3 — установка программного обеспечения, его настройка).
Группа поддержки, взаимодействие с клиентом.
К работе подключаются 2 ведущих инженера, они в курсе всех деталей архитектуры.
20 дежурных администраторов в круглосуточном режиме следят за мониторингом проекта и реагируют на инциденты.
Тикетная система для долгих задач.
Прием заявок по e-mail, срочных — по телефону.
Мы используем cookies для быстрой и удобной работы сайта. Продолжая пользоваться сайтом, вы даёте согласие и принимаете политику
обработки персональных данных