Когда Kubernetes не помогает: кейс VIPAVENUE
Миграция на Kubernetes привела к замедлению работы сайта VIPAVENUE. Чтобы исключить финансовые и репутационные риски, был проведен аудит, который выявил проблемные места инфраструктуры.
Что было не так?
- Проект переехал на микросервисную архитектуру и в kubernetes, но вместо роста скорости и уменьшения количества проблем компания получила обратный результат.
- Скорость работы сайта в среднем снизилась.
- Появились таймауты между сервисами.
- Стали возникать жалобы пользователей на работу сайта – требовалась постоянная отладка и корректировка мелких проблем.
Кейс
VIPAVENUE – онлайн-версия крупнейшей региональной сети магазинов брендовой одежды, в которую входит 16 бутиков и 5 корнеров по всей стране. Компания работает на рынке более 25 лет, а онлайн-магазин VIPAVENUE ежемесячно посещают более 400 тысяч человек.
После переноса приложения в Kubernetes команда проекта столкнулась с проблемами: сайт стал тормозить, что негативно сказывалось на пользовательском опыте. Команда VIPAVENUE попросила нас определить причины сбоев, выявить проблемы при развертывании и настройке Kubernetes, найти узкие места в инфраструктуре онлайн-магазина и предложить решения.
За два месяца работы над проектом мы провели полный чекап состояния инфраструктуры, аудит Kubernetes. У нас было четыре направления исследования.
Что мы проверили
- Конфигурации worker нод;
- Жизненный цикл приложений в кластере;
- Надежность и стабильность кластера.
Какие проблемы выявили
- Часть инфраструктуры была не покрыта кодом – это значит, что при сбое или поломке всё пришлось бы настраивать с нуля;
- Другая часть кода не соответствовала имеющейся инфраструктуре;
- Имелись некоторые несоответствия в логике инфраструктуры.
Что мы проверили
- Конфигурации worker нод;
- Жизненный цикл приложений в кластере;
- Надежность и стабильность кластера.
- Команда проекта использовала Managed Cluster, то есть управляющая часть находилась под управлением хостера – это снижает, но не исключает риск каких-либо ошибок;
- Некоторые конфигурации были настроены неправильно – это негативно влияло на работу приложения.
Что мы проверили
- Логику пайплайнов;
- Инструменты;
- Шаблоны конфигурации и структуры;
- Безопасность.
Выявили проблему отсутствия мониторинга для отслеживания сбоев во время и после деплоя в Kubernetes, при том что процессы сборки и доставки работали штатно.
Что мы проверили
- Удобство набора инструментов для мониторинга k8s;
- Наличие всех необходимых метрик;
- Наличие всех необходимых алертов;
- Жизненный цикл алертов и инцидентов;
- Удобство и актуальность дашбордов.
Выявили проблему несбалансированного мониторинга: большая часть систем не была покрыта алертами, в то время как существующие уведомляли о малозначительных ошибках, что создавало риск пропустить реальный сбой.
Схема работы проекта
Результаты аудита для VIPAVENUE
- Подробные схемы действующей инфраструктуры, чтобы было проще исправлять недочеты;
- Детальный отчет обо всех ошибках и слабых местах в инфраструктуре, чтобы в будущем их не допускать;
- Приоритизированный план дальнейших действий, чтобы как можно скорее решить проблемы в порядке от самых критичных до самых безобидных;
- Онлайн-консультацию по итогам аудита, на которой мы рассказали заказчику о самых острых моментах, дали подсказки, как исправить ситуацию и сделать приложение быстрее и стабильнее.
Рекомендации
Стабильная и надежная инфраструктура – гарант устойчивости онлайн-бизнеса. Аудит Kubernetes – хорошая идея, если:
- Вы видите, что в процессе эксплуатации случаются рандомные рестарты приложений в кластере;
- Вы обнаружили проблемы или простои в процессе деплоя новых версий приложений;
- Вам нужно проверить интеграцию решения, чтобы быть уверенным в корректной адаптации пайплайнов и нормальном взаимодействии между системами;
- Вы хотите понять, с каких «узких мест» начать, чтобы сократить издержки проекта и сделать его эффективнее.
Искать weakpoints, мешающие развитию проекта, самостоятельно – зачастую долго и малоэффективно. Если вы хотите сэкономить время и силы, обратитесь за профессиональным аудитом. Экспертный взгляд со стороны поможет быстро и точно выявить «узкие места» – это сократит ваш путь к успеху. Напишите нам, чтобы обсудить ваш проект.
Упомянутые услуги
Ответим на заявку в ближайшие 24 часа. А еще мы можем проконсультировать вас по телефону +7 800 555-91-99, электронной почте info@itsumma.ru или в Telegram-чате.