Одна из крупных кредитных организаций России испытывала проблемы с системой «клиент-банк» — сервис часто оказывался недоступен для конечных пользователей. ИТ-департамент компании никак не мог найти причины сбоя, используя инфраструктурный мониторинг, и был вынужден перезагружать сервера, чтобы система вновь заработала. Найти причину «неработоспособности» сервиса не удавалось на протяжении долгого времени.
Чтобы найти корень проблемы, банку требовалось APM-решение — Application Performance Monitoring, или инструмент мониторинга производительности приложений.
Инструмент такого типа позволяет собирать как инфраструктурные метрики (ЦПУ, память, свободное место, загрузка сетевых интерфейсов), так и отслеживать состояния различных компонентов самого Сервиса (программное обеспечение, которое обеспечивает работу конечного продукта: веб-серверы, серверы контента, базы данных и т.д.).
Задачи
- Найти причины сбоев системы «клиент-банк»
- Внедрить новый инструмент мониторинга производительности приложений Dynatrace
Специалисты ICL Services предложили внедрить в банке решение Dynatrace — компании, которая восемь лет подряд занимает лидирующую позицию в квадранте Гартнера.
Заказчик согласился использовать продукт Dynatrace в пилотном режиме. Внедрение проходило в августе 2018 года. Специалисты ICL Services на этапе планирования запросили все необходимые ресурсы и указали все технические условия для выполнения работ: список серверов, которые обеспечивают работу сервиса и которые будут включены в мониторинг; порты, которые должны быть открыты для функционирования Dynatrace; требуемые ресурсы для самого продукта Dynatrace.
Поскольку у заказчика были повышенные требования по информационной безопасности, то удаленно внедрить Dynatrace было невозможно, поэтому было принято решение проводить внедрение на территории Банка. Служба безопасности Банка заранее запросила полностью расписать решение — на каких серверах будут стоять агенты, по каким портам будет работать коммуникация между агентами и сервером Dynatrace, какие учетные записи, и с какими правами доступа необходимы для работы АРМ-решения.
После всех согласований и выполнения озвученных технических условий, был запланирован выезд специалиста ICL Services в офис банка. Установка и первоначальное конфигурирование Dynatrace заняло три дня. Дополнительно, на второй день работ, были установлены агенты на тестовые сервера, т.к. заказчик хотел убедиться, что Dynatrace не тратит много серверных ресурсов и не влияет на работу сервиса «Клиент-Банк».
На следующий день, когда банк убедился, что Dynatrace не оказывает влияния на производительность системы, агентское решение было развернуто на «боевой» контур — 20 серверов, которые обслуживают сервис «Клиент-Банк».
Результаты
- Благодаря еженедельным отчетам по работе сервиса в целом, бизнес сразу видел, как влияет недоступность сервисов на конечных пользователей
- Отчет подсвечивал разработчикам неоптимизированные запросы к базе и проблемные места в коде приложения
- Отчет подсвечивал ИТ-департаменту проблемы инфраструктуры + нагрузку в сети и связь между всеми компонентами инфраструктуры
Предоставленные услуги и решения
Старший руководитель группы систем управления ИТ-инфраструктурой