Почему обслуживание ИТ-инфраструктуры становится проблемой, и как ее решить?
Решение проблем с производительностью ИТ-инфраструктуры в трети случаев занимает больше месяца, по данным исследования Forrester Research. Причиной столь большой задержки являются попытки управлять сетями без достаточной видимости и понимания, как именно пользователи воспринимают качество работы приложения. В то же время, проблемы и способы их решения одинаковы для большинства компаний, осуществляющих миграцию на современные ИТ.
Суть проблемы
Ключевая причина многих проблем в том, что объективные показатели производительности ИТ-системы не равнозначны пользовательскому опыту. Обычное дело, когда панель мониторинга сети показывает, что все в порядке, а пользователи заявляют о плохом качестве работы сервисов. Причины такого явления могут быть разными, например, плохое взаимодействие разных элементов инфраструктуры. Оператор сети не видит этих проблем, так как по отдельности элементы сети работают в рамках спецификаций. ИТ-команды в таком случае могут исходить только из предположений о причине неполадок. В конечном счете, поиск и исправление проблемы могут затянуться на недели, а обсуждение таких ситуаций — привести к конфликтам, потере репутации, упущенной выгоде.
Предприятия инвестируют значительные средства в модернизацию ИТ и переходят от морально устаревшей традиционной инфраструктуры к гибридным облачным и виртуализированным средам. Одновременно быстро увеличивается объем обрабатываемых данных, расширяются центры обработки данных (ЦОД). Технический прогресс также приводит к росту ожиданий пользователей. Это предъявляет новые требования к ИТ-командам, которые и без того уже борются с проблемами миграции сетей.
В конечном итоге растет разрыв между ожиданиями и реальным опытом пользователей. Специалисты поддержки сети не способны быстро устранить проблемы, которые потребляют все больше и больше ресурсов предприятий.
Опросы, проведенные в последние два года компанией Gartner, показывают: примерно половина сетевых инженеров отметили, что они не видят происходящего в облаке, 32% имеют ограниченную видимость, а 79% недовольны результатами попыток оценки пользовательского опыта с помощью традиционных показателей производительности сети.
Таким образом, ИТ-команды зачастую вынуждены использовать для оценки субъективного потребительского опыта инструменты, которые были разработаны для совсем других целей — мониторинга технических параметров сети.
Что делать?
Многие команды техподдержки пытаются работать с сетями в условиях недостаточной видимости. Однако очень часто необходимо устранить проблему с определенным приложением, например в экосистемах Oracle или Microsoft, у которого свои уникальные характеристики и поведение. В итоге выясняется, что у приложения слишком большое время отклика или высокая задержка. Но все это без контекста и четкого понимания того, какие именно сложности испытывает пользователь.
Конечно, наиболее простой способ — это увидеть работу приложения глазами пользователя, то есть лично или через удаленный доступ. Но в современных условиях это не всегда возможно из-за сокращения ИТ-бюджетов, ограничения прав и большого количества собственных устройств сотрудников, работающих в сетях предприятий (концепция BYOD).
Хорошая новость в том, что новые технологии могут оптимизировать рабочие нагрузки и облегчить работу ИТ-команды. Машинное обучение, софт с элементами ИИ, алгоритмические измерения позволяют собирать данные о событиях в режиме реального времени в удаленных и локальных средах. Более того, современные инструменты мониторинга в некоторых случаях могут предупредить о надвигающихся проблемах еще до того, как пользователь обратится в техподдержку.
Согласно исследовательскому отчету Gartner «Network Performance Monitoring and Diagnostics» за февраль 2019 г., тройка лидеров рынка мониторинга ИТ-систем остается неизменной: NETSCOUT, Riverbed и VIAVI Solutions.
В частности, компания NETSCOUT предлагает программно-аппаратный комплекс Visual TruView, обеспечивающий мониторинг производительности каналов связи и бизнес-приложений.
Решение Visual TruView нацелено на превентивное выявление проблемы, то есть до того, как пользователь будет вынужден обратиться в техподдержку. Комплекс может использоваться совместно с сетевым анализатором OptiView XG.
NETSCOUT Visual TruView
Подобные системы учитывают актуальные требования по автоматизации анализа сбоев в работе приложений в условиях сокращенных штатов и бюджетов. При этом портативный сканер помогает проще найти технические проблемы на стороне клиента и в любой точки сети, включая ЦОД.
Но, что важнее, наличие современных инструментов для анализа реального пользовательского опыта позволяет не тратить время на проверку предположений. Техподдержка и клиенты могут беседовать на одном языке и эффективно выполнять свои задачи.
Появились вопросы или нужна консультация? Обращайтесь!
Вечный параноик, Антон Кочуков.
См. также:
Авторизуйтесь для этого