Что такое AIOps: необходимость или маркетинг?
Аналитики Gartner предсказывают вместе с цифровой трансформацией бизнеса необходимость трансформации ИТ службы. Цифровая трансформация объединяет в себе использование новых технологий и их внедрение за короткий промежуток времени. Это требует концентрации усилий на написание, доработку новых приложений, сокращение времени внедрения новых релизов, взаимодействие разных приложений через API интерфейсы, использование машинных агентов и Интернета вещей. Новые подходы и технологии, недоступные ранее, делают традиционные стратегии и методы управления ИТ отстающими и не пригодными для быстрой трансформации.
Аналитики предсказывают, что мы увидим значительные изменения в текущих методиках и практиках эффективного управления гибридными ИТ-инфраструктурами. И ключ к этим изменениям - новая платформа, которую Gartner называет AIOps. И которая должна ответить на вызовы новых технологий.
Что такое AIOps?
AIOps расшифровывается как Artificial Intelligence for IT Operations. По сути это искусственный интеллект для управления ИТ на базе многослойной платформы, который автоматизирует обработку данных и принятие решения с помощью машинного обучения и аналитики больших данных, которые приходят с различных элементов ИТ-инфраструктуры в режиме реального времени.
AIOps состоит из двух основных компонентов: «большие данные» и «машинное обучение». Таким образом, ИТ специалисты должны отойти от логгирования и отслеживания множества отдельных событий (siloed IT), которые активно используются сейчас, а положиться на машинное обучение и анализ данных, которые приходят от систем мониторинга, журналов нарядов на работы и т.д.
Желаемый результат - непрерывный анализ, который даст ответы и позволит реализовать непрерывные улучшения и исправления в работе ИТ-инфраструктуры. Платформа AIOps связывает три дисциплины – управление услугами, управление производительностью и автоматизацию - для достижения желаемого результата и может рассматриваться как непрерывное совершенствование, интеграция и внедрение (CI/CD) основных ИТ функций.
Что должна иметь AIOps платформа?
На данном этапе разные производители предлагают избыточные или частичные решения AIOps, поэтому Gartner для того чтобы иметь возможность сравнивать различные решения определил 9 функциональных элементов, которые должна иметь AIOps платформа:
- Управление накопленными данными — программное обеспечение или аппаратный комплекс, которые позволяют записывать, индексировать и хранить полуструктурированные данные, которые поступают в больших объемах и с высокой скоростью. По своей сути это управление большими данными.
- Потоковое управление данными — программное обеспечение или аппаратный комплекс, которые позволяют осуществлять захват, возможную нормализацию и индексацию, а также представление в реальном времени одного или нескольких типов данных, представленных ниже. Для управления данными в режиме реального времени, программное обеспечение должно не только представлять входящие данные во времени, которые пользователь будет считать реальными, но и фактически предоставлять данные пользователю непосредственно в момент приема, так сказать на лету, не требуя доступа к базе данных.
- Прием логов — программное обеспечение, которое позволяет принимать текстовые лог файлы от различных источников с целью дальнейшей обработки и индексирования для хранения.
- Прием пакетных данных — программное обеспечение, которое позволяет осуществлять захват пакетных данных напрямую с зеркальных портов или ответвителей трафика. Все пакеты или записи о потоках (flow) должны быть подготовлены к записи и проиндексированы.
- Прием цифровых показателей — программное обеспечение, которое позволяет принимать любые цифровые показатели, к которым может быть применена обработка путем математических операций или агрегации по времени.
- Прием документов — программное обеспечение, которое позволяет принимать документы и осуществлять семантический и синтаксический анализ документов. По своей сути это обработка естественного языка - natural-language processing (NLP).
- Автоматизированное обнаружение и прогнозирование шаблонов — программное обеспечение, которое на основе исторических или потоковых данных одного или нескольких из упомянутых выше типов создает математические или структурные шаблоны, описывающие новые корреляции, которые могут быть выведены из наборов данных, но не непосредственно присутствуют в них. Затем эти закономерности могут использоваться для прогнозирования инцидентов с различной степенью вероятности.
- Обнаружение аномалий – программное обеспечение, которое использует различные шаблоны, обнаруженные предыдущими компонентами, чтобы сначала определить базовую производительность или состояние элемента или сервиса, а затем определяет любые отклонения и их степень важности.
- Определение истинного источника проблемы – программное обеспечение, которое отключает корреляцию, установленную элементом автоматического обнаружения и прогнозирования шаблонов, для изоляции тех звеньев зависимости, которые представляют подлинные причинно-следственные связи в смысле предоставления шагов и действий для эффективного устранения проблемы.
Реализация платформы AIOps возможно в виде локальной инсталляции в сети заказчика или как сервис SaaS.
На рынке существуют много производителей, и аналитики Gartner свели их в одну таблицу на основе приведенных выше 9 элементов:
|
Управление |
Потоковое |
Прием логов |
Прием |
Прием |
Прием |
Автоматизированное |
Обнаружение |
Определение |
Локальное |
Облако |
BMC |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
Correlsense |
* |
* |
* |
* |
* |
* |
* |
* |
|||
Corvil |
* |
* |
* |
* |
* |
* |
* |
||||
Elastic |
* |
* |
* |
* |
* |
* |
* |
* |
|||
ExtraHop |
* |
* |
* |
* |
* |
* |
* |
* |
* |
||
FixStream |
* |
* |
* |
* |
* |
* |
* |
* |
* |
||
Hewlett Packard |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
IBM |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
ITRS |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
Logtrust |
* |
* |
* |
* |
* |
* |
* |
* |
* |
||
Logz.io |
* |
* |
* |
* |
* |
* |
* |
||||
Loom Systems |
* |
* |
* |
* |
* |
* |
* |
* |
* |
||
Moogsoft |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
* |
Rocana |
* |
* |
* |
* |
* |
* |
* |
||||
SAP |
* |
* |
* |
* |
* |
* |
* |
* |
* |
||
Scalyr |
* |
* |
* |
* |
* |
* |
|||||
SIOS Technology |
* |
* |
* |
* |
* |
* |
* |
||||
Splunk |
* |
* |
* |
* |
* |
* |
* |
* |
* |
||
Sumo Logic |
* |
* |
* |
* |
* |
* |
* |
* |
|||
VNT Software |
* |
* |
* |
* |
* |
* |
* |
* |
* |
Что вынуждает двигаться в сторону AIOps?
AIOps это новая платформа, которая пока даже не имеет страницы описания в Викидепии. Но AIOps это бесспорно следующий эволюционный шаг в управлении ИТ на который влияют следующие потребности:
- Сложность управления в ручном режиме современной инфраструктурой.
Современная ИТ-среда включает управляемые и не управляемые облака, услуги третьих лиц, различные мобильные приложения и технологии и т.д. Это постоянно изменяющийся организм и традиционные подходы к управлению не могут работать в такой динамической среде. Отслеживание всех событий и управление этой средой без привлечения машинного обучения и больших данных невозможно.
- Объем данных необходимых ИТ-службе экспоненциально растет.
Мониторинг производительности ИТ-среды приводит к значительному увеличению количества событий и оповещений, что ведет к невозможности создания отчетов в ручном или полуавтоматическом режиме.
- Проблемы с ИТ средой должны решаться быстро.
Компании с использованием ИТ делают деньги и ИТ это не принтеры, картриджи и текстовые редакторы - это важная составляющая бизнес среды. Индустрия потребления изменила ожидания пользователей. Всё нужно здесь и сейчас, поэтому все проблемы должны решаться, так как напрямую влияют на производительность компании.
- Все больше и больше ресурсов переносится за пределы здания, ядра своей корпоративной среды.
Облачные технологии, аренда инфраструктуры как сервис, сервисы от третьих лиц давно размыло границы и вносит проблемы в контроле за распределенной инфраструктурой, которая часто не твоя, а кого-то другого и для выстраивания диалога с ними нужны данные.
- Разработчики приложений и сервисов на коне и имеют больше власти и влияния, но ответственность за работу все равно лежит на ИТ.
Новые технологии DevOps и Agile заставляют программистов взять больше контрольных функций на прикладном уровне, но ответственность за общее состояние экосистемы и взаимодействие между приложениями, сервисами и инфраструктурой по-прежнему остается под ИТ. ИТ-служба берет на себя большую ответственность, так как сети становятся все более сложными.
Основные структурные элементы AIOps
Структурно платформа AIOps включает следующие элементы:
- Обширные и разнообразные источники данных. Все то, к чему привыкли и пытаются использовать сейчас в ручном режиме: события, метрики, журналы, данные, наряды, системы мониторинга и т. д.
- Большие данные в режиме истории и реальных данных, проиндексированные и каким-то образом структурированные.
- Вычисления и аналитика, позволяющие системе генерировать новые данные и метаданные из существующих в ней данных. Расчеты и аналитика удаляют лишние данные, выявляют закономерности или тенденции, изолируют возможные причины, выявляют основные проблемы.
- Алгоритмы, которые позволяют грамотно проанализировать вычисления и аналитику и предложить эффективное решение для достижения желаемого результата.
- Машинное обучение, которое может автоматически изменять или создавать новые алгоритмы, основанные на выводах алгоритмического анализа и новых данных, введённых в систему.
- Визуализация – отображение действий и выводов в удобном для осмысления виде с целью устранения проблем.
Как уже упоминалось выше, AIOps платформа должна включать в себя управление производительностью, управление сервисами, автоматизацию и совершенствование процессов, применяемые к динамичной ИТ-среде. Это не радикальный подход в применении аналитики и машинного обучения. Несколько десятилетий назад трейдеры на биржах перешли от ручного анализа графиков, трендов, документов и статей в журналах к использованию машинного обучения. Социальные сети и слежение за нами «Большого брата» с целью предложить что-то купить или интересного посмотреть или почитать – это тоже пример машинного обучения. Эти методы надежно и широко используются в средах, где требуется высокая скорость реакции на динамически изменяющиеся условия и ожидания пользователей. Пришла очередь и ИТ сделать шаг в будущее.
Вы готовы к использованию искусственного интеллекта? Удачи и меньше проблем в работе текущей и будущей ИТ-среды!
Подписывайтесь на рассылку, делитесь статьями в соцсетях и задавайте вопросы в комментариях!
Всегда на связи, Игорь Панов.
См. также:
Авторизуйтесь для этого