Как минимизировать время простоя ИТ-инфраструктуры? Интервью с практиком!
Предлагаем вашему вниманию интервью с инженером Джеймс Отт (James Ott) о том, как с помощью инструмента для мониторинга сети PRTG в паре с пользовательскими сетевыми сенсорами он научился предотвращать неисправности до того, как они начинали беспокоить пользователей.
Джеймс Отт совмещает несколько должностей на своей работе в компании-провайдере решений для двухсторонней связи и диспетчеризации Pegasus Radio Corp / Federal Radio из города Абердин (штат Мэриленд, США), которая предлагает услуги транковой радиосвязи государственным учреждениям и подрядчикам. Как сетевой инженер, ИТ-администратор и технический специалист по коммуникационным системам, Джеймс Отт проектирует, строит и управляет территориально-распределенными сетями, а также сетями на территории кампусов и внутри зданий, которые позволяют пользователям компании Pegasus Radio Corp / Federal Radio безопасно связываться друг с другом.
Поскольку подписчики рассчитывают на компанию Pegasus Radio Corp / Federal Radio для осуществления ежедневных и экстренных коммуникаций, надежность сети является критически важным элементом для успешной работы компании. Одним из инструментов, который, по словам г-на Отта, «драматически изменил видимость сети и время безотказной работы оборудования», стало программное обеспечение для мониторинга работы сети Paessler PRTG Network Monitor.
Ниже предлагаем Джеймсу Отту самому поведать, как инструмент PRTG позволил ему создать десятки пользовательских сетевых сенсоров, которые помогают ему предвидеть большинство сбоев в работе устройств до того, как они смогут повлиять на работоспособность коммуникационной радиосистемы и нанести какой-либо вред деятельности его клиентов. Г-н Отт также даст несколько советов молодым профессионалам в области сетевых технологий, которые только начинают свою карьеру.
- Как программное обеспечение для мониторинга работы сети Paessler PRTG Network Monitor помогло сократить время простоя для транковой системы радиосвязи компании Pegasus Radio Corp / Federal Radio?
Наши действия стали более проактивными, чем реактивными, так как теперь мы можем видеть, когда устройство начинает выходить из строя. Это позволяет нам в большинстве случаев начинать решение неисправностей, вносить необходимые изменения, а также подготовиться к замене устройства, если это необходимо, до момента полного отказа оборудования.
Мы осуществляет мониторинг в режиме реального времени в нашем сетевом операционном центре, а также получаем оповещения по электронной почте и мобильные уведомления от устройств. С помощью PRTG мы можем видеть, когда появляется проблема, которая может оказать непосредственное негативное влияние на клиентов еще до того, как они успеют что-либо заметить. Сейчас доступ к этой информации стал для нас намного более легким, что значительно упростило нашу работу.
- Расскажите о пользовательских сетевых сенсорах, которые вы создали с помощью PRTG API.
Многие наши устройства не могут подключаться к системе как обычный персональный компьютер. Поэтому написание пользовательских сетевых сенсоров позволило нам контролировать работу этих устройств в полевых условиях.
В настоящее время у нас есть в общей сложности 543 сенсора, 136 из которых — мои собственноручно написанные сетевые сенсоры. Мы постоянно растем, поэтому ожидаем, что скоро их количество станет больше 600. Устройства могут иметь более одного сенсора, чтобы помочь нам лучше понять, что с этим устройством происходит. Мы можем отслеживать такие вещи, как загрузка процессора, использование памяти или сетевой трафик. Мои пользовательские сенсоры также контролируют напряжение, температуру и уровень сигнала.
- Трудно ли было создавать пользовательские сетевые сенсоры?
На самом деле это просто. Нужно было только понять, как стандартный интернет-протокол SNMP для управления устройствами в IP-сетях работает с этим конкретным программным обеспечением, а затем перейти в расширенную виртуальную базу данных MIB (management information base, база управляющей информации), используемую для управления объектами в сети связи, чтобы получить эту информацию.
- Как работает программный инструмент PRTG Network Monitor?
PRTG использует протокол SNMP, утилиту Ping, а также ETH, DNS и HTTP/HTTPS для мониторинга устройств в поле. В настоящее время мы используем VPN-туннели с шифрованием AES, идущих как к стационарным объектам, так и к устройствам с мобильным подключением. Все данные передаются в наш сетевой операционный центр в городе Абердин. Что касается мобильного подключения объектов, то мы используем укрепленный мобильный сотовый маршрутизатор для создания наших виртуальных частных сетей (Virtual Private Network, VPN). Эти туннели создаются только при включении мобильных устройств. У меня также есть несколько пользовательских сенсоров для этих устройств, которые показывают такие вещи, как текущее состояние сотового соединения, текущий уровень сигнала сотового соединения, общий месячный трафик и температура устройства. Все данные мы получаем в режиме реального времени, и они поступают через VPN-туннели. Мы разработали веб-порталы с изменяемой в режиме реального времени графикой, поэтому некоторые наши клиенты могут входить в систему и просматривать текущую и архивную информацию о своих собственных устройствах, а также об оборудовании их объекта. Это позволяет нам повысить прозрачность в отношениях с нашими клиентами.
- Вы можете рассказать о задачах, которые актуальны для вас в настоящее время?
Самой большой проблемой, с которой нам приходится иметь постоянно дело, является необходимость оставаться в рамках правительственных указаний и правил безопасности. К примеру, сейчас мы работаем с Комиссией по ядерному регулированию США (Nuclear Regulatory Commission, NRC), и я соединяю их штаб-квартиру в районе населенных пунктов Роквилль и Бетесда в штате Мэриленд с локациями в штатах Техас, Вирджиния и Пенсильвания, причем все по закрытой радиосвязи. Мы сталкиваемся с подобными вызовами также и с другими клиентами, включая музеи Смитсоновского института, Музей Холокоста, Управление по санитарному надзору за качеством пищевых продуктов и медикаментов, Администрацию общих служб и множество различных федеральных групп.
Прежде всего, мы стараемся выяснить, что именно клиент хочет делать и какого типа система им нужна. Во многих случаях мы пытаемся использовать их сеть, но отделяем ее от нашей собственной виртуальной локальной сети, поэтому проблем у нас не так много. Но мы по-прежнему должны оставаться в рамках требований FIPS (Federal Information Processing Standards, Федеральные стандарты обработки информации) и FISMA (Federal Information Security Management Act, Федеральный закон об управлении информационной безопасностью).
После того, как мы определим, что ищут наши клиенты, я беру сетевые руководства, которые они мне предоставляют, и разрабатываю на их базе свой проект системы связи с учетом всех требований. Возможно, сеть будет построена на основе однонаправленной передачи данных. Возможно, мы решим использовать мультивещание. Возможно, это будет просто соединение точка-точка. А, возможно, наши системы для осуществления передачи данных будут поддерживать разные способы пакетной маршрутизации. Иногда может понадобиться некий мобильный сетевой набор, который наши клиенты смогут взять с собой и пойти в другое здание, в таком случае нам необходимо будет использовать мобильный роутер или сотовый маршрутизатор, который полностью защищен и может возвращаться в систему. Все зависит от того, что ищут наши клиенты.
- Как вы попали в ИТ-индустрию?
Я работаю с компьютерами с шести лет. Тогда мои родители отправили меня в компьютерный лагерь, где все и началось. С сетями я работаю с начала 2000-х годов, и в этой работе я всегда стремлюсь вперед.
Я работал в таких компаниях, как SecurityLink и Tyco. Я также работал для IBM. В первых двух компаниях я был специалистом по обслуживанию сетевых устройств. С IBM я сотрудничал в качестве инженера по обслуживанию заказчиков, проектируя и строя системы для таких клиентов, как Verizon, Kaiser Permanente и Chase Bank.
- Что особенно вас нравится в работе с сетью?
Лично меня привлекает возможность того, что я могу заставить несколько компьютеров общаться и выполнять разные вещи, но при этом продолжать работать, координируя свою совместную деятельность. И эта возможность относится не только к компьютерам, но и, конечно, к различным сетевым устройствам.
- Что вам больше всего нравится в вашей нынешней роли?
Мои задачи постоянно меняются. Мне еще ни разу не приходилось разрабатывать две идентичные системы связи. Каждый новый проект — это новый вызов. Мне постоянно приходится думать о разных вещах и способах решения проблем для моих клиентов. И именно это доставляет мне больше всего удовольствия.
- Что бы вы посоветовали молодым сетевым специалистам, которые только начинают свою карьеру?
Никогда не отчаивайтесь. В вашей работе будет много сложной математики, но чем дольше вы будете этим заниматься, тем вам будет легче.
Определенно, лучше всего начинать с сервисной службы, так как вы сразу столкнетесь с большим количеством проблем и неисправностей. И в дальнейшем вы уже сразу сможете видеть, где проект реализован правильно, а где что-то может пойти не так. Этот путь вовлечет вас быстрее, чем любой другой способ.
См. также:
Авторизуйтесь для этого