Сергей Сафонов. «Анатомия систем управления»

Статья Сергея Сафонова, директора дивизиона программных решений компании INLINE Technologies, посвящена обзору современных программных решений в области управления ИТ-инфраструктурой предприятий.

Работа любого современного промышленного предприятия или корпорации немыслима без использования ИТ. Обширный экономический опыт подтверждает выводы аналитиков о том, что эффективное применение информационных технологий существенно повышает производительность компании, контроль и управляемость ее текущей и перспективной деятельностью, позволяет оптимизировать и сделать более гибкими и прозрачными внутренние бизнес-процессы, а также заметно снижает затраты и издержки, в том числе, вызванные недоступностью информационных ресурсов. Все это в конечном счете повышает стоимость компании и ее конкурентоспособность.

Сегодня все больше организаций осознают важнейшую роль ИТ в их бизнесе. Но чем крупнее ИТ-инфраструктура на предприятии, тем больше возникает и проблем – сложнее становится процесс ее управления и контроля, исчезает четкое представление об эффективном распределении бюджетных средств в ИТ (а у крупных компаний они немалые) и их отдаче. Также возникает вопрос, насколько оптимально выстроена организация работы соответствующих ИТ-служб. Иными словами, мало иметь ИТ в качестве инструмента для развития бизнеса, нужно еще уметь грамотно и эффективно воспользоваться этим инструментом.

Решение этих проблем существенно облегчается в случае автоматизации процессов управления с использованием специализированных программных комплексов. При этом обычно выделяют две категории средств управления. К первой относятся различные узкоспециализированные продукты, которые создаются для решения отдельных текущих задач. Подобные решения, как правило, разрабатываются кустарным способом внутри организации, имеют сравнительно низкую стоимость, но вместе с тем и слабую функциональность, низкую надежность и возможность развития. И на практике внедрение подобных самописных программ на крупных предприятиях дает по меньшей мере сомнительный эффект и не обеспечивает никаких гарантий безотказной работы. По этой причине в данной статье мы их рассматривать не будем.

Вторая категория ПО – это комплексные системы промышленного уровня, построенные по модульному принципу и предназначенные для управления всей ИТ-инфраструктурой предприятия. Как показывает опыт, внедрение таких решений приносит организации наибольший эффект как в краткосрочной, так и в долгосрочной перспективе. Комплексные системы ориентированы на решение широкого спектра задач, они тщательно тестируются и отлаживаются, а кроме того, обладают высокой совместимостью и гибкостью при настройке и адаптации под различные условия использования. Разработчики таких решений предоставляют гарантии и поддержку, а также обеспечивают дальнейшее развитие ПО, тем самым сохраняя ИТ-инвестиции заказчика.

Сегодня большинство крупных предприятий и корпораций уже обратили внимание на программные продукты ведущих мировых производителей в области комплексных решений по управлению ИТ. Как показало проведенное в США исследование IDC, внедрение таких систем позволяет на 26% увеличить эффективность работы всей информационной инфраструктуры предприятия. При этом на 42% повышается продуктивность работы пользователей, а также почти на треть снижаются общие потери из-за недоступности информационных ресурсов и время недоступности приложений.

Производители и потребители

По данным ряда независимых аналитических компаний, на сегодняшний день лидерами на рынке ПО для управления ИТ-инфраструктурой предприятий выступают компании IBM, Hewlett-Packard, Computer Associates, BMC Software и Microsoft, причем первые две имеют наибольшие и примерно равные рыночные доли. Все эти производители предлагают наиболее полные и сбалансированные семейства продуктов для решения широкого спектра задач, а именно IBM Tivoli, HP OpenView, CA Unicenter, BMC Patrol/Remedy и Microsoft SMS/MOM.

Основными потребителями подобных комплексных решений, прежде всего, выступают крупные предприятия и корпорации в самых разных областях бизнеса. И внедрение систем управления промышленного масштаба становится наиболее оправданным в организациях, где численность ИТ-службы насчитывает несколько десятков специалистов.

Как уже упоминалось, важное преимущество крупных систем управления заключается в их высокой функциональности, а кроме того, в том, что они в одно время и в одном месте обеспечивают получение не только частной, но и общей прозрачной картины о состоянии всей ИТ-инфраструктуры и работе ИТ-службы. Кроме того, они позволяют заметно снизить требования к квалификации и опыту ИТ-специалиста, который фактически перестает быть для компании уникальным.

Это означает, что подобные системы являются важными не только для ИТ-специалистов, но также и для руководства предприятия, которое на основе полученных консолидированных данных может проводить соответствующий анализ и принимать тактические и стратегические решения. При этом стоит отметить, что внедрение такого мощного инструмента контроля нередко встречает и определенное противодействие со стороны ИТ-служб, сотрудники которых по понятным причинам не заинтересованы в полной прозрачности своей деятельности и снижении собственной ценности для компании.

ИТ-служба предприятия

Существуют различные определения, что такое ИТ и какие компоненты следует включать в это понятие. В данном обзоре мы будем использовать наиболее распространенное понятие, которое описывает ИТ предприятия как совокупность всех программных и аппаратных средств, услуг, процессов и технологий, относящихся к ведению ИТ-департамента, за исключением АСУ ТП, АСКУ и им подобных.

В такой трактовке ИТ-инфраструктура предприятия включает активное и пассивное сетевое оборудование, серверы и приложения, а также рабочие места пользователей и периферийное оборудование.

Несмотря на то, что внутри каждой из этих групп требования и задачи по обслуживанию довольно схожи, например, для сервера и ПК пользователя эти задачи существенно различаются. Поэтому в большинстве случаев обслуживанием каждой инфраструктурной группы занимается выделенное подразделение внутри службы ИТ, выполняющее две функции – контроль безотказного функционирования всех компонентов ИТ-инфраструктуры и обеспечение ее адекватного развития.

Структура систем управления

Ввиду того, что первоочередной задачей ИТ-службы является обеспечение четкой и бесперебойной эксплуатации элементов ИТ-инфраструктуры, решения по управлению ИТ чаще всего ориентированы именно на решение задач эксплуатации и условно объединяются в две категории.

Системы первой категории являются технологически-ориентированными и наиболее тесно связаны с устройствами и элементами ИТ-инфраструктуры. Они призваны обеспечивать контроль работоспособности и производительности инфраструктуры и в соответствии с тремя основными областями ИТ-инфраструктуры включают модули управления сетями, серверами и приложениями и автоматизированными рабочими местами (АРМ), каждый из которых, в свою очередь, предназначен для решения своего круга задач. Главные и принципиальные различия этих подсистем у разных производителей заключаются в реализации их базовой платформы (framework).

Второй тип систем управления ориентирован на организацию работы персонала ИТ-служб в процессе эксплуатации и регламентирует взаимоотношения между разными группами ИТ-специалистов, отвечающих за управление сетями, серверами, приложениями и рабочими местами, а также за взаимодействия с внешними пользователями. Этот уровень систем контроля можно назвать системой автоматизации деятельности ИТ-службы или процессов ИТ. В английском языке для нее существует довольно емкое наименование – Service Desk.

Назначение подобной системы можно проиллюстрировать на простом примере. От пользователя поступил сигнал о какой-либо неполадке, и требуется оперативно определить, чем она вызвана и на каком из участков ИТ-инфраструктуры произошел сбой (в сети, на сервере или непосредственно на ПК пользователя). В системе Service Desk четко прописаны все соответствующие правила и инструкции отработки поступающих сигналов о сбоях и неполадках, а также распределены роли и обязанности между группами ИТ-службы. Кроме того, с помощью Service Desk руководитель ИТ получает достоверную картину эффективности работы и всей ИТ-службы, и составляющих ее отделов. В свою очередь, это дает возможность наглядно продемонстрировать роль ИТ для бизнеса предприятия в целом.

Вне зависимости от категории в основе архитектуры систем управления лежат понятия сервера мониторинга и агентов. В качестве сервера мониторинга обычно используется компьютер с установленным специальным ПО для сбора и анализа информации о работе разных элементов, а также для выдачи управляющих команд по корректировке ситуации. Агентом называется программа, установленная на контролируемый объект. Как правило, агент формирует информацию для сервера мониторинга и выполняет его инструкции. При этом сервер мониторинга взаимодействует с агентом по определенным правилам.

Системы управления сетями

Общий подход в реализации систем управления сетями у разных производителей схож и принципиальных отличий не имеет. Основными задачами этих решений являются контроль работоспособности сети и построение ее топологии. В то же время задачи мониторинга производительности в корпоративных сетях не являются первоочередности из-за малой эффективности и низкой отдачи этих процессов, и при необходимости они могут быть решены с помощью специальных технологий контроля полосы пропускания, встроенных в современные сетевые устройства.

На сегодня основным стандартом управления сетевым оборудованием является протокол SNMP, и именно он лежит в основе работы большинства систем такого класса. Различия состоят в особенностях алгоритмов и касаются, прежде всего, построения топологий сети и ее отдельных срезов с последующей визуализацией. Как правило, современные сетевые устройства в подавляющем большинстве оснащаются встроенными агентами SNMP, через которые и осуществляется контроль сети, а также управление устройством с сервера мониторинга.

Системы управления серверами и приложениями

Среди задач, которые решает ИТ-служба для систем этой группы, основной можно считать обеспечение безотказности. По этой причине и соответствующие решения ориентированы главным образом на контроль работоспособности и требуемой производительности серверного оборудования и ПО.

Базовая организация подобных систем выглядит следующим образом. На сервер мониторинга устанавливается управляющее ПО, которое обеспечивает функции сбора и анализа информации. На элементы аппаратной или программной части оборудования, которые требуется контролировать, загружаются соответствующие агенты, получающие и выполняющие инструкции. В рамках базовой платформы систем управления серверами и приложениями реализуется двустороннее взаимодействие между центральным сервером и агентом, механизмы настройки и интеграцию на уровне данных и на уровне графических интерфейсов. При увеличении числа контролируемых объектов увеличивается и количество установленных на них агентов, а также дополняется управляющее ПО на центральном сервере.

На этом принципе основаны решения по управлению серверами и приложениями IBM, НР и Microsoft. В них центральное устройство мониторинга взаимодействует с агентами, обеспечивая интеграцию на всех уровнях. По мере роста числа агентов управляющая программа на центральном сервере дополняется соответствующими программными блоками. Такой подход позволяет получить как частную, так и общую картину состояния всех контролируемых объектов.

У Сomputer Associates отличие базовой платформы системы управлениями серверами состоит в том, что она реализована только на уровне интеграции графических интерфейсов. При этом каждому агенту (т. е. контролируемому элементу) соответствует своя управляющая программа, работающая независимо от остальных пар «агент—центральная программа». По мере увеличения контролируемых объектов на центральном сервере увеличивается и число управляющих программ, а значит, все корреляционные процессы необходимо налаживать дополнительно. В силу этого, кроме общего графического интерфейса в наборе из N независимых подсистем данная система от одного вендора мало чем отличается от N систем, реализованных на решениях нескольких производителей.

В свою очередь, система управления серверами и приложениями ВМС фактически не имеет базовой платформы. В ней нет центрального сервера управления, а все управляющие функции переданы агенту, который собирает, анализирует и хранит данные, а также выполняет определенные инструкции. Таким образом, каждый сервер, который требуется контролировать, – это независимая система. Поочередный мониторинг таких «умных» агентов можно осуществлять с помощью организованной консоли администратора.

Системы управления с архитектурой, аналогичной ВМС, наиболее целесообразно использовать в случаях, когда требуется контролировать малое число серверов, а в случае их увеличения нужно дополнительно создавать способ получения общей картины состояния контролируемых серверов и приложений ИТ-инфраструктуры.

Решение ВМС по управлению серверами и приложениями не является по-настоящему централизованным. Дело в том, что этот производитель долгое время работал на рынке малых и средних компаний и теперь не может до конца отказаться от децентрализованного принципа прежде всего из-за необходимости обеспечивать совместимость и преемственность своих систем. В тоже время стоит отметить, что принцип обратной совместимости версий является не менее важным и для других производителей промышленных систем управления, поскольку таким образом защищаются инвестиции заказчиков и обеспечивается их лояльность.

Компания Microsoft вышла на рынок систем мониторинга и управления серверами и приложениями с относительно новым продуктом – Microsoft Operations Manager 2005 (MOM). Одна из основных его функций – проактивный мониторинг информационной системы, позволяющий администратору получать актуальную информацию о всех ее компонентах, а также выявлять и устранять мелкие неполадки еще до того, как они перерастут в большие.

Архитектура MOM построена на базе пакетов управления – наборов правил для отслеживания состояния сетевых устройств и серверных приложений. Как заявляет Microsoft, MOM может работать с различными платформами, однако агенты системы управления для платформ, отличных от Microsoft, разрабатываются и поставляются третьими фирмами-разработчиками. Как можно видеть, данный подход чем-то напоминает подход CA. Время покажет, как эта система будет развиваться в дальнейшем.

Системы управления рабочими местами

Базовая платформа построения систем управления автоматизированными рабочими местами (АРМ) реализована аналогично системам управления серверами и приложениями, однако их основными задачами являются инвентаризация рабочих мест (конфигурация ПК, базовые установки, набор установленных программ и утилит), централизованное распространение ПО и удаленное управление. Задачи же производительности АРМ не относятся к первостепенным, поскольку ПК и периферийное оборудование в принципе можно отнести к стандартным устройствам. В стороне остается и задача контроля используемых лицензий: подобные решения существуют, но пользуются на российском рынке весьма ограниченным спросом.

Эти особенности отражаются на архитектуре агентов и управляющих программ систем управления АРМ – в частности, в отличие от сервера, ПК не требуется непрерывно контролировать, поэтому управление здесь происходит по запросу. Если требуется произвести, например, инвентаризацию, то с центрального сервера поступает команда, установленный на ПК агент загружает необходимый программный модуль, исполняет его, а после выгружает, тем самым высвобождая ресурсы системы.

Тем не менее, принципиальная схожесть архитектур модулей управления серверами и приложениями и модулей управления АРМ позволяет в некоторых случаях предлагать их комплексную реализацию. Например, по этому пути пошла IBM. В системе IBM Tivoli для управления серверами, приложениями и рабочими местами можно использовать один центральный сервер мониторинга, на котором главная программа включает оба модуля, сохраняя со всеми агентами двустороннее взаимодействие. И для предприятий с территориально распределенной структурой такое решение оказывается наиболее эффективным.

В свою очередь, в системе HP OpenView система управления серверами и приложениями и система управления АРМ реализованы независимо. В этом случае, несмотря на то, что каждая из двух подсистем хоть работает согласно базовому принципу, взаимодействие двух центральных серверов требуется налаживать дополнительно. В то же время отсутствие централизованного управления в комплексной системе управления позволяет гармонично интегрировать в качестве подсистем решения других производителей.

Система управления АРМ Systems Management Server (SMS), разработанная Microsoft, включает инструменты для проведения инвентаризации программных и аппаратных средств, распространения приложений и обновлений. Неоспоримыми преимуществами SMS являются легкость развертывания и эксплуатации, а также высокая масштабируемость, которая позволяет наращивать уровень управления от небольшого количества АРМ до крупной территориально распределенной системы с сотнями тысяч конечных устройств. Как и в случае с модулем управления серверами и приложениями, для взаимодействия с платформами, отличными от Windows, Microsoft предлагает использовать ПО третьих фирм, которое интегрируется с SMS.

В целом системы управления АРМ в последнее время пользуются повышенным спросом. И в этой области среди относительно новых разработок довольно известны такие системы, как Altiris, Marimba и Novadigm (при этом вторая уже приобретена ВМС, а третья принадлежит НР). Эти решения поддерживают описанную выше базовую платформу систем управления АРМ. Корпорация Intel также продвигает свою систему управления АРМ (LanDesk Man), однако это решение нельзя отнести к новым разработкам, к тому же оно реализовано на совершенно иных принципах и на российском рынке сегодня почти не присутствует.

Системы Service Desk

Как уже говорилось выше, системы Service Desk ориентированы на работу персонала ИТ-службы, в которой существует разделение групп по функциональному признаку. Системы этого уровня реализуют ряд процессов, описанных в библиотеке ITIL (IT Infrastructure Library), где собраны лучшие мировые практики организации работы департаментов ИТ. На сегодняшний день в этой области наиболее автоматизированными считаются процессы управления уровнем обслуживания, управления инцидентами (сбои, неполадки и простои в ИТ-инфраструктуре), управления проблемами (определение причины инцидента и решение о его устранении), управления изменениями (т. е. все события, происходящие в ИТ-инфраструктуре, должны быть авторизованы и известны), а также стандартизация рабочих мест и контроль всех элементов ИТ-инфраструктуры и их взаимосвязи. При этом первый из них относится к сфере стратегического контроля, а остальные характеризуют функции оперативного контроля.

Сегодня в сегменте решений Service Desk наиболее известны системы BMC Remedy ITSM, HP Service Desk, CA ServicePlus Service Desk и Peregrine Service Center. Следует отметить, что до недавнего времени IBM также продвигала собственное решение Tivoli Service Desk, однако этот проект был продан компании Peregrine Systems. В свою очередь, нынешней осенью было объявлено о покупке уже самой Peregrine компанией НР, что в итоге значительно усилило позиции последней в данном сегменте.

Логическая архитектура всех программных решений Service Desk построена на двух основных подсистемах – организации данных и реализации логики обработки этих данных. Первая выполняет расширенные задачи СУБД и отвечает на вопросы о том, какие данные нужны для работы системы, какие данные необходимы для работы пользователям, какова структура и взаимные отношения этих данных, как эти данные хранятся, как обеспечивается их целостность и другие. Вторая подсистема выполняет функции сервера операций и контролирует, в частности, взаимодействие различных пользователей системы, механизмы автоматизации процедур и характер изменения данных.

С технической точки зрения базовой здесь является архитектура «сервер приложений-сервер баз данных», и в основном решения отличаются друг от друга тем, как распределены функции по обслуживанию структуры данных и обеспечена логика работы между сервером приложений и сервером баз данных. Рассмотрим с этих позиций решения HP Service Desk, Peregrine Service Center и BMC Remedy ITSM.

В решении НР для размещения данных, а также их структуры и логики обработки используются ресурсы промышленных СУБД. Сервер приложений в этом случае используется лишь как средство визуализации данных и частично для балансировки нагрузки, то есть фактически HP Service Desk является СУБД-ориентированной системой.

Такая архитектура крайне затрудняет создание распределенных систем и предполагает создание строго централизованных решений. Кроме того, она сильно ограничивает возможности доработки в системе, и значительно усложняет любые переделки. По этой причине, внедряя HP Service Desk, ИТ-служба будет вынуждена перестроить все свои бизнес-процессы в строгом соответствии с лучшими мировыми практиками, что, с одной стороны, влечет существенные организационные риски, однако, с другой, препятствует соблазну переделать программный продукт под существующие неэффективные бизнес-процессы.

В архитектуре Remedy ITSM реализовала прямо противоположную концепцию: БД выступает в качестве простого хранилища данных, а вся информация об их структуре, а также логика обработки перенесены на сервер приложений. Основой же решения является многофункциональная платформа разработки систем автоматизации процессов Remedy Action Request System (ARS), которая обеспечивает создание как централизованных, так и распределенных систем. И наличие в качестве ядра мощного средства разработки обеспечивает широкие возможности по интеграции с различными внешними системами и модернизации ПО под уникальные требования заказчика. В то же время подобная гибкость имеет и свои отрицательные стороны, поскольку всегда есть опасность автоматизировать неэффективные ИТ-процессы или же бесконечно затянуть проект внедрения, постоянно внося различные дополнения и улучшения. В этом случае успех во многом зависит от четкой проработки будущих ИТ-процессов, квалификации команды инсталляторов и твердой позиции руководителя ИТ-службы. К тому же на управление проектом накладываются требования жесткого контроля уровня и числа переделок и доделок. Вместе с тем эффект от внедрения решения Remedy может значительно перекрывать подобные издержки.

Компания Peregrine Systems реализовала компромиссный вариант, разместив данные и их структуру на сервере БД, а логику – на сервере приложений. Таким образом, изменения структуры данных оказывают слабое влияние на логику их обработки. Поэтому риски, связанные с адаптацией этого программного продукта в соответствии с условиями заказчика, значительно ниже, чем в HP Service Desk, хотя и выше, чем у Remedy. В то же время у Peregrine Service Center опасность впасть в бесконечные переделки ниже, чем в случае с Remedy, поскольку создание распределенных конфигураций обеспечивается специальными модулями синхронизации данных между различными компонентами. К слову, те же средства используются и для интеграции с внешними системами.

Системы Service Desk набирают популярность, спрос на них растет и этот сегмент привлекает новых игроков. В частности, относительно недавно на этот рынок вышла отечественная компания Naumen со своим продуктом Naumen Service Desk. Довольно серьезную конкуренцию ведущим производителям сегодня в данном сегменте составляет и корпорация Microsoft, которая создала собственный вариант библиотеки ITIL, модифицированный под Windows-продукты, – MOF (Microsoft Operations of Framework). При этом корпорация пускает в ход различные инструменты увеличения рыночной доли и укрепления своих позиций, в частности, по сравнению с другими игроками, она имеет возможность более агрессивно регулировать свою ценовую политику.