Прессинг, направленный на более полное использование активов, продвигает такие технологии, как виртуализация и сетевые вычисления, дальше в массы. Но при этом интенсивность использования трех основных технологических ресурсов – средства вычисления, хранения и связи - будет расти, и эта интенсивность будет приближаться к теоретическим ограничениям мощности. Тогда нам потребуется не только более совершенная аппаратура и инструменты мониторинга, но также мы будем вынуждены разбираться с проблемами отказоустойчивости.
Один из моих клиентов нечаянно вступил на эту неизведанную территорию. Компания столкнулась со стечением обстоятельств, при которых аппаратное и программное обеспечение, до этого справлявшееся идеально, заработало на пределе возможностей. Это вызвало целый ряд ошибок, в итоге привело к нехватке времени на завершение определенных действий и последующему запуску бесконечного цикла, которые ранее не проявлялись.
В результате, в течение двух дней не работал один из основных бизнес-процессов компании. Такая ситуация сложилась не в результате какой-то сверхъестественной комбинации технологий, а в результате очень интенсивного использования. Когда клиент отправил запрос поставщику, выяснилось, что продукт никогда не тестировался со столь высокой интенсивностью использования.
[Перепечатка материалов ERPnews.ru разрешается только с предварительного согласования с редакцией или автором. Если вы читаете этот материал на другом ресурсе, пожалуйста, сообщите нам об этом editor@erpnews.ru]
Выясняется, что ранее поставщик решения пришел к выводу, что такое тестирование будет экономически не оправданным и не стал указывать максимальный уровень, при котором гарантируется работоспособность. Интересно, что когда клиент перезапустил задание того же объема на другой комбинации технологий и при том же уровне использования, проблема исчезла.
Есть еще примеры отказов при работе на предельных значениях в других интенсивно используемых комбинациях технологий. Например, другой клиент запустил множество виртуальных серверов, которые потребляли 95% доступной мощности оборудования. Эта компания начала встречаться с непредвиденными отказами, которые казались случайными.
Так как было крайне сложно найти основную причину отказов, это затрудняло диагностику и защиту. Можно сделать вывод, что причина только в слишком интенсивном использовании (большая часть поставщиков виртуального ПО дали бы рекомендации задействовать 80% мощностей, чтобы система работала стабильно), но экономический прессинг приведет к тому, что менеджеры будут пытаться приблизиться к 100%. И эти примеры поднимут более серьезный вопрос для директоров ИТ и специалистов по ИТ-технологиям: как изначально поставщики определяют требования надежности?
Ответ, кажется, на 50% состоит из физического тестирования (гоняют до разрушения) и на 50% в симуляции и моделировании, основанных на данных физического теста. Это работает, пока вы придерживаетесь середины диапазона возможностей, но говорит ли это что-то о работе на пределе теоретических возможностей? Ответы будут: «немного», «недостаточно».
Так, в следующий раз, когда вы решите совершить бросок к границам возможностей инфраструктуры, чтобы вписаться в ограниченный бюджет, спросите своих поставщиков, что они в действительности знают о пределах возможностей своих продуктов и будьте готовы скорректировать свои планы.
John Parkinson
Ziff Davis Enterprise Inc. ©
Перевод ERPNEWS©
© Галактика, 2007
© Издание 12NEWS (ИП Маринин А.Л.), 2007