Нельзя предотвратить, но можно проконтролировать!
Нельзя предотвратить, но можно проконтролировать!

Тот, кто заботится о защите информационных технологий от отказов, должен существенно минимизировать риски от неправильной организации работы или форс-мажорных обстоятельств. Заранее следует позаботиться о том, как избежать возможного дефицита персонала из-за болезни сотрудников, неудовлетворительного обслуживания, неполного тестирования или недостаточного контроля действий, направленных на обеспечение безопасности ИТ и приемлемого уровня производительности. Кроме того, следует продумать меры предосторожности от некорректного поведения людей, к примеру поломки устройств, краж или актов саботажа, и от технических отказов системы энергоснабжения или сетевых компонентов.

В первую очередь рекомендуется провести анализ возможных угроз и одновременно установить, насколько длительным может быть время отказа.

Очень важно выяснить, каков допустимый уровень потерь данных, сколько времени займет их восстановление, как быстро должны стать доступными сетевые приложения и какова максимально приемлемая продолжительность работы предприятия в ограниченных условиях.

Ответы на эти и другие вопросы содержатся в рекомендациях инфраструктурной библиотеки ИТ (IT Infrastructure Library, ITIL), в которых аспекты обеспечения эксплуатационной безопасности ИТ играют значительную роль. ITIL обобщает практический опыт, фокусируя функционал информационных технологий на процессах, услугах и нуждах клиентов. ITIL демонстрирует эффект синергии и указывает на зависимости между отдельными областями ИТ, тем самым позволяя добиться эффективного управления обеспечением безопасности.

После оценки длительности потенциального отказа её можно соотнести с возможным финансовым ущербом, для чего необходимо учесть все факторы затрат, связанные с отказом. И наконец, на основе полученных результатов можно определить адекватные технические меры.

Большинство катастроф, созданных руками человека влекут за собой аварию в информационных системах.

Любая индустрия боится временного прекращения работы, а иногда и последующего за ним разорения, которое может причинить авария или катастрофа.

Особенно это относится к индустрии финансовых услуг, где потери даже нескольких секунд в из-за аварии в информационном потоке могут привести к большой потере денег.

Очевидно, что большинство людей думают о крупномасштабных естественных событиях как о самой обычной утечке данных. Но они не всегда являются причинами этой проблемы.

Для того, чтобы разобраться со способами минимизации потерь от форс-мажорных обстоятельств, мы обратились к зарубежному опыту построения информационных систем.

«Природные катастрофы вызывают больше беспокойства из-за связанных с данным явлением сбоев» - говорит Эрик Флик, руководитель отдела аварийного обслуживания в компании Symitar, предоставляющей сотни наборов продуктов и услуг - «Когда люди звонят по стационарному телефону, они ожидают услышать гудки. Так же, все ожидают, что интернет будет всегда доступным. Но что происходит, когда строительная команда случайно перерезает оптоволоконный кабель?».

По словам Флика, в этом случае, системные администраторы должны знать, как сделать поменьше заплаток, так же как и предпринять основные меры по восстановлению работоспособности системы. «Как правило, мы рекомендуем в таких случаях предоставлять альтернативные средства связи, допустим, мы будем восстанавливать связь через ноутбук, пока не починят порванный кабель. В большинстве случаев, мы восстанавливаем доступ в интернет менее чем за час».

Он говорит, что в течение 5 последних лет не возникло ни одного вида техногенной опасности. Но некоторые люди считают, что если произойдёт что-либо подобное, то это будет сравнимо с крушением поезда.

«Поезда перевозят огромный ассортимент груза, включая опасные химикаты, поэтому, вы должны быть готовы к угрозе появления облаков, содержащих химические вещества» - предупреждает Флик. «Это значит, что необходимо иметь план эвакуации и план обеспечения непрерывности бизнеса».

Большинство техногенных аварийных ситуаций включают в себя системный сбой в основной системе технического обеспечения, говорит Скотт Хьюзмэн, исполнительный директор в сервисном центре Harland Financial Solutions. «Именно поэтому мы настоятельно рекомендуем нашим клиентам, чтобы у них были контракты на техническое обслуживание информационной системы и чтобы они следили за состоянием своих систем. Также мы советуем им помнить разницу между местными и региональными сбоями.

Местные сбои могут затронуть только один отдел или подразделение. Это тот тип проблемы, с которой довольно легко справиться.

Региональные сбои могут вывести из строя всю сеть филиалов и всю информационную систему кооператива».

Всё же, помимо техногенных аварий специалисты по восстановлению не исключают возможность аварий природного характера.

«В области таких аварий мы заметили возникновение необычных сбоев из-за дождя там, где обычно они не появляются – затопление в таких городах как, например, Калгари, Альберта и в центре штата Висконсин, где месячная норма дождя может выпасть за 4 часа.

Внезапные затопления могут сделать всё, что угодно: разрушить или блокировать устройства, помешать сотрудникам начать работать или пайщикам воспользоваться услугами».

Правила по восстановлению информационной системы в случае форс-мажорных обстоятельств:

  • Проверяйте и тестируйте ваш план восстановления в случае аварии или сбоя как минимум ежегодно.
  • Добавляйте новые проблемы или ситуации в каждую проверку.
  • Обязательно учитывайте разницу между местными и региональными сбоями и действуйте согласно указанному виду сбоя.
  • Приготовьтесь к катастрофам, созданным руками человека. Крушение поезда или обрыв кабеля могут вывести вас из работы также, как и ураган или землятресение.
  • Воспользуйтесь всеми преимуществами кооперации и объединений кооперативов в ассоциации. Держите связь с вашими кооперативами-соседями и заключите двустороннее соглашение о возможности обмена рабочим пространством в случае форс-мажорных обстоятельств.

Средства восстановления

Хьюзмэн говорит, что сервисный центр Harland Financial Solutions предлагает следующие средства по восстановлению центральных процессоров:

  • Услуги по восстановлению в аварийных ситуациях, в особенности основной системы и восстановление дополнительных служб. В основном, компания перезагружает данные кредитного кооператива, чтобы снова можно было ими пользоваться.
  • Разрешение проблемы хранения данных, технология зашифрованного резервного копирования данных, которая хранит данные в информационном центре кооператива. Эта услуга предоставляется вместе с услугами по восстановлению в аварийных ситуациях.
  • Услуги сосредоточения. Представляют собой размещение серверов разных владельцев в одном месте с использованием общего высокоскоростного интернет-соединения. Harland Financial Solutions также предоставляет клиентам пространство в их центре хранения и обработки данных для серверов клиентов и другой вычислительной техники, создавая резервные копии данных главных серверов и других систем.
  • Обслуживание бизнес-ресурсов. «Мы можем работать в качестве администраторов UNIX-системы и\или отдела по компьютерным операциям клиента. Это помогает восстановлению в аварийных ситуациях, потому что мы знаем системы клиентов» - объясняет Хьюзмэн.

По словам Хьюзмэна, крупные кредитные кооперативы, несмотря на свой размер и имеющиеся ресурсы, считают, что не всегда необходимо или целесообразно делать все внутри системы.

«Например, у кредитных кооперативов есть тенденция не платить системным администраторам высокую зарплату по среднерыночной шкале заработной платы, поэтому они часто принимают на работу молодых людей, которые работают, потому что им нужен опыт работы. Это как проходной двор» - говорит он.

Хьюзмэн добавляет: «Решением является привлечь компанию, у которой имеются опытные, высокооплачиваемые администраторы, которые работают в этом месте годы и прекращали работу только по причине выхода на отпуск или больничный».

Главным сопротивлением при обращении к сторонним организациям для восстановления в аварийных ситуациях, с которым столкнулся Хьюзмэн, является желание кредитного кооператива «обладать этим, завладеть этим и прикоснуться к этому».

«Но сложная экономика и ограниченные ресурсы заставили кредитные кооперативы осознать, что некоторые проблемы не столь существенны и могут быть выполнены сторонними организациями. Таким образом, они смогут сосредотачиваться на долгосрочном планировании».

Хьюзмэн говорит, что один аспект движения кредитных кооперативов оказывает специалистам по восстановлению значительную помощь в быстром восстановлении дел клиента – это атмосфера сотрудничества организаций.

«Для наших сторонних клиентов, если у кредитного кооператива А, имеющего одно отделение, случится сбой, мы можем сделать так, чтобы он обратился к кредитному кооперативу Б и установил там свой кассовый отдел, который непосредственно и безопасно будет соединен с собственной базой данных и центральной системой. Пайщики этого кредитного кооператива могут идти туда и вести дела, как в своем отделении».

Самые лучшие приёмы

Хьюзмэн говорит, что кредитные кооперативы могут предпринять шаги, чтобы быть готовыми к возможной аварии, а именно:

  • Быть способным разместить персонал в другом месте;
  • Установить резервные объекты. Допустим, у вас есть 12 отделений – расширьте половину из них, чтобы разместить там дополнительный персонал и пайщиков.
  • Использовать соцсети при общении с пайщиками в случае перебоя в бизнесе.
  • Многие кредитные кооперативы предлагают пайщикам, которые пользуются планшетами и смартфонами, различные мобильные сервисы.
  • Также во время сбоя предложите пайщикам использовать сеть отделов.

Хьюзмэн говорит, что у некоторых кредитных кооперативов есть передвижной офис, который может фигурировать в качестве временного отделения.

«Это - специализированный полуприцеп с электроэнергией, кондиционированием воздуха и отоплением, доступом в интернет и с кассовыми пунктами. У нас может быть один на месте, работающий в течение 48 часов» - объясняет Хьюзмэн.

«Хорошо подготовленные кредитные кооперативы – это те, которые тестируют план действий по восстановлению как минимум раз в год» - добавляет он.

«Воспользуюсь спортивной метафорой, чтобы описать, что нужно делать согласно этому плану: практикуй метод, по которому ты планируешь играть.

Тренируйся для реальных событий, а не делай упражнения просто для галочки. Выйди за рамки своих планов, столкнись с проблемами, о которых ты не думал».

Хьюзмэн согласен с тем, что даже при наличии хорошего плана тестирования, кредитный кооператив должен обращать особое внимание на пункты, которые идут вразрез от запланированного.

«Все хорошо, если вы сталкиваетесь с проблемами, когда тестируете план действий по восстановлению. Лучше найти и устранить дефекты во время проверки, чем в реальной ситуации» - говорит он.

«Не довольствуйтесь достигнутым. Добавляйте пункты к плану действий. Разработайте чёткие инструкции и план действий и тестируйте их ежегодно».

Флик говорит, что разработчики планов аварийного восстановления должны принимать активное участие, когда кредитные кооперативы тестируют данные планы. «Когда мы рядом с ними, то можем выявить недоработки. Мы делаем акцент, что нет неудачного испытания – вы всегда что-нибудь узнаете, что лучше подготовит вас к реальной ситуации. Мы указываем время восстановления и отправляем эти данные аудиторам и лицам, участвующим в проверке.

«Нам помогает то, что у руководства имеются сведения о реальном времени восстановления. Между руководством и персоналом ИТ может быть напряжённость – руководство хочет, чтобы сервисы были восстановлены немедленно, а персоналу ИТ необходимо время на восстановление».

Хотите внедрить в своей организации CRM или получить бесплатную консультацию? Тогда звоните нам по телефону: +7(843)202-38-93