Dumb ways to die, или 7 популярных ошибок при подключении оборудования

Рассказываем, как правильно подключать ИТ-оборудование в стойку.

04 сентября 2013  • 

Не хотелось бы никого расстраивать, но даже самый “нарядный” ЦОД - с резервированием по схеме N в кубе и вообще ваш собственный - еще не гарантия бесперебойной работы оборудования: это самое оборудование, прежде всего, нужно правильно подключить.

“Спасибо, Кэп!” - снисходительно улыбнется мой читатель, а я ему отвечу: не стоит благодарностей, сходите лучше в ЦОД и проверьте еще раз ваши стойки. Да-да, те самые, с которыми сто лет как все в порядке. Вы не поверите, как часто именно с такими вот “беспроблемными” стойками и случается прискорбное. Я даже чеклист набросал.


Итак, что НЕ должно встретиться вам на этой послеобеденной прогулке:

1. Сервер, СХД или сетевое оборудование о двух блоках питания, подключенных зачем-то к одному PDU*

Вот вроде бы азбука, - а вы все же проверьте. Бывает.

Вариация на ту же тему - АВР, обоими кабелями питания воткнутый в один и тот же PDU.

Во избежание: АВР (автоматический ввод резерва) - это такая штуковина, посредством которой к двум PDU (и, стало быть, к двум лучам) подключается оборудование с одним блоком питания - например, сетевое: коммутаторы, маршрутизаторы, вот это все.

Предположим, по чьей-то рассеянности АВР, к которому вот это все подключено, оказывается запитан от одного PDU. Чем это чревато? При пропадании соответствующего луча оборудование с таким АВР, разумеется, отключится, - а если это сетевое железо, вы и вовсе потеряете связь со всей стойкой. Звучит не очень, согласитесь.

2. Оборудование с одним блоком питания, подключенное вовсе без АВР

Плохая, плохая идея. Понимаю, копейка рубль бережет, - но вам ведь важно, чтобы оно еще и  безотказно работало, верно?

3. Загрузка АВР более чем на 75-80%

?В чем тут засада: при запуске и перезагрузке оборудование потребляет гораздо больше тока, чем в обычном рабочем режиме. Соответственно, если «запаса» АВР на такие разовые «всплески» нет, у вас при запуске \ перезапуске просто «выбьет пробки» и привет.

4. Оборудование, подключенное в соседние стойки

?Возможно, кому-то покажется остроумным “отгрузить” немного электропотребления в соседний “шкаф”, раз уж он простаивает недоутилизированным, пока рядом, что называется, некуда вешать. А теперь вопрос на засыпку: что там у нас к какому лучу подключено в итоге? А? Никто не в курсе? Вот то-то и оно.

Еще есть такой нюанс, как тепло, вырабатываемое оборудованием, и риски локального перегрева стойки, нагруженной этим оборудованием «под завязку». Перегрев и бардак с прокладкой проводов - не лучшее подспорье в ИТ-хозяйстве, поверьте.

5. Перегруженные секции PDU

Начну издалека: у PDU есть секции, и это все не просто так. Каждая секция стандартного PDU, суммарная мощность которого составляет, скажем, 32А, рассчитана на ток не более 16А. А на 20А уже не рассчитана. И на 25 тоже нет. Даже если вторая секция совершенно свободна. Такой вот нюанс.

А теперь представим, что кто-то (с самыми светлыми, заметим мы в скобках, намерениями) аккуратно заполняет стойку оборудованием и АВР - допустим, снизу вверх - и, понятно, подключает все это дело также строго снизу вверх. Чтобы как раз без бардака и красиво.

Казалось бы, все правильно сделал, и 32А еще не вычерпаны, а всего только 20 - живи да радуйся. Потом одним прекрасным утром в ЦОДе отключается один луч питания - и внезапно (!) на “перегретой” секции срабатывают защитные автоматы и вся эта секция (с подключенным к ней оборудованием, да-да) благополучно отключается. Изящно, правда? Хотите себе такое?

6. Стойка, перегруженная оборудованием настолько, что вынуждена в штатном режиме “кормиться” сразу от двух лучей, один из которых вообще-то резервный

Тут такое дело: резерв, который задействован в штатной ситуации, - он как бы уже и не резерв, что ли...
Хорошая же новость заключается в том, что есть и человеческие способы увеличить мощность стойки,-  причем без отключения активного оборудования. Заинтриговал? Тогда записывайте:

  • во-первых, можно добавить еще пару PDU аналогичной мощности и все новое оборудование...ладно, дальше сами, не маленькие;
  • во-вторых (вариант поэкзотичнее), можно заменить текущие PDU на более мощные

Здесь, пожалуй, потребуется некоторая сноровка, но в целом все, опять-таки, прозрачно: ставите более мощные автоматы, прокладываете более мощный кабель, устанавливаете новый (по совместительству более мощный) PDU рядом с прежним - и спокойно переключаете оборудование из одного PDU в другой. Ну, то есть как спокойно: если вдруг у вас недосмотр по пункту один нашего чеклиста, может получиться неловко. А если все четко - пройдет без помех. Далее повторяете процедуру со вторым PDU - и виват! Можно пойти перекурить.

7. Вы только не смейтесь, но… проверьте индикацию. Нет, правда,  проверьте

У самого бывало: подключили АВР, вроде бы все ok, – а плохой контакт, или нерабочий провод, или вовсе неплотно вставлен кабель… продолжать?

То же самое и с двумя блоками питания: внешне все прекрасно – оборудование работает, проблем нет. А на самом деле один из блоков давно помер, не оставив завещания.

В общем, не ленитесь раз в как получится проверить особенно дорогое вашему сердцу оборудование на наличие красных лампочек или отсутствие зеленых в нужных местах. Сами себе потом спасибо скажете.


На этом наш скромный хит-парад несуразностей при подключении оборудования исчерпан. Непрерывного вам сервиса и бесперебойных благ.

 

* Power Distribution Unit – блок розеток, если по-простому

Расскажите друзьям и коллегам о статье
  • Поделиться
  • Поделиться
  • Поделиться

Подписка на новые статьи

Свежие статьи и анонсы семинаров по почте

Пишем редко и по делу

Последние статьи

Нашли решение для давней проблемы, перед которой сдалась сама VMware.

13 февраля
Евгений Парфенов

Простые настройки, которые защитят вашу базу данных от непрошеных гостей.

06 февраля
Виталий Ковригин

Рассказываем про облако, которое выживет при падении целого дата-центра.

30 января
DataLine

Комментарии

randomness