Преамбула:
Начиная с конца мая (когда в Москве началась жара) в нашей серверной началась "веселая жизнь". Несколько раз отключались кондиционеры, а в пятницу нам попытались ограничить потребление электроэнергии.
Приехали электрики, и заменили на входных фидерах вставки на 200 Aмпер на 100 Амперные. Пока все это происходило, естественно не работало освещение и кондиционеры, но расположенный в подвале УПС чесно тянул всю подключенную к нему вычтехнику - несколько сотен рабочих мест, полсотни серверов и два дестка цисок с АТС в придачу.
После того, как питание восстановилось, он начал заряжать батареи, при этом его потребление от сети зашкалило за 100A.
Приехала аварийка, заменили вставки (опять на такие же), после чего они сгорели снова. Это случилось уже в самом конце рабочего дня. Большинство персоналок выключили, остались только сервера, на которые УПС отдавал порядка 50A. Со скандалом заставили электриков вернуть все как было...
Амбула. В субботу упал сервер. По ТТХ аналог того, на чем сейчас крутится Ромба, только 2U и по-этому с рейдом.
Поднять его за выходные не получилось. Вчера приступил к выяснению отношений без скидок на ограничения выходных дней.
В минимальной конфигурации (т.е. с одним модулем памяти и без сетевухи), сервер завелся и дошел до инициализации рейд-контроллера, на которой и повис.
Я вспомнил, как в прошлом году сдох такой же контроллер у его брата-близнеца, и взяв диски, контроллер и кое-что по мелочи пошел к себе с мыслью пересадимть диски на набортовый SCSI контроллер, собрать на них SoftRaid и пусть дальше живет так. На всякий случай проверел контроллер на Cur DLS, на которой он и заработал.
После этого, я подключил к серверу другой БП и убедился, что виноват именно питальник. Причем, судя по всему, проблемы в цепи 3.3V, т.к. проявлялись они именно при подключении рейда, который практически не потребляет по 5V.
К сожалению БП у двухюнитовых корпусов нестандартный по геометрии, и вместо замены, пришлось заняться ремонтом.
По совету ivp осмотрел конденсаторы, и обнаружил, что три из них вздулись. Заменил на позаимствованные с найденного на складбище Повермана IW-P300A2-0 3300 mkF Ost (спасибо всем, кто расписал в Вики, что такое хорошо и что такое плохо применительно к конденсаторам), после тестирования на машинке, которую не жалко и угробить, ежели что, поставил в сервер, который, опять-таки после тестирования вернул в стойку.
Михаил.
Кондиtion надо бы ставить...:wink:
А упс не потянет, если на него перевесить хотябы один кондиционер? Хоть какое-никакое охлаждение.
[offtop]вот на работе стоит одно чудо-юдо роутерное с попухшими уже везде кондесаторами (даже на видеокарте) и тем не менее аптаймы по полгода при нагрузке вполне приличной
ns1$ uptime
8:40PM up 156 days, 22:50, 1 user, load averages: 0.95, 0.95, 0.94
[/offtop]
А Либерти в подвале не резиновый, чтобы на него вешать еще и кондеи, с учетом того, что к паре самых мощных подводится по десять киловатт (это не в тепловом а в электрическом измерении).
GetinakS У помянутого сервера Uptime был с случившегося прошлым летом пожара, когда обесточили все.
А вообще проблема перегрева серверных - достаточно комплексная. Тут надо подумать хорошо и статью написать. "Это я скорее себе на будущее узелок мотаю".
Причем кроме трех вспухших cTc на 2200 в той же цепи стоял один CapXon на 3300. Я его тоже заменил, но он-то все это перенес нормально.
Сегодня постараюсь выложить фото.
стояли там сервера класса пень 2-3
работают практически в Uptime
И вот на одном практически все конденсаторы повспухали
несколько раз ручи чесались поменять их / так и не дошли
;) "зато" на том сервер сгорел БП / пару винтов посыпались;-)
в общем с того момента как я ее первый раз увидел - 3 года прошло ;-)
до сего момента трудиться
p.s. насчет кондиционера - после того как сгорел порт на циске
и практическа сразу ушло в ремонт пару серверых УПС
/ жара летом была такая....что рукой горячевато было приконуться к корпосам серверов......;-(
нам все таки купили "кондиционер"
единственная проблема - на UPS его не повесиш...мощный зараза / если свет мигнул - кондиционер вырубился и начился африканский климат
...но потом ...дежурного напрягли - что бы смотрел время от времени - за кондионером. ;-)
и так вроде порядок
- ESR косвенной причиной. Высокий уровень ЭПС вызывает больший нагрев. Ставим с ESR в два-три раза меньше и радуемся почти эквивалентному снижению нагрева.