Рассказ про аварию в ЦОДе RU VDS
habr.com "Коротко: 17 июня около часа ночи мы потеряли два ввода питания от города из-за аварии на подстанции, затем — один из дизелей, что вызвало «мигание» питания в подземном дата-центре. Итог инцидента — простой около 12 часов примерно 7–10 % машин одного из 14 наших ЦОДов." "...оказывается, что тяжело менять коммутатор, когда ты держишь руками патрубок дизеля."
Когда в РусАлко (Русский Стандарт) шифратор (пришедший с украинской подсетки украинского филиала) положил всю сеть и весь ИТ работал как проклятый несколько суток - никого не только не премировали, но ещё грозили оштрафовать, что такая ситуация возникла. На два дня встала отгрузка товара, а доставка товара в крупные сети согласуется по времени - фуры с алкоголем должны разгрузиться в нужное время. Какие убытки были - не озвучивали, но скандал был знатный.
В итоге директор ИТ (пришедший с Пепси-Колы) стал козлом отпущения и уволился через полгода.
P.S. Я сижу, мучаю 1С, сзади админ восклицает - что за херня? Оглядываюсь - у него комп перегрузился и идет сканирование диска (checkdisk), бац, рядом с ним такой же комп перегрузился... Я так - ага, раз, сетевой кабель выдёргиваю, все остальные компы админы стали вырубать, в итоге опенспейс - огромный зал - не работает и среди всего этого чОрного бедлама светится мой работающий комп. ))))
Хотя выдернутый провод был скорее всего для очистки совести, - за месяц до этого я читал про уязвимость Heartbleed, запустил и установил с Майкрософта патч, ликвидирующий уязвимость. А админы устанавливали обновления централизовано и просрали этот момент.
В итоге на моем компе сохранились настройки, пароли, ключи, что позволило быстрее начать отгрузки, пока всё остальное восстанавливали с ленты.