Рассказ про аварию в ЦОДе RU VDS
habr.com "Коротко: 17 июня около часа ночи мы потеряли два ввода питания от города из-за аварии на подстанции, затем — один из дизелей, что вызвало «мигание» питания в подземном дата-центре. Итог инцидента — простой около 12 часов примерно 7–10 % машин одного из 14 наших ЦОДов." "...оказывается, что тяжело менять коммутатор, когда ты держишь руками патрубок дизеля."
>
> В итоге директор ИТ (пришедший с Пепси-Колы) стал козлом отпущения и уволился через полгода.
В моем понимании, за такое должен отвечать как раз директор ИТ и старшие админы, которые отвественны за архитектуру и реализацию ИТ инфраструктуры. А бегающие с жопой в мыле рядовые админы - получить премию, сэкономленную на вышестоящих. И не надо рассказывать (как у нас любит рассказывать наш ИТ директор), что собственники/генеральный/акционеры не поддержали его благих начинаний и не выделили нужных денег на людей/железо/софт - твоя система упала? упала. ты не смог ее поднять обратно в актуальные сроки? не смог. Херовый из тебя ИТ директор.