«Раз в месяц падает — норм, перезагрузил и забыл»

Звучит разумно — пока не посчитаешь цену «мелкого» сбоя. Перезагрузка снимает симптом, но не причину. Разбираем, почему редкие падения — это уже много, и что проверять за пять минут.

Типичная картина

  • Ночью OOM-killer убил MySQL — утром белый экран.
  • Certbot не отработал — HTTPS упал в пятницу в 19:00.
  • Диск 98% — «ну пару раз в месяц тормозит, живём».

Следующий раз часто попадает в рабочий день, когда клиенты уже на сайте.

Почему «раз в месяц» — это много

  • 12 раз в год — шанс попасть в пик продаж или дедлайн заказчика.
  • Час простоя в понедельник утром ≠ «никто не заметил ночью».
  • Поисковики видят 5xx и медленные ответы — SEO не прощает «редко».

Мини-ритуал на 5 минут (раз в неделю)

# 1. Сайт снаружи — не из своего кэша браузера
curl -sI https://ваш-сайт.ru | head -5

# 2. Диск — пока не 95%
df -h | grep -E '^/dev'

# 3. Сервисы — живы ли
systemctl is-active nginx mysql php*-fpm 2>/dev/null | paste - -

# 4. Повторяющиеся ошибки за сутки
journalctl -u nginx -u mysql --since "24 hours ago" -p err --no-pager | tail -5

Один красный пункт — не «подождём до следующего раза», а разберитесь сегодня. Без регистрации: проверка сайта и SSL.

Честно про Mediops

Мониторинг не про паранойю — про то, чтобы узнать о проблеме до клиента. На бесплатном тарифе: 1 сервер, 3 сайта, алерт на email при сбое. Telegram и MAX — с тарифа «Старт». Постоянные проверки сайта и SSL между вашими ручными ритуалами.

Автоматизируйте то, что делаете руками

Между еженедельными проверками — мониторинг с алертами. Бесплатный старт без карты.