«Раз в месяц падает — норм, перезагрузил и забыл»
Звучит разумно — пока не посчитаешь цену «мелкого» сбоя. Перезагрузка снимает симптом, но не причину. Разбираем, почему редкие падения — это уже много, и что проверять за пять минут.
Типичная картина
- Ночью OOM-killer убил MySQL — утром белый экран.
- Certbot не отработал — HTTPS упал в пятницу в 19:00.
- Диск 98% — «ну пару раз в месяц тормозит, живём».
Следующий раз часто попадает в рабочий день, когда клиенты уже на сайте.
Почему «раз в месяц» — это много
- 12 раз в год — шанс попасть в пик продаж или дедлайн заказчика.
- Час простоя в понедельник утром ≠ «никто не заметил ночью».
- Поисковики видят 5xx и медленные ответы — SEO не прощает «редко».
Мини-ритуал на 5 минут (раз в неделю)
# 1. Сайт снаружи — не из своего кэша браузера
curl -sI https://ваш-сайт.ru | head -5
# 2. Диск — пока не 95%
df -h | grep -E '^/dev'
# 3. Сервисы — живы ли
systemctl is-active nginx mysql php*-fpm 2>/dev/null | paste - -
# 4. Повторяющиеся ошибки за сутки
journalctl -u nginx -u mysql --since "24 hours ago" -p err --no-pager | tail -5
Один красный пункт — не «подождём до следующего раза», а разберитесь сегодня. Без регистрации: проверка сайта и SSL.
Честно про Mediops
Мониторинг не про паранойю — про то, чтобы узнать о проблеме до клиента. На бесплатном тарифе: 1 сервер, 3 сайта, алерт на email при сбое. Telegram и MAX — с тарифа «Старт». Постоянные проверки сайта и SSL между вашими ручными ритуалами.
Автоматизируйте то, что делаете руками
Между еженедельными проверками — мониторинг с алертами. Бесплатный старт без карты.