7 метрик VDS, которые нельзя игнорировать

Zabbix с сотней графиков перегружает. На практике достаточно семи показателей с понятными порогами — остальное смотрите при разборе инцидента. Mediops собирает их агентом раз в минуту.

1. CPU (%)

Средняя загрузка за 5–15 минут важнее секундного пика. Постоянно > 80% — узкое место в коде, индексах БД или нехватка ядер.

Стартовый порог алерта: 85% в течение 10 минут. Для batch-ночей — отдельный порог или расписание тишины.

2. RAM (%)

Linux кэширует файлы в памяти — это нормально. Опасно, когда available стремится к нулю и растёт swap.

Порог: 90% занятой RAM + активный swap — разбирать до OOM.

3. Swap (%)

Swap как буфер — ок. Swap 50–100% при нормальной RAM — приложение утекает или лимиты php-fpm завышены.

На VPS с 1–2 GB RAM swap обязателен, даже если «всё влезает» — пик нагрузки придёт ночью с импортом.

4. Disk (%)

Самая частая причина «сайт лёг» без ошибок в логах приложения. Рост логов, сессий, бэкапов на том же разделе.

Порог: предупреждение 80%, критично 90%. Смотрите тренд за 7 дней, не только текущее значение.

5. Network RX/TX

Внезапный всплеск TX — DDoS, утечка данных или сломанный cron, шлющий почту. RX — парсинг фидов, бэкапы с другого сервера.

Сравнивайте с базовой линией: «в 10 раз выше обычного» лучше, чем абсолютный Mbps.

6. Nginx: активные соединения

Рост conn при стабильном трафике — медленные upstream (PHP/MySQL), keepalive, атака slowloris.

Связка: nginx conn ↑ + CPU PHP ↑ + MySQL conn ↑ = ищите тяжёлый запрос или отсутствие кэша.

7. MySQL: число соединений

Упирается в max_connections — сайт отдаёт 500/502. Частые причины: не закрытые соединения в коде, агенты без пула, боты.

SHOW VARIABLES LIKE 'max_connections';
SHOW STATUS LIKE 'Threads_connected';

Как не утонуть в цифрах

  • Один дашборд на сервер с семью метриками + алерты на пороги.
  • Ежедневная сводка в email/Telegram/MAX — видно деградацию до пика.
  • Запрос метрик из бота MAX — когда веб-кабинет недоступен, а мессенджер работает.

Соберите метрики за 2 минуты

Агент Mediops по cron — графики в кабинете и алерты в Telegram/MAX.