7 метрик VDS, которые нельзя игнорировать
Zabbix с сотней графиков перегружает. На практике достаточно семи показателей с понятными порогами — остальное смотрите при разборе инцидента. Mediops собирает их агентом раз в минуту.
1. CPU (%)
Средняя загрузка за 5–15 минут важнее секундного пика. Постоянно > 80% — узкое место в коде, индексах БД или нехватка ядер.
Стартовый порог алерта: 85% в течение 10 минут. Для batch-ночей — отдельный порог или расписание тишины.
2. RAM (%)
Linux кэширует файлы в памяти — это нормально. Опасно, когда available стремится к нулю и растёт swap.
Порог: 90% занятой RAM + активный swap — разбирать до OOM.
3. Swap (%)
Swap как буфер — ок. Swap 50–100% при нормальной RAM — приложение утекает или лимиты php-fpm завышены.
4. Disk (%)
Самая частая причина «сайт лёг» без ошибок в логах приложения. Рост логов, сессий, бэкапов на том же разделе.
Порог: предупреждение 80%, критично 90%. Смотрите тренд за 7 дней, не только текущее значение.
5. Network RX/TX
Внезапный всплеск TX — DDoS, утечка данных или сломанный cron, шлющий почту. RX — парсинг фидов, бэкапы с другого сервера.
Сравнивайте с базовой линией: «в 10 раз выше обычного» лучше, чем абсолютный Mbps.
6. Nginx: активные соединения
Рост conn при стабильном трафике — медленные upstream (PHP/MySQL), keepalive, атака slowloris.
Связка: nginx conn ↑ + CPU PHP ↑ + MySQL conn ↑ = ищите тяжёлый запрос или отсутствие кэша.
7. MySQL: число соединений
Упирается в max_connections — сайт отдаёт 500/502. Частые причины: не закрытые соединения в коде, агенты без пула, боты.
SHOW VARIABLES LIKE 'max_connections';
SHOW STATUS LIKE 'Threads_connected';
Как не утонуть в цифрах
- Один дашборд на сервер с семью метриками + алерты на пороги.
- Ежедневная сводка в email/Telegram/MAX — видно деградацию до пика.
- Запрос метрик из бота MAX — когда веб-кабинет недоступен, а мессенджер работает.
Соберите метрики за 2 минуты
Агент Mediops по cron — графики в кабинете и алерты в Telegram/MAX.