Product SiteDocumentation Site

Глава 43. Встроенный мониторинг PVE

Все данные о потреблении ресурсов и производительности можно найти на вкладках Сводка (Summary) узлов PVE и ВМ. Можно просматривать данные на основе почасового ежедневного, еженедельного или за год периодов.
Сводка (Summary) узла pve01 со списком для выбора периода данных:
Выбор периода данных, для отображения отчета
Просмотреть список всех узлов, ВМ и контейнеров в кластере можно, выбрав ДатацентрПоиск (DatacenterSearch). Этот список может быть отсортирован по полям: Тип (Type), Описание (Description), Использование диска % (Disk usage), Использование памяти (Memory usage), Загрузка CPU (CPU usage) и Время работы (Uptime). В этом списке отображается потребление ресурсов только в реальном масштабе времени.
Потребление ресурсов
Для мониторинга состояния локальных дисков используется пакет smartmontools. Он содержит набор инструментов для мониторинга и управления S.M.A.R.T. системой для локальных жестких дисков.
Получить статус диска можно, выполнив следующую команду:
# smartctl -a /dev/sdX
где /dev/sdX — это путь к одному из локальных дисков.
Включить поддержку SMART для диска, если она отключена:
# smartctl -s on /dev/sdX
Просмотреть S.M.A.R.T. статус диска в веб-интерфейсе можно, выбрав в разделе Диски нужный диск и нажав кнопку Показать данные S.M.A.R.T.:
Кнопка Показать данные S.M.A.R.T.
По умолчанию, smartmontools daemon smartd активен и включен, и сканирует диски в /dev/sdX и /dev/hdX каждые 30 минут на наличие ошибок и предупреждений, а также отправляет сообщение электронной почты пользователю root в случае обнаружения проблемы (для пользователя root в PVE должен быть введен действительный адрес электронной почты).
Электронное сообщение будет содержать имя узла, где возникла проблема, а также параметры самого устройства, такие как серийный номер и идентификатор дискового устройства. Если та же самая ошибка продолжит возникать, узел будет отсылать электронное сообщение каждые 24 часа. Основываясь на содержащейся в электронном сообщении информации можно определить отказавшее устройство и заменить его в случае такой необходимости.