Одной из наиболее распространенных задач технического обслуживания Ceph является замена диска OSD. Если диск уже находится в состоянии сбоя, можно выполнить шаги, описанные в разделе
Удаление OSD. Ceph воссоздаст копии данных на оставшихся OSD, если это возможно. Перебалансировка начнётся сразу после обнаружения сбоя или остановки OSD.
При настройках по умолчанию (size=3, min_size=2) для восстановления требуется минимум 4 (домен отказа — хост).
Для замены исправного диска из веб-интерфейса, следует выполнить шаги, указанные в разделе
Удаление OSD. Единственное дополнение — дождаться, пока кластер не покажет HEALTH_OK, прежде чем останавливать OSD для его уничтожения.
Замена исправного диска:
Выведите OSD из кластера:
# ceph osd out osd.<id>
Дождитесь состояния HEALTH_OK.
Проверьте возможность удаления:
# ceph osd safe-to-destroy osd.<id>
Остановите и удалите OSD:
# systemctl stop ceph-osd@<id>.service
# pveceph osd destroy <id>
Остановите и удалите OSD:
# systemctl stop ceph-osd@<id>.service
# pveceph osd destroy <id>
Замените диск новым (того же типа и размера) и выполните процедуру, описанную в разделе
Создание OSD.
После завершения автоматической перебалансировки состояние кластера должно вернуться к HEALTH_OK. Оставшиеся отчёты об авариях можно подтвердить командой:
# ceph crash archive-all
Рекомендуется регулярно запускать fstrim (discard) на ВМ и контейнерах. Это освобождает блоки данных, которые файловая система больше не использует, снижая нагрузку на ресурсы хранения.
Большинство современных ОС выполняют discard автоматически. Необходимо лишь убедиться, что для ВМ включена опция Discard (Отклонить).
26.6.10.3. Очистка (scrubbing)
Ceph обеспечивает целостность данных, выполняя очистку (scrubbing) групп размещения. В ходе этой операции проверяется работоспособность каждого объекта в PG.
По умолчанию Ceph выполняет проверки:
Если очистка влияет на производительность, можно настроить расписание с помощью параметров:
osd scrub begin hour = 2
osd scrub end hour = 6