Стоит ли включать дедупликацию при создании резервных копий?

Здравствуйте! <br/> У меня есть виртуальная машина под управлением Windows Server 2019 Standard, на которой установлена Veeam Backup & Replication CE. Она будет создавать резервные копии других виртуальных машин и сохранять их на отдельном разделе, отформатированном в REFS. Нужно ли включать дедупликацию на этом разделе? С одной стороны, это может сэкономить место. С другой стороны, если произойдет повреждение общих блоков, могут ли оказаться неработающими все резервные копии? Или стоит не беспокоиться об этом?
  • 20 марта 2025 г. 15:54
Ответы на вопрос 2
Здравствуйте!

Вопрос о необходимости включения дедупликации для резервных копий требует взвешенного подхода. Вот некоторые моменты, которые стоит учесть:

1. **Экономия места**: Дедупликация действительно может существенно сэкономить место, особенно если ваши резервные копии содержат много повторяющихся данных. Однако стоит помнить, что этот процесс требует ресурсов процессора и памяти, что может повлиять на производительность системы.

2. **Риск повреждения данных**: Вы правы в своих опасениях: если дедупликация происходит на уровне блоков и один из блоков оказывается поврежденным, это может затронуть все резервные копии, использующие этот общий блок. Это особенно критично в случае, если дедупликация выполняется неправильно или происходит corruption данных.

3. **Требования к восстановлению**: Если вам необходимо быстро восстанавливать данные, дедупликация может увеличить время восстановления, так как система должна будет собирать блоки для восстановления.

4. **Использование REFS**: Файловая система REFS (Resilient File System) уже включает в себя механизмы исправления ошибок и защиты данных от повреждений, что может снизить риски, связанные с повреждением данных на уровне файловой системы.

5. **Рекомендации Veeam**: Veeam обычно рекомендует не использовать дедупликацию на разделах, предназначенных для хранения резервных копий. Они рекомендуют использовать свое встроенное сжатие и оптимизацию для хранения данных резервного копирования. Это позволяет уменьшить объем занимаемого места без риска повреждения данных.

С учетом вышесказанного, если ваша система и данные критично важны, лучше оставить дедупликацию выключенной и полагаться на другие механизмы оптимизации, предлагаемые Veeam и REFS. Однако, если у вас есть достаточно ресурсов и вы готовы к потенциальным рискам, можно попробовать включить дедупликацию на тестовом разделе, чтобы увидеть, как это повлияет на ваши конкретные операции. 

В любом случае, регулярное тестирование восстановления резервных копий является обязательным для обеспечения надежности ваших данных.
Veeam Backup не хранит файлы как они были в оригинале, а создает что то типа архива в своем формате, со своими технологиями сжатия и дедупликации, поэтому файловая система не найдет в них копий. 

Дедупликация это в принципе очень слабый механизм сжатия данных, который срабатывает в ограниченном количестве случаев (пофайлово, а точнее поблочно), когда ты делаешь копию файла и чуть чуть его редактируешь (меняя только его часть, вот например текстовые, если ты вставишь/удалишь символ в начале, это сдвинет содержимое всего файла и он будет считаться полностью изменившимся, но замена одного символа в начале позволит хранить только тот блок, в котором было это изменение, а остальное содержимое будет ссылаться на оригинальный файл)
Похожие вопросы