Дедупликация файлов внутри нескольких.смола.архивы gz

Я беру ночную резервную копию с моего веб-хостинга .смола.gz. Измененные данные очень мало каждую ночь (<10 МБ).

Я хотел бы архивировать эти файлы и дедуплицировать (сплошное сжатие) файлы по нескольким .смола.ГЗ архивов без извлечения каждого отдельного файла резервной копии.

упрощенный пример:

2013-02-24.tar.gz содержит a.pdf
2013-02-25.tar.gz содержит a.pdf и b.pdf

Я хочу сжать и архив 2013-02-24.tar.gz и 2013-02-25.tar.gz и store a.pdf только один раз.

единственный способ, которым я получил дедупликацию, - это распаковать оба .смола.gz и упакуйте их снова (используя твердое сжатие). Но это еще один шаг, и он, вероятно, сотрет информацию о файловой системе из-за разных ОС. Просто tar / gz оба .смола.gz файлы работать не будут, итоговый размер этого архива будет суммой обоих исходных.смола.файлы gz.

есть ли способ использовать дедупликацию на содержании нескольких .смола.gz файлы?

25
задан rimshot
13.04.2023 0:32 Количество просмотров материала 2718
Распечатать страницу

4 ответа

Я не думаю, что вы можете делать то, что вы пытаетесь сделать это "легко"

Если .файлы tgz достаточно похожи, вы можете использовать xdelta и создать резервную копию первого файла полностью, а затем xdelta с разницей между первым и вторым файлом.

альтернативным частичным решением было бы использование rzip (или lrzip ??) который предназначен для сжатия очень больших файлов - хотя он и не идеален, он, вероятно, будет значительно меньше, чем то, что вы используете в момент, за счет процессора и памяти.

0
отвечен davidgo 2023-04-14 08:20

Я использую squashfs для аналогичных целей:

mksquashfs dir1 dir2 dir3 backup_file.fs -keep-as-directory
0
отвечен user369869 2023-04-14 10:37

Я опаздываю на вечеринку, но требования, похоже, сводятся к следующему:

  1. дедупликация содержимого файла архива
  2. должна быть возможность восстановления исходных файлов gzip

сначала это кажется невозможным. Дедупликация обычно зависит от возможности работы с несжатыми файлами. Но потом я понял, что если вы можете положиться на gunzip / gzip, создающий точно такой же файл (лучше протестировать его), то вы можете использовать zbackup, который на самом деле предназначен для дедупликации tarballs. So:

  1. gunzip архивы вам
  2. gzip tarballs еще раз, чтобы убедиться, что они точно совпадают (должно быть, если реализация gzip одинакова, но уровень сжатия может варьироваться, например, так что вам может понадобиться, чтобы узнать, что)
  3. кормить tarballs zbackup
0
отвечен user1338062 2023-04-14 12:54

отличная решение который делает то, что вы просите, он дедуплицирует блоки внутри нескольких файлов TAR. Это не только исключает файлы, которые не были изменены, но он также хранит только измененные части подобных файлов.

Это, однако, клиент / серверное решение, где сервер является платным предложением. Но из-за дедупликации это очень доступный плюс он предлагает шифрование и хранит файлы безопасно для вас.

клиент использует нормальный код tar, поэтому команда является Оснастки для использования.

0
отвечен eckes 2023-04-14 15:11

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх