Я беру ночную резервную копию с моего веб-хостинга .смола.gz. Измененные данные очень мало каждую ночь (<10 МБ).
Я хотел бы архивировать эти файлы и дедуплицировать (сплошное сжатие) файлы по нескольким .смола.ГЗ архивов без извлечения каждого отдельного файла резервной копии.
упрощенный пример:
2013-02-24.tar.gz
содержит a.pdf
2013-02-25.tar.gz
содержит a.pdf
и b.pdf
Я хочу сжать и архив 2013-02-24.tar.gz
и 2013-02-25.tar.gz
и store a.pdf
только один раз.
единственный способ, которым я получил дедупликацию, - это распаковать оба .смола.gz и упакуйте их снова (используя твердое сжатие). Но это еще один шаг, и он, вероятно, сотрет информацию о файловой системе из-за разных ОС. Просто tar / gz оба .смола.gz файлы работать не будут, итоговый размер этого архива будет суммой обоих исходных.смола.файлы gz.
есть ли способ использовать дедупликацию на содержании нескольких .смола.gz файлы?