есть ли контрольная сумма файла, разработанная специально для восстановления одного файла (архива) с повреждением данных? Что-то простое, как хэш, который может быть использован для восстановления файла
Я пытаюсь архивировать некоторые резервные копии домашних и деловых файлов (не медиафайлов), сжимая их и датируя их. Самый большой архив в настоящее время работает около 250 ГБ. После того, как архив был создан, я сделал контрольную сумму MD5 на нем, передал архив на другой диск, а затем использовал MD5 для проверки файлы были переданы правильно и сохранены MD5 хэши с архивами для последующей проверки. Я планирую пытаться архивировать эти резервные копии 1-2 раза в год и хранить их на жестком диске и лентах, как позволяет бюджет.
текущий формат архива "Zipx" с самыми высокими настройками.
учитывая объем информации около 1-2 ТБ в год в настоящее время, я вижу, что у вас есть какое-то повреждение данных; особенно учитывая, что эти файлы находятся на потребительских дисках. Добавлять при этом резервные копии в конечном итоге передаются с диска на диск, на ленту и обратно, что первоначальный архив 250 ГБ может фактически быть много терабайт записанных и прочитанных данных, что увеличивает риск повреждения данных. И проверка MD5s после каждой передачи добавляет много времени, поскольку проверка MD5 ограничена вводом-выводом; проверка MD5 на архиве 250 ГБ занимает много времени, умноженное на все архивы, и MD5 не будут проверяться так часто, как им нужно.
Так предположения таковы:
- данные будут повреждены
- мы не узнаем об этом до тех пор, пока факт.
- из-за бюджетных ограничений и отсутствия "критически важных", у нас нет нескольких копий одних и тех же архивов резервных копий, только разные итерации резервных копий.
- мы хотим, чтобы свести к минимуму копии наших резервных копий, защищая от повреждения данных.
- если файл или два в архиве поврежден, и мы теряем данные, когда мы пытаемся восстановить; жизнь будет продолжаться. Это не критически важная вещь.
- архивы резервной копии и, надеюсь, не привыкнет больше, чем пару раз в десять лет или меньше. Оперативная резервная копия существует несжатой.
С этим предположением, как мы защищаем от повреждения данных.
хранение хэша MD5 только позволяет кому-то знать, соответствуют ли текущие данные исходные данные или нет. Это не позволяет кому-то, или помочь каким-либо образом, чтобы восстановить данные. То есть, если мне нужно восстановить из резервной копии и иметь повреждение данных в файле или файлах, которые мне нужны, MD5 фактически бесполезен.
так есть ли контрольная сумма, которая специально предназначена не только для проверки данных, но и для их восстановления? Вроде как ECC для памяти, но для файлов?
Примечание: я нашел parchive, но это, кажется, не настоящий и надежно годный к употреблению. Хотя мне может не понравиться, как они реализовали вещи, в целом parchive-это именно то, что я ищу, но не могу найти. Делает что-то parchive-как существуют, что это "производство" готовы?
обновление:
Выглядит как будто некоторые форматы архивов поддерживают восстановление, хотя единственным основным кажется WinRAR. Было бы предпочтительнее не получить заблокирован в формате просто для этого один вариант как большинство achiving форматов (75% + / - в связанном списке) не поддерживает восстановление.