Какой метод архивирования лучше использовать для сжатия текстовых файлов в Linux?

в моем приложении мне нужно сделать сжатие журналов, которые являются текстовыми файлами.

Кажется, что bzip2 и gzip имеют одинаковую степень сжатия.

это правильно?

25
задан slhck
04.04.2023 12:03 Количество просмотров материала 2785
Распечатать страницу

6 ответов

нормально, bz2 имеет более лучший коэффициент компрессии, совмещенный с более лучшими характеристиками recoverability.

OTOH, gz быстрее.

XZ, как говорят, даже лучше, чем bz2, но я не знаю поведения времени.

4
отвечен glglgl 2023-04-05 19:51

последнее обновлениеmaximumcompression.com июнь-2011 (ответ обновлен в октябре-2015)

Поэтому этот сайт не упоминает

ток чемпион текстовый компрессор по всему миру:

cmix

Конкурсы/Ориентиры:

детали:

Нолл Байрон активно развивается cmix как libre software (GPL) с 2013 года на основе книги Сжатие Данных Объяснил by Matt Mahoney. Мэтт Махони также поддерживает некоторые из вышеперечисленных критериев и предлагает ZPAQ (WP), добавочный архиватор командной строки.


если вы предпочитаете более стандартный инструмент (требующий меньше оперативной памяти), я рекомендую:

      lrzip

lrzip эволюция rzip by Con Kolivas.

lrzip стоит два имени: дальний ZIP и Lzma RZIP.

lrzip часто лучше, чем xz (другой популярный инструмент сжатия).

Александр Риччио рекомендует lrzip.


мой любимый is:

zpaq

"эксперт архиватор",Matt Mahoney, и интенсивно работал над PAQ алгоритмы на 10 лет и обеспечивают самый лучший компромисс между ресурсами C. P. U. / memory и уровнем обжатия.

однако last zpaq версия не часто упаковывается / доступен на недавнем дистрибутиве: - (

Я всегда компилирую его из источники, когда у меня есть новая машина, и мне нужен очень хороший компрессор:https://github.com/zpaq/zpaq

clone https://github.com/zpaq/zpaq
cd zpaq
g++ -O3 -march=native -Dunix zpaq.cpp libzpaq.cpp -pthread -o zpaq
5
отвечен olibre 2023-04-05 22:08

может быть, вы могли бы взглянуть на эти критерии, особенно в части тестирования сжатие файлов журнала.

4
отвечен Cédric Julien 2023-04-06 00:25

bz2 имеет более жесткое сжатие, алгоритм имеет больше возможностей для поиска избыточности для сжатия.

gzip-это гораздо больше инструментов, и более кросс-платформенный. Больше инструментов Windows может заниматься .файлы gz. Это часть http, так что даже веб-браузеры могут понять это.

в linux есть инструменты, которые позволяют напрямую работать со сжатыми файлами. zgrep и bzgrep поиск в сжатых файлах.

Если как раз на Линуксе, я использовал бы bzip2, для немножко лучшие коэффициенты сжатия.

0
отвечен Rich Homolka 2023-04-06 02:42

ХZ сжимает намного лучше, чем bz2, но занимает больше времени. Итак, если ваша цель-максимальное сжатие, а пространство на вашем жестком диске на премиуме (это мой случай с одним диском на 98% - в то время как я реорганизую свои файловые системы), и вы можете запустить скрипт, чтобы сделать работу - сделайте перерыв и вернитесь через 5 минут.

unxz очень быстро, чтобы распаковать в моем опыте-что хорошо для меня на ежедневной основе.

bz2 сжимается быстрее, чем xz, но не похоже, чтобы достичь результатов сжатия xz.

единственный способ сделать эти оценки, чтобы запустить тесты против смеси общих файлов, которые вы обычно сжимать / распаковывать, и варьировать параметры, чтобы увидеть, что выходит на первое место.

0
отвечен Tom 2023-04-06 04:59

Я сделал тест, чтобы проверить, чтобы сжать следующее:

204MB папку (С 1600 html файлами)

результаты

7zip =>     2.38 MB
winrar =>   49.5 MB
zip =>      50.8 MB
gzip =>     51.9 MB

Так что 7zip является лучшим среди них вы можете получить его отсюда

http://www.7-zip.org/

0
отвечен Abdalla Mohamed Aly Ibrahim 2023-04-06 07:16

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх