в моем приложении мне нужно сделать сжатие журналов, которые являются текстовыми файлами.
Кажется, что bzip2
и gzip
имеют одинаковую степень сжатия.
это правильно?
в моем приложении мне нужно сделать сжатие журналов, которые являются текстовыми файлами.
Кажется, что bzip2
и gzip
имеют одинаковую степень сжатия.
это правильно?
нормально, bz2 имеет более лучший коэффициент компрессии, совмещенный с более лучшими характеристиками recoverability.
OTOH, gz быстрее.
XZ, как говорят, даже лучше, чем bz2, но я не знаю поведения времени.
последнее обновлениеmaximumcompression.com июнь-2011 (ответ обновлен в октябре-2015)
Поэтому этот сайт не упоминает
ток чемпион текстовый компрессор по всему миру:
cmix
Конкурсы/Ориентиры:
cmix
не является победителем, потому что требует слишком много оперативной памяти, более чем 20GB)детали:
Нолл Байрон активно развивается cmix
как libre software (GPL) с 2013 года на основе книги Сжатие Данных Объяснил by Matt Mahoney. Мэтт Махони также поддерживает некоторые из вышеперечисленных критериев и предлагает ZPAQ (WP), добавочный архиватор командной строки.
если вы предпочитаете более стандартный инструмент (требующий меньше оперативной памяти), я рекомендую:
lrzip
lrzip
эволюция rzip
by Con Kolivas.lrzip
стоит два имени: дальний ZIP и Lzma RZIP.lrzip
часто лучше, чем xz
(другой популярный инструмент сжатия).
Александр Риччио рекомендует lrzip
.
мой любимый is:
zpaq
"эксперт архиватор",Matt Mahoney, и интенсивно работал над PAQ алгоритмы на 10 лет и обеспечивают самый лучший компромисс между ресурсами C. P. U. / memory и уровнем обжатия.
однако last zpaq
версия не часто упаковывается / доступен на недавнем дистрибутиве: - (
Я всегда компилирую его из источники, когда у меня есть новая машина, и мне нужен очень хороший компрессор:https://github.com/zpaq/zpaq
clone https://github.com/zpaq/zpaq
cd zpaq
g++ -O3 -march=native -Dunix zpaq.cpp libzpaq.cpp -pthread -o zpaq
может быть, вы могли бы взглянуть на эти критерии, особенно в части тестирования сжатие файлов журнала.
bz2 имеет более жесткое сжатие, алгоритм имеет больше возможностей для поиска избыточности для сжатия.
gzip-это гораздо больше инструментов, и более кросс-платформенный. Больше инструментов Windows может заниматься .файлы gz. Это часть http, так что даже веб-браузеры могут понять это.
в linux есть инструменты, которые позволяют напрямую работать со сжатыми файлами. zgrep и bzgrep поиск в сжатых файлах.
Если как раз на Линуксе, я использовал бы bzip2, для немножко лучшие коэффициенты сжатия.
ХZ сжимает намного лучше, чем bz2, но занимает больше времени. Итак, если ваша цель-максимальное сжатие, а пространство на вашем жестком диске на премиуме (это мой случай с одним диском на 98% - в то время как я реорганизую свои файловые системы), и вы можете запустить скрипт, чтобы сделать работу - сделайте перерыв и вернитесь через 5 минут.
unxz очень быстро, чтобы распаковать в моем опыте-что хорошо для меня на ежедневной основе.
bz2 сжимается быстрее, чем xz, но не похоже, чтобы достичь результатов сжатия xz.
единственный способ сделать эти оценки, чтобы запустить тесты против смеси общих файлов, которые вы обычно сжимать / распаковывать, и варьировать параметры, чтобы увидеть, что выходит на первое место.
Я сделал тест, чтобы проверить, чтобы сжать следующее:
204MB папку (С 1600 html файлами)
результаты
7zip => 2.38 MB
winrar => 49.5 MB
zip => 50.8 MB
gzip => 51.9 MB
Так что 7zip является лучшим среди них
вы можете получить его отсюда
http://www.7-zip.org/
Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]