повторяющиеся элементы хранятся в словаре и присвоить код в качестве замены.
ЭТО УПРОЩЕНИЕ
aaaaaaaaaaaaaaaaaaaaaaaa 0001
bbbbbbbbbbbbbbbbbbbbbbbb 0002
alsdjl;asjdfkl;asdfjkljj 0003
вместо целой строки он просто ставит код на свое место. Чем больше словарь, тем больше кодов он может обрабатывать. Обычно, когда словарь заполняется, он начинает новый на лету. Когда он начинает новый, он пуст, и новые коды назначаются обнаруженным шаблонам.
как правило, чем больше тем лучше в точку. Весь словарь хранится в памяти так что вам нужно больше оперативной памяти, чем размер словаря.
размер словаря зависит от сжимаемости данных, количества файлов, размера и общего размера.
Как правило, 32 Мб более чем достаточно, но если вы сжимаете многочисленные файлы с несколькими концертами, можно использовать гораздо большее число. Большие словари часто делают процесс медленнее, но результаты в меньшем файле.