Основные параметры распознавания в Adobe Acrobat: "изображение, доступное для поиска (точное)" и " редактируемый текст и изображения"

в Adobe Acrobat (я использую Pro DC, если это имеет значение), есть три варианта OCR:

  1. "Поиск Изображения".
  2. " Изображение Для Поиска (Точное)".
  3. "редактировать текст и изображения".

enter image description here

каковы различия между этими тремя вариантами?

в частности, от чего зависит размер выходного файла? Сейчас я работаю как 1-й и 3-й варианты и кажется, что иногда один больше, а иногда другой больше (и различия могут быть существенными).

каковы (если таковые имеются) компромиссы между качеством, размером файла и скоростью обработки OCR?

16
задан Kenny LJ
25.11.2022 2:08 Количество просмотров материала 3022
Распечатать страницу

1 ответ

статья справки Adobe сканировать бумажный документ в PDF, раздел распознать текст-диалоговое окно Общие настройки, определяет режимы сканирования :

Поиск Изображения

гарантирует, что текст доступен для поиска и выбора. Эта опция сохраняет оригинальные изображения, deskews его по мере необходимости, и находится невидимый текст слой над ним. Выбор для изображений Downsample в этом же диалоговом окне поле определяет, является ли изображение понижается и в какой степени.

Изображение Для Поиска (Точное)

гарантирует, что текст доступен для поиска и выбора. Эта опция сохраняет исходное изображение и размещает невидимый текстовый слой поверх него. Рекомендуемый для случаев, требующих максимальной точности исходного изображения.

Редактируемый Текст И Изображения

синтезирует новый пользовательский шрифт, который близко приближается к оригиналу, и сохраняет страницу фон с использованием копии с низким разрешением.

Downsample К

уменьшает количество пикселей в цвете, оттенки серого и монохромный изображения после OCR завершена. Выберите степень понижения частоты дискретизации до применять. Более высок-пронумерованные варианты делают меньше downsampling, производящ PDF-файлы с более высоким разрешением.

я проанализирую влияние этих параметров на размер выходного файла.

все параметры сохранить изображение, которое, вероятно, крупный объект.

Поиск Изображения поворачивает изображение, что может изменить его размер больше или меньше, в зависимости от метода перекодирования изображения, используемого внутри компанией Adobe

Downsample К можно уменьшить разрешение изображения и так уменьшите свой размер, но объем космоса полученный (или потерянный) результат зависит от метода повторной выборки, используемого внутри Adobe.

Редактируемый Текст И Изображения синтезирует новый шрифт, который затем включается в PDF и добавит несколько десятков K-байт к выходному размеру.

В общем, нет четкого метода для создания наименьшего PDF. Сумма, полученная (или потерянная), зависит от обоих изображений и насколько эффективно они могут быть повторно сжаты Adobe.

Если цель сохранить космос, Я бы предложил использовать Редактируемый Текст И Изображения, но как описано в этом статьи в PDF, укажите в Настройки "использовать доступный системный шрифт", пользовательский шрифт. Вы также можете удалить изображения, если текста достаточно.

1
отвечен harrymc 2022-11-26 09:56

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх