Распознавание текста на страницах, содержащих текст и изображения в Acrobat XI Pro

Почему Acrobat XI Pro не разрешает OCR-сканирование страниц, содержащих как изображения, так и отображаемый текст? Образец PDF на снимке экрана был создан из документа MS Word. Первая линия была напечатана; во второй строке-скриншот в отдельном doc.

Это кажется произвольным ограничением. Есть ли веская причина, почему Acrobat не может просто пропустить отображаемый текст и сканировать все остальное? Есть ли простой способ запустить OCR только на части Пейдж?

enter image description here

29
задан P Fitz
16.04.2023 23:47 Количество просмотров материала 3114
Распечатать страницу

1 ответ

Да, это произвольное ограничение, и оно не будет исправлено в Acrobat XI (больше).

рекомендуется экспортировать страницу в формат TIFF и перезагрузить ее в Acrobat. Теперь все является изображением, и поэтому страница может быть OCRd.

1
отвечен Max Wyss 2023-04-18 07:35

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх