Можно ли заставить Acrobat Professional заменить выбираемое изображение текстом?

У меня есть книга, которую я хочу прочитать на экране. Он сканируется в монохромном режиме с разрешением 200 dpi (я все еще не знаю, что пошло не так в драйвере сканера, я помню, что установил его в оттенки серого, но не могу позволить себе время для сканирования снова), поэтому его трудно читать. Я познакомился с Acrobat Acrobat Pro, и все прошло достаточно хорошо. Но в результате получается либо нечто под названием "поиск изображения" или "Clearscan". Мне нравится тот факт, что макет сохраняется, но проблема в том, что текст отображается так, как он был отсканирован, поэтому трудно читать на экране. Кроме того, вся книга занимает 70 МБ.

здесь вы можете увидеть, как выглядит уже распознанный текст:

enter image description here

Я пробовал другие программы OCR, но (помимо 100% процессорного времени и памяти в течение 2 минут на двойную страницу)все они распознали текст, полностью оставив цифры. Мне все равно, что макет и типографика, но цифры важны (мне не нужны текстовые метки в изображения для распознавания). И я думаю, что если использовать ASCII для текста и изображений для рисунков, размер должен значительно снизиться.

Так есть ли способ избавиться от изображений текста и использовать OCRed версию для чтения, сохраняя при этом цифры на своих местах? Я бы предпочел, чтобы конечный результат был PDF-файлом, но я тоже открыт для других форматов. Я знаю, что могу сделать это вручную, вставив текст OCRed в word и захватив скриншоты изображений, но это тоже много работы за 520 страниц.

6
задан Eduard Florinescu
21.12.2022 10:27 Количество просмотров материала 3482
Распечатать страницу

2 ответа

в Omnipage 16, 17, 18 вы можете (лучше макет):

  • выберите типы зон автоматически или вручную
  • отрегулируйте seleted тип зоны, текст, изображение, таблица
  • поворот страницы
  • изменить двойные страницы на отдельные страницы
  • экспорт в pdf с оригинальным отсканированным изображением и без него (более четкое и удобное для чтения)

программа делает по требованию (признание).

  • разогнуть страницы
  • выпрямление линии

Omnipage 17, 18 выпрямить изогнутые страницы, неправильные углы от изображений с цифровой камеры (крупным планом)

ABBYY 8,9, 10 имеют те же функции, но дают меньше результатов для цифровых фотографий камеры.

ABBYY 10 имеет большой "на экране чтения". С помощью этого вы можете распознавать текстовые части на вашем мониторе. Или даже выберите текст онлайн-книг, таких как Google books или sribd dot com. Поверните монитор вертикально и убедитесь, что текст имеет максимальный размер.

Infix работает для очистки признанных PDF экспортируется как "текст с картинками". Простой способ стереть неправильно выбранную часть страницы без изображения и т. д. Также добавление страниц в PDF или удаление страниц.

Able2Abstract отлично подходит для распознавания таблиц. PDF2XL делает это тоже.

Scan Tailor немного недружелюбный способ, но бесплатно, чтобы получить только черный текст из сканирования. При отсутствии частей страниц задайте размеры отдельных страниц снова.

с Abbyy также возможно получение черного текста и картинок. Здесь сохраненные рабочие файлы содержат B+W tiff-страницы. Вы можете скопировать их в другое место, стереть tumbfiles или метаданные и поместить tiffs в multitiff или pdf. Этот файл больше, чем распознанный pdf.

Photoshop, Paint Shop Pro может помочь изменить изображение отсканированного текста, одной страницы или пакетного режима.

Paperport (не идеально) помогает сканировать, делает текст более черным при сканирование, исправление текста и т. д. После сканирования, но работает только на отдельных страницах, помещает отдельные страницы в 1 pdf.

букмекерская контора дорогая, старше, исправляет некоторые кривые страницы, почерневшие стороны могут быть стерты. Пробная версия имеет ограничения, но где-то скрыто что-то может быть экспортировано в tiffs, страница за страницей.

Изменение параметров сканера может дать более лучший выход.

фотографирование 500-страничной книги займет 1 час.

  • использовать штатив
  • iso 100 или 200
  • ручной баланс белого с белой бумагой книги. (Или другой документ, который является "более белым")
  • хороший свет, но не прямой солнечный свет
  • посмотрите на большие оттенки между страницами, поверните книгу на полпути, когда это необходимо
  • сделать некоторые тесты
  • slr используйте более высокий стоп f как 8 или 11 для лучшей глубины резкости
3
отвечен Kees 2022-12-22 18:15

лучшее, что я нашел это, но я хотел бы услышать лучшее решение с Acrobat.

Afer OCR, вы можете выбрать текст, а затем изменить шрифт:

щелкните правой кнопкой мыши на выделении и выберите properties

перейдите на вкладку Текст и выберите шрифт и размер шрифта.

к сожалению, это, как правило, также искажает макет как позиции букв, а также межстрочный интервал.

другая возможность-скопировать весь текст в текстовый редактор (например, word или openoffice), а затем полностью изменить макет всего текста....

0
отвечен noami 2022-12-22 20:32

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх