Как сделать так, чтобы OCR лучше распознавал текст моих документов?

Question

Как сделать так, чтобы OCR лучше распознавал текст моих документов?

Я не могу получить некоторые из моих документов с изображениями для распознавания OCR. Они не особенно низкого разрешения-хотя некоторые искажены - но я не могу получить их через OCR даже с Omnipage. Я загрузил one в качестве примера (преобразовано из DOC в PDF для Omnipage), но у меня есть больше. Что я могу сделать, чтобы добиться успеха OCR?

4

задан Pops

09.01.2023 16:12

ocr

1 ответ

92	55	28	64	5	7	9	6	4	18

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя

Email

Похожие вопросы про тегам:

ocr

score 1 · Answer 1

несмотря на то, как они выглядят на экране, текст картинки не очень высокого разрешения. Вы можете увидеть это, увеличив вид в средстве просмотра pdf. Изображения неровные и не все черно-белые.

я извлек изображений с pdfimages. Gocr работал над результатом .ppm изображения, но со многими ошибками. Я не мог заставить tesseract работать с изображениями, несмотря на преобразование в монохромный tiff.

Apple	$173,24	+0,81%
Amazon	$114,49	-1,94%
Microsoft	$325,19	+3,61%
Google	$123,44	+2,11%
Netflix	$364,74	-0,03%
Intel	$27,45	-5,34%
Facebook	$254,49	+2,11%
Tesla	$185,54	+1,44%
Tencent	$322,40	-3,01%