pdftotext-ошибка: недопустимый вход в блок bfchar в ToUnicode CMap

Я бегу pdftotext на кучу PDF-файлов, и некоторые из них бросают эту ошибку:

Error: Illegal entry in bfchar block in ToUnicode CMap

Я посмотрел на outfiles, и они выглядят нормально, поэтому я не уверен, что это значительная ошибка, но я обеспокоен. Кто-нибудь знает, что это за ошибка, что ее вызывает, и сколько ущерба из-за нее?

21
задан dsolimano
25.11.2022 9:53 Количество просмотров материала 3629
Распечатать страницу

1 ответ

похоже, что у него проблемы с преобразованием символа в эквивалент unicode. Я предполагаю, что это вызовет небольшое или никакое повреждение,и это, вероятно, вызвано только ASCII-кодированным PDF.

2
отвечен Josh K 2022-11-26 17:41

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх