Как исправить / восстановить поврежденный PDF-файл?

есть ли у кого-нибудь рекомендации или процедуры для восстановления поврежденного PDF? Когда я открываю файл, я получаю " произошла ошибка при открытии этого документа. файл поврежден и не может быть восстановлен."Там, кажется, множество инструментов там, но ни один, что я мог бы описать как авторитетные. Есть ли какие-либо решения на основе opensource linux для этого?

22
задан Breakthrough
31.03.2023 10:40 Количество просмотров материала 2860
Распечатать страницу

4 ответа

Ghostscript автоматически восстановит поврежденный PDF-файл... если он может открыть его в первую очередь (то есть, если он не подлежит ремонту). Но после этого вам все равно придется перепроверить результат...

на Linux, попробуйте эту команду:

 gs \
  -o repaired.pdf \
  -sDEVICE=pdfwrite \
  -dPDFSETTINGS=/prepress \
   corrupted.pdf

в Windows попробуйте следующее:

 gswin32c.exe ^
  -o repaired.pdf ^
  -sDEVICE=pdfwrite ^
  -dPDFSETTINGS=/prepress ^
   corrupted.pdf
87
отвечен Kurt Pfeifle 2023-04-01 18:28

у меня был поврежден файл PDF print.pdf, что Ghostscript не удалось открыть, но обычные графические Linux PDF viewers (Okular, Evince) открылись нормально. (В моем случае в файле был мусор в начале вместо заголовка PDF, когда он открывался в шестнадцатеричном редакторе.)

эти PDF зрители используют Poppler в качестве фонового PDF визуализации. Таким образом, вы можете восстановить PDF с помощью инструментов командной строки Poppler В. В Ubuntu эти poppler-utils пакета. Я использовал:

pdftocairo -pdf print.pdf print_repaired.pdf

который сгенерировал PDF-файл с правильными заголовками, Какие инструменты, такие как Ghostscript теперь принимаются.

28
отвечен Mechanical snail 2023-04-01 20:45

mutool (страница проекта,manpage) будет ремонт сломанных PDF-файлов без печати.

  • установка например на Ubuntu: sudo apt-get install mupdf-tools
  • запустите его следующим образом:mutool clean input.pdf output.pdf
mutool clean [options] input.pdf [output.pdf] [pages]

  The clean command pretty prints and rewrites the syntax of a PDF file.
   It can be used to repair broken files, expand compressed streams,
   filter out a range of pages, etc.
  If no output file is specified, it will write the cleaned PDF to
   "out.pdf" in the current directory.

в качестве альтернативы, есть несколько инструментов и фреймворков, которые могут декомпозировать / декомпилировать PDF-файлы в свои компоненты без их рендеринга. Они могут быть полезны для извлечения текста, скриптов и изображения. Увидеть этот ответ в список таких средств: https://reverseengineering.stackexchange.com/q/1526/8210. Е. Г. вы можете попробовать нынешний топ-ответа оригами, он имеет GTK на основе просмотра.

18
отвечен jmiserez 2023-04-01 23:02

У меня был поврежденный pdf-файл, потому что php-файл, используемый для его загрузки, повторял некоторые ошибки (в HTML) и символы NUL в конце.

решение состояло в том, чтобы открыть pdf с Notepad++ и удалить весь текст после строки

%%EOF
9
отвечен Oriol 2023-04-02 01:19

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх