Как исправить / восстановить поврежденный PDF-файл?

Question

Как исправить / восстановить поврежденный PDF-файл?

есть ли у кого-нибудь рекомендации или процедуры для восстановления поврежденного PDF? Когда я открываю файл, я получаю " произошла ошибка при открытии этого документа. файл поврежден и не может быть восстановлен."Там, кажется, множество инструментов там, но ни один, что я мог бы описать как авторитетные. Есть ли какие-либо решения на основе opensource linux для этого?

22

задан Breakthrough

31.03.2023 10:40

4 ответа

91	55	27	64	5	7	9	5	4	18

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя

Email

Похожие вопросы про тегам:

ghostscript

pdf

repair

score 87 · Answer 1

Ghostscript автоматически восстановит поврежденный PDF-файл... если он может открыть его в первую очередь (то есть, если он не подлежит ремонту). Но после этого вам все равно придется перепроверить результат...

на Linux, попробуйте эту команду:

 gs \
  -o repaired.pdf \
  -sDEVICE=pdfwrite \
  -dPDFSETTINGS=/prepress \
   corrupted.pdf

в Windows попробуйте следующее:

 gswin32c.exe ^
  -o repaired.pdf ^
  -sDEVICE=pdfwrite ^
  -dPDFSETTINGS=/prepress ^
   corrupted.pdf

score 28 · Answer 2

у меня был поврежден файл PDF print.pdf, что Ghostscript не удалось открыть, но обычные графические Linux PDF viewers (Okular, Evince) открылись нормально. (В моем случае в файле был мусор в начале вместо заголовка PDF, когда он открывался в шестнадцатеричном редакторе.)

эти PDF зрители используют Poppler в качестве фонового PDF визуализации. Таким образом, вы можете восстановить PDF с помощью инструментов командной строки Poppler В. В Ubuntu эти poppler-utils пакета. Я использовал:

pdftocairo -pdf print.pdf print_repaired.pdf

который сгенерировал PDF-файл с правильными заголовками, Какие инструменты, такие как Ghostscript теперь принимаются.

score 18 · Answer 3

mutool (страница проекта,manpage) будет ремонт сломанных PDF-файлов без печати.

установка например на Ubuntu: sudo apt-get install mupdf-tools
запустите его следующим образом:mutool clean input.pdf output.pdf

mutool clean [options] input.pdf [output.pdf] [pages]

  The clean command pretty prints and rewrites the syntax of a PDF file.
   It can be used to repair broken files, expand compressed streams,
   filter out a range of pages, etc.
  If no output file is specified, it will write the cleaned PDF to
   "out.pdf" in the current directory.

в качестве альтернативы, есть несколько инструментов и фреймворков, которые могут декомпозировать / декомпилировать PDF-файлы в свои компоненты без их рендеринга. Они могут быть полезны для извлечения текста, скриптов и изображения. Увидеть этот ответ в список таких средств: https://reverseengineering.stackexchange.com/q/1526/8210. Е. Г. вы можете попробовать нынешний топ-ответа оригами, он имеет GTK на основе просмотра.

score 9 · Answer 4

У меня был поврежденный pdf-файл, потому что php-файл, используемый для его загрузки, повторял некоторые ошибки (в HTML) и символы NUL в конце.

решение состояло в том, чтобы открыть pdf с Notepad++ и удалить весь текст после строки

%%EOF

Apple	$173,24	+0,81%
Amazon	$114,49	-1,94%
Microsoft	$325,19	+3,61%
Google	$123,44	+2,11%
Netflix	$364,74	-0,03%
Intel	$27,45	-5,34%
Facebook	$254,49	+2,11%
Tesla	$185,54	+1,44%
Tencent	$322,40	-3,01%