есть ли у кого-нибудь рекомендации или процедуры для восстановления поврежденного PDF? Когда я открываю файл, я получаю " произошла ошибка при открытии этого документа. файл поврежден и не может быть восстановлен."Там, кажется, множество инструментов там, но ни один, что я мог бы описать как авторитетные. Есть ли какие-либо решения на основе opensource linux для этого?
Как исправить / восстановить поврежденный PDF-файл?
4 ответа
Ghostscript автоматически восстановит поврежденный PDF-файл... если он может открыть его в первую очередь (то есть, если он не подлежит ремонту). Но после этого вам все равно придется перепроверить результат...
на Linux, попробуйте эту команду:
gs \
-o repaired.pdf \
-sDEVICE=pdfwrite \
-dPDFSETTINGS=/prepress \
corrupted.pdf
в Windows попробуйте следующее:
gswin32c.exe ^
-o repaired.pdf ^
-sDEVICE=pdfwrite ^
-dPDFSETTINGS=/prepress ^
corrupted.pdf
у меня был поврежден файл PDF print.pdf
, что Ghostscript не удалось открыть, но обычные графические Linux PDF viewers (Okular, Evince) открылись нормально. (В моем случае в файле был мусор в начале вместо заголовка PDF, когда он открывался в шестнадцатеричном редакторе.)
эти PDF зрители используют Poppler в качестве фонового PDF визуализации. Таким образом, вы можете восстановить PDF с помощью инструментов командной строки Poppler В. В Ubuntu эти poppler-utils
пакета. Я использовал:
pdftocairo -pdf print.pdf print_repaired.pdf
который сгенерировал PDF-файл с правильными заголовками, Какие инструменты, такие как Ghostscript теперь принимаются.
mutool
(страница проекта,manpage)
будет ремонт сломанных PDF-файлов без печати.
- установка например на Ubuntu:
sudo apt-get install mupdf-tools
- запустите его следующим образом:
mutool clean input.pdf output.pdf
mutool clean [options] input.pdf [output.pdf] [pages] The clean command pretty prints and rewrites the syntax of a PDF file. It can be used to repair broken files, expand compressed streams, filter out a range of pages, etc. If no output file is specified, it will write the cleaned PDF to "out.pdf" in the current directory.
в качестве альтернативы, есть несколько инструментов и фреймворков, которые могут декомпозировать / декомпилировать PDF-файлы в свои компоненты без их рендеринга. Они могут быть полезны для извлечения текста, скриптов и изображения. Увидеть этот ответ в список таких средств: https://reverseengineering.stackexchange.com/q/1526/8210. Е. Г. вы можете попробовать нынешний топ-ответа оригами, он имеет GTK на основе просмотра.
У меня был поврежденный pdf-файл, потому что php-файл, используемый для его загрузки, повторял некоторые ошибки (в HTML) и символы NUL в конце.
решение состояло в том, чтобы открыть pdf с Notepad++ и удалить весь текст после строки
%%EOF
Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]