Поиск разрешения изображения в PDF-файле?

У меня проблема с некоторыми пользователями, создающими очень большие PDF-файлы. С другой стороны, у меня есть PDF-файл, отправленный с наших факсимильных аппаратов, которые действительно малы по размеру и полностью печатаются. Мой вопрос заключается в

  • есть ли способ, которым я могу найти разрешение (DPI) PDF.
    Я искал в Интернете, не мог найти ответа. Проверил свойства файла, эта информация там не хранилась, по крайней мере в моем случае.
  • каково оптимальное разрешение преобразования текста файл в формате PDF изображения. 96 точек на дюйм, 300 точек на дюйм или больше ?
  • забавный вопрос. Можно ли изменить размер PDF-файла, отсканированного с высоким разрешением,на меньший?

Я знаю, что некоторые ответы могут быть недоступны, так как я уже искал в интернете и не мог найти ответы.

Примечание: мой PDF полностью изображения, текст к изображениям. Я также знаком с primoPDF (free), с чем вы можете поэкспериментировать

18
задан studiohack
04.12.2022 9:36 Количество просмотров материала 3388
Распечатать страницу

6 ответов

ответ slhck и комментарий scruss ' заслуживают того, чтобы быть обновлены:pdfimages теперь (по крайней мере, начиная с версии 0.26.5) явно перечисляет x-ppi и y-ppi. Вот пример выходных данных:

$ pdfimages -list example.pdf 
page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
   1     0 image    2244  2244  cmyk    4   8  image  no       215  0   301   301  418K 2.1%
   2     1 image     900   600  rgb     3   8  image  no       324  0  1524  1525 35.5K 2.2%

на Debian (Wheezy) и Fedora (23),pdfimages является частью poppler-utils пакеты.

12
отвечен Skippy le Grand Gourou 2022-12-05 17:24

Я знаю, что вы не хотите извлекать данные изображения, но это, вероятно, единственный способ узнать исходное разрешение.


на *Nix, если у вас есть ImageMagick в identify и Xpdf установлен1:

pdfimages -j test.pdf test && for file in $(find . -name "test*.jpg"); do identify "$file"; done

здесь test.pdf ваш входной PDF. Выходные файлы записываются в test-000.jpg,test-001.jpg и так далее. Это даст вам исходный размер всех содержащихся изображений этого PDF2.

пример вывода файла PDF, содержащего только одно большое изображение:

./test-000.jpg JPEG 2500x1961 2500x1961+0+0 8-bit DirectClass 1.022MB 0.000u 0:00.000

1) Windows имеет их тоже, но сценарий будет отличаться, конечно.

2) Обратите внимание, что изображения на самом деле не несут информацию DPI. Проще говоря: это просто то, что используется для печати, и изображения не нуждаются в присущей мере DPI.


какое оптимальное разрешение преобразование текстового файла в формат. 96 точек на дюйм, 300 точек на дюйм или больше?

вообще, что-нибыдь вы хотите напечатать должно быть 300dpi или больше. Большинств принтеры отрегулируют более высокое разрешение слишком.

8
отвечен slhck 2022-12-05 19:41

по какой-то причине последняя версия pdfimages, которую я могу обновить в моем CentOS, - это версия 3.04.

Итак, у меня нет опции-list, как указано в предыдущих ответах. Однако тестовый образ, созданный из pdfimages на основе ответа slhck, содержит желаемый ответ!

определить-подробный тест-0000.jpg / more

Image: test-0000.jpg  
Format: JPEG (Joint Photographic Experts Group JFIF format)  
Mime type: image/jpeg  
Class: DirectClass  
Geometry: 6600x5100+0+0  
Resolution: 600x600  
Print size: 11x8.5

таким образом, dpi явно отображается на 6-й строке, используя опцию-verbose в команде identify.

Так, ответ slhck может быть изменен следующим образом.

pdfimages-j тест.тест pdf && для файла в $(Найти . -название "Тест*.форматы jpg"); сделать определить-подробный файл "$" | на awk 'ШП==6'; сделал

на другой ноте, я пробовал использовать

определить -подробный тест.pdf

Format: PDF (Portable Document Format)  
Mime type: application/pdf  
Class: DirectClass  
Geometry: 792x612+0+0  
Resolution: 72x72  
Print size: 11x8.5  

Кажется, что Imagemagick всегда принимает 72dpi и поэтому информация, напечатанная здесь, кажется неправильной.

3
отвечен kykong 2022-12-05 21:58

файл PDF не имеет собственного разрешения, каждое растровое изображение в нем (если оно есть) будет иметь свое собственное разрешение. Я не знаю простого способа извлечь одно число для медианного / модального разрешения встроенных XObjects изображения.

1
отвечен RedGrittyBrick 2022-12-06 00:15

это работало с pdf, сгенерированным из МФУ Kyocera...

  1. открыть pdf ж / Reader -
  2. файл>свойства-вкладка описание-размер страницы. Мой пример сказал 8.5x11.0 дюймов.

  3. откройте pdf в текстовом редакторе (Блокнот), найдите /width и /height

  4. возьмите высоту и ширину и разделите их на высоту и ширину страницы (в дюймы)

пример:

5100/8.5=600
6600/11.0=600

мой PDF был отсканирован с разрешением 600x600.

1
отвечен Jeff21050 2022-12-06 02:32

чтобы ответить на ваш второй вопрос, в дополнение к упоминанию @slhck о принтере dpi, 300dpi также является типичным минимальным рекомендуемым числом для OCR с размерами шрифта 10 + pt.

кроме того, современный 15-дюймовый экран ноутбука 4K также имеет только около 280PPi, поэтому, если вы хотите просмотреть весь A4 на экране (ландшафт), нет точечного сканирования с разрешением выше ~320 dpi, потому что любой документ выше этого будет уменьшен. Конечно, это не имеет значения, если вы планируете увеличить, то вы может потребоваться более высокое разрешение.

чтобы ответить на ваши другие два пункта, в настоящее время, по крайней мере, вы можете использовать Acrobat Pro для проверки DPI и разрешения изображения, и вы можете редактировать его тоже.

0
отвечен jiggunjer 2022-12-06 04:49

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх