Как преобразовать веб-страницу в PDF с сохранением ее внешнего вида (точно как в веб-браузере) и текста/ссылок?

Я ищу способ конвертировать веб-страницу в PDF, но сохраняя внешний вид веб-страницы. Также сохраняя текст веб-страницы (будучи выбираемым), с возможностью поиска [создание скриншота изображения для веб-страницы не сделает текст ни выбираемым, ни доступным для поиска].

Я ищу печать веб-страницы в формате PDF как есть (как в веб-браузере) без каких-либо манипуляций со стилем или выравниванием или потерей статических компонентов любой веб-страницы.

Это поможет сохранить оффлайн копии веб-страниц, легко читается, annotateable и поиска.


вам не нужно читать какие-либо из ниже (Вопрос выше) для того, чтобы сделать мой вопрос. Следующий раздел - это просто перечисление того, что я получил через исследования или ответы других, вложенным способом, чтобы получить ответ на вопрос.

результаты исследований (предложения, которые не решили мою проблема)

результаты до сих пор на попытке найти решение (все еще не работает в качестве решения для этого вопроса)

Я пробовал эти PDF веб-движки печати, но все манипулировать взглядом страниц, более даже повреждения и сделать некоторые трудно читаемые: (Пример страницы скриншоты заключены в квадратные скобки)

  • Chrome [Оригинал, Стили Печати (отключен/не Отключено)]
  • Firefox [Оригинал, Стили Печати (Инвалид p1,p2 | не инвалид Р1,p2)]
  • читабельности
    • это упрощает веб-страницу (что хорошо для целенаправленного чтения–однако это не то, что я ищу). Я ищу сохранение всех свойств позиций/стилей веб-страницы, как видно на веб-браузере, в формате PDF без каких-либо манипуляция.
  • Foxit Reader
  • NovaPDF
  • CutyCapt [Оригинал,Коэффициент Увеличения: 0.4: скриншоты, выведенный PDF]
    • я добавлю ссылки после того, как решу запущенные проблемы программы на Windows"
  • wkhtmltopdf [Оригинал,Коэффициент Увеличения: 0.4:скриншоты,выводится PDF]
    • он не поддерживает CSS3.

все плагины для захвата скриншотов изображений с веб-страницы (например,похищение,Потрясающие Скриншоты,Fireshot,Firefox Скриншот Инструмент Разработчика,Захват Экрана На Всю Страницу,Page2Images,web-capture,...) не отвечай на мой вопрос, потому что они не сохранить текст и ссылки.

Scrible отлично подходит для сохранения веб-страниц, как для дальнейших аннотаций и исследований, но, к сожалению, все еще Онлайн и без преобразования в формат PDF.

есть еще два вопроса по сообществу, похожему как-то на мой, однако, этот немного отличается, но с теми важными различиями:

более похожие вопросы, где сохранение текста и ссылок-это не требование (страницы захватываются как скриншоты изображения в основном):


Примечания

OS: Windows 10

26
задан Omar
06.04.2023 4:12 Количество просмотров материала 2990
Распечатать страницу

6 ответов

мы столкнулись с той же проблемой в Университетском проекте и смогли решить ее с помощью

wkhtmltopdf

нам очень понравились возможности этого инструмента в командной строке. Мы также вызвали его с помощью кода python для отображения текущего состояния веб-страниц. Он имеет возможность доставить веб-страницу в формате pdf, как правило, не идеально, чтобы сохранить вид веб-сайта из-за форматирования страницы (A4, например), или как png (сохраняет вид страницы, но не ссылки)

существует также читаемость(для Python:pypi.python.org/pypi/readability-lxml) проект, который мы использовали, что делает удаление объявлений и обнаружение контента довольно хорошо (например, для газетных статей и тому подобное). Если вам просто нужен аддон или расширение для Вашего браузера, следующая реализация удобочитаемости может удовлетворить ваши потребности:

https://www.readability.com/addons/

4
отвечен SSchneid 2023-04-07 12:00

Если вы на Linux, попробуйте этот небольшой инструмент командной строки CutyCapt, который зависит только от Qt и QtWebkit и экспортируется в PDF.

1
отвечен Ziggy Crueltyfree Zeitgeister 2023-04-07 14:17

Я имел такую же проблему, и выяснил это через хром и с водителем принтер PDF995, которую я скачал спокойно и бесплатно (ссылка на страницу загрузки https://pdf995.en.softonic.com/ другое http://downloads.tomsguide.com/pdf995,0301-829.html).

однако, я думаю, что любой веб-браузер и любой конвертер pdf будет достаточно. Во всяком случае, вот что я сделал:

  1. выделить все или выделить все.
  2. щелкните правой кнопкой мыши выделенное выделение или нажмите Ctrl+P (оба варианта дают вам немного разные результаты, но вы получите тот же результат после завершения).

  3. Если вы щелкнули правой кнопкой мыши в 2., выбор (короткий), нажмите кнопку "Печать"и только все, что вы выбрали будет на предварительный просмотр. Убедитесь, что вы изменили место назначения принтера на любой PDF конвертер, который вы решите использовать (PDF995 или другой).

  4. Нажмите кнопку "Печать", и он сохраняет в виде pdf-документа.

  5. при нажатии Ctrl+P в 2. (немного более длинный путь) вместо этого нажмите "Дополнительные настройки" и прокрутите вниз до "параметры".

  6. нажмите на поле с надписью "Только выбор", и все, что я описал, будет следовать.

  7. Не забудьте изменить ваш принтер к любому PDF конвертер вы выберете (PDF995 или другие.)

  8. Нажмите кнопку "Печать".

1
отвечен user726167 2023-04-07 16:34

хотя точно не ваш запрос, а не в PDF, если цель чисто чтобы сохранить автономную копию веб-страниц для последующего просмотра, сохраните его как веб-страницы может сделать это.

большая оговорка заключается в том, что он будет создавать .html-файл и папка со всем медиаконтентом на странице, а не один документ.

в Chrome и Firefox вы можете сохранить страницу, щелкнув по ней правой кнопкой мыши и выбрав Сохранить как... В Internet Explorer его можно сохранить в разделе Файл - > Сохранить as (нажатие клавиши Alt для отображения меню).

0
отвечен Pyheme 2023-04-07 18:51

попробуйте этот сервис. Создает PDF с веб-сайта, как вы видите его в браузере. https://lomotoh.com/ (я связан с этим сайтом)

0
отвечен David Herse 2023-04-07 21:08

по крайней мере, весь текст на некоторых страницах поиска, выбора, вырезать и pastable. Я попробовал на странице, вставленной роботизированным компьютером из текста и pix, и он настроил все это на изображение.

Я использовал эти вещи в течение многих лет. Я получаю лучшие результаты в Linux, перестраивая страницу в XX слове по вашему выбору и экспортируя результат в формате PDF. Я могу получить то, что я хочу по значительной цене. Из арки ограниченного использования ivin сайт Дэвид Херс миритьсяhttps://lomotoh.com/ (I am не связаны с этим сайтом) работает так же, как любой я когда-либо использовал. Я буду моим ресурсом, чтобы покрыть веб-страницы в PDF-файлы, пока не найду лучше, или это слишком дорого для меня из моей собственной тонкой сумочки.

0
отвечен Gordon Couger 2023-04-07 23:25

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх