Загрузка всех папок, вложенных папок и файлов с помощью Wget

Я использую Wget, и я столкнулся с проблемой.
У меня есть сайт, который имеет несколько папок и подпапок внутри сайта.
Мне нужно загрузить все содержимое в каждой папке и подпапке.
Я пробовал несколько методов с помощью Wget, и когда я проверяю завершение, все, что я вижу в папках, - это "индексный" файл. Я могу нажать на индексный файл, и он приведет меня к файлам, но мне нужны фактические файлы.

есть ли у кого-нибудь команда для Wget, что у меня есть недосмотрел, или есть другая программа, которую я мог бы использовать, чтобы получить всю эту информацию?

пример сайта:

www.mysite.com/Pictures/
внутри Pictures DIr есть несколько папок.....

www.mysite.com/Pictures/Accounting/

www.mysite.com/Pictures/Managers/North Америка / Калифорния / JoeUser.jpg

Мне нужны все файлы, папки и т. д.....

19
задан Der Hochstapler
05.12.2022 2:14 Количество просмотров материала 2707
Распечатать страницу

3 ответа

Я хочу, что ты не попытался это:

wget -r --no-parent http://www.mysite.com/Pictures/

или, чтобы получить содержимое, без загрузки " индекс.html " файлы:

wget -r --no-parent --reject "index.html*" http://www.mysite.com/Pictures/

ссылки: использование wget для рекурсивной выборки каталога с произвольными файлами

25
отвечен Felix Imafidon 2022-12-06 10:02

Я использую wget -rkpN -e robots=off http://www.example.com/

-r означает рекурсивно

-k означает преобразование одной. Таким образом, ссылки на веб-странице будут localhost вместо example.com/bla

-p означает получить все ресурсы веб-страницы, так что получить изображения и файлы javascript, чтобы сделать работу сайта правильно.

-N является получение метки времени, так что если локальные файлы новее, чем файлы на удаленном сайте пропустить их.

-e является флаг вариант, он должен будьте там для robots=off на работу.

robots=off значит игнорировать файл роботов.

у меня тоже было -c в этой команде, так что если они соединение упало, если бы продолжить, где он остановился, когда я повторно запустить команду. Я понял -N бы -c

13
отвечен Tim Jonas 2022-12-06 12:19

с wget -M и * -ПК -электронная роботов=выкл. www.mysite.com/ это позволит загрузить все типы файлов локально и указать на них из html-файла

и он будет игнорировать роботы файл

0
отвечен Abdalla Mohamed Aly Ibrahim 2022-12-06 14:36

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх