Я использовал wget для загрузки html-файлов, где хранятся изображения в сохраненном файле?

10

Firefox загружался очень медленно, поэтому я решил использовать wget для сохранения файлов HTML. Я использовал следующую команду:

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Файлы были сохранены в моей домашней папке. Но я не знаю, где хранятся изображения. Мне нужно, чтобы они использовались в Anki .

Итак, где хранятся изображения?

    
задан Registered User 08.11.2013 в 14:43
источник

4 ответа

24

Я предпочитаю использовать --page-requisites ( -p для краткости) вместо -r здесь, поскольку он загружает все, что нужно для отображения страницы, но не содержит других страниц, и мне не нужно думать о том, какие файлы Я хочу.

На самом деле я обычно использую что-то вроде

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Это означает:

  • -E : Добавить .html в имя файла, если это файл HTML, но не заканчивается .html или аналогичным
  • -H : Загрузка файлов с других хостов.
  • -k : после загрузки конвертировать любую ссылку в нее, чтобы они указывали на загруженные файлы
  • -p : загрузите что-либо, что нужно для просмотра в автономном режиме
ответ дан Florian Diesch 08.11.2013 в 15:52
источник
2

с использованием параметра -r следует включить wget для загрузки всей папки, включая ваши изображения.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
    
ответ дан vegard torvund 08.11.2013 в 14:55
2

Загрузка файлов изображений отдельно

Я думаю, что эта команда может помочь вам.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Он позволяет указать местоположение для сохранения изображений и типов файлов, которые вы хотите. Возможно, загрузка изображений как таковая проще.

Источник :

  

-r позволяет рекурсивное извлечение. См. Рекурсивную загрузку для получения дополнительной информации.

     

-P устанавливает префикс каталога, в котором сохраняются все файлы и каталоги.

     

-A устанавливает белый список для извлечения только определенных типов файлов. Строки и шаблоны принимаются, и оба могут использоваться в списке, разделенном запятыми (как показано выше). Дополнительные сведения см. В разделе Типы файлов.

Копирование файлов изображений из папки

Я заметил, что на сайте используются файлы изображений PNG. Вы можете просто скопировать их из своей папки. Это должно выполняться в папке, где вы храните веб-страницу.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;
    
ответ дан don.joey 08.11.2013 в 14:55
1

Wget просто загружает HTML-файл страницы, а не изображения на странице, так как изображения в HTML-файле страницы записываются как URL-адреса. Чтобы сделать то, что вы хотите, используйте параметр -R (рекурсивный), -A с суффиксами файла изображения, параметр --no-parent , чтобы он не поднимался, и параметр --level с 1 .

В частности, wget -R -A .jpg,.png,.gif --no-parent --level <url>

Более того, в большинстве браузеров есть способы сохранения страниц для автономного просмотра .     

ответ дан Ramchandra Apte 08.11.2013 в 14:55