Всем привет!
Недавно нужно было скачать и распарсить страницы около 100 сайтов.
Однако какие-бы опции я не давал wget'y он качал сайт c ненужными документами(картинки, pdf-ки, и пт.)
Вообщем со своей задачай справился за 2-е суток, вместо пары часов.
Так вот, вопрос такой,что тут было неверно:
wget --recursive \
--forse-html \
--tries=10 \
-nc \
-l 3 \
-U Mozilla http://www.site.com