Webseite regelmäßig durchsuchen

Johannes Nix Johannes.Nix at gmx.net
Di Apr 12 22:00:14 CEST 2011


> wget -m http://www.webseite.de ; grep -r Wort www.webseite.de
> 

Das hakt, wenn die Seite Umlaute o.ä. enthält. Statt dessen kann man in dem Fall lynx oder ähnliche Textbrowser nehmen. (Option --dump hab ich grob in Erinnerung). Falls man mehrere Seiten durchsuchen muß, ist natürlich eine Pipeline in der Art

find www.website.de -type -f -name "*html" -print0 | xargs -0 lynx --dump | grep Wort

immer ganz praktisch. 

Johannes
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lug-owl.de/pipermail/lugrav/attachments/20110412/93ae9796/attachment.html>


Mehr Informationen über die Mailingliste Lugrav