Webseite regelmäßig durchsuchen
Johannes Nix
Johannes.Nix at gmx.net
Di Apr 12 22:00:14 CEST 2011
> wget -m http://www.webseite.de ; grep -r Wort www.webseite.de
>
Das hakt, wenn die Seite Umlaute o.ä. enthält. Statt dessen kann man in dem Fall lynx oder ähnliche Textbrowser nehmen. (Option --dump hab ich grob in Erinnerung). Falls man mehrere Seiten durchsuchen muß, ist natürlich eine Pipeline in der Art
find www.website.de -type -f -name "*html" -print0 | xargs -0 lynx --dump | grep Wort
immer ganz praktisch.
Johannes
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lug-owl.de/pipermail/lugrav/attachments/20110412/93ae9796/attachment.html>
Mehr Informationen über die Mailingliste Lugrav