leicht OT: wie geht Ihr mit Spam um, der gezielt den Bayes (oder anderen) Filter entkräften soll?

Stefan Ulrich Hegner stefan at hegner-online.de
Mon Feb 2 10:45:24 CET 2004


Moin,

nachdem ich dank eurer tatkräftigen Mithilfe meinen SA nun ganz
ordentlich am rennen habe und das Spam Problem an sich im Griff ist,
hätte ich noch folgende Frage:

Seit 1-2 Monaten tauchen immer diese Spam-Mails auf die im Betreff und
im Body wahllos irgendwelche englischen "Dictionary words" verbraten.
Ziel davon ist sicherlich, irgendwelche content-Filter zu irritieren.

Bisher waren das i.d.R. nur 3 Zeilen "Vokabeln" ... heute hab' ich die
erste Spam mail bekommen mit rd. 30 Zeilen davon.

Wenn ich die alle als "spam" in den Bayes schmeisse, ist es dann nicht
eine Frage der Zeit, bis der auf englische Mails gar nicht mehr
anspringt?

Auf der anderen Seite werden diese fraglichen Spams derzeit noch als
99-100% Spam Wahrscheinlichkeit getaggt. - Daher meine Überlegung: Wenn
ich SA noch mal Spam zum lernen gebe, sortiere ich die vorher manuell
aus. --- wobei das natürlich eine ätzende Arbeit ist.

Plan B wäre, SA nur noch false Positives/Negatives zum Lernen zu geben.
Bei ca. 4500 Ham und 1500 Spam Messages sollte der Bayes ja eigentlich
genügend Futter haben, oder?

... wie macht Ihr sowas in der Praxis?

Danke

Stefan.

-- 
/ Stefan Ulrich Hegner aka "Hegi" - Loehne/ Westfalen - Germany \
| stefan at hegner-online.de, my Cyberhome http://www.hegner-web.de|
\ GPG-Fprint D9DB 51BD 2DA6 9B3A 41CB  0287 05A1 8D11 38BA CE91 /
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 189 bytes
Desc: Dies ist ein digital signierter Nachrichtenteil
URL: <http://lug-owl.de/pipermail/linux/attachments/20040202/b9195cb6/attachment.sig>


More information about the Linux mailing list