leicht OT: wie geht Ihr mit Spam um, der gezielt den Bayes (oder anderen) Filter entkräften soll?

Cord Beermann cord at lug-owl.de
Mon Feb 2 11:00:44 CET 2004


Hallo! Du (Stefan Ulrich Hegner) hast geschrieben:


>Plan B wäre, SA nur noch false Positives/Negatives zum Lernen zu geben.
>Bei ca. 4500 Ham und 1500 Spam Messages sollte der Bayes ja eigentlich
>genügend Futter haben, oder?
>
>... wie macht Ihr sowas in der Praxis?

wie in dem Beispiel angegeben muss ein bayes permanent gefuettert
werden. gaengige Praxis ist hierbei, als Spam erkannte Mail gleich
automatisch wieder lernen zu lassen. (genauso fuer Ham)

und natuerlich falsch klassifizierte Mails passend nachzulernen.

Ob diese seltsamen Mails den Filter wirklich vergiften koennen weiss
ich nicht. schliesslich lernen die Spamfilter auch den Mailheader (in
dem ich bspw auch noch verschiedene Taggings habe.

Aber vermutlich werden diese Mails die Entwicklung von
Kontext-Bayes-Filtern beschleunigen. (Also Filter die nicht nur Wort
fuer Wort bewerten, sondern auch die Zusammenstellung mehrerer Woerter
berücksichtigen...)

Cord

-- 
Cord Beermann   cord at Wunder-Nett.org (Privat)



More information about the Linux mailing list