SpamAssassin: Schlechtere Wirkung trotz niedrigerer Schwellen + Bayes

Stefan Ulrich Hegner stefan at hegner-online.de
Wed Jan 21 12:14:34 CET 2004


Hi Lars,

Am Mi, den 21.01.2004 schrieb lmb um 10:32:
> Allerdings hat bei meinen Tests der SA Bayes nicht so gut abgeschnitten,
> der bogofilter war besser. Deswegen verwende ich SA und bogofilter
> kaskadiert.

Wie genau geht sowas praktisch? Geht das auch wenn SA durch amavisd
aufgerufen wird?

> Wichtig ist, das ein Bayes trainiert werden muß; ie, am Anfang
> ordentlich gefüttert wird auch zur Laufzeit false positives / negatives
> nachtrainiert werden.

... datt mach ich an sich seit einem Jahr. 

> > 4. Wenn ich entsprechend schärfer filtere, steigt das Risiko von "false
> > positives". - Aber der Aufwand immer "manuell" danach zu suchen ist auch
> > recht hoch. - Wie macht Ihr das am effizientesten?
> 
> Das muß dennoch sein, sonst wird insbesondere der Bayes-Filter
> sukzessive schlechter und generiert mehr false positives. Deswegen
> scanne ich meinen Spam-Folder einmal die Woche grob durch und trainiere
> ihm die wieder ab.

Wobei ich aber auch schon erlebt habe, dass das nicht sofort hilft.
Hatte da schon mal Mails von 'nem Bot, die als Spam getaggt wurden. Nach
einem sa-learn --ham ... war dem aber immer noch so.

> Hier meine entsprechenden procmail Einträge. Swen & MS Attachments im
> allgemeinen Haue ich direkt weg, damit belaste ich meine Spam-Filter
> garnicht erst.

Was ist "Swen"?

> Die von SA als Spams klassifizierten Mails gehen direkt in den
> bogofilter als Trainingsdaten; ansonsten wird bogofilter gefragt, ob es
> vielleicht doch Spam ist. Ich habe Erkennungsraten von ca. 99% und
> besser, auch wenns leider etwas langsam ist.

So weit so gut. 

[.procmailrc]

... sieht ja doch schwer danach aus, dass ich um Procmail zumindest
diesmal nicht herumkomme.

Auch wenn ich noch nicht alles in Deiner .procmailrc verstehe, sieht das
aber so aus, als ich die mit einigen kleinen Anpassungen übernehmen
könnte.

Das würde heißen, dass ich MD (oder was ähnliches) und bogofilter
installieren müsste, ein paar Pfund Spam da durchjage und dann hoffe,
dass es besser wird ...

... lieber wäre mir es würd' sich noch was weniger komplexes findes. Da
ich den ganzen Krams "nur für den Hausgebrauch" nutze, stell ich mir
manchmal auch durch die Komplexität ein paar Beine.

Gruß

Stefan.

-- 
/ Stefan Ulrich Hegner aka "Hegi" - Loehne/ Westfalen - Germany \
| stefan at hegner-online.de, my Cyberhome http://www.hegner-web.de|
\ GPG-Fprint D9DB 51BD 2DA6 9B3A 41CB  0287 05A1 8D11 38BA CE91 /
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 189 bytes
Desc: Dies ist ein digital signierter Nachrichtenteil
URL: <http://lug-owl.de/pipermail/linux/attachments/20040121/44977422/attachment.sig>


More information about the Linux mailing list