leicht OT: wie geht Ihr mit Spam um, der gezielt den Bayes (oder anderen) Filter entkräften soll?

Florian Lohoff flo at rfc822.org
Mon Feb 2 21:37:35 CET 2004


On Mon, Feb 02, 2004 at 01:03:49PM +0100, Stefan Ulrich Hegner wrote:
> Hi Flo,
> 
> Am Mo, den 02.02.2004 schrieb Florian Lohoff um 11:50:
> > On Mon, Feb 02, 2004 at 10:45:24AM +0100, Stefan Ulrich Hegner wrote:
> > > Plan B wäre, SA nur noch false Positives/Negatives zum Lernen zu geben.
> > > Bei ca. 4500 Ham und 1500 Spam Messages sollte der Bayes ja eigentlich
> > > genügend Futter haben, oder?
> > 
> > Ich habe meinen Bogofilter mit bestehenden Mails trainiert und lasse
> > nicht jede getaggte mail da reinlaufen sondern tagge nur false pos/neg.
> 
> Jeppp. So denke ich macht das wohl am meisten Sinn. Trotzdem noch eine
> Frage: Wieviele Mails hast Du zum Training durch den Bogofilter gejagt?
> Bzw. wieviel ist sinnvoll. - Ich kann im Moment überhaupt nicht
> einschätzen ob meine ~6.000 Mails eine "gute Hausnummer" sind oder ob
> mehr noch sinnvoll wäre.

Wie wir hier immer scherzen - "Statistik beginnt bei 500". Je mehr mails
du durchjagst desto besser ist die Statistik. Jedoch denke  ich das es
wichtig ist das ein gewisses verhaeltnis zwischen neg. und pos. mails
gewahrt bleibt.

Ich habe initial denke ich mal 4000 Negatives und ebensoviele positivs
reingeworfen.

Flo
-- 
Florian Lohoff                  flo at rfc822.org             +49-171-2280134
                        Heisenberg may have been here.
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: application/pgp-signature
Size: 189 bytes
Desc: not available
URL: <http://lug-owl.de/pipermail/linux/attachments/20040202/6d7c68a0/attachment.sig>


More information about the Linux mailing list