Avatar billede NanoQ Nybegynder
07. februar 2004 - 22:42 Der er 10 kommentarer og
1 løsning

Jeg anbefaler: Spambayes

Jeg har igennem længere tid benyttet mig af programmet Spamfighter, når det galdt filtrering af mails for spam. Det har hjulpet mig ganske godt, men på det sidste er udsendere af spam blevet dygtige til at omgåes de fleste antispam produkter.

Jeg har nu "opdaget" et nyt produkt, der mildest talt imponerer mig - Spambayes.

Programmet fungerer på en helt anden måde end Spamfighter, spamnet og hvad jeg ellers har stiftet bekendtskab med. Programmet bygger på en simplificeret form for kunstig intelligens. Ud fra de mails du allerede har, samt de mails du med tiden modtager, "lærer" det hvad der er spam og hvad der er ok. Det vil sige programmet hele tiden bliver "klogere" og dermed bedre og bedre til at filtrere.

Indtil jeg installerede programmet, kørte jeg som sagt Spamfighter. Jeg havde stadig spamfighters spam-folder liggende i min Outlook. Denne indeholde 10.000+ spammails. Jeg bad Spambayes bruge indholdet af denne folder til at danne karakteristika for hvad der er spam. Derudover bad jeg programmet om at bruge mine øvrige foldere, for at finde ud af hvad der er godt. Dette grundlag har gjort, at Spambayes nu filtrerer 99% korrekt. Og jo længere tid jeg brugere det, des bedre bliver korrekt hitrate :)

http://spambayes.sourceforge.net/

Spambayes findes til Windows, Unix/Linux og Mac.

Hent det på http://spambayes.sourceforge.net/ - det er ganske gratis :)
Avatar billede googolplex Novice
07. februar 2004 - 22:55 #1
Det lyder dejligt, jeg bruger også Spamfighter, men det går hele tiden ned :(

Desværre har jeg ikke gemt min SPAMfolder, hvordan bruger jeg så bedst programmet hvis jeg skal starte fra begyndelsen ?

Jeg får ca. 50 spam mails om dagen.

Læste i øvrigt følgende: http://computerworld.dk/default.asp?Mode=2&ArticleID=22478

Man må da håbe der sker noget, det er jo fuldstandæg grotesk så mange resourcer der spildes på det L...!
Avatar billede NanoQ Nybegynder
07. februar 2004 - 23:02 #2
Når du installerer programmet, vælger du blot IKKE at lære den noget fra starten. Så danner den blot karakteristika ud fra de mails den løbende modtager. Den har nogle defaults, der fanger langt det meste (95% vil jeg skyde på). Men med de mængder spam du modtager, vil det gå hurtigt med at blive mere effektiv.

Et andet plus ved Spambayes er, at det er tordnende hurtigt. Spamfighter dræbte mig outlook i 30 sekunder, hver gang den skulle arbejde (har mange mails i inbox). Her er der ingen delay :)
Avatar billede googolplex Novice
07. februar 2004 - 23:06 #3
Ja, Spamfighter er dræææbende langsomt!!

Jeg prøver det, takker for tippet :)
Avatar billede NanoQ Nybegynder
07. februar 2004 - 23:17 #4
Denne post fylder en del. Men den kan måske give jer en idé om hvordan Spambayes arbejder. Eksemplet er taget fra en Eksperten mail (der scorer 0% - altså ikke antydningen af spam):

Spam Score: 0% (1.11022e-016)


word                                spamprob        #ham  #spam
'*H*'                              1                  -      -
'*S*'                              2.22045e-016        -      -
'eksperten'                        0.000283572      793      0
'email addr:idg.dk'                0.000286825      784      0
'240,'                              0.000288665      779      0
'email name:e.hansen'              0.000288665      779      0
'hansen,'                          0.000288665      779      0
'kategorien'                        0.000289036      778      0
'message-id:@eksperten.dk'          0.000289036      778      0
'from:addr:list.idg.dk'            0.000289408      777      0
'from:name:eksperten mailrobot'    0.000289408      777      0
'url:bruger'                        0.000289408      777      0
'url:exp'                          0.000289408      777      0
'ekspertenvil'                      0.00028978        776      0
'url:konto'                        0.00028978        776      0
'from:addr:eksperten'              0.000290154      775      0
'kommentar'                        0.000421783      533      0
'url:spm'                          0.00101714        859      1
'abonnere'                          0.00101832        858      1
'subject: : '                      0.00111715        782      1
'url:phtml'                        0.00112144        779      1
'kategori'                          0.00112433        777      1
'to:addr:nanoq_spam'                0.00183973        827      2
'annoncere'                        0.00194785        781      2
'url:key'                          0.00195284        779      2
'url:dtd'                          0.00195534        778      2
'url:catid'                        0.00195785        777      2
'url:navn'                          0.00195785        777      2
'kontakt:'                          0.00277574        781      3
'to:name:nanoq'                    0.00277574        781      3
'url:w3'                            0.00278285        779      3
'subject:det'                      0.00302216        74      0
'l?ngere'                          0.0032462        867      4
'v?lge'                            0.00356588        789      4
'url:afmeld'                        0.00359768        782      4
'300'                              0.00439383        787      5
'url:html4'                        0.00468052        324      2
'url:loose'                        0.00468052        324      2
'link.'                            0.00524453        782      6
'ervin'                            0.00525791        780      6
'sp?rgsm?l'                        0.00666591        808      8
'konto'                            0.00668234        806      8
'mails'                            0.00688595        782      8
'subject:Hvad'                      0.00819672        27      0
'url:tr'                            0.00855449        779    10
'url:amp'                          0.0101142        785    12
'bruger'                            0.0105523        813    13
'handling'                          0.0116187        627    11
'link:'                            0.0128022        869    17
'header:In-Reply-To:1'              0.014748          666    15
'url:org'                          0.022297          779    27
'?nsker'                            0.0227427        903    32
'dette'                            0.0235303        926    34
'skip:- 30'                        0.0238888        779    29
'vil'                              0.0295977        902    42
'skip:w 20'                        0.0327168        871    45
'accepteret'                        0.0333265          44      2
'eller'                            0.0342743        885    48
'venlig'                            0.0371602        898    53
'hilsen'                            0.0408731        920    60
'kan'                              0.0452098        1075    78
'via'                              0.045329          812    59
'ikke'                              0.0485497        1023    80
'den'                              0.0504675        921    75
'din'                              0.0510374        886    73
'side'                              0.0524129        791    67
'fra'                              0.0551306        1006    90
'header:Received:3'                0.0624632        920    94
'hvad'                              0.0783046        186    24
'skip:h 60'                        0.0866191          9      1
'har'                              0.0870102        609    89
'skip:w 10'                        0.0878272        974    144
'link'                              0.0899378        824    125
'nej,'                              0.0918367          2      0
'det'                              0.0959985        571    93
'url:dk'                            0.0963648        1050    172
'skriver'                          0.108423          23      4
'ved'                              0.113675          189    37
'forst?et?'                        0.155172            1      0
'her?'                              0.155172            1      0
'skip:e 10'                        0.177995          538    179
'subject:?'                        0.195994          94    35
'betyder'                          0.196741            6      2
'skip:f 10'                        0.303539          215    144
'x-mailer:none'                    0.338412          920    724
'subject:her'                      0.344354          20    16
'reply-to:none'                    0.358592        1037    892
'header:Mime-Version:1'            0.366081          340    302
'script'                            0.795795            1      7
'subject:skip:P 10'                0.970388            0    11

Message Stream:


Return-Path: <eksperten@list.idg.dk>
Received: from mxbackup.webpartner.dk ([195.184.96.22]) by fepW.post.tele.dk
    (InterMail vM.5.01.06.08 201-253-122-130-108-20031117) with ESMTP
    id <20040207221518.TGIF21183.fepW.post.tele.dk@mxbackup.webpartner.dk>
    for <nanoq_spam@mail.dk>; Sat, 7 Feb 2004 23:15:18 +0100
Received: from eksperten.dk (www.exp.dk [195.184.98.141])
    by mxbackup.webpartner.dk (Postfix) with ESMTP id 7F32DE18B4
    for <nanoq_spam@mail.dk>; Sat,  7 Feb 2004 23:15:17 +0100 (CET)
Received: by eksperten.dk (Postfix, from userid 500)
    id AEC5F19F311; Sat,  7 Feb 2004 23:15:02 +0100 (CET)
To: "nanoq" <nanoq_spam@mail.dk>
Subject: Programmering : Script : ASP : Hvad betyder det her?
Content-Type: multipart/alternative;
    boundary="=_06c74b5e121389c8f0028dee76e8f3df"
Mime-Version: 1.0
From: "Eksperten mailrobot" <eksperten@list.idg.dk>
Message-ID: <941499ac432c507072c87b3ebdac2df4.r4306516q462348@eksperten.dk>
In-Reply-To: <941499ac432c507072c87b3ebdac2df4.q462348@eksperten.dk>
Date: Sat,  7 Feb 2004 23:15:02 +0100 (CET)

Spørgsmål : Hvad betyder det her?
Bruger    : wedellsborghovedlys
Handling  : Kommentar
Kategori  : Programmering : Script : ASP
Link      : http://exp.dk/spm/462348
------------------------------------
Nej, ved du hvad, chmod, den har ikke accepteret 777, den skriver at kommandoen ikke er forstået?
------------------------------------

Ønsker du ikke længere at abonnere på kategorien kan du vælge den fra via din konto side eller dette link:
http://exp.dk/afmeld.phtml?catid=3&key=092e9c75b6d721231d7a3b23bfbc88fd

Venlig hilsen Eksperten

Vil du annoncere i Eksperten mails eller på www.eksperten.dk?
Kontakt: Ervin Hansen, 77 300 240, e.hansen@idg.dk
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
    "http://www.w3.org/TR/html4/loose.dtd">
<html><head><title>Eksperten E-Mail</title><style type="text/css">.expbody,.exptd,.expth{background-color:#ffffff;color:#000000;font-family:verdana,arial,helvetica,sans-serif;font-size:9pt;}.expth{text-align:left;padding-right:10px;}.exptd,.expth{padding:2px;}.exph1{font-size:13pt;}a:hover.explink{text-decoration:none;color:#006699;}.expsynopsis{background-color:#f0f5fa;border:1px solid #dde4ee;padding:5px;font-size:10pt;}</style></head><body class="expbody" bgcolor="#ffffff" text="#000000" link="#006699" alink="#006699" vlink="#006699"><h1 class="exph1"><a href="http://exp.dk/spm/462348" class="explink">Programmering : Script : ASP : Hvad betyder det her?</a></h1><table><tr><th class="expth">Spørgsmål</th><td class="exptd"><a href="http://exp.dk/spm/462348#rid4306516" class="explink">Hvad betyder det her?</a></td></tr><tr><th class="expth">Bruger</th><td class="exptd"><a href="http://exp.dk/bruger.phtml?navn=wedellsborghovedlys" class="explink">wedellsborghovedlys</a></td></tr><tr><th class="expth">Handling</th><td class="exptd">Kommentar</td></tr><tr><th class="expth">Kategori</th><td class="exptd"><a class="explink" href="http://exp.dk/spm/Programmering/">Programmering</a> : <a class="explink" href="http://exp.dk/spm/Programmering/Script/">Script</a> : <a class="explink" href="http://exp.dk/spm/Programmering/Script/ASP/">ASP</a></td></tr></table><br /><div class="expsynopsis">Nej, ved du hvad, chmod, den har ikke accepteret 777, den skriver at kommandoen ikke er forst&aring;et?</div><p>Ønsker du ikke længere at abonnere på kategorien kan du vælge den fra via din <a href="http://exp.dk/konto.phtml" class="explink">konto side</a> eller <a href="http://exp.dk/afmeld.phtml?catid=3&amp;key=092e9c75b6d721231d7a3b23bfbc88fd" class="explink">dette link</a>.</p><p>Venlig hilsen Eksperten</p><br />Vil du annoncere i Eksperten mails eller på www.eksperten.dk?<br />Kontakt: Ervin Hansen, 77 300 240, <a href="mailto:e.hansen@idg.dk" class="explink">e.hansen@idg.dk</a></body></html>
Message Tokens:

121 unique tokens

'240,'
'300'
'777,'
'?nsker'
'abonnere'
'accepteret'
'annoncere'
'asp'
'aspnej,'
'betyder'
'bruger'
'cc:none'
'chmod,'
'content-type:text/plain'
'den'
'det'
'dette'
'din'
'eksperten'
'ekspertenvil'
'eller'
'email addr:idg.dk'
'email name:e.hansen'
'ervin'
'forst?et?'
'fra'
'from:addr:eksperten'
'from:addr:list.idg.dk'
'from:name:eksperten mailrobot'
'handling'
'hansen,'
'har'
'header:Date:1'
'header:From:1'
'header:In-Reply-To:1'
'header:Message-ID:1'
'header:Mime-Version:1'
'header:Received:3'
'header:Return-Path:1'
'header:Subject:1'
'header:To:1'
'her?'
'hilsen'
'hvad'
'hvad,'
'ikke'
'kan'
'kategori'
'kategorien'
'kommandoen'
'kommentar'
'kontakt:'
'konto'
'l?ngere'
'link'
'link.'
'link:'
'mails'
'message-id:@eksperten.dk'
'nej,'
'proto:http'
'reply-to:none'
'script'
'sender:none'
'side'
'skip:- 30'
'skip:e 10'
'skip:f 10'
'skip:h 10'
'skip:h 60'
'skip:p 10'
'skip:w 10'
'skip:w 20'
'skriver'
'sp?rgsm?l'
'subject: '
'subject: : '
'subject:?'
'subject:ASP'
'subject:Hvad'
'subject:Script'
'subject:betyder'
'subject:det'
'subject:her'
'subject:skip:P 10'
'to:2**0'
'to:addr:mail.dk'
'to:addr:nanoq_spam'
'to:name:nanoq'
'url:092e9c75b6d721231d7a3b23bfbc88fd'
'url:3'
'url:462348'
'url:462348#rid4306516'
'url:afmeld'
'url:amp'
'url:asp'
'url:bruger'
'url:catid'
'url:dk'
'url:dtd'
'url:exp'
'url:html4'
'url:key'
'url:konto'
'url:loose'
'url:navn'
'url:org'
'url:phtml'
'url:programmering'
'url:script'
'url:spm'
'url:tr'
'url:w3'
'url:wedellsborghovedlys'
'url:www'
'v?lge'
'ved'
'venlig'
'via'
'vil'
'x-mailer:none'
Avatar billede bjornicle Nybegynder
08. februar 2004 - 12:10 #5
Baynesian filtering har vaeret her et stykke tid, bla. er det indbygget i mozilla thunderbird samt spamassassin. Det virker fortraeffeligt ved simple mails, men der er flere og flere spammails som bliver sendt med "baynesian poison", hvilket vil sige at udover den normale text bliver der sendt x antal random ord. Hvilket du saa laere dit filter er spamord, selvom de ikke er.
Jeg har provet det baynesian filter der er i thunderbird, og jeg faar ca. 250 spammails per dag, og ca 60% blev fanget, andre siger at deres thunderbirds fanger 97-98% af alt spam.

Jeg tror ikke personligt at baynesian filtere er 100% vejen frem, men gerne en mix, som f.eks. spamassassin, her kan du have baynesian filtering, regex regler, dnsbl checking samt hashcheck (som f.eks. spamfighter), og hvert "hit" giver saa et antal point, og naar den naar over en graense bliver den markeret som spam, utroligt lidt slipper igennem.
Avatar billede googolplex Novice
08. februar 2004 - 13:24 #6
Ja, men Spamassassin koster, de andre to er gratis (indtil videre).
Avatar billede bjornicle Nybegynder
08. februar 2004 - 14:01 #7
spamassassin er gratis, her er f.eks. en guide til at installere det paa windows: http://www.openhandhome.com/howtosa260.html

du taenker sikkert paa et kommercielt produkt der bruger spamassassin som koster
Avatar billede fromsej Praktikant
08. februar 2004 - 14:13 #8
Bjornicle>>Du har sikkert ret, det betvivler jeg ikke et sekund, men jeg må indrømme den vejledning kunne lige så godt være skrevet på kinesisk, desværre for vi er også på udkig efter et godt Anti-spam program, og da 90% af vores "kunder" er Ikke-nørder, vil de give blankt op overfor noget der ser så uoverskueligt ud
Fromsej/TeamSpywarefri.
Avatar billede bjornicle Nybegynder
08. februar 2004 - 14:32 #9
Fromsej> Jeg vil give dig ret, spamassassin er desvaerre et "made by geeks for geeks" product

Optimalt bør man bede sin mailadministrator om at installere det paa mailserveren, saa skal man bare saette en regel op som frasortere det paa klienten
Avatar billede bjornicle Nybegynder
08. februar 2004 - 14:42 #10
Her er f.eks. en spammail jeg modtog i dag, som viser hvordan spammeren bruger random ord i bunden for at odelaegge et baynesian system. Hvis man markere denne mail som spam "laere" den at disse ord er spamord, og naar man har faaet mange nok vil forkerte mails blive markeret, og saa vil man begynde at laere den at disse ord ikke er spam, hvorefter de igen vil begynde at smutte igennem filteret. Dette er ikke det storste problem i danmark da det er sjaelden at spammere brugere danske ord, men modtager man meget engelsk mail kan det godt blive et problem


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD><TITLE>Google-me</TITLE>

<META content=3D"MSHTML 6.00.2600.0" name=3DGENERATOR></HEAD>
<BODY text=3D#000000 vLink=3D#ff0000 aLink=3D#ff9900 link=3D#000000 bgColo=
r=3D#ffffff>
<DIV>&nbsp;</DIV>
<P align=3Dleft><I><B><FONT face=3D"Times New Roman"><FONT size=3D5>How to=
get
a</FONT><FONT size=3D6> <FONT color=3D#ff3300>TOP 10</FONT> </FONT><FONT
size=3D5>ranking&nbsp;on</FONT><FONT color=3D#003366 size=3D6> </FONT><FON=
T
size=3D6><FONT color=3D#0099ff>G</FONT><FONT color=3D#ff3300>o</FONT><FONT=

color=3D#ffcc00>o</FONT><FONT color=3D#0099ff>g</FONT><FONT
color=3D#339933>l</FONT><FONT color=3D#ff3300>e</FONT></FONT><FONT
color=3D=
#003366
size=3D6> </FONT><FONT size=3D5>and<FONT color=3D#003366 size=3D6> </FONT>=

</FONT><FONT
color=3D#ff3300 size=3D6>Yahoo</FONT><FONT color=3D#003366
size=3D5>...!</FONT></FONT></B></I></P>
<P align=3Dleft><I><FONT face=3DArial size=3D3><B>Did you know that</B> <F=
ONT
color=3D#ff3300><B>80%</FONT><FONT face=3DArial size=3D3> of all searches =
online</B>&nbsp;</FONT><BR><B>are made
through</B> <B><FONT color=3D#000099>Google</FONT></B> <B>and</B> <B><FONT=

color=3D#ff3300>Yahoo</FONT></B>?</FONT></I></P>

<P align=3Dleft><I><FONT face=3DArial size=3D3><B>Did you also know that t=
here are
over</B> <FONT color=3D#ff3300><B>200 million</B> &nbsp;</FONT><BR><B>sear=
ches
made on</B> <FONT color=3D#000099><B>Google</B></FONT> <B>EVERY
DAY!</B></FONT></I></P>

<P align=3Dleft><I><B><FONT face=3DArial size=3D2>That means that if your =
web site is
not HIGH up in&nbsp;<BR>their listings, you are missing out on a stackful
of&nbsp;<BR>C -l -i -c -k -s&nbsp; and orders!</FONT></B></I></P>
<P align=3Dleft>
<A href=3D"http://www.googletop.biz"
target=3D_blank>&nbsp;<I><font color=3D"#FF0000"><b>Please <FONT color=3D#=
003366 size=3D5> </FONT><FONT
size=3D5><FONT color=3D#0099ff>G</FONT><FONT color=3D#ff3300>o</FONT><FONT=

color=3D#ffcc00>o</FONT><FONT color=3D#0099ff>g</FONT><FONT
color=3D#339933>l</FONT><FONT color=3D#ff3300>e</FONT></FONT><FONT
color=3D=
#003366
size=3D6> </FONT> Me !</font></I></A></b></P>

<HR>

          <TR>
          <TD colSpan=3D4>&nbsp;</TD></TR></TBODY></TABLE></TD></TR></TBOD=
Y></TABLE>
          <img src=3D"http://www.googletop.biz/m.php?mt=3DGIS-MP&alt=3DSAL=
ES1M" height =3D"1" width =3D "1" border =3D "0">
          <DIV><BR></DIV>

<P align=3Djustify><FONT color=3D#fbf9f9>coeditor appian manipulate</FONT>=
<BR><FONT
color=3D#fbf9f9>cromwell darken fluorescein aitken kay</FONT><BR><FONT
color=3D#fbf9f9>bertha justice cardioid</FONT><BR><BR><FONT color=3D#fbf9f=
9>sonnet
ulster pow drench magdalene</FONT><BR><FONT color=3D#fbf9f9>conklin divest=

dais</FONT><BR><FONT color=3D#fbf9f9>janeiro mitochondria stefan division
emphysema</FONT><BR><FONT color=3D#fbf9f9>dread baronet paranoid somber
singapore</FONT><BR><FONT color=3D#fbf9f9>aspect fishermen
broke</FONT><BR><BR><FONT color=3D#fbf9f9>highland alberich rampart discov=
ery

<BR>barnet clothesman walpole boot brainwash <BR>bundle gullet encephaliti=
s
grievous <BR>mort orthophosphate buckskin tenor <BR>durer integrity atlant=
ic
bravo already <BR></FONT>
<DIV align=3Dcenter><IMG height=3D50
src=3D"http://www.googletop.biz/images/CS.jpg" width=3D250 border=3D0></A>=
</CENTER></BODY></HTML>
Avatar billede NanoQ Nybegynder
10. april 2004 - 11:46 #11
.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester