Avatar billede lau_r Nybegynder
23. september 2003 - 11:25 Der er 6 kommentarer og
1 løsning

opslag i ordbog

Jeg er ved at lave en ordbog brugeren kan slå op i ved at trykke på et tilfældigt ord på en asp.net side.
Nu har jeg to problemer:
1) Hvordan fjerner jeg alle tegn fra det ord jeg er ved at slå op? Eks. huset? --> huset
2) Hvordan slipper jeg bedst fra at skulle tage højde for et ords forskellige endelser?
Eks. hus = huset = husene osv.
Avatar billede arne_v Ekspert
23. september 2003 - 11:58 #1
#1 er meget nem. Kan kodes med en simpel lille løkke.

#2 er absolut ikke nem. Det hedder teknisk set "lemmatisering" og
er en meget krævende process at lave korrekt.
Avatar billede lau_r Nybegynder
23. september 2003 - 12:09 #2
jeg selv løst #1 ved hjælp af Regex.Replace fra System.Text.RegularExpressions.
Det er klart at #2 ikke er nem, men der må være nogen der har erfaring med "lemmatisering". Måske findes der en metode der tager højde for 90% af tilfældende, eller en smart måde at designe databasen så den er klar over hvordan det specifikke ord bøjes?
Avatar billede arne_v Ekspert
23. september 2003 - 12:24 #3
For at illustere nogle af problemerne, så betragt følgende 2 sætninger:
  Det er svært at huse så mange flygtninge.
  Der lå 3 huse i udkanten af byen.

Bedste/nemmeste 90% løsning er nok at lave en lille tabel med:

grundform afledtform
hus      huse
hus      huset
hus      husets
hus      husenes

Og så slå op i den tabel og find grundform.

Den vil ikke være entydig.

Og den vil være stor.

Men rent programmeringsmæssigt er den ihvertfald til at overskue.

[hvis du er interesseret i en betalings-løsning så kender jeg nogen
der kender nogen der arbejder professionelt med den slags]
Avatar billede lau_r Nybegynder
23. september 2003 - 12:50 #4
En betalings-løsning kan godt komme på tale.
Avatar billede arne_v Ekspert
23. september 2003 - 19:38 #5
Folkene bag http://www.termplus.dk/ ved rigtigt meget om den slags
sprog-teknologi.
Avatar billede arne_v Ekspert
23. september 2003 - 23:03 #6
Og lad os kalde det et svar.
Avatar billede arne_v Ekspert
27. september 2003 - 12:45 #7
OK ?
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester