08. april 2003 - 13:52Der er
7 kommentarer og 1 løsning
Fritekst søgning
Hej
Jeg har brug for en algoritme, som kan sammenligne et stykke fritekst, med en database (MySQL) og udtage alle sætninger som forkommer i teksten, og som er inde i databasen. Desuden skal den også kunne identificere stavefejl og rette disse.
EX:
Fritext: Jeg kan ikke rigetigt find ud af atlave så dan en algoritme, som ikke kører alt for langsomt.
Databasen indeholder følgende felter: 1. Jeg kan ikke; 2. rigtigt 3. finde ud af 4. at lave 5. sådan;
programmet skal så kunne finde samtlige af disse felter i friteksten. Læg mærke til at der er flere ord i felt i adsiklte af mellemrum. Felt 2 er stavet forkert i friteksten. Felt 3 er en kombination af 1 og 2. Felt 4 er skrevet som ét ord i friteksten, og felt 5 er skrevet som to ord i friteksten.
Det burde kunne lade sig gøre, idet man har sådan noget i diverse skriveprogrammer.
Jeg havde også selv tænkt på noget i den retning. Men det der vil tage rimelig lang tid, specielt når du har en stor database, og et stort stykke tekst du skal søge i. Der MÅ være noget andet smart man kan bruge i MySQL.
Det bør også være muligt at få det til at køre rimeligt hurtigt. Feltet / de to felter skal naturligvis være indekseret. Og selve databasen bliver jo ikke så stor.
Jeg sidder her med en bog om brugervenlige søgemaskiner. Den anbefaler man -erstatter dobbeltbogstaver med det tilsvarende enkelte bogstav. -erstatter hv med v -fjerner afsluttende r.
Det kan også være en go ide at fjerne tegn som + & ^ * ? " ' ( )
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.