Avatar billede lauge Nybegynder
17. maj 2003 - 00:55 Der er 6 kommentarer

Hvordan søger jeg bedst på indholdet i vedlagte word filer?

Hejsa,

Jeg sider med et projekt hvor det skal være muligt at vedlægge filer til en nyhed. F.eks. Word filer.
Når en bruger så søger på siten skal der også søges i de word filer brugeren har rettigheder til.
Der er forskellige rettigheder på de oprettede nyheder, så jeg kan ikke bare lægge alle word filerne i en mappe og bruge index server.

Så jeg har tænkt mig at smide tekstindholdet fra wordfilerne i en database, således at jeg i min søgning, kan holde styr på hvilke word filer brugeren må søge i.

Jeg har tænkt at gøre det nogen lunde således.

1) brugeren opretter en nyhed og vedlægger nogle word filer
2) disse word filer uploader jeg så på serveren i en mappe der hedder GUIDen på nyheden. Således at folk ikke bare kan gætte sig frem til stien.
3) Så vil jeg her efter løbe filerne igennem og hente tekst indholdet ud, ikke billeder og div. Word opsætninger, kun ren tekst. Og lægge disse tekster i en database.

Så kommer mit spørgsmål.

Hvordan faen læser jeg en word fil på en server og filtrere alt andet end den rå tekst fra?? Skal jeg lave et regulært udtryk eller er der en .NET klasse til det samme?

Er der nogen med andre gode ideer - så kom med dem! :-)

På forhånd mange tak!

Lauge

Men hvordan faen
Avatar billede roenving Novice
17. maj 2003 - 00:59 #1
-- om ikke andet, så kan du da åbne en OLE-instans af Word og vælge gem som kuntekst-fil
Avatar billede mortrr Praktikant
17. maj 2003 - 01:06 #2
Hvorfor ikke bruge index-server til at lave søgningen, og sammenkæde den med databasen?
http://www.eksperten.dk/spm/336185
Avatar billede lauge Nybegynder
17. maj 2003 - 01:06 #3
ganske rigtigt!
Men det kan jeg jo ikke få brugeren af siten til.
Brugeren skal jo ikke lægge mærke til at jeg "klipper" teksten ud af deres word filer for at søge i dem.
Brugerne af siten skal jo bare kunne uploade word filer til hinanden, med billeder og graffer m.v.
Avatar billede odegaard Nybegynder
17. maj 2003 - 01:06 #4
Hvorfor ligger du ikke de uploadede filer uden for web-biblioteket, og istedet streamer filerne til brugeren? På denne måde sikrer du jo at man ikke bare kan linke til beskyttede dokumenter. Alternativt kunne de lige så godt smides ind i databasen i en kolonne sammen med plain-text versionen af dokumentet.

Den nemme måde at læse Word-documentet er at bruge den DLL der følger med Word, men det kræver at serveren har Officepakken installeret.
Avatar billede lauge Nybegynder
17. maj 2003 - 01:11 #5
ok - mange gode ideer!
Jeg skal lige hjem og sove nogle timer - prøver det så af her i weekenden.

Sikke mange natteravne! :-)
Avatar billede lauge Nybegynder
17. maj 2003 - 01:15 #6
en sidste kommentar - jeg har lidt regnet med at bruge en Acces database. Med .NET cashing og en site som ikke har den store aktivitet, rækker den fint.
Men hvis jeg på en nem måde kan flette Index server og msSQl server sammen i en søgning, og stadig kun søg i filer som brugeren har rettigheder til, springer jeg måske på den vogn.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester