Hvordan søger jeg bedst på indholdet i vedlagte word filer?
Hejsa,Jeg sider med et projekt hvor det skal være muligt at vedlægge filer til en nyhed. F.eks. Word filer.
Når en bruger så søger på siten skal der også søges i de word filer brugeren har rettigheder til.
Der er forskellige rettigheder på de oprettede nyheder, så jeg kan ikke bare lægge alle word filerne i en mappe og bruge index server.
Så jeg har tænkt mig at smide tekstindholdet fra wordfilerne i en database, således at jeg i min søgning, kan holde styr på hvilke word filer brugeren må søge i.
Jeg har tænkt at gøre det nogen lunde således.
1) brugeren opretter en nyhed og vedlægger nogle word filer
2) disse word filer uploader jeg så på serveren i en mappe der hedder GUIDen på nyheden. Således at folk ikke bare kan gætte sig frem til stien.
3) Så vil jeg her efter løbe filerne igennem og hente tekst indholdet ud, ikke billeder og div. Word opsætninger, kun ren tekst. Og lægge disse tekster i en database.
Så kommer mit spørgsmål.
Hvordan faen læser jeg en word fil på en server og filtrere alt andet end den rå tekst fra?? Skal jeg lave et regulært udtryk eller er der en .NET klasse til det samme?
Er der nogen med andre gode ideer - så kom med dem! :-)
På forhånd mange tak!
Lauge
Men hvordan faen