Avatar billede jensen363 Forsker
07. juni 2006 - 13:23 Der er 10 kommentarer og
1 løsning

Adressevask-kriterier og varianter

Jeg skal i gang med at opstille nogle kriterier for adressevask/beautifier.

Mit datasæt består udelukkende af adresser med store bogstaver, som herefter som skal vaskes, med et output hvor adresserne er med stort forbogstav, stort efter punktum ... samt alle andre forekomne stave-varianter

Er der nogen som har erfaring med en lignende opgave, og hvordan har I grebet opgaven an ?????
Avatar billede mugs Novice
07. juni 2006 - 13:35 #1
Alle ord med stort begyndelsesbogstav:

Private Sub felt1_AfterUpdate()
[felt1].Value = StrConv([felt1].Value, vbProperCase)
End Sub
Avatar billede Slettet bruger
07. juni 2006 - 13:40 #2
Kan du ikke først lave alt med små bogstaver, så lav det første bogstav stort og så lav stort bogstav hver gang der er et punktum og et mellemrum?~)
Avatar billede jensen363 Forsker
07. juni 2006 - 13:55 #3
Ved ikke lige om det er så simpelt endda ... der er mange andre stavevarianter som der også skal tages hensyn til ... et par eksempler :

D'Angletarre
1. sal tv

Det er lige så meget stavevarianter som metode til konvertering jeg efterlyser
Avatar billede Slettet bruger
07. juni 2006 - 14:07 #4
Held og lykke!~)
Avatar billede jensen363 Forsker
07. juni 2006 - 14:16 #5
Takker  c",)
Avatar billede fdata Forsker
07. juni 2006 - 16:40 #6
Det nemmeste er nok først at konvertere hele dynen med vbProperCase og derefter køre Søg-Og-Erstat på alle de kendte kombinationer, du kan komme i tanke om, altså A/S, I/S, c/o, ApS, osv osv.
D'Angleterre er så speciel, så den vil du nok ikke kunne opstille en regel for. Eller måske ... Hvis ' efterfølges af et bogstav, skal bogstavet ændres til UpperCase. Det må være namnam for en kodehaj.
Avatar billede jensen363 Forsker
08. juni 2006 - 08:38 #7
fdata > jeg har endnu ikke modtaget testdata ... men jeg er opmærksom på, at at opgaven ikke er lige til højrebenet ...

Under alle omstændigheder er den største showstopper nok performance i sådan en opgave ... datasættet består af minimum 3-4 mio records, hertil kommer stavevarianter 
af samme gadenavne ( Sct. Jørgensgade / Sankt Jørgensgade ... o.s.v. )
Avatar billede jensen363 Forsker
08. juni 2006 - 14:42 #8
Her er lige et eksempel på, hvad jer er oppe imod :

UA;1-1;Majbritt Rasmussen;;;;Lange Müllers Vej;1;;;;;9900;;;;;
UA;1-2;Majbritt Rasmussen;;;;LANGE MYLLERS VEJ;1;;;;;9900;;;;;
UA;1-3;Majbritt Rasmussen;;;;LANGE-MYLLERS VEJ;1;;;;;9900;;;;;
UA;2-4;SKAT;;;;Lüdersvej ;1;;;;;2100;;;;;
UA;2-5;SKAT;;;;LYDERSVEJ ;1;;;;;2100;;;;;
UA;3-6;;jensen;;;Lüttichausvej;5;;;;østerballe;5450;;;;;
UA;3-7;;jensen;;;LYTTICHAUSVEJ;5;;;;østerballe;5450;;;;;
UA;4-8;;marie nielsen;;;Lützensvej;1;;1;0004;;4220;;;;;
UA;4-9;;marie nielsen;;;LYTZENSVEJ;1;;1;0004;;4220;;;;;
Avatar billede fdata Forsker
08. juni 2006 - 22:20 #9
Som de siger i reklamen: "Det er svært at se, hvad der er snavs og hvad der er pletter" ... og det bliver jo nok værre endnu.
Jeg tror godt du kan bestille mavesårsmedicinen med det samme.
God fornøjelse  ;o]
Avatar billede jensen363 Forsker
09. juni 2006 - 08:57 #10
fdata > det tror jeg du har ret i :o) ... der er omkring 47.000 gadenavne i Danmark, gud ved hvor mange stave-varianter der er af dem ????
Avatar billede jensen363 Forsker
25. juli 2006 - 14:31 #11
Lukker spørgsmål
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Dyk ned i databasernes verden på et af vores praksisnære Access-kurser

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

IT-JOB

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Ingeniør til Satellitkommunikation

Banedanmark

Systemarkitekt

AL Sydbank A/S (tidligere Arbejdernes Landsbank)

Tech Lead til Datacenter Operations

Netcompany A/S

Managing Architect