04. december 2019 - 11:34Der er
8 kommentarer og 2 løsninger
Identificere navne der ligner hinanden
Hej, Jeg har et Excelark med en lang list med navne. Nogle navne dækker over samme person, men navnene kan være en smule forskellige fx ved et ekstra navn eller stavet en smule anderledes. Dem skal jeg have identificeret som samme person - eller i hvert fald et hint om, at det kan være den samme, så jeg manuelt kan vurdere, om det er den samme. Fx Hansen,Jens Petre Hansen,Jens Peter (dvs. stavet forkert i første omgang)
Mads,Larsen Larsen,Mads (dsv. byttet om på for- og efternavn i første omgang)
Der er altid komma mellem efternavn og fornavn uden mellemrum, og mellemrum til ekstra fornavn eller mellemnavne.
Jeg forestiller mig en ekstra kolonne med en "1" angivelse, hvis der kan være flere personer, der ligner. Nogle forslag til en smart løsning?
Jeg har selv tænkt, om man kan omregne bogstaver i navnet til tal og så lave et sumprodukt. Dvs. sumprodukter, der ligger indenfor +/- samme værdi kan være identiske personer.
Jeg har prøvet med følgende eksempel: Kolonne A B C D E ABC VÆRDI A 1 B 2 C 3
I B2 skrives =SUMPRODUKT(LOPSLAG(MIDT(A2;RÆKKE(INDIREKTE("1:"&LÆNGDE(A2)));1);D$2:E$3;2))
Men det giver mig blot værdien af første bogstave. Jeg ikke regne ud, hvordan jeg får den til at tage alle bogstaverne i navnet. Selvom jeg finder en løsning til dette forslag, kan der jo selvfølgelig være flere meget forskellige navne, som giver samme værdi. Så det er bestemt ikke en ideel løsning under alle omstændigheder. Kom endelig med andre forslag.
JackJazz tak for svar. Der er mange, hvor efternavnet er et andet anden gang; enten fordi man har byttet om på for- og efternavn, det er stavet forkert (også første bogstave), eller der er kommet nyt efternavn til og det tidligere efternavn nu er mellemnavn. Dvs. en sortering vil ikke sætte to identiske personer sammen. Desuden er det en lang liste, så manuel gennemgang af alle er ikke realistisk.
Du kommer jo ikke uden om en vis mængde af mauelt arbejde, når forskellighederne er så mange. Men din egen løsning kan måske gøre identificeringen lidt nemmere, så lad os arbejde videre med den.
I dit eksempel ville jeg gøre det meget ukønt men effektivt ved at sætte cellerne i kolonne B til at være summen af cellerne til højre, og så ville jeg udfylde Række 1 med tallene 1,2,3 osv fra kolonne C og frem.
Derefter kan du lave følgende formel i C2 og kopiere den videre: =HVIS.FEJL(LOPSLAG(MIDT($A2;D$1;1);$A$19:$B$47;2;FALSK);0)
I formlen er kolonnen med bogstaver og kolonnen med tilhørende tal tilstede i A19:B47.
Det er svært at lave en automatisk løsning, hvis der slet ikke er systematik i fejlene, og det ikke vides, hvor i navnene de står. Excel har ingen "lyder som" funktion, så derfor vil man skulle tage hvert navn for sig, opdele det i enkeltdele, og så sammenligne det med alle andre navne i listen.
1. Peter eller Petre har samme længde. Vha. =KODE() kunne du sammenligne navnene tegn for tegn, i Peter / Petre er der 3 ens (pet) tegn, og ialt 5 x samme bogstaver. Sammenfaldet er 60% gange 100%, eller 6.000 af 10.000 point. 2. Peter eller Peder: Sammenfaldet er 80% gange 80%, eller 6400 af 10.000 point.
Tak for svar til jer alle. Fuzzy Lookup Add-in var den gyldne løsning, og det virker super godt. Både svar fra xl-Enthusiast (download) og acore (god vejledning) var til stor hjælp. Kan man dele en "løsning" ?
Ja, du kan markere lige så mange som svar, som du vil. Men det vigtigste er, at du fandt en god løsning :)
Synes godt om
1 synes godt om dette
Ny brugerNybegynder
Din løsning...
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.