Avatar billede MKH Novice
04. december 2019 - 11:34 Der er 8 kommentarer og
2 løsninger

Identificere navne der ligner hinanden

Hej,
Jeg har et Excelark med en lang list med navne.
Nogle navne dækker over samme person, men navnene kan være en smule forskellige fx ved et ekstra navn eller stavet en smule anderledes. Dem skal jeg have identificeret som samme person - eller i hvert fald et hint om, at det kan være den samme, så jeg manuelt kan vurdere, om det er den samme.
Fx
Hansen,Jens Petre
Hansen,Jens Peter (dvs. stavet forkert i første omgang)

Mads,Larsen
Larsen,Mads (dsv. byttet om på for- og efternavn i første omgang)

Der er altid komma mellem efternavn og fornavn uden mellemrum, og mellemrum til ekstra fornavn eller mellemnavne.

Jeg forestiller mig en ekstra kolonne med en "1" angivelse, hvis der kan være flere personer, der ligner.
Nogle forslag til en smart løsning?

Jeg har selv tænkt, om man kan omregne bogstaver i navnet til tal og så lave et sumprodukt. Dvs. sumprodukter, der ligger indenfor +/- samme værdi kan være identiske personer.

Jeg har prøvet med følgende eksempel:
Kolonne    A            B                C        D      E
                ABC      VÆRDI                  A        1
                                                              B        2
                                                              C        3

I B2 skrives
=SUMPRODUKT(LOPSLAG(MIDT(A2;RÆKKE(INDIREKTE("1:"&LÆNGDE(A2)));1);D$2:E$3;2))

Men det giver mig blot værdien af første bogstave. Jeg ikke regne ud, hvordan jeg får den til at tage alle bogstaverne i navnet.
Selvom jeg finder en løsning til dette forslag, kan der jo selvfølgelig være flere meget forskellige navne, som giver samme værdi. Så det er bestemt ikke en ideel løsning under alle omstændigheder.
Kom endelig med andre forslag.
Avatar billede JackJazz Seniormester
04. december 2019 - 12:49 #1
Jeg tror blot jeg ville lave to ekstra kolonner med hhv Efternavn og Fornavn(e) i en tabel, og så sortere dem og manuelt vurdere næsten-sammenfald.

/JackJazz
Avatar billede MKH Novice
04. december 2019 - 12:54 #2
JackJazz tak for svar.
Der er mange, hvor efternavnet er et andet anden gang; enten fordi man har byttet om på for- og efternavn, det er stavet forkert (også første bogstave), eller der er kommet nyt efternavn til og det tidligere efternavn nu er mellemnavn. Dvs. en sortering vil ikke sætte to identiske personer sammen.
Desuden er det en lang liste, så manuel gennemgang af alle er ikke realistisk.
Avatar billede JackJazz Seniormester
04. december 2019 - 13:44 #3
Du kommer jo ikke uden om en vis mængde af mauelt arbejde, når forskellighederne er så mange. Men din egen løsning kan måske gøre identificeringen lidt nemmere, så lad os arbejde videre med den.

I dit eksempel ville jeg gøre det meget ukønt men effektivt ved at sætte cellerne i kolonne B til at være summen af cellerne til højre, og så ville jeg udfylde Række 1 med tallene 1,2,3 osv fra kolonne C og frem.

Derefter kan du lave følgende formel i C2 og kopiere den videre:
=HVIS.FEJL(LOPSLAG(MIDT($A2;D$1;1);$A$19:$B$47;2;FALSK);0)

I formlen er kolonnen med bogstaver og kolonnen med tilhørende tal tilstede i A19:B47.

/JackJazz
Avatar billede Jan K Ekspert
04. december 2019 - 13:47 #4
Det er svært at lave en automatisk løsning, hvis der slet ikke er systematik i fejlene, og det ikke vides, hvor i navnene de står. Excel har ingen "lyder som" funktion, så derfor vil man skulle tage hvert navn for sig, opdele det i enkeltdele, og så sammenligne det med alle andre navne i listen.

Petre,Larsen
Peter,Larsen
Larsen-Schultz,Peter
Petere, Schiltz Larsen

er måske samme person, men at få en makro til at bestemme det, mener jeg er urealistisk, da det vikl kræve et skøn, og det kan koden ikke.
Avatar billede JackJazz Seniormester
04. december 2019 - 13:53 #5
Ups, der var en lille fejl i min formel. Den skal være:
=HVIS.FEJL(LOPSLAG(MIDT($A2;C$1;1);$A$19:$B$47;2;FALSK);0)

Jeg håber det giver mening.

/JackJazz
Avatar billede xl-Enthusiast Ekspert
04. december 2019 - 13:58 #6
Du kan eventuelt prøve at se om følgende kan være til hjælp.

https://www.microsoft.com/en-us/download/details.aspx?id=15011
Avatar billede finb Ekspert
04. december 2019 - 14:06 #7
1.
Peter eller Petre har samme længde.
Vha. =KODE() kunne du sammenligne navnene tegn for tegn,
i Peter / Petre er der 3 ens (pet) tegn, og ialt 5 x samme bogstaver.
Sammenfaldet er 60% gange 100%, eller 6.000 af 10.000 point.
2.
Peter eller Peder:
Sammenfaldet er 80% gange 80%, eller 6400 af 10.000 point.
Avatar billede acore Ekspert
04. december 2019 - 17:00 #8
Tag et kik på https://www.got-it.ai/solutions/excel-chat/excel-tutorial/vlookup/excel-fuzzy-lookup som bruger forslaget fra #6.

Jeg har ikke prøvet det selv, men kunne være en vej frem
Avatar billede MKH Novice
05. december 2019 - 13:29 #9
Tak for svar til jer alle.
Fuzzy Lookup Add-in var den gyldne løsning, og det virker super godt.
Både svar fra xl-Enthusiast (download) og acore (god vejledning) var til stor hjælp. Kan man dele en "løsning" ?
Avatar billede acore Ekspert
05. december 2019 - 16:30 #10
Ja, du kan markere lige så mange som svar, som du vil. Men det vigtigste er, at du fandt en god løsning :)
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester





Premium
Den amerikanske it-milliardær Chris Sacca skulle have været ambassadør i Danmark, men planerne blev ødelagt af Trump: “Ja, den er god nok. Jeg skulle have haft Rufus Gifford job"
Amerikanske Chris Sacca er milliardær og kendt som deltager i den amerikanske udgave Løvens Hule, og hvis ikke Donald Trump havde vundet det amerikanske præsidentvalg, var han formodentligt blevet USA's ambassadør i Danmark.
CIO
“Der har simpelthen været for få gråhårede medarbejdere involveret i den her udviklingsproces. Folk der ved, hvad der skal til”
"Vi havde ansat nogle unge mennesker i sandaler og med langt skæg for at bryde med det traditionelle it-setup. De her vakse unge mennesker fik også ret hurtigt bygget en supersmart applikation til virksomheden. Men den brager ned, da vi ruller den ud, og den fylder cirka 1,5 procent af alle transaktioner."
Job & Karriere
35-årig kvinde gik amok på hjemmekontoret efter fyring: ”De fjernede ikke min adgang, så jeg slettede p-drevet lol”
En 35-årig kvinde står anklaget for at have slettet 21,3 gigabyte data fra fællesdrevet efter, at hun blev fyret. Nu risikerer hun op til 10 års fængsel.
White paper
Identificér og håndter sofistikerede sikkerhedsbrud hurtigt og effektivt
Forebyggelse er ikke nok. Sikkerhedsbrud kan og vil ske, og så skal de håndteres hurtigt og effektivt. Men sofistikerede angreb kan holde sig under radaren længe, og de helt rette modsvar være svære at identificere.