Notifikationer

Markér alle som læst Log ud

trine_h Nybegynder

18. september 2004 - 09:02 Der er 23 kommentarer og
1 løsning

Algoritme til at finde det ord som ligner mest..

Jeg ved ikke om følgende kan lade sig gøre. Men jeg skal bruge en algoritme der max ud fra 15 navne kan finde det navn som ligner mest.
Eks.
FC Copenhagen
Århus FC

I anden liste har jeg en række ord som ligner ordene men som ikke er helt magen til.
Eks.
FC CPH
FC Århus
Kan det lade sig gøre at lave en algortme der finder det ord som ligner mest??

Synes godt om

arne_v Ekspert

18. september 2004 - 09:18 #1

Du kan godt lave noget kode som finder noget der ligner.

Men da det er svært at definere "ligner" præcist, så er det ikke
sikkert at du får de resultater du gerne vil have.

Den mest kendte algoritme er SoundEx.

For noget C# SoundEx kode se:

http://www.thecodeproject.com/csharp/soundex.asp

Synes godt om

lemon Nybegynder

26. september 2004 - 01:58 #2

Fik du løst det? Ellers vil jeg da godt give et bud - det skal bare omsættes til kode.

Ud fra det eks. du selv giver, ser det ud til at du kan bruge følgende fremgangsmåde:

<pseudo-pseudo-kode>

Definationer:

"hele ord" er whitespace-terminarede char kombinationer som eks "dette", "er", "et", "ord" i strengen "dette er et ord".

karakterer er enkelte tegn. eks 'f' eller 'u'.

strenge er et punkt i en liste, eks "FC Århus".

Kode:

For hver streng i den liste der søges i:
{
Hele_ord = Tæl antal "hele ord" som matcher. (eks.: "ord" og "ORD")

Forkortelser = antal "hele ord" der enten har alle chars fra et ord i den anden liste, eller hvor et ord i den anden liste har alle chars fra dette ord. (eks.: "CPH" og "CoPenHagen")

}

Den streng med flest (hele_ord + forkortelser) er bedste match.

En udbygning kunne være at ændre (hele_ord + forkortelser) til (hele_ord * hel_ords_vægt + forkortelser * forkortelses_vægt) så du kan justere om hele ord eller forkortelser skal veje tungest.
Man kunne også vælge at tælle antal uens tegn, eller ord der ikke er pladseret samme sted, for at kunne udelukke evt. resultater hvor der er flere strenge som matcher lige godt.

--

Alternativet til denne traditionelle måde at gøre det på - som jeg ser det - er at lade en genetisk algoritme om at finde den bedste måde at udføre matchningen på, eller evt. træne et simpelt neuralt netværk til at genkende de bedste matches. Det er godt nok lidt at skyde gråspurve med kanonkugler, men kan muligvis være den eneste brugbare løsning hvis opgaven er bare en tand mere kompliceret end det du her beskriver.
Mere om neurale netværk på: http://www2000198.thinkquest.dk/

Synes godt om

trine_h Nybegynder

26. september 2004 - 10:29 #3

Hej Lemon - Jeg har lige et spørgsmål - Ville alle nedenstående kunne genkendes med din pseudo-kode?
Tottenham - Tottenham Hotspur
Liverpool - FC Liverpool
Chelsea FC - Chelsea
Man Utd - Manchester Utd
Hertha BSC Berlin - Hertha Berlin
West Brom - West Bromwich
Hannover 96 - Hannover
1. FC Kaiserslautern - Kaiserslautern
Man City - Manchester City
Borussia Mgladbach - Bor. M´Gladbach
1. FC Nürnberg - Nürnberg
FSV Mainz -Mainz

Synes godt om

lemon Nybegynder

26. september 2004 - 11:03 #4

Yup, de ville alle kunne genkendes - samt nedenstående:
T.H. - Trine H.
McD - McDonalds

Jeg skal forresten også selv bruge noget lignende, så jeg kan lige lave en simpel stump kode.

Synes godt om

trine_h Nybegynder

26. september 2004 - 11:43 #5

Det er da pænt af dig... Er det klar idag :)

Synes godt om

lemon Nybegynder

26. september 2004 - 12:12 #6

using System;

namespace NameSearch
{
class TestClass
{
static void Main(string[] args)
{
string searchFor = "Man Utd";
string[] searchIn = "Tottenham Hotspur;FC Liverpool;Chelsea;Manchester United;Hertha Berlin;West Bromwich;Hannover;Kaiserslautern;Manchester City;Bor. M´Gladbach;Nürnberg;Mainz".Split(';');
int best = BestMatch(searchFor, searchIn);
if(best == -1)
Console.WriteLine("Intet fundet.");
else
Console.WriteLine("'" + searchFor + "' ligner sjovt nok '" + searchIn[best] + "'.");

Console.WriteLine("\n\n\t** Kan du ramme enter? aká Hit enter to quit **");
Console.ReadLine();
}

/// <summary>
/// Matcher navne ol. som eks:
/// Tottenham - Tottenham Hotspur
/// Liverpool - FC Liverpool
/// Chelsea FC - Chelsea
///
/// Returnerer: indeks i nameList på det bedste match, eller -1 hvis der ikke blev fundet et match.
/// </summary>
/// <param name="name">Det navn eller den forkortelse der skal søges efter.</param>
/// <param name="nameList">Den liste af navne og forkortelser der skal søges i.</param>
/// <returns></returns>
static int BestMatch(string name, string[] nameList)
{
string WhiteSpacesAndSutch = "\t .,-_'´`|()\"@/\\\r\n*[]{}$&+?="; /* Dette er de tegn som deler ord. Kan tilføjes/fjernes efter behov.
* Eks.: Hvis # bliver brugt ved eks "Hansensvej#7", så tilføj # til denne liste.
*/
int wordMatch, innerInitialsMatch;
int[] matchWeights = new int[nameList.Length];
int listIdx, aNameIdx, bNameIdx, aCharIdx, bCharIdx;
string[] nameTmp, listTmp;

nameTmp = name.ToLower().Split(WhiteSpacesAndSutch.ToCharArray());
for(listIdx = 0; listIdx < nameList.Length; listIdx++)
{
wordMatch = 0;
innerInitialsMatch = 0;
listTmp = nameList[listIdx].ToLower().Split(WhiteSpacesAndSutch.ToCharArray());
for(aNameIdx = 0; aNameIdx < nameTmp.Length; aNameIdx++)
{
for(bNameIdx = 0; bNameIdx < listTmp.Length; bNameIdx++)
{
if(nameTmp[aNameIdx].Length != 0 && listTmp[bNameIdx].Length != 0)
{
if(nameTmp[aNameIdx] == listTmp[bNameIdx]) // Check for ens ord:
wordMatch++;
else // Check for forkortelser
{
if(nameTmp[aNameIdx].Length > listTmp[bNameIdx].Length) // Check om listeordet er en del af søgeordet
{
bCharIdx = 0;
for(aCharIdx = 0; aCharIdx < nameTmp[aNameIdx].Length; aCharIdx++)
{
if(nameTmp[aNameIdx][aCharIdx] == listTmp[bNameIdx][bCharIdx])
bCharIdx++;
if(bCharIdx == listTmp[bNameIdx].Length)
break; // Liste slut - forkortelse fundet.
}
if(bCharIdx == listTmp[bNameIdx].Length)
innerInitialsMatch++;
}
else if(nameTmp[aNameIdx].Length < listTmp[bNameIdx].Length) // Check om søgeeordet er en del af listeordet
{
aCharIdx = 0;
for(bCharIdx = 0; bCharIdx < listTmp[bNameIdx].Length; bCharIdx++)
{
if(listTmp[bNameIdx][bCharIdx] == nameTmp[aNameIdx][aCharIdx])
aCharIdx++;
if(aCharIdx == nameTmp[aNameIdx].Length)
break; // Ord slut - forkortelse fundet.
}
if(aCharIdx == nameTmp[aNameIdx].Length)
innerInitialsMatch++;
}
}
}
}
}
matchWeights[listIdx] = wordMatch + innerInitialsMatch;
}

int bestMatchWeight, bestMatchIdx;
bestMatchIdx = -1;
bestMatchWeight = 0;
for(listIdx = 0; listIdx < matchWeights.Length; listIdx++)
{
if(bestMatchWeight < matchWeights[listIdx])
{
bestMatchIdx = listIdx;
bestMatchWeight = matchWeights[listIdx];
}
}

return bestMatchIdx;
}
}
}

Synes godt om

lemon Nybegynder

26. september 2004 - 12:16 #7

Du skal nok smide det i en try{} catch{} i starten - for jeg har ikke debugget det - og svigermor sad ved siden af min og snakkede mens jeg kodede det. ;o)

string searchFor = "Man Utd";
string[] searchIn = "Tottenham Hotspur;FC Liverpool;Chelsea;Manchester United;Hertha Berlin;West Bromwich;Hannover;Kaiserslautern;Manchester City;Bor. M´Gladbach;Nürnberg;Mainz".Split(';');
try
{
int best = BestMatch(searchFor, searchIn);
}
catch(Exception ex)
{
Console.WriteLine("Æv, der opstod en fejl. Men det kan heldigvis rettes.\r\n" + ex.ToString();
}
if(best == -1)
Console.WriteLine("Intet fundet.");
else
Console.WriteLine("'" + searchFor + "' ligner sjovt nok '" + searchIn[best] + "'.");

Synes godt om

lemon Nybegynder

26. september 2004 - 12:17 #8

Med andre ord: Tilbagemelt lige evt. fejl du måtte løbe på - samt de benyttede inputs som skabte fejlen, så jeg kan rette det. Finder jeg selv fejl poster jeg lige rettelserne her.

Synes godt om

trine_h Nybegynder

26. september 2004 - 12:32 #9

det er bare super ... Tester det lige...

Synes godt om

trine_h Nybegynder

26. september 2004 - 19:21 #10

1. FC Kaiserslautern bliver til FC Liverpool... Kan den slags fejl undgås??

Synes godt om

trine_h Nybegynder

27. september 2004 - 15:37 #11

er du der?

Synes godt om

lemon Nybegynder

28. september 2004 - 09:36 #12

Ja jeg ser lige på det idag.

Synes godt om

trine_h Nybegynder

29. september 2004 - 10:46 #13

Hej lemon, har du fået kigget lidt på det endnu :)

Synes godt om

lemon Nybegynder

30. september 2004 - 15:04 #14

Yup, men åbenbart ikke nok ;) Jeg har lige noget c++ kode som skal værefærdig asap, så kigger jeg på det bagefter, enten imorgen eller i weekenden.

Synes godt om

trine_h Nybegynder

30. september 2004 - 15:29 #15

oki - glæder mig til at se resultatet :)

Synes godt om

trine_h Nybegynder

04. oktober 2004 - 23:34 #16

Glæder mig stadig til resultatet :) men du har nok travlt...

Synes godt om

lemon Nybegynder

04. oktober 2004 - 23:41 #17

Ja sorry, det er helt rigtigt gættet at jeg har ustyrligt travlt, men jeg ser på det så snart jeg kan. Håber du har tid/tålmodighed til det.

Synes godt om

arne_v Ekspert

10. oktober 2004 - 00:45 #18

using System;

public class NameMatcher
{
private static int Score(string s1, string s2)
{
string[] w1 = s1.Split(" ".ToCharArray());
string[] w2 = s2.Split(" ".ToCharArray());
int score = 0;
for(int i = 0; i < w1.Length; i++)
{
for(int j = 0; j < w2.Length; j++)
{
if(w1[i] == w2[j])
{
score += 4*w1[i].Length;
}
else if(w1[i].IndexOf(w2[j])==0)
{
score += 4*w2[j].Length;
}
else if(w2[j].IndexOf(w1[i])==0)
{
score += 4*w1[i].Length;
}
else
{
int front = 0;
while(front < w1[i].Length && front < w2[j].Length && w1[i][front] == w2[j][front]) {
front++;
}
score += 2*front;
int back = 0;
while(back < w1[i].Length && back < w2[j].Length && w1[i][w1[i].Length-back-1] == w2[j][w2[j].Length-back-1]) {
back++;
}
score += back;
}
}
}
return score;
}
public static string BestMatch(string s, string[] possible) {
int ix = -1;
int maxscore = -1;
for(int i = 0; i < possible.Length; i++)
{
int score = Score(s.ToUpper(), possible[i].ToUpper());
if(score > maxscore)
{
ix = i;
maxscore = score;
}
}
if(maxscore > 0)
{
return possible[ix];
}
else
{
return "(unknown)";
}
}
}

class MainClass
{
public static void Main(string[] args)
{
string[] name1 = { "FC Copenhagen",
"Århus FC",
"Tottenham Hotspur",
"FC Liverpool",
"Chelsea",
"Manchester Utd",
"Hertha Berlin",
"West Bromwich ",
"Hannover",
"Kaiserslautern",
"Manchester City",
"Bor. M´Gladbach",
"Nürnberg",
"Mainz" };
string[] name2 = { "FC CPH",
"FC Århus",
"Tottenham",
"Liverpool",
"Chelsea FC",
"Man Utd",
"Hertha BSC Berlin",
"West Brom",
"Hannover 96",
"1. FC Kaiserslautern",
"Man City",
"Borussia Mgladbach",
"1. FC Nürnberg",
"FSV Mainz" };
for(int i = 0; i < name2.Length; i++)
{
Console.WriteLine(name2[i] + " = " + NameMatcher.BestMatch(name2[i], name1));
}
for(int i = 0; i < name1.Length; i++)
{
Console.WriteLine(name1[i] + " = " + NameMatcher.BestMatch(name1[i], name2));
}
}
}

Synes godt om

arne_v Ekspert

10. oktober 2004 - 00:45 #19

FC CPH = FC Copenhagen
FC Århus = Århus FC
Tottenham = Tottenham Hotspur
Liverpool = FC Liverpool
Chelsea FC = Chelsea
Man Utd = Manchester Utd
Hertha BSC Berlin = Hertha Berlin
West Brom = West Bromwich
Hannover 96 = Hannover
1. FC Kaiserslautern = Kaiserslautern
Man City = Manchester City
Borussia Mgladbach = Bor. M'Gladbach
1. FC Nürnberg = Nürnberg
FSV Mainz = Mainz
FC Copenhagen = FC CPH
Århus FC = FC Århus
Tottenham Hotspur = Tottenham
FC Liverpool = Liverpool
Chelsea = Chelsea FC
Manchester Utd = Man Utd
Hertha Berlin = Hertha BSC Berlin
West Bromwich = West Brom
Hannover = Hannover 96
Kaiserslautern = 1. FC Kaiserslautern
Manchester City = Man City
Bor. M'Gladbach = Borussia Mgladbach
Nürnberg = 1. FC Nürnberg
Mainz = FSV Mainz

Synes godt om

arne_v Ekspert

10. oktober 2004 - 00:46 #20

Jeg har grebet det lidt anderledes an end lemon.

Synes godt om

trine_h Nybegynder

14. oktober 2004 - 13:31 #21

Arne - Jeg har prøvet med andre navne og jeg må sige at dit fungerer rigtig godt - Gider i lægge et svar så kan i dele pointene - og mange tak for hjælpen til jer begge...

Synes godt om

arne_v Ekspert

14. oktober 2004 - 18:50 #22

Synes godt om

lemon Nybegynder

25. oktober 2004 - 02:31 #23

Argh, så glemte jeg selvfølgeligt alt om det her... nå men godt du fik løst det og til Arne: Lækker kode :)

Synes godt om

trine_h Nybegynder

25. oktober 2004 - 11:11 #24

Ok - men tak for hjælpen begge - Arne du får pointene

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Se alle it-kurser fra Computerworld Kurser

IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Se alle it-kurser

Flere spørgsmål fra C# kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Log i Azure Af joki i C#	1	04/12/202517:27	06/12/202520:32
Hent Virksomhed hos graphql.datafordeler.dk Af krukken i C#	13	18/11/202510:57	20/11/202508:59
Http client med X509Certificate2 Af joki i C#	6	11/09/202515:08	11/09/202518:51
pull request Af OBS i C#	1	30/08/202510:47	03/09/202518:51
Vejledning i god opbygning af program, erklæring af lister og modeller. Af Henrik_B i C#	10	10/04/202519:47	13/04/202502:40

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

09:03

Et kinesisk kampfly i frit fald - og en verden, som vi slet ikke ønsker os

15:45

Nedtælling til skæbnesvanger messe for Apple: Det kan du forvente fra det enorme WWDC-show

15:05

Han opfandt Oculus Rift og står nu bag vildt AI-baseret våbenfirma: Har fordoblet sin værdi på et år - er nu 400 milliarder kroner værd

14:21

Netcompany-stifterne André Rogaczewski og Claus Bo Jørgensen skovler penge ind: Så meget scorede de i 2025

13/05

BitLocker kan knækkes på få minutter med en USB-stick: Sådan kan du beskytte din pc

13/05

Kæmpe-strejke kan snart lamme Samsung: Forhandlinger brudt sammen - 50.000 medarbejdere vil nedlægge arbejdet

13/05

Har ikke andre muligheder: Danske universiteter nødt til at betale 64 millioner kroner til Oracle i ny licens-afgift

13/05

Alle CISO'er er ramt af dette paradoks: Jo bedre arbejdet udføres, jo mindre værdifuldt fremstår det

13/05

Claus Rydkjær vil som ny topchef gennemtrawle hele NNIT-forretningen efter svagt kvartal: "Vi vender hver en sten"

13/05

EU får adgang til OpenAI's nye cyber-værktøj - vil følge udrulningen tæt og håndtere sikkerhedsbekymringer

13/05

Windows, Azure, Office og SharePoint truet: Microsoft patcher stort antal sårbarheder med kæmpe opdatering

Vis flere artikler

IT-JOB

Banedanmark

Projektleder til IT-sikkerhed

Region Midtjylland

It-supporter til Aarhus Universitetshospital

Politiets Efterretningstjeneste

CNE-specialist til PET`s indhentningsafdeling

Region Midtjylland

It-specialist til Mobile Device Management i stort driftsmiljø

KMD A/S

Senior SAP Architect

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I går 20:48	Bred buet skærm vs. 2 skærme Af Nanarsi i Skærme
I går 18:07	Tilslut printer til netværk med WPS - hvis WPS slukkes på Router mistes forbindelse. Af Uvanga i Wifi
11/0521:05	Questyle M15i lydforstærker Af valby i Diverse
11/0518:27	Mærkeligt ikon på proceslinjen Af ErikHg i Windows
11/0513:54	Jeg skal have indstaleret Garmin express Af skolevej321 i Andet software

White papers

Samarbejde mellem AI og mennesker styrker sikkerheden
Konica Minolta
Erfaringer fra frontlinjen: Sådan ændrer trusselsbilledet sig
Arctic Wolf
Find den SOC-model, der virker i praksis
SecureDevice
E-fakturering bliver et krav – er din forretning klar?
Tabellae

Flere white papers »