Fire af folkene bag det nye maskinoversættelsessystem: Ph.d.-studerende Jakob Elming, CBS, teknologichef Morten Esmann, Lingtech, administrerende direktør, Birgit Pichat, Lingtech og lektor Dan Hardt, CBS. Foto: Per Gudmann

Dansk oversætter-program kan gøre sig selv bedre

Et nyt, danskudviklet oversætterprogram lærer at oversætte ved at blive fodret med eksempler. Det skal sætte ekstra skub i oversættelserne.

Oversæt dokumenter fra et vilkårligt sprog til et andet.

Resultatet skal stadig efterbehandles af en menneskelig oversætter, men det er så meget bedre end traditionel maskinoversættelse, at det sparer 40 til 80 procent af arbejdstiden.

Det er perspektiverne i SMT (Statistical Machine Translation), som er vokset ud af et forskningsprojekt på Copenhagen Business School.

Blandt deltagerne i projektet var firmaet Lingtech, der er blandt pionererne inden for maskinoversættelse i Danmark.

Lingtech har hidtil brugt et traditionelt, regelbaseret system til oversættelse af patenter, PaTrans. Det er nu skrottet til fordel for det nye, der bygger på automatisk oplæring af systemet.

"Med det gamle system satte vi en oversættelse over, før vi gik hjem om aftenen. Når vi kom næste morgen, var det så ved at være færdigt. Det nye system klarer samme opgave på 10 minutter, og kvaliteten er oven i købet bedre. Desuden går der ingen tid til forberedelse, før man begynder oversættelsen," siger administrerende direktør Birgit Pichat, Lingtech.

Selvlærende system
To af folkene fra projektet, lektor Daniel Hardt og ph.d-studerende Jakob Elming, CBS, har dannet virksomheden LanguageLens, der udvikler produktet.

"Systemet lærer at oversætte ved, at man præsenterer det for en stor mængde tekster på de to sprog, det skal oversætte imellem. Det opbygger en tabel over ord og fraser på det ene sprog, og hvad de er oversat til på det andet sprog. Det registrerer også, hvor hyppige forskellige oversættelser af samme frase er," forklarer Daniel Hardt.

Endvidere registrerer systemet også de fraser, der står før og efter en frase. På den måde kan det vide noget om den sammenhæng, et ord eller frase typisk indgår i.

Løbende forbedring
Jo flere par af oversatte dokumenter, man hælder ind i systemet, desto dygtigere bliver det.

Lingtech har trænet systemet med 24 millioner ord fra patentoversættelser mellem dansk og engelsk.

"Erfaringen viser, at systemet faktisk hele tiden bliver bedre. Jeg havde frygtet, at vi ville nå et øvre loft, hvor det ikke kunne forbedres mere, men hvis det findes, har vi ikke nået det endnu," siger Birgit Pichat.

SMT præsenteres i denne uge på en international konference for forskning i maskinoversættelse.

Birgit Pichat kender til andre systemer, der anvender statistisk analyse, blandt andet et canadisk system. M

en Lingtech valgte at satse på det danske, blandt andet fordi det canadiske foreløbig ikke understøtter dansk som sprog.

En af fordelene ved SMT er netop understøttelsen af mange sprog: Hvis man har et sæt oversatte dokumenter mellem to sprog, kan man oplære systemet i at oversætte mellem dem.


Ytringer på debatten er afsenders eget ansvar - læs debatreglerne
Indlæser debat...


Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Erhvervsakademiet Lillebælt
Udvikling og salg af klassebaseret undervisning, blandt andet inden for multimedie og it.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
It-sikkerhed 2017: De nye trusler - og dit næste modtræk

Vi tager pulsen på den aktuelle it-sikkerhedssituation ved at gå i dybden med de nyeste trusler og give til inspiration til dine nødvendige modtræk. Der er masser at skulle forholde sig til som it-ansvarlig. Men har du forstået de reelle trusler, og prioriterer du sikkerhedsindsatsen på den mest hensigtsmæssige måde?

24. januar 2017 | Læs mere


It-sikkerhed 2017: De nye trusler - og dit næste modtræk

Vi tager pulsen på den aktuelle it-sikkerhedssituation ved at gå i dybden med de nyeste trusler og give til inspiration til dine nødvendige modtræk. Der er masser at skulle forholde sig til som it-ansvarlig. Men har du forstået de reelle trusler, og prioriterer du sikkerhedsindsatsen på den mest hensigtsmæssige måde?

26. januar 2017 | Læs mere


Customer Relationship Management (CRM)

CRM er stort set blevet en standard i danske virksomheder. Der stilles stigende krav til sikkerheden når værdifulde informationer om virksomhedens væsentligste aktiv - kunderne - skal sikres, deles og gemmes, og netop sikkerheden i den web-baserede løsning kan virke uoverskuelig. Hør mere om hvordan bringer du dig i front med CRM, og hvordan får du størst muligt afkast af din CRM-investering.

31. januar 2017 | Læs mere






Computerworld
Advarsel til Gmail-brugerne: Lumsk phishing-mail på spil netop nu - sådan spotter du den
Gmail-brugerne skal være på vagt: It-kriminelle forsøger sig i øjeblikket med en udspekuleret phishing-mail. Se her, hvordan du spotter fupnummeret.
CIO
Årets CIO om 2017: Nu skruer vi op for kunstig intelligens for at finde mønstre i driftdata og optimere komponenter
Klumme: Hos Energinet går forretning og it nu sammen om at skabe systemer baseret på kunstig intelligens. Målet er et mere effektivt dansk el-system ved at udnytte og forstå de gigantiske datamængder fra elforsyningen.
Comon
Undgå passwordet: Smart tilbehør til at låse og åbne din computer med Windows Hello
Windows Hello kan mere end blot låse din computer op med dit ansigt. Der findes en lang række muligheder af tilbehør, som kan være med til at sikre din computer mod indtrængere. Se fem af dem her.
Channelworld
Ny EG-direktør har en plan: Sådan skal EG vokse sig større og endnu mere profitabel
Interview: Mikkel Bardram er ny administrerende direktør i EG. Selvom EG nu har 2.000 ansatte og en omsætning på 1,8 milliarder kroner, er der potentiale for endnu mere, mener den nye direktør.
White paper
Telefoni i skyen - få mere ud af Office 365
Dette whitepaper sætter fokus på, hvordan I kan komme godt i gang med cloud-telefoni via O365, samt udnytte de nye kommunikationsmuligheder optimalt.