Artikel top billede

Firefox-plugin skal oversætte internettet til dansk

Et browser-plugin skal automatisk oversætte alle internet-tekster til dansk. Læs testen og hør en sprogeksperts vurdering af de største udfordringer i maskinoversættelserne.

Maskinoversætterne har fået en ny kollega på internettet.

Navnet er Worldwide Lexicon Project, og den nye oversætter i klassen kommer dermed i selskab med andre lette mobbeofre, der er blevet hånet for at være upræcise og ufrivilligt morsomme.

Selv om Niels Helveg Petersen-udsagnet "I think we can screw this together" desværre ikke er et eksempel på en maskinoversættelse, så har computernes forsøg på at efterligne menneskets sprogtalenter gennem tiderne trukket på en del smilebånd i hele verden.

Trods maskinoversættelsernes hoved- og halefejl forsøger Worldwide Lexicon Project sig med et plugin til Mozillas Firefox-browser, som skal kunne oversætte alverdens hjemmesider til dansk - eller et andet ønsket sprog.

"Vores mål er gøre webbrowsing på ethvert sprog lige så nemt, som hvis det skete på dit eget modersmål […] Vores mål er fjerne sprogbarrierer for webbrugerne og gøre world wide web virkelig verdensomspændende," lyder den ambitiøse erklæring fra folkene bag Worldwide Lexicon Project, hvor den amerikanske udvikler og iværksætter Brian S McConnell står som stifter.

Bygger community af og for oversættere

Firefox-plugin'et fungerer ved, at brugeren går ind på den ønskede hjemmeside, hvor teksten derefter automatisk bliver indlæst og oversat til dansk via forskellige oversættelsesprogrammer.

Det ambitiøse open source-projekt låner nemlig oversættelseskapacitet fra andre open source-oversættelsesprogrammer som Google Translate og Apertium for at kunne gøre gengivelsen på dansk så præcis som mulig.

Udover automatoversættelserne forsøger Worldwide Lexicon Project at skabe et community af oversættere, der også kan oversætte og gengive teksterne på diverse sprog. Formålet er, at når borgere fra land A vil læse tekster fra Land B, vil teksterne automatisk være oversat af enten maskiner eller mennesker.

Som bruger kan man via plugin'et samtidig selv bestemme, om originalteksten skal forblive stående for at give den rette kontekst, eller om man blot vil læse historier fra et fransk nyhedssite - som eksempelvis Le Figaro - på dansk.

I alt reklamerer Worldwide Lexicon Project med, at plugin'et kan oversætte fra og til 40 sprog, og man bestræber sig på at dække 95 procent af klodens sprog.

Står helt af på kinesisk

Når man kører med plugin'et viser det sig, at tidligere tiders utilnærmelige websites pludselig kan give mening - på et eller andet niveau.

Eksempelvis er det nogenlunde overskueligt at skimme aviser på arabisk og græsk, mens flere hebraiske, kinesiske, franske og spanske nyhedssites står helt af i forsøget på at blive oversat.

Et besøg på teknologi-sitet Cnet.com's giver en overskrift, hvor der blot står "Æble", mens sitet andre steder retsmæssigt skriver "Apple".

Millioner af spiselige hjemmesider op under neglene

Og så er der utallige eksempler på totalt uforståelige oversættelser, hvis man ikke lige har slået den tosprogede baggrund med originalsproget til.

Kan du eksempelvis gætte, hvad der gemmer sig bag overskriften "Ny web-filter love spørgsmålstegn ved toppen børnemishandling cop" fra det engelske teknologi-site The Register?

Du gættede rigtigt, hvis du satsede på "New web filter laws questioned by top child abuse cop", som betyder noget i retning af "Top-børnemishandler-betjent stiller spørgsmålstegn ved ny webfilter-lovgivning".

Et behjertet forsøg

Alt i alt virker Worldwide Lexicon Project som et behjertet forsøg på at bygge den globale landsby ved afkørslen til informationsmotorvejen, men teknologien kan endnu ikke følge med intentionerne.

Det kan dog anbefales, at man tager en prøvekørsel af plugin'et, fordi det trods alt er et af de bedre eksempler på, hvordan man som internetbruger kan få millionvis af udenlandske hjemmesider op under neglene i en spiselig version uden at skulle sidde med en parlør i baghånden.

Man skal dog ikke forvente, at teksterne er gennemtyggede for en.

Og så står selv den bedste oversættelsesmaskine- eller plugin helt af, når webmasteren har brugt tekst indlejret i billeder i HTML-body'en frem for almindelig tekst.

Dårlige erfaringer

Worldwide Lexicon Project har heller ikke megen historisk støtte at læne sig opad, fordi maskinoversættelser i tiden før internettet og frem til et produkt som Google Translate ikke altid har været lettilgængelige eller den store hjælp for nysgerrige sjæle, der søger information i udenlandske tekster.

De mange fejl i tidligere versioner af maskinoversættelser skyldes ifølge udviklingsingeniør Lene Offersgaard fra Center for Sprogteknologi ved Københavns Universitet, at maskinoversætterne før i tiden oversatte fra ord til ord.

Nu benytter maskinoversætterne - som i Google Translates tilfælde - såkaldte statistiske oversættelser.

En statistisk oversættelse er, når man indsamler bunkevis af oversættelser af tekster i databaser, og derigennem gør faste vendinger og visse ords placeringer til et princip.

Den mulighed fandtes ikke tidligere, da der ikke var så mange digitaliserede tekster.

Men der er dog langt fra statistikken og til faste, tunge regler, som er det højeste trin inden for maskinelle oversættelser.

De regelbaserede oversættelser koster dog ofte mere tid og penge, og giver alligevel ikke helt korrekte oversættelser.

"En menneskelig oversætter vil altid være bedre end en computer til at oversætte, fordi vedkommende vil kunne forstå konteksten langt bedre end en computer," siger Lene Offersgaard, der påpeger, at eksempelvis skønlitteratur og politiske taler aldrig vil kunne blive oversat korrekt af en maskine.

"Man vil ikke kunne fange de fine nuancer og undladelser i en automatisk oversættelse. Derudover er der alle de kulturelle forskelle mellem to lande, som heller ikke kan oversættes direkte," forklarer sprogeksperten til Computerworld.

Det holder nok ikke i byretten

Hun påpeger, at selv om eksempelvis juridiske tekster aldrig nogensinde vil kunne nøjes med at blive maskinoversat på grund af den manglende præcision, kan der være mange gode grunde til at benytte maskinoversættelser til "fredelig information."

"Om oversættelsen er god afhænger jo af informationsbehovet. Hvis man blot skal sættes ind i et emne, kan maskinoversættelser jo være gode nok frem for, at man slet ikke ved, hvad teksten handler om," siger hun

"Hvis man skal oversætte utvetydige informationer kan maskinoversættelser faktisk nå rigtig langt," lyder det fra Lene Offersgaard.

Hun påpeger, at maskinoversættelserne kan nå endnu længere, hvis man i oversættelsesøjeblikket angiver, hvilken sammenhæng - eller domæne - teksten skal oversættes inden for.

Den funktionalitet udnyttes for eksempel i i maskinoversættelsesprogrammet GramTrans.

Der er jo stor forskel på ordet Apple alt afhængig af, om man er inden for landbrugs- eller it-industrien.

Om man også undgår at oversætte fodboldlandslandsholdet taktik som "long balls" står endnu hen i det uvisse.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
KEYBALANCE A/S
Udvikling og salg af økonomisystemer samt CRM og MPS. Systemer til blandt andet maskinhandlere, vvs-branchen, vognmænd, låsesmede,handelsvirksomheder

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
IAM - din genvej til højere sikkerhed uden uautoriseret adgang og datatab

På denne dag udforsker vi de nyeste strategier, værktøjer og bedste praksis inden for IAM, med det formål at styrke virksomheders sikkerhedsposition og effektiviteten af deres adgangsstyringssystemer og dermed minimere risikoen for uautoriseret adgang og datatab. Og hvordan man kommer fra at overbevise ledelsen til rent faktisk at implementere IAM?

18. april 2024 | Læs mere


EA Excellence Day

Hvad er det, der gør it-arkitektens rolle så vigtig? Og hvad er det for udfordringer inden for områder som cloud, netværk og datacentre, som fylder hos nogle af landets bedste it-arkitekter lige nu? Det kan du her høre mere om og blive inspireret af på denne konference, hvor du også får lejlighed til at drøfte dette med ligesindede.

23. april 2024 | Læs mere


AI Business Excellence Day – sådan folder du mulighederne ud

Mange danske virksomheder har eksperimenteret med AI-projekter af begrænset omfang, men kun de færreste har for alvor udforsket mulighederne i storskala. Det gør vi her! Du vil blandt andet få mulighed for at se eksempler på, hvordan AI kan anvendes som accelerator i storskala og skubber til grænserne for, hvordan det er muligt at integrere teknologien, så potentialet for alvor foldes ud.

24. april 2024 | Læs mere