Her er Danmarks fem bedste CIO’er lige nu:Se de fem nominerede til prisen som Årets CIO 2024

Artikel top billede

Firefox-plugin skal oversætte internettet til dansk

Et browser-plugin skal automatisk oversætte alle internet-tekster til dansk. Læs testen og hør en sprogeksperts vurdering af de største udfordringer i maskinoversættelserne.

Maskinoversætterne har fået en ny kollega på internettet.

Navnet er Worldwide Lexicon Project, og den nye oversætter i klassen kommer dermed i selskab med andre lette mobbeofre, der er blevet hånet for at være upræcise og ufrivilligt morsomme.

Selv om Niels Helveg Petersen-udsagnet "I think we can screw this together" desværre ikke er et eksempel på en maskinoversættelse, så har computernes forsøg på at efterligne menneskets sprogtalenter gennem tiderne trukket på en del smilebånd i hele verden.

Trods maskinoversættelsernes hoved- og halefejl forsøger Worldwide Lexicon Project sig med et plugin til Mozillas Firefox-browser, som skal kunne oversætte alverdens hjemmesider til dansk - eller et andet ønsket sprog.

"Vores mål er gøre webbrowsing på ethvert sprog lige så nemt, som hvis det skete på dit eget modersmål […] Vores mål er fjerne sprogbarrierer for webbrugerne og gøre world wide web virkelig verdensomspændende," lyder den ambitiøse erklæring fra folkene bag Worldwide Lexicon Project, hvor den amerikanske udvikler og iværksætter Brian S McConnell står som stifter.

Bygger community af og for oversættere

Firefox-plugin'et fungerer ved, at brugeren går ind på den ønskede hjemmeside, hvor teksten derefter automatisk bliver indlæst og oversat til dansk via forskellige oversættelsesprogrammer.

Det ambitiøse open source-projekt låner nemlig oversættelseskapacitet fra andre open source-oversættelsesprogrammer som Google Translate og Apertium for at kunne gøre gengivelsen på dansk så præcis som mulig.

Udover automatoversættelserne forsøger Worldwide Lexicon Project at skabe et community af oversættere, der også kan oversætte og gengive teksterne på diverse sprog. Formålet er, at når borgere fra land A vil læse tekster fra Land B, vil teksterne automatisk være oversat af enten maskiner eller mennesker.

Som bruger kan man via plugin'et samtidig selv bestemme, om originalteksten skal forblive stående for at give den rette kontekst, eller om man blot vil læse historier fra et fransk nyhedssite - som eksempelvis Le Figaro - på dansk.

I alt reklamerer Worldwide Lexicon Project med, at plugin'et kan oversætte fra og til 40 sprog, og man bestræber sig på at dække 95 procent af klodens sprog.

Står helt af på kinesisk

Når man kører med plugin'et viser det sig, at tidligere tiders utilnærmelige websites pludselig kan give mening - på et eller andet niveau.

Eksempelvis er det nogenlunde overskueligt at skimme aviser på arabisk og græsk, mens flere hebraiske, kinesiske, franske og spanske nyhedssites står helt af i forsøget på at blive oversat.

Et besøg på teknologi-sitet Cnet.com's giver en overskrift, hvor der blot står "Æble", mens sitet andre steder retsmæssigt skriver "Apple".

Millioner af spiselige hjemmesider op under neglene

Og så er der utallige eksempler på totalt uforståelige oversættelser, hvis man ikke lige har slået den tosprogede baggrund med originalsproget til.

Kan du eksempelvis gætte, hvad der gemmer sig bag overskriften "Ny web-filter love spørgsmålstegn ved toppen børnemishandling cop" fra det engelske teknologi-site The Register?

Du gættede rigtigt, hvis du satsede på "New web filter laws questioned by top child abuse cop", som betyder noget i retning af "Top-børnemishandler-betjent stiller spørgsmålstegn ved ny webfilter-lovgivning".

Et behjertet forsøg

Alt i alt virker Worldwide Lexicon Project som et behjertet forsøg på at bygge den globale landsby ved afkørslen til informationsmotorvejen, men teknologien kan endnu ikke følge med intentionerne.

Det kan dog anbefales, at man tager en prøvekørsel af plugin'et, fordi det trods alt er et af de bedre eksempler på, hvordan man som internetbruger kan få millionvis af udenlandske hjemmesider op under neglene i en spiselig version uden at skulle sidde med en parlør i baghånden.

Man skal dog ikke forvente, at teksterne er gennemtyggede for en.

Og så står selv den bedste oversættelsesmaskine- eller plugin helt af, når webmasteren har brugt tekst indlejret i billeder i HTML-body'en frem for almindelig tekst.

Dårlige erfaringer

Worldwide Lexicon Project har heller ikke megen historisk støtte at læne sig opad, fordi maskinoversættelser i tiden før internettet og frem til et produkt som Google Translate ikke altid har været lettilgængelige eller den store hjælp for nysgerrige sjæle, der søger information i udenlandske tekster.

De mange fejl i tidligere versioner af maskinoversættelser skyldes ifølge udviklingsingeniør Lene Offersgaard fra Center for Sprogteknologi ved Københavns Universitet, at maskinoversætterne før i tiden oversatte fra ord til ord.

Nu benytter maskinoversætterne - som i Google Translates tilfælde - såkaldte statistiske oversættelser.

En statistisk oversættelse er, når man indsamler bunkevis af oversættelser af tekster i databaser, og derigennem gør faste vendinger og visse ords placeringer til et princip.

Den mulighed fandtes ikke tidligere, da der ikke var så mange digitaliserede tekster.

Men der er dog langt fra statistikken og til faste, tunge regler, som er det højeste trin inden for maskinelle oversættelser.

De regelbaserede oversættelser koster dog ofte mere tid og penge, og giver alligevel ikke helt korrekte oversættelser.

"En menneskelig oversætter vil altid være bedre end en computer til at oversætte, fordi vedkommende vil kunne forstå konteksten langt bedre end en computer," siger Lene Offersgaard, der påpeger, at eksempelvis skønlitteratur og politiske taler aldrig vil kunne blive oversat korrekt af en maskine.

"Man vil ikke kunne fange de fine nuancer og undladelser i en automatisk oversættelse. Derudover er der alle de kulturelle forskelle mellem to lande, som heller ikke kan oversættes direkte," forklarer sprogeksperten til Computerworld.

Det holder nok ikke i byretten

Hun påpeger, at selv om eksempelvis juridiske tekster aldrig nogensinde vil kunne nøjes med at blive maskinoversat på grund af den manglende præcision, kan der være mange gode grunde til at benytte maskinoversættelser til "fredelig information."

"Om oversættelsen er god afhænger jo af informationsbehovet. Hvis man blot skal sættes ind i et emne, kan maskinoversættelser jo være gode nok frem for, at man slet ikke ved, hvad teksten handler om," siger hun

"Hvis man skal oversætte utvetydige informationer kan maskinoversættelser faktisk nå rigtig langt," lyder det fra Lene Offersgaard.

Hun påpeger, at maskinoversættelserne kan nå endnu længere, hvis man i oversættelsesøjeblikket angiver, hvilken sammenhæng - eller domæne - teksten skal oversættes inden for.

Den funktionalitet udnyttes for eksempel i i maskinoversættelsesprogrammet GramTrans.

Der er jo stor forskel på ordet Apple alt afhængig af, om man er inden for landbrugs- eller it-industrien.

Om man også undgår at oversætte fodboldlandslandsholdet taktik som "long balls" står endnu hen i det uvisse.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Fiftytwo A/S
Konsulentydelser og branchespecifikke softwareløsninger til retail, e-Commerce, leasing og mediebranchen.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
OT og IT: Modernisér produktionen og byg sikker bro efter et årelangt teknologisk efterslæb

Moderne produkter skal have mere end strøm for at fungere – og deres navlestreng skal ikke klippes når de forlader fabrikshallen. På denne konference kan du derfor lære mere om hvordan du får etableret det sikre setup når der går IT i OT.

30. april 2024 | Læs mere


Roundtable for sikkerhedsansvarlige: Hvordan opnår man en robust sikkerhedsposition?

For mange virksomheder har Zero Trust og dets principper transformeret traditionelle tilgange til netværkssikkerhed, hvilket har gjort det muligt for organisationer at opnå hidtil usete niveauer af detaljeret kontrol over deres brugere, enheder og netværk - men hvordan implementerer man bedst Zero Trust-arkitekturer i et enterprise set up? Og hvordan muliggør Zero Trust-arkitekturen, at organisationer opnår produktivitetsfordele med AI-værktøjer samtidig med, at de forbliver sikre i lyset af fremvoksende trusler?

01. maj 2024 | Læs mere


ERP-trends 2024

Bliv derfor inspireret til, hvordan du kan optimere dine systemer og processer når af nogle af de fremmeste eksperter på ERP-markedet dele deres iagttagelser af det aktuelle marked og vurderinger af, hvad vi har i vente de kommende 3-5 år. Vi sætter også fokus på, hvordan udviklingen kommer til at påvirke din organisation, hvordan du bedst forbereder og planlægger ERP-indsatsen og om, hvilke faldgruber du skal være opmærksom på.

02. maj 2024 | Læs mere