Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 23. juni 2006.
Hvis du kunne tale alle sprog, hvem ville du så tale med? Internettet har stort set overvundet afstandsbarrieren i vores kontakt med andre. Ny sprogteknologi kan fjerne sprogbarrieren, så vi kan tale med alle på kloden.
Automatisk oversættelse har været en fast spøg i aviserne i mange år. Det undrer og fornøjer os, når vi igen opdager, at sprog ikke kan oversættes ord for ord, men består af helheder. Sprogprogrammets forsøg er ofte morsomme, sjældent forståelige og aldrig brugbare.
Men nu er den dag måske kommet, hvor vi skal holde op med at grine ad oversætterprogrammerne. I stedet skal vi opdage, at verden bliver en anden, når automatisk oversættelse gør os i stand til at forstå og tale alle sprog.
Den mand, der måske kan få det til at ske, hedder Alex Waibel. Han er leder af Interactive Systems Laboratories, et fælles forskningsprojekt mellem Karlsruhe Universitet og Carnegie-Mellon Universitetet i Pittsburgh. Projektets formål er at lave oversættelsesteknologi bygget over en statistisk analyse af sproget. Jeg fangede Waibel i et hotelværelse i Karlsruhe lige hjemkommet fra Hongkong og på vej til Pittsburgh. Han beskriver deres ambitioner sådan:
- Vi har sat os måske den vanskeligst mulige opgave i oversættelse. Ikke alene vil vi oversætte fra et sprog til et andet, men vi vil også gerne oversætte fra et talt sprog til et andet talt sprog.
Oversættelse af det talte sprog er den ultimative udfordring for mekaniske oversættere. Her skal de ikke bare oversætte ordene og meningen - de skal også oversætte det yderst upræcise medium, som tale er.
Det skrevne sprog er præcist i den forstand, at et ord altid staves på samme måde. Så snart vi udtaler ordet, er den lydlige variation derimod enorm. Oven i kommer så den mundtlige tradition for at lave halve sætninger og på andre måder forkorte sproget.
Men Waibel og hans kolleger er allerede kommet langt. Den teknologi, som de bruger, er tæt beslægtet med T9 Predictive Text-systemet på mobiltelefonerne. Den bygger på en statistisk analyse af sproget, der i øvrigt også er teknologien bag de fleste talegenkendelsesprogrammer.
Ved hjælp af en gigantisk database af sprogeksempler kan systemet lave statistisk baserede gæt på, hvad en person siger, og hvordan det kan oversættes til et andet sprog.
Waibel påstår ikke, at de har løst problemerne. Men de har en fungerende oversættelse mellem flere sprog. Hans vurdering af den øjeblikkelige kvalitet er, at systemet kan bruges til forholdsvis formaliserede sprogsituationer som for eksempel foredrag. Her giver det langt fra en fuldstændig oversættelse, men det kan give sproghjælp, så man med kendskab til foredragsemnet - og noget besvær - kan stykke en forståelse sammen.
Det er endnu langt fra en rigtig oversættelse. Metoden har desuden den svaghed, at komplekse sproglige konstruktioner kræver større præcision, hvad der gør dem langt vanskeligere at oversætte på denne måde. Originalt sprog og ordkunst har heller ikke store chancer for at blive oversat særlig godt.
Til gengæld virker metoden fint i dagligsproget - de situationer, hvor vi bruger sproget som et redskab til at fortælle forholdsvis utvetydige ting. Anmodningen "ræk mig saltet" kan måske nok formuleres på 35 forskellige måder, men indholdet er let at dechifrere og gengive på et andet sprog.
Den virkelige fordel ved automatisk oversættelse er, at den er billig. Menneskelig oversættelse er rasende dyr. Det gælder uanset, om man køber en kvalificeret oversætter eller investerer mængder af sin egen tid på at lære et sprog, som man kun sjældent bliver mester i.
Med Waibels system bliver det muligt at oversætte i alle de situationer, hvor det nu er for dyrt eller upraktisk. Oversættelse bliver et personligt redskab, som kan bruges i enhver situation.
Måske kan det bedst sammenlignes med de elektroniske vejkort. I dag kan vi få kort over hele Vesteuropa for et overskueligt beløb og vi har dem til rådighed på en håndholdt computer - begge dele var en utopisk fantasi for femten år siden.
Hvor vi i dag - stort set - kender hvert eneste gadenavn, vil det om yderligere ti år være tænkeligt, at vi kan tale med hvert eneste menneske, vi møder på de gader.
Vi er normalt ikke opmærksomme på, hvor meget vores sprogforståelse forvrænger vores billede af verden. Vores opmærksomhed mod og forståelse af andre lande er styret af, hvor let tilgængeligt deres sprog er for os.
Prøv en gang det tankeeksperiment, at Nordkorea, Irak eller for den sags skyld Italien ved et mirakel talte dansk. Vi ville uden besvær kunne læse aviser, se tv og i øvrigt fordybe os i disse landes kultur, som de selv udøver den. I stedet for at opleve dem gennem et filter af oversættere og journalister, ville vi opleve deres verden direkte.
Vores evne til at forstå dem vil blive langt mere finkornet og præcis.
I dag findes der knap 7.000 aktive sprog på kloden, omkring 200 af dem bliver talt af over to millioner mennesker. På listen over mest talte sprog er dansk omkring nummer 100. Selvom engelsk stadig er verdens vigtigste sprog og forholdsvis universelt forståeligt, så er det interessant, at tre af verdens fem største sprog er stort set ukendte for danskere.
Det er kinesisk, hindi, bengali. Sprog som måske ikke i øjeblikket er særligt relevante for os, men som tales af nogle af verdens mest dynamiske befolkninger. Vi kommer til at høre mere til dem, og vi vil få et meget større behov for at forstå deres tankegang - på fuldstændig samme måde, som vi de sidste par år har fået et væsentligt større behov for at forstå arabisk.
Sprog styrer vores oplevelse af verden på en måde, som næsten ligner de fortegnede kort, hvor man i stedet for en geografisk tegning af verden ser den forvrænget i en økonomisk eller militær gengivelse (se nogle vidunderlige eksempler på www.worldmapper.org).
Waibels forskning vil måske eller måske ikke give os den universelle oversætter, Babelfisken og hvad den ellers er blevet kaldt i science fiction-litteraturen. Men hans forskning tyder på, at sproget trods alt bliver håndterligt, når bare man har tilstrækkeligt store dimensioner på sin database.
Waibel og hans kolleger forsker ikke kun i selve sprogoversættelsen, de er også i gang med at overveje, hvordan denne type oversættelsesteknologi kan fungere i vores dagligdag.
De har lavet en fungerende prototype af retningsbestemt lyd, hvor man kan lave en oversættelse, som akustisk sendes til bestemte personer i et rum, for eksempel under et foredrag. De hører, hvad der svarer til en lille stemme over skulderen, som oversætter oplægget.
Deres mest spændende forsøg er imidlertid en rigtig Babelfisk. Det viste sig nemlig, at den teknologi, der analyserer det talte sprog, fungerer udmærket på andre typer sprogligt input end de akustiske. Man kan for eksempel måle en persons mund- og strubebevægelser og fodre disse data ind i maskinen. Med et forholdsvis begrænset antal modifikationer kan maskinen forstå det på samme måde som et talt sprog.
Forskellen er selvfølgelig, at man bare skal lade som om man taler, så vil systemet opfatte denne "tavse" tale og oversætte den til det sprog, man ønsker. Resultatet bliver, at man kan tale et fremmed sprog på en næsten naturlig måde. Eller måske er det en meget unaturlig måde, for det vil selvfølgelig ligne en eftersynkroniseret film, hvor talen er nogle sekunder efter mundbevægelserne.
Tilvænning er helt klart et krav.
Men den praktiske brug af selv en uperfekt teknologi kan åbne for kontakt til kulturer, som vi hidtil fuldstændig har overset. Og som Alex Waibel understreger, så er en af styrkerne ved denne teknologi, at den bevarer sprog og kultur - alle kan klare sig med deres eget sprog.
InterACT-centret:
www.is.cs.cmu.edu
Billedtekst:
Undertekster Oversættelse kan leveres på mange måder. En diskret og elegant måde er at sende oversættelsen op på en persons briller. Ved den rigtige opsætning kan det fungere fuldstændig som en tekstning på tv.
Kindaflæsnin Elektroderne på personens ansigt aflæser muskelbevægelserne, der er nødvendige for at sige noget. Det er klart, at i en endelig version vil de blive erstattet af mange flere mikroskopiske elektroder, som indopereres i huden og sender trådløst til oversætteren.
OriginalModTime: 22-06-2006 15:12:28