6.000 sprog.
Det er det ultimative mål for søgeselskabet Google i bestræbelserne på at oversætte telefonsamtaler i noget, der ligner realtid, så alle personer på kloden potentielt kan tale sammen på deres eget modersmål via en mobiltelefon.
Det skriver Times Online.
"Vi tror, at tale-til-tale oversættelse vil være muligt og virke tilfredsstillende inden for et par år," siger Franz Och, chef for Googles oversættelsesservice.
Kombinerer eksisterende teknologier
Taleoversættelse af verdens omkring 6.000 sprog i et rent Babelstårn-projekt er dog ikke det første, som søgegiganten har i tankerne.
Derimod vil Google "nøjes med" at udvide antallet af de nuværende 52 sprog, som findes i selskabets Translate-applikation og arbejde på at forfine eksisterende talegenkendelses-værktøjer.
Udover sit tekst-til-tekst-oversættelsesprogram, Translate, har Google også et talegenkendelses-program til mobiltelefonen, der gør det muligt at søge på nettet ved hjælp at talekommandoer i stedet for at skrive søgeord.
Og det er kombinationen af talegenkendelse og tekstoversættelser, der giver Google håb om at kunne bygge et samtalesystem inden for en overskuelig fremtid.
Googles robotstemme
Resultatet for mobilbrugerne vil være, at når de taler på deres modersmål med personer fra udlandet, vil deres tale-input blive optaget, transskriberet til tekst og derefter tekst-til-tekst oversat.
Slutteligt vil en robotstemme læse den oversatte tekst op, og modtageren vil derefter kunne svare på sit modersmål.
Mobiltelefonen kender din stemme
"Det er klart, at hvis det (oversættelsen, red.) skal virke flydende, så har man brug for en ekstremt præcis maskin-oversættelse og stemmegenkendelse, og det er lige, hvad vi arbejder på. Hvis man ser på udviklingen inden for maskinoversættelse og den tilsvarende proces på området for talegenkendelse, så har der været en kæmpeudvikling på det seneste," siger Franz Och fra Googles sproglaboratorier til Times Online.
Problemer med talegenkendelse
Med nutidens maskinelle sprogoversættelser er det ikke en ord-for-ord-oversættelse, som man kender det fra internettets barndom.
Derimod vil Googles tale-til-tale oversættelser i mobiltelefonen i høj grad bygge på oversættelserne på statistik og sandsynlighedsberegninger fra Google Translate.
Oversættelsestjenesten er nemlig dykket ned i millionvis af hjemmesider på forskellige sprog for at finde ud af, hvordan ord bliver sat sammen og derefter selv kunne gengive ord som "vejr", "værd" og "hver" korrekt ud fra statistikken, selvom ordene lyder ens i en telefon.
Samtalerne i Googles tale-oversættelse vil derfor heller ikke foregå i realtid. Oversættelsesprogrammet skal simpelthen høre hele sætninger færdige, før de bliver oversat med robotstemmen.
En af de større udfordringer bliver dog at få talegenkendelses-softwaren til at spille i mobilerne.
"Alle har deres egen stemme, accent og pitch, men genkendelsen skulle gerne være effektiv med mobiltelefoner, fordi de er vores personlige ejendele. Telefonen skulle eksempelvis gerne kunne genkende din stemme fra tidligere samtaler," lyder det håbefuldt fra Franz Och.
Samtidig bliver oversættelsesprogrammer også hele tiden mere effektive jo mere, de bliver brugt. Det sker simpelthen ved, at jo mere data-input, der kommer i programmerne, des bedre bliver genkendelsen og kvaliteten af det oversatte.
"Der er heller ingen mangel på hjælp til sproget. Der er jo mange sprogentusiaster derude," siger Franz Och til Times Online.