Søgeselskabet Google har på sin blog løftet sløret for, at seere på videositet Youtube i fremtiden vil kunne få automatisk genererede undertekster på hjemmesidens millionvis af videoklip.
Underteksterne er på engelsk og designet til at hjælpe døve eller hørehæmmede til at følge med i videoerne. Selve teknologien bag underteksterne er en algoritme, som den døve software-designer Ken Harrenstien fra Google har været med til at udvikle.
For at få tekster på ordene kombinerer han og kollegerne Googles talegenkendelsesværktøjer med Googles undertekstsystem således, at når der bliver talt i en video, vil de talte ord automatisk blive skrevet på engelsk i en undertekst på skærmen.
I første omgang ryger der kun undertekster på videoer fra 13 Youtube-kanaler, der blandt andet tæller National Geographic.
Udover underteksterne på flere eksisterende videoer vil det være muligt for brugerne at få undertekster med maskinoversættelser automatisk på ny-uploadede videoer ved at vælge "Transcribe audio" fra menufunktionen.
Det er derimod ikke muligt at oversætte fra andre sprog til engelske undertekster.
Lnagtrfa prefekrt
På nuværende tidspunkt er der allerede nok arbejde i at få det engelske til at glide nogenlunde forståeligt ned. For underteksterne er i flere tilfælde ikke helt så heldige.
På Google-bloggen demonstrerer søgeselskabet sine undertekster, og der bliver ordet "sim" (som i SIM-kort) undertekstet som "salmon" (laks).
"Det er stadig bedre end ingenting," bliver der efterfølgende sagt på videoen.
Maskinen overgår ikke mennesket
En realtidsoversætter hos DR, Hans Palle Mortensen, har tidligere fortalt, at ingen maskine kan overgå den menneskelige oversættelse og undertekstning.
Dels går der en masse informationer tabt i udtalelsen, dels skal maskineriet helst være kalibreret til én bestemt person.
"Talegenkendelse uden en personlig stemmeprofil sænker allerede niveauet kraftigt," forklarede han i sommer til Computerworld.