Artikel top billede

DR digitaliserer sine realtids-undertekster

DR sender snart undertekster i direkte tv-udsendelser til det kommende digitale tv-signal. Læs her, hvordan tale-til-tekst-teknologien fungerer.

Når DR, TV2 og lokal-tv fra 31. oktober lukker for de analoge transmissioner og i stedet sender digitalt til antennerne, vil statsradiofonien DR og TV2 være klar til at kunne transmittere sine realtids-undertekster.

Det betyder, at seerne blandt andet kan følge med i studieværtens ord i underteksterne, når DR sender direkte.

Transmissionen af underteksterne til det digitale tv-signal faldt på plads, da DR i forrige uge udvalgte selskabet Cavena Image Products til den digitale teksttransmission for en pris, der ligger på omkring tre millioner kroner.

Men DR har allerede på det analoge signal kunnet realtids-undertekste udsendelser som TV-Avisen til hørehæmmede i knap tre år, efter DR dengang købte Philips' SpeechMagic-system, der er blevet rettet til af det danske software-selskab Prolog Development Center.

"Talegenkendelsesprogrammet kan være en "hystade", men det fungerer rimeligt godt, når vi sender direkte interviews i eksempelvis TV-Avisen," forklarer Hans Palle Mortensen, der er tekster hos DR.

Faktisk kan tale-til-tekst-programmet også bruges til andre formål som eksempelvis indlæsning af mails, rapporter, fortæller Hans Palle Mortensen, der tidligere har oversat og indtalt et helt kapitel af bogen "Straffe" om det internationale fodboldforbunds præsident Sepp Blatter via tale-til-tekstprogrammet SpeechMagic.

Hystade med baggrundsproblemer

"Hystaden" har dog også vist svaghedstegn.

Systemet forstår eksempelvis ikke, når det skal genkende tale fra forskellige personer og oversætte talen til tekst. Ligeledes bliver baggrundsstøj som pippende fugle, tasteklik og geværskud fra Afghanistan fortolket som ord og udskrevet som det rene volapyk i live-underteksterne i TV-Avisen.

Hvis ikke systemet er kalibreret til og bruges af én bestemt person, vil sandsynligheden for at matche tekst med tale ifølge Hans Palle Mortensen dale fra omkring 97 procents nøjagtighed til cirka 30 procents nøjagtighed.

Derfor har DR og TV2 valgt at køre med en usynlig og uhørlig speaker - en såkaldt simultantekster - når eksempelvis studievært Kim Bildsøe Lassen toner frem på tv-skærmen i 18.30-TV-Avisen.

Speakerens opgave er at gengive Kim Bildsøe Lassens tale ekstremt tydeligt og inkludere alle tegnsætninger, for at systemet kan genkende ordene, stave korrekt og sætte de korrekte tegn.

"Der..er..mange..men-ne-sker..på..ga-der-ne i Te-he-ran..komma..ef-ter..i-ra-ner-ne..har..haft..mistanke...om..valg-fusk..punktum," siger Hans Palle Mortensen som et eksempel på speakerens rolle, der i underteksterne kommer til at se sådan ud:

"Der er mange mennesker på gaderne i Teheran, efter iranerne har haft mistanke om valgfusk."

Opbygget i tre moduler

Selve talegenkendelsessystemet består af tre hoveddele.

Først og fremmest er der det akustiske modul, der identificerer speakerens lyde og via statistik og sandsynlighedsberegning benytter de to andre moduler, ordbogen og sprogmodellen, til at kunne skrive sætningerne automatisk ud på tekststrenge.

Ingen maskine oversætter hurtigere end mennesker

DR's talegenkendelses-ordbog består af omkring 157.000 ord, hvorfra systemet udvælger speakerens indtalte ord.

I sprogmodellen bliver disse udvalgte ord behandlet via sandsynlighedsberegning og statistik fra 850 millioner indlæste ord i forskellige sætninger, for at kunne stave til den korrekte indtaling af eksempelvis ordet "hver", som har samme lyd som "vejr" og "værd", men en helt anden betydning.

Når speakerens sætning er blevet behandlet af alle tre moduler, vil tekststrengen blive omsat til undertekst med omkring to til fire sekunders forsinkelse, efter Kim Bildsøe Lassen har udtalt ordene.

Hvis der er problemer med manglende eller sjældne ord og navne må tekstmedarbejderen forsøge at tale uden om eller på forhånd forberede nogle templates, hvor disse ord og navne er indlæst i systemet.

"Blandt andet har vi en udfordring ved den kommende royale barnedåb, hvor der er en masse franske og eksotiske navne, der muligvis skal lægges ind på forhånd," siger Hans Palle Mortensen, der samtidig erkender, at de direkte transmitterede undertekster ikke altid slipper lige heldigt fra den opgave.

Mangler ord

Netop manglende eller sjældne ord er ifølge Hans Palle Mortensen den store akilleshæl ved realtids-underteksningen.

"Der mangler simpelthen ord i databasen," siger Hans Palle Mortensen.

Det danske sprog menes at have over én million ord i forskellige bøjninger, og der kommer talegenkendelsesordbogen altså til kort.

Et andet problem er fejl i den fonetiske ordbog, som systemet ikke altid genkender og indsætter et forkert ord. Blandt andet er der væsentlige problemer med vokaler, der skal udtales mere som en højtlæsende ordbog ville gøre det frem for at blive udtalt på normalt dansk. Derfor må Hans Palle Mortensen og kollegerne ofte fejlrette og meddele leverandøren Prolog Development Center om manglerne.

"Vi prøver konstant at udvide ordbogen i programmer og få rettet fejlagtige fonetiske genkendelser, men det er en langsommelig proces," siger DR-medarbejderen Hans Palle Mortensen om det daglige arbejde med tale-til-skrift-programmet.

Går helt galt med fremmedsprog

På grund af huller i systemet er Hans Palle Mortensen ikke nervøs for at stå uden et arbejde på hånden, selv om genveje i programmer, der benytter tale-til-tekst-teknologien konstant er blevet videreudviklet siden BBC implementerede sin version af IBM's Via Voice-program for omkring seks år siden.

"Der er ikke nogen software, der er hurtigere end den menneskelige hjerne, når det kommer til forståelse og oversættelse af ord," siger han.

Netop ved oversættelser står de fleste systemer helt af. Derfor må teksterne hos DR og andre tv-stationer simultantolke fra det udenlandske sprog til dansk i direkte udsendelser og så via tale-til-tekstsystemet få underteksterne frem.

"Talegenkendelse uden en personlig stemmeprofil sænker allerede niveauet kraftigt, og derefter skal den udenlandske tekststreng køres igennem et af de oversættelsesprogramer, som på nuværende tidspunkt er ret elendige. Det ville aldrig blive en succes," siger Hans Palle Mortensen.

Blandt andet forsøgte Hans Palle Mortensen sig med at simultanoversætte præsident Barack Obamas indtrædelsestale i januar, men det blev ikke særlig vellykket på grund af præsidentens mange sprogblomster, der blev til decideret ukrudt i de danske undertekster.

Realtids-underteksterne bliver dog også næsten udelukkende brugt fra dansk tale til dansk tekst, fordi det er ekstremt sjældent, at DR sender direkte udsendelser på fremmedsprog.

DR's og TV2's talegenkendelsesprogram kostede for små tre år siden syv millioner kroner, der blev betalt af Videnskabsministeriet, Kulturministeriet, DR og TV2. Planen for DRs vedkommende er, at alt dansk speak skal live-tekstes i 2012.

Undertekster til direkte indslag i blandt andet TV-Avisen kan findes på side 399 på DR's tekst-tv, hvilket også gør sig gældende for TV2's undertekster til 19-Nyhederne.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Fiftytwo A/S
Konsulentydelser og branchespecifikke softwareløsninger til retail, e-Commerce, leasing og mediebranchen.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Compliance og strategisk it-sikkerhed efter DORA

Finansielle koncerner har i snit 85 sikkerhedsløsninger i drift – men er i snit op til 100 dage om at opdage et igangværende cyberangreb. Ydermere viser øvelser, at det typisk tager 4-6 uger at rense og genetablere sikker drift af centrale systemer efter et stort angreb. Fokus for dagen vil derfor være på henholdsvis governance samt om, hvordan du som it-leder i den finansielle sektor skal kunne håndtere fremtidens cybertrusler og arbejde effektivt med sikkerhed på et strategisk niveau.

04. april 2024 | Læs mere


EA Excellence Day

Hvad er det, der gør it-arkitektens rolle så vigtig? Og hvad er det for udfordringer inden for områder som cloud, netværk og datacentre, som fylder hos nogle af landets bedste it-arkitekter lige nu? Det kan du her høre mere om og blive inspireret af på denne konference, hvor du også får lejlighed til at drøfte dette med ligesindede.

16. april 2024 | Læs mere


IAM - din genvej til højere sikkerhed uden uautoriseret adgang og datatab

På denne dag udforsker vi de nyeste strategier, værktøjer og bedste praksis inden for IAM, med det formål at styrke virksomheders sikkerhedsposition og effektiviteten af deres adgangsstyringssystemer og dermed minimere risikoen for uautoriseret adgang og datatab. Og hvordan man kommer fra at overbevise ledelsen til rent faktisk at implementere IAM?

18. april 2024 | Læs mere