DR digitaliserer sine realtids-undertekster

DR sender snart undertekster i direkte tv-udsendelser til det kommende digitale tv-signal. Læs her, hvordan tale-til-tekst-teknologien fungerer.

Når DR, TV2 og lokal-tv fra 31. oktober lukker for de analoge transmissioner og i stedet sender digitalt til antennerne, vil statsradiofonien DR og TV2 være klar til at kunne transmittere sine realtids-undertekster.

Det betyder, at seerne blandt andet kan følge med i studieværtens ord i underteksterne, når DR sender direkte.

Transmissionen af underteksterne til det digitale tv-signal faldt på plads, da DR i forrige uge udvalgte selskabet Cavena Image Products til den digitale teksttransmission for en pris, der ligger på omkring tre millioner kroner.

Men DR har allerede på det analoge signal kunnet realtids-undertekste udsendelser som TV-Avisen til hørehæmmede i knap tre år, efter DR dengang købte Philips' SpeechMagic-system, der er blevet rettet til af det danske software-selskab Prolog Development Center.

"Talegenkendelsesprogrammet kan være en "hystade", men det fungerer rimeligt godt, når vi sender direkte interviews i eksempelvis TV-Avisen," forklarer Hans Palle Mortensen, der er tekster hos DR.

Faktisk kan tale-til-tekst-programmet også bruges til andre formål som eksempelvis indlæsning af mails, rapporter, fortæller Hans Palle Mortensen, der tidligere har oversat og indtalt et helt kapitel af bogen "Straffe" om det internationale fodboldforbunds præsident Sepp Blatter via tale-til-tekstprogrammet SpeechMagic.

Hystade med baggrundsproblemer
"Hystaden" har dog også vist svaghedstegn.

Systemet forstår eksempelvis ikke, når det skal genkende tale fra forskellige personer og oversætte talen til tekst. Ligeledes bliver baggrundsstøj som pippende fugle, tasteklik og geværskud fra Afghanistan fortolket som ord og udskrevet som det rene volapyk i live-underteksterne i TV-Avisen.

Hvis ikke systemet er kalibreret til og bruges af én bestemt person, vil sandsynligheden for at matche tekst med tale ifølge Hans Palle Mortensen dale fra omkring 97 procents nøjagtighed til cirka 30 procents nøjagtighed.

Derfor har DR og TV2 valgt at køre med en usynlig og uhørlig speaker - en såkaldt simultantekster - når eksempelvis studievært Kim Bildsøe Lassen toner frem på tv-skærmen i 18.30-TV-Avisen.

Speakerens opgave er at gengive Kim Bildsøe Lassens tale ekstremt tydeligt og inkludere alle tegnsætninger, for at systemet kan genkende ordene, stave korrekt og sætte de korrekte tegn.

"Der..er..mange..men-ne-sker..på..ga-der-ne i Te-he-ran..komma..ef-ter..i-ra-ner-ne..har..haft..mistanke...om..valg-fusk..punktum," siger Hans Palle Mortensen som et eksempel på speakerens rolle, der i underteksterne kommer til at se sådan ud:

"Der er mange mennesker på gaderne i Teheran, efter iranerne har haft mistanke om valgfusk."

Opbygget i tre moduler
Selve talegenkendelsessystemet består af tre hoveddele.

Først og fremmest er der det akustiske modul, der identificerer speakerens lyde og via statistik og sandsynlighedsberegning benytter de to andre moduler, ordbogen og sprogmodellen, til at kunne skrive sætningerne automatisk ud på tekststrenge.

Artiklen fortsætter på næste side...


Ytringer på debatten er afsenders eget ansvar - læs debatreglerne
Indlæser debat...


Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Konica Minolta Business Solutions Denmark A/S
Salg af kopimaskiner, digitale produktionssystemer og it-services.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Datacenter og hosting: Sådan får du mere ud af dine data

Bliv opdateret på alle de nye teknologier og tendenser inden for datacenter-løsninger og hosting af markedets stærkeste leverandører. Du får også gode råd om, hvordan du kan sikre en fleksibel skalering i datacentret og potentielt opnå effektiviseringer og besparelser.

13. december 2016 | Læs mere


Kom godt i gang med EU-persondataforordningen

EU's persondataforordning træder i kraft 14. april 2018. Med trusler om høje bøder vil EU tvinge langt de fleste virksomheder til at få styr på deres håndtering og sikring af persondata. Så det er på høje tid at komme i gang ? kom og hør om kravene og se løsninger, der letter arbejdet frem mod at blive compliant.

15. december 2016 | Læs mere


Datacenter og hosting: Sådan får du mere ud af dine data

Bliv opdateret på alle de nye teknologier og tendenser inden for datacenter-løsninger og hosting af markedets stærkeste leverandører. Du får også gode råd om, hvordan du kan sikre en fleksibel skalering i datacentret og potentielt opnå effektiviseringer og besparelser.

19. januar 2017 | Læs mere





mest debaterede artikler

Computerworld
Jens Højgaard skrev negativ anmeldelse på Trustpilot - nu er han blevet sagsøgt for 11.419 kroner
En negativ anmeldelse på Trustpilot om et inkassofirma har indtil videre kostet den selvstændige hvidevare-reparatør Jens Høgni Højgaard flere tusinde kroner og en tur i retten. Forklaringen er, at inkassofirmaet har forbudt kunder at udtale sig negativt i offentlighed om selskabet.
CIO
Har rulllet Mac-computere ud til 90.000 ansatte: Her er seks nyttige erfaringer fra IBM's store Mac-udrulningsprojekt
På lidt over et år har IBM rullet 90.000 Mac-computere ud til medarbejderne, mens virksomheden har gjort sig en hel række erfaringer. Læs her, hvad IBM har lært af projektet.
Comon
Overblik: Her har du ni af årets allerbedste bærbare computere
Her har du en liste over ni af de bedste bærbare computere, du kan købe i Danmark.
Channelworld
Overblik: Det ved vi efter første retsmøde i den store Atea-bestikkelsessag
Den første sag om bestikkelse af offentlige ansatte kører i disse dage, hvor offentlige ansatte anklages for at have modtaget bestikkelse fra it-giganten Atea.
White paper
Sådan overvinder man de 5 største udfordringer ved application recovery.
Få svar på hvordan man løser de 5 største udfordringer ved application recovery