DR digitaliserer sine realtids-undertekster

DR sender snart undertekster i direkte tv-udsendelser til det kommende digitale tv-signal. Læs her, hvordan tale-til-tekst-teknologien fungerer.

Når DR, TV2 og lokal-tv fra 31. oktober lukker for de analoge transmissioner og i stedet sender digitalt til antennerne, vil statsradiofonien DR og TV2 være klar til at kunne transmittere sine realtids-undertekster.

Det betyder, at seerne blandt andet kan følge med i studieværtens ord i underteksterne, når DR sender direkte.

Transmissionen af underteksterne til det digitale tv-signal faldt på plads, da DR i forrige uge udvalgte selskabet Cavena Image Products til den digitale teksttransmission for en pris, der ligger på omkring tre millioner kroner.

Men DR har allerede på det analoge signal kunnet realtids-undertekste udsendelser som TV-Avisen til hørehæmmede i knap tre år, efter DR dengang købte Philips' SpeechMagic-system, der er blevet rettet til af det danske software-selskab Prolog Development Center.

"Talegenkendelsesprogrammet kan være en "hystade", men det fungerer rimeligt godt, når vi sender direkte interviews i eksempelvis TV-Avisen," forklarer Hans Palle Mortensen, der er tekster hos DR.

Faktisk kan tale-til-tekst-programmet også bruges til andre formål som eksempelvis indlæsning af mails, rapporter, fortæller Hans Palle Mortensen, der tidligere har oversat og indtalt et helt kapitel af bogen "Straffe" om det internationale fodboldforbunds præsident Sepp Blatter via tale-til-tekstprogrammet SpeechMagic.

Hystade med baggrundsproblemer
"Hystaden" har dog også vist svaghedstegn.

Systemet forstår eksempelvis ikke, når det skal genkende tale fra forskellige personer og oversætte talen til tekst. Ligeledes bliver baggrundsstøj som pippende fugle, tasteklik og geværskud fra Afghanistan fortolket som ord og udskrevet som det rene volapyk i live-underteksterne i TV-Avisen.

Hvis ikke systemet er kalibreret til og bruges af én bestemt person, vil sandsynligheden for at matche tekst med tale ifølge Hans Palle Mortensen dale fra omkring 97 procents nøjagtighed til cirka 30 procents nøjagtighed.

Derfor har DR og TV2 valgt at køre med en usynlig og uhørlig speaker - en såkaldt simultantekster - når eksempelvis studievært Kim Bildsøe Lassen toner frem på tv-skærmen i 18.30-TV-Avisen.

Speakerens opgave er at gengive Kim Bildsøe Lassens tale ekstremt tydeligt og inkludere alle tegnsætninger, for at systemet kan genkende ordene, stave korrekt og sætte de korrekte tegn.

"Der..er..mange..men-ne-sker..på..ga-der-ne i Te-he-ran..komma..ef-ter..i-ra-ner-ne..har..haft..mistanke...om..valg-fusk..punktum," siger Hans Palle Mortensen som et eksempel på speakerens rolle, der i underteksterne kommer til at se sådan ud:

"Der er mange mennesker på gaderne i Teheran, efter iranerne har haft mistanke om valgfusk."

Opbygget i tre moduler
Selve talegenkendelsessystemet består af tre hoveddele.

Først og fremmest er der det akustiske modul, der identificerer speakerens lyde og via statistik og sandsynlighedsberegning benytter de to andre moduler, ordbogen og sprogmodellen, til at kunne skrive sætningerne automatisk ud på tekststrenge.

Artiklen fortsætter på næste side...


Ytringer på debatten er afsenders eget ansvar - læs debatreglerne
Indlæser debat...


Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Kompetera A/S
Hardware, licenser, konsulentydelser

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Få det optimale it-miljø i skyen: Sådan udnytter du de førende cloud-platforme

Det moderne it-miljø udspringer af skyen. Cloud-løsningerne er mere effektive, lettere at håndtere, og frigiver ressourcer i din organisation, så I kan fokusere på kerneforretningen. Kom og hør bl.a. Amazon, Riverbed, TDC Hosting, interxion, Oracle, Citrix og NetApp omkring deres bud på det optimale cloud-miljø.

28. september 2016 | Læs mere


Sikkerhed i virksomheden - Ballerup

Angrebene på it-sikkerheden bliver stadig mere målrettede og professionelle. Det sætter dig som sikkerhedsansvarlig i et krydspres mellem behovet for oplyste brugere, behovet for at etablere et forsvar og samtidig behovet for at overholde budgetterne. Kom og hør, hvordan du skaber større sikkerhed i din virksomhed.

05. oktober 2016 | Læs mere


Netværksvirtualisering, SSD og storage

Mange overvejer i dag at flytte hele eller dele af it-opgaverne ud i en cloud-løsning, mens andre opgaver - som regel de forretningskritiske - ofte bliver hjemme. Det gør det gode datacenter til en afgørende brik for enhver virksomhed. Kom og hør Danmarks bedste datacenter-leverandørers bud på fremtidens datahåndtering.

11. oktober 2016 | Læs mere






Computerworld
Nordkoreas internet tvunget i knæ efter afsløring af landets 28 websites
Afsløringen af Nordkoreas blot 28 hjemmesider har resulteret i så megen nysgerrighed, at besøgende udefra har lagt flere af landets hjemmesider ned.
CIO
Situationen er alvorlig for CSC: Brændende underskud på 930 millioner kroner kan få konsekvenser
ComputerViews: Situationen er alvorlig for CSC Danmark, der har tabt 930 millioner kroner på et år. Har man nogen fremtid og kan man beholde både de dygtigste medarbejdere og sine kunder, når alle alarmklokker bimler, og pengene vælter ud ad kassen? Det har CSC intet svar på.
Comon
Google klar med verdens vildeste Android-telefoner om 14 dage
De nyeste Android-flagskibsmodeller er bekræftet til at være klar 4. oktober. Læs her, hvad du kan forvente af det allerbedste, som Android-verdenen endnu har budt på.
Channelworld
Kæmpe-underskud: Elektronik-kæden Power har tabt 132 millioner kroner på et år
Varehus-kæden Power tabte 132 millioner kroner i 2015. Egenkapitalen er blæst helt væk. Nu venter store ekspansionsplaner imidlertid forude.
White paper
Sådan følger du med den moderne forbruger
Virksomheder er nødt til at optimere deres kontaktpunkter for ikke at fremmedgøre deres mest kritiske interessenter. Læs i dette white paper hvordan