Skræl til kernen

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 1. november 2002.


Udfordringen er at finde frem til informationskernen i talestrømmen, beretter PDC, der står bag en informationstjeneste baseret på talegenkendelse, som er i test hos ATP.

tema: Sprogteknologi

ATP tester i øjeblikket en talestyret informationstjeneste om feriekonto-ordningen, udviklet af det danske konsulent- og udviklingsfirma PDC (Prolog Development Center).

I den nye tjeneste erstatter brugernes svar de tidligere valg ved hjælp af telefonens taster. Det kræver, at talegenkendelsen kan finde frem til den del af svaret, den kan reagere på. I starten bliver man bedt om at fortælle, hvilken af de tre situationer, hvor man typisk har brug for tjenesten, man er i: Om man er lønmodtager, har forladt arbejdsmarkedet eller bor i udlandet. Her kan brugeren svare såvel "lønmodtager" som "jeg er lønmodtager" og meget andet. Kunsten er at udvikle et system, der kan skille nøgleordet "lønmodtager" eller dets synonymer ud.

- Der er tale om en tjeneste, som du måske vil benytte tre gange i dit liv. Strukturen skal tilpasses efter, hvor tit tjenesten benyttes. Når du er begynder, skal den bygges op af forholdsvis meget information og få valg. Vores opgave er at udvikle en dialogstruktur, der gør det muligt at forudse så mange af de svar, brugerne kan forventes at give, som muligt. Det er netop, fordi vi beskæftiger os med et begrænset område, at vi kan lave en robust genkendelse, siger markedschef Jens Kjærum fra PDC.

En af udfordringerne ved at lave en talestyret informationstjeneste er at give brugerne et billede af alle de muligheder, de har - og samtidig lede brugeren til at give forudsigelige og brugbare svar. Derfor kører PDC en slags laboratorieforsøg, hvor testpersoner benytter tjenesten. Resultaterne benyttes sammen med statistik fra brugen af tjenesten, når den bliver sat i ordinær drift, til at forbedre de sandsynlighedsberegninger, som genkenderen benytter til at kombinere lydene til en meningsfuld sætning.

Ny brugerflade
PDC er et softwarehus, der arbejder med planlægnings- og informationssystemer. De begyndte at arbejde med talegenkendelse, da de for et par år siden kom med i et EU-projekt, der går ud på at etablere et informationssystem til hjemmet. I dette system tænkes brug af tastatur og mus suppleret med styring ved tale.

- I mange tilfælde oplever firmaerne de talebaserede informationstjenester som endnu en brugerflade, det er forholdsvis enkelt at føje til den web-baserede brugerflade, de har i forvejen. Systemerne skal opbygges hver for sig, men kan trække på samme databaser, siger Jens Kjærum.

PDC's tjeneste arbejder på grundlag af en talegenkender, der bygger på Philips SpeechMagic.
Generelt bliver talegenkendelser forbedret ved at blive brugt. Derigennem opsamler genkendelsen sproglige variationer som dialekter og børns sprog. Samtidig bliver ordforrådet udvidet, og der kommer udenlandske ord, og den lærer at genkende flere navne.

Billedtekst:
Hos ATP erstatter talegenkendelse de tidligere valg ved hjælp af telefonens taster. Først bliver man bedt om at fortælle, om man er lønmodtager, har forladt arbejdsmarkedet eller bor i udlandet. Her kan brugeren svare såvel "lønmodtager" som "jeg er lønmodtager" og meget andet.