Pc'ens talegenkendelse lig vores om syv år

Ifølge Microsoft-forsker vil systemerne lære at forstå sproget på samme måde, som babyer gør. Programmerne forbedres med 10-15 procent hvert år, og dermed haler pc'en ind på mennesket i kampen om at lære talesprog.

Hvert år forbedres computerens evne til at forstå et naturligt talt sprog med 10 til 15 procent, og i løbet af de næste syv år vil computeren nå eller overgå det menneskelige niveau.

Det hævder datalogen Kai-Fu Lee, som Microsoft fik overtalt til at forlade jobbet på Carnegie Mellon universitetet for at lede softwaregigantens forskning i taleteknologi.

Men hans sammenligning gælder en bestemt situation. Over for nyhedtjenesten Cnet bruger han scenariet, at et menneske - med en pc og et andet menneske foran sig - dikterer.

Bagefter tager man et tjek af, hvad pc?en har forstået, og hvad mennesket har forstået.

- Vi forventer, at maskinen vil være bedre til at forstå, hvad der bliver sagt. Det hele er en funktion af Moores lov. Der vil være mere hukommelse, mere kapacitet og mere computerkraft til rådighed, siger Kai-Fu Lee.

Computerens indlæring lig en babys

Nutidens talegenkendelse er ifølge ham kun til rigtig nytte for mennesker, der lider af skader som følge af brug af mus og tastatur.

Når han skal forklare teknologien, der gør det muligt for forskerne at få lært computeren bedre talegenkendelse, taler han om opbygning af en statistisk model af enhver mulig lyd, på ethvert muligt sprog i verden og baseret på mængder af indsamlet tale.

Ifølge ham vil indlæringen ske meget lig en babys.

- Forskellen er blot, at maskiner skal vejledes mere. Babyer behøver for eksempel ikke at få fortalt, om det er en mand eller en kvinde, der taler, siger Kai-Fu Lee.

Men mennesket skal lære at tale til computeren, og det vil ske, mener forskeren. Der er behov for lidt mere adskilte beskeder, end vi normalt bruger.

For eksempel vil man - hvis man vil aflyse et møde i sin Outlook-kalender - ikke blot kunne sige, "Aflys næste møde i dag med Charlie". I stedet bliver det til: Åbn Outlook, Åbn kalender, Find Charlie, Slet."

Computerligt at fejle

Men ingen skal forvente at få et fuldt konverserende system. Ifølge Kai-Fu Lee skal man blot forvente, at systemet arbejder lige så godt som en menneskelig assistent.

Det er menneskeligt at fejle, og man kan ikke forvente, at computeren begår færre fejl, siger Microsoft-forskeren.

IT-rådgivningsfirmaet Gartner er i øvrigt uenig med Lee i, at talegenkendelsen foreløbig kun batter for de museskadede.

Ifølge Gartner foreligger der beviser for, at løsninger med talegenkendelse bidrager til forretningen via besparelser og forbedret kundeservice.

Gartner betragter taleteknologi fra Nuance og Scansoft som det bedste og ser Microsofts og Intels entre på området som en vækstmotor for markedet.

Denne artikel stammer fra avisen Computerworld




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Jobindex Media A/S
Salg af telemarketing og research for it-branchen, it-kurser og konferencer

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Computerworld Cloud & AI Festival 2025

Glæd dig til to dage, hvor du kan netværke med over 2.400 it-professionelle, møde mere end 50 it-leverandører og høre indlæg fra +90 talere. Vi sætter fokus på emner som AI; infrastruktur, compliance, sikkerhed og løsninger for både private og offentlige organisationer.

17. september 2025 | Læs mere


IT og OT i harmoni: Sikring uden at gå på kompromis med effektiviteten

IT og OT smelter sammen – men med risiko for dyre fejl. Få metoder til sikker integration med ERP, kundesystemer og produktion. Tilmeld dig og få styr på forskellene og faldgruberne.

24. september 2025 | Læs mere


NIS2: Vi gør status efter tre måneder og lærer af erfaringerne

Vær med, når vi deler oplevelser med implementering af NIS2 og drøfter, hvordan du undgår at gentage erfaringerne fra GDPR – og særligt undgår kostbar overimplementering.

30. september 2025 | Læs mere