Tal og styr Windows Phone 7 med stemmen

Stemmer kan styre Microsofts nye mobilplatform, som skal udfordre Android og iPhone.

Artikel top billede

Computerworld News Service: I håbet om at hoppe direkte ind foran Google og Apple på markedet for smartphones har Microsoft planlagt at anvende cloud-baseret stemmegenkendelse og natursprogsbehandling til at tilbyde funktioner, som ikke findes på hverken iPhone eller enheder med Android.

"Vi tror ikke, at tale skal ses som en separat applikation. I stedet indgår det som en integreret del af brugeroplevelsen," sagde Zig Serafin, som er general manager for unified communications hos Microsoft, foran publikum under konferencen SpeechTEK 2010, som blev afholdt i New York i denne uge.

Microsoft håber at booste Windows Phone 7's evne til at forstå stemmestyring og levere de ønskede resultater, og derfor planlægger virksomheden at sammenknytte Windows Phone 7-telefonen med selskabets Tellme, som er en service til stemmegenkendelse og natursprogsbehandling, fortalte Zig Serafin under et efterfølgende interview med IDG News Service.

Microsoft opkøbte virksomheden bag Tellme, Tellme Networks, i 2007.

Nedgør Android og iPhone

Zig Serafin valgte desuden foran publikummet til SpeechTEK at nedgøre styresystemerne Android og iPhones brug af ikoner til primær styring.

"De fleste smartphones består af et net af ikoner, meget lig Windows 3.1," sagde han.

Det er mere naturligt at tale til telefonen, når man vil have den til at gøre noget, sagde han.

"Når man står over for en enhed uden et stort tastatur, så kommer stemmestyring til at udgøre et interessant supplement til oplevelsen," tilføjede han.

Sådan fungerer det

Derefter fik han marketing director for Microsoft Ilya Bukshteyn til demonstrere, hvordan Windows Phone 7 vil kunne bruge stemmegenkendelse og natursprogsbehandling, og på hvilken måde en computer tolker menneskers tale.

Ilya Bukshteyn bad for eksempel telefonen om at ringe til "Paul", hvorefter en stemme i telefonen svarede ved at tilbyde valget mellem en række forskellige kontakter med det fornavn. Ilya Bukshteyn nævnte derefter personens fulde navn, og telefonen reagerede ved at ringe kontakten op.

Ilya Bukshteyn bad desuden telefonen om at åbne et album med billeder, hvorefter en fremvisnings-applikation dukkede op på skærmen. Her kunne man se, ikke bare de billeder som brugeren selv havde lagt ind, men også fotos taget af venner fra forskellige sociale netværk.

Som et tredje eksempel bad Ilya Bukshteyn telefonen om en liste over kinesiske restauranter. Forespørgslen røg med det samme over i søgemaskinen Bing, som returnerede med en liste over restauranter og et kort med deres beliggenhed.

Microsoft: Vi skiller os ud

Selv om både iPhone og Android-varianterne har visse funktioner til stemmegenkendelse, så vil Microsofts telefon være anderledes på flere punkter, fortalte Zig Serafin.

Dels vil stemmestyringen ikke være begrænset til brug med nogle enkelte applikationer men kan styre hele telefonen. Telefonen vil desuden være unik, fordi den er interaktiv. Hvis den får en flertydig kommando, vil telefonen bede brugeren om at specificere forespørgslen.

Stemmekomponenten en bare en del af det, Zig Serafin kaldte et "natural user interface" eller NUI. NUI kan forstå input som tale, berøring og endda bevægelse.

"Tale udgør kernen i NUI," sagde han.

En del af demonstrationen viste, hvordan Microsofts Kinnect Xbox teknologi kan gøre det muligt for en computer at tolke og reagere på håndbevægelser.

Den teknologi vil skulle bruges i adskillige Microsoft-produkter udover Xboxen, fortalte Ilya Bukshteyn under et efterfølgende interview med IDG.

Først i processen

Zig Serafin fortalte, at virksomheden stadig er i begyndelsen af processen med at udrulle talestyring til forskellige Windows Phone 7-komponenter, først og fremmest til de mest brugte funktioner, nemlig søgninger, opkald og billedalbums.

Brugeren kan indstille telefonen til stemmestyring ved at holde en enkelt knap nede på telefonen. En del af talebehandlingen vil blive gennemført i selve telefonen, mens Tellme vil tage sig af resten.

"Men ærligt talt, så behøver forbrugerne hverken at vide eller interessere sig for, hvor informationerne bliver behandlet," tilføjede Ilya Bukshteyn.

Zig Serafin påstår, at Tellme er det mest udbredte system til natursprogsbehandling i dag. Microsoft regner især med at sælge tjenesten til større virksomheder til brug i telefon-baseret help desk support.

Tjenesten behandler mere end 2,5 milliarder opkald for virksomhedskunder om året, fortalte han.

Oversat af Marie Dyekjær Eriksen

Annonceindlæg fra SoftwareOne

Quantum computing bliver næste konkurrenceparameter

Danske virksomheder bør forberede data og systemer på at spille sammen med fremtidens kvanteteknologi.

Navnenyt fra it-Danmark

Signifly har pr. 1. august 2025 ansat Anders Kirk Madsen som Tech Lead. Anders skal især beskæftige sig med at hjælpe Signiflys offentlige og private kunder med at styrke forretningen gennem teknisk solide løsninger. Anders kommer fra en stilling som Business Architect hos SOS International. Nyt job
Netip A/S har pr. 19. august 2025 ansat Marck Stadel Klaris som Datateknikerelev ved netIP's kontor i Herning. Nyt job
Signifly har pr. 1. august 2025 ansat Morten Eskildsen som UX Lead. Han skal især beskæftige sig med styrke bureauets kompetencer inden for UX og digital strategi i konsulentteamet og arbejde på tværs af alle afdelinger. Han kommer fra en stilling som CDO, UX & Digital Strategy Consultant hos Zupa. Nyt job

Morten Eskildsen

Signifly

Netip A/S har pr. 25. august 2025 ansat Frank Bjerrum Pedersen som Systemkonsulent ved netIP's kontor i Esbjerg. Han kommer fra en stilling som IT-konsulent hos Konsulenthuset Bluebyte. Nyt job