Tal og styr Windows Phone 7 med stemmen

Stemmer kan styre Microsofts nye mobilplatform, som skal udfordre Android og iPhone.

Artikel top billede

Computerworld News Service: I håbet om at hoppe direkte ind foran Google og Apple på markedet for smartphones har Microsoft planlagt at anvende cloud-baseret stemmegenkendelse og natursprogsbehandling til at tilbyde funktioner, som ikke findes på hverken iPhone eller enheder med Android.

"Vi tror ikke, at tale skal ses som en separat applikation. I stedet indgår det som en integreret del af brugeroplevelsen," sagde Zig Serafin, som er general manager for unified communications hos Microsoft, foran publikum under konferencen SpeechTEK 2010, som blev afholdt i New York i denne uge.

Microsoft håber at booste Windows Phone 7's evne til at forstå stemmestyring og levere de ønskede resultater, og derfor planlægger virksomheden at sammenknytte Windows Phone 7-telefonen med selskabets Tellme, som er en service til stemmegenkendelse og natursprogsbehandling, fortalte Zig Serafin under et efterfølgende interview med IDG News Service.

Microsoft opkøbte virksomheden bag Tellme, Tellme Networks, i 2007.

Nedgør Android og iPhone

Zig Serafin valgte desuden foran publikummet til SpeechTEK at nedgøre styresystemerne Android og iPhones brug af ikoner til primær styring.

"De fleste smartphones består af et net af ikoner, meget lig Windows 3.1," sagde han.

Det er mere naturligt at tale til telefonen, når man vil have den til at gøre noget, sagde han.

"Når man står over for en enhed uden et stort tastatur, så kommer stemmestyring til at udgøre et interessant supplement til oplevelsen," tilføjede han.

Sådan fungerer det

Derefter fik han marketing director for Microsoft Ilya Bukshteyn til demonstrere, hvordan Windows Phone 7 vil kunne bruge stemmegenkendelse og natursprogsbehandling, og på hvilken måde en computer tolker menneskers tale.

Ilya Bukshteyn bad for eksempel telefonen om at ringe til "Paul", hvorefter en stemme i telefonen svarede ved at tilbyde valget mellem en række forskellige kontakter med det fornavn. Ilya Bukshteyn nævnte derefter personens fulde navn, og telefonen reagerede ved at ringe kontakten op.

Ilya Bukshteyn bad desuden telefonen om at åbne et album med billeder, hvorefter en fremvisnings-applikation dukkede op på skærmen. Her kunne man se, ikke bare de billeder som brugeren selv havde lagt ind, men også fotos taget af venner fra forskellige sociale netværk.

Som et tredje eksempel bad Ilya Bukshteyn telefonen om en liste over kinesiske restauranter. Forespørgslen røg med det samme over i søgemaskinen Bing, som returnerede med en liste over restauranter og et kort med deres beliggenhed.

Microsoft: Vi skiller os ud

Selv om både iPhone og Android-varianterne har visse funktioner til stemmegenkendelse, så vil Microsofts telefon være anderledes på flere punkter, fortalte Zig Serafin.

Dels vil stemmestyringen ikke være begrænset til brug med nogle enkelte applikationer men kan styre hele telefonen. Telefonen vil desuden være unik, fordi den er interaktiv. Hvis den får en flertydig kommando, vil telefonen bede brugeren om at specificere forespørgslen.

Stemmekomponenten en bare en del af det, Zig Serafin kaldte et "natural user interface" eller NUI. NUI kan forstå input som tale, berøring og endda bevægelse.

"Tale udgør kernen i NUI," sagde han.

En del af demonstrationen viste, hvordan Microsofts Kinnect Xbox teknologi kan gøre det muligt for en computer at tolke og reagere på håndbevægelser.

Den teknologi vil skulle bruges i adskillige Microsoft-produkter udover Xboxen, fortalte Ilya Bukshteyn under et efterfølgende interview med IDG.

Først i processen

Zig Serafin fortalte, at virksomheden stadig er i begyndelsen af processen med at udrulle talestyring til forskellige Windows Phone 7-komponenter, først og fremmest til de mest brugte funktioner, nemlig søgninger, opkald og billedalbums.

Brugeren kan indstille telefonen til stemmestyring ved at holde en enkelt knap nede på telefonen. En del af talebehandlingen vil blive gennemført i selve telefonen, mens Tellme vil tage sig af resten.

"Men ærligt talt, så behøver forbrugerne hverken at vide eller interessere sig for, hvor informationerne bliver behandlet," tilføjede Ilya Bukshteyn.

Zig Serafin påstår, at Tellme er det mest udbredte system til natursprogsbehandling i dag. Microsoft regner især med at sælge tjenesten til større virksomheder til brug i telefon-baseret help desk support.

Tjenesten behandler mere end 2,5 milliarder opkald for virksomhedskunder om året, fortalte han.

Oversat af Marie Dyekjær Eriksen

Læses lige nu

    Event: Computerworld Summit 2026 - Aarhus

    Digital transformation | Aarhus C

    Styrk din digitale strategi med konkret brug af AI og ny teknologi. Mød 200 it-professionelle, få indsigter, løsninger og netværk på én dag. Computerworld Summit i Aarhus viser hvordan teknologi skaber forretningsværdi – her og nu.

    21 april 2026 | Gratis deltagelse

    Navnenyt fra it-Danmark

    Pentos har pr. 2. juni 2025 ansat Erik Ebert som Country Manager. Han skal især beskæftige sig med udvidelsen af Pentos til Danmark og Norden. Det kræver bl.a. etablering af et lokalt leverance team og SAP Partnerskab. Han kommer fra en stilling som Senior Director hos Effective People. Han har tidligere beskæftiget sig med HR systemer baseret på SAP SuccessFactors hos en række danske større og mellemstore virksomheder. Nyt job

    Erik Ebert

    Pentos

    Infosuite A/S har pr. 1. marts 2026 ansat Henrik Sandmann som Chief Operating Officer (COO). Han skal især beskæftige sig med drift, produktudvikling og skalering, herunder også procesforbedringer og udnyttelse af AI og nye teknologier. Han kommer fra en stilling som Program Director hos ADMG ApS. Han er uddannet cand. scient i datalogi og har derudover en MBA indenfor strategi, ledelse og forretningsudvikling. Nyt job

    Henrik Sandmann

    Infosuite A/S

    Netip A/S har pr. 1. marts 2026 ansat Maria Lyng Refslund som Marketing Project Manager ved netIP Herning. Hun kommer fra en stilling som Marketing Project Manager hos itm8. Nyt job