Digitale studieværter

Microsoft Agent er en helt ny teknologi, som tryller animerede og snakkende agenter frem på skærmen.

"God aften. Dagens nyheder er færdige og kan læses under rubrikken Nyheder. God fornøjelse
med hjemmesiden." Denne besked kan man fremover risikere at få, når man surfer rundt på nettet.
De første audiovisuelle, intelligente agenter er allerede vågnet til live og fungerer som virtuelle
studieværter på nettet, hvor de forsyner brugerne med gode råd og tips og tricks, og fortæller om
nye sider på web-steder. Microsoft Agent er en helt ny teknologi, som kan befolke nettet med små
venlige assistenter, digitale studieværter, der guider os rundt på hjemmesiderne.


Den visuelle assistent


Intelligente agenter er ikke et nyt fænomen. De første spæde eksemplarer af de smarte assistenter
blev allerede præsenteret for flere år siden, og der var næsten ingen grænser for den begejstring,
som programmerne udløste. Det var berettiget, for deres funktionalitet var og er imponerende;
spredning af søgninger til flere søgemaskiner, nedhenting af hjemmesider mens brugerens sover,
anbefaling af produkter indenfor mange forskellige kategorier. Men alle agenterne lider under en
alvorlig skavank; de er grå og kedelige. I bedste fald signalerer agenternes navne, som "Surfbot"
eller "WebHound", at de skal forstås som små digitale assistenter, men på skærmen har man
stadig et program med menuer, værktøjsbjælker og tekstfelter, ikke en elektronisk butler.


Intelligente agenter er selvfølgelig i bund og grund almindelige programmer, men hvis agenterne
skal medvirke til at gøre livet lettere for brugerne - og begyndere, der endnu ikke er komfortable
med denne kolde teknik - kan det være en stor fordel, hvis de udstyres med en visuel brugerflade,
en grafisk metafor, der skjuler den enorme funktionalitet bag en pæn facade. I den forbindelse skal
man huske på, at computeren som vi kender den jo blot er en serie af facader. Windows er en
grafisk overbygning til kommandoprompten, DOS, der igen er en forenkling af den rå maskinkode
i processorens kerne.


Den grafiske assistent kan næsten ses som den ultimative grafiske overbygning, en visuel
brugerflade, hvis uhyre enkelthed skal medvirke til at gøre brugerens liv lettere. Microsoft Agent
repræsenterer en kerneteknologi, en serie af funktionsbiblioteker, der lader programmører og
web-designere gribe tilbage på funktioner, som får virtuelle studieværter til at udfolde deres virke
på skærmen. Agenten kan ikke blot bevæge sig rundt på skærmen med en detaljerigdom, der slår
de bedste computerspil, men også melde sig med digitaliseret tale og forstå brugerens talte ord.


Microsoft Agent


Programmører finder omfattende dokumentation hos Microsoft, der forklarer, hvordan man
udnytter den nye teknologi. Hvis man vil integrere Microsoft Agent i selvstændige applikationer,
eksempelvis på CD-ROM mediet, skal man tegne en licensaftale med firmaet, men
web-programmører, der ønsker at anvende agenterne på deres hjemmeside, kan gøre dette gratis.
Microsoft Agent består af tre ActiveX-moduler, som automatisk hentes og installeres fra
Microsoft, når det behøves: kernemodulet, der afvikler animationerne og styrer figuren på
skærmen, fylder omkring 300 KB, mens tekst-til-tale modulet, der håndterer den digitaliserede
tale, fylder lidt over 800 KB. Hvis man også ønsker at udnytte talegenkendelse, der tillader
brugeren at føre en konversation med agenten, skal man hente et større modul, der omfatter lidt
mere end 3 MB.


De programdele, der omdanner tekst til tale og tale til tekst, er opbygget efter et modulært princip,
der betyder, at man kan erstatte standardbibliotekerne med moduler fra trejdepartsfirmaer. Fra
starten leveres tekst-til-tale funktionen fra Microsofts partnerfirma Lernout & Hauspie, men her
kan man altså vælge et andet modul, eksempelvis hvis man ønsker at benytte andre sprog end
amerikansk-engelsk. Standardmodulet kan ikke håndtere dansk tale, men programmøren kan altså
erstatte det med produkter fra andre firmaer, hvis man kan finde et dansk tekst-til-tale modul. Det
samme gælder tale-genkendelsen, hvor modulet blot skal understøtte SAPI (Speech Application
Programming Interface), men desværre er der ikke udsigt til, at der vil blive udviklet gode danske
talegenkendelses-programmer indenfor den nærmeste fremtid.


Men agenten kan alligevel håndtere dansk tale, hvis man indtaler teksten i forvejen og gemmer
den i en lydfil, der afspilles sammen med agenten. Microsoft Agent synkroniserer automatisk
læbernes bevægelser, så det virker som om den digitale studievært siger ordene. Man kan tilmed
hente et værktøj, Linguistic Information Sound Editing Tool, der yderligere forbedrer kvaliteten af
det indtalte.


Programmerne, der styrer agenternes opførsel, skal enten skrives i JavaScript eller Visual Basic
Script. I den forbindelse skal man være opmærksom på, at Visual Basic Script kun understøttes af
Microsofts egen Internet Explorer-browser, mens JavaScript kan afvikles af alle browsere.


Færdige agenter


En færdig animeret agent vil ofte bestå af 30-40 forskellige handlinger, der igen hver indeholder
op til 15 enkeltbilleder (frames). Microsoft har udarbejdet tre færdige agenter, Genie, Merlin og
Robbie, som man kan hente fra Microsoft på href="http://www.microsoft.com/workshop/prog/agent/"
target="_top">www.microsoft.com/workshop/prog/agent/. Hvis man vil se agenterne i
aktion, og afprøve nogle af programmeringsmulighederne, kan man kigge forbi hos firmaet
Argolink på www.argolink.com, der har programmeret en webbaseret brugerflade, hvorfra
man kan styre agenterne. På Usenet kan man deltage i en nyhedsgruppe, hvor teknologien
diskuteres; news://microsoft.public.msagent.
Flere steder på Internet findes fortegnelser over agent-sider, bl.a. hos href="http://www.mrccomputing.com" target="_top"> www.mrccomputing.com.


Communication On-line har oprettet en demo-side, hvor man kan afprøve nogle af mulighederne,
og indtaste en (engelsksproget) tekst, som agenten læser op; tjenesten findes på href="http://www.comon.dk/demo.htm">www.comon.dk/demo.htm. På den første side
findes en længere animation med lyd, der kan tage adskillige minutter at hente, hvortil skal
lægges den tid, som det tager at hente ActiveX-modulerne første gang. Vælg "Klik her, hvis du vil
lære agenten at tale", og du kan skrive den ønskede tekst i tekstfeltet.


Du skal bruge Microsoft Internet Explorer, hvis du vil afprøve agenterne under Communication
On-line.




    Brancheguiden
    Brancheguide logo
    Opdateres dagligt:
    Den største og
    mest komplette
    oversigt
    over danske
    it-virksomheder
    Hvad kan de? Hvor store er de? Hvor bor de?
    Ciklum ApS
    Offshore software- og systemudvikling.

    Nøgletal og mere info om virksomheden
    Skal din virksomhed med i Guiden? Klik her

    Kommende events
    AI i det offentlige: Potentiale, erfaringer og krav

    Hør erfaringerne med at anvende AI til at transformere og effektivisere processer i det offentlige – og med at sikre datakvalitet, governance og overholdelse af retningslinjer.

    27. august 2025 | Læs mere


    Computerworld Cloud & AI Festival 2025

    Med den eksplosive udvikling indenfor cloud & AI er behovet for at følge med og vidensdeling større end nogensinde før. Glæd dig til to dage, hvor du kan netværke med over 2.400 it-professionelle, møde mere end 50 it-leverandører og høre indlæg fra +90 talere. Vi sætter fokus på emner som AI; infrastruktur, compliance, sikkerhed og løsninger for både private og offentlige organisationer.

    17. september 2025 | Læs mere


    IT og OT i harmoni: Sikring uden at gå på kompromis med effektiviteten

    IT og OT smelter sammen – men med risiko for dyre fejl. Få metoder til sikker integration med ERP, kundesystemer og produktion. Tilmeld dig og få styr på forskellene og faldgruberne.

    24. september 2025 | Læs mere