Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.
Jeg har tidligere talt om fremtidens sprogteknologi: World Model Based Agents, men i denne klumme vil jeg komme lidt mere ind på hvordan mødet med de tiltagende stærke AI agenter vil forme sig.
Vi har i årtier vænnet os til, at en computer er noget, vi bruger gennem programmer. Vi klikker os rundt i et interface. Finder en funktion. Lærer systemets logik. Tilpasser os maskinen. Men det nu er ved at ændre sig.
For med store sprogmodeller er der opstået en ny måde at møde computeren på. I stedet for at bruge et program, kan vi tale med den. I stedet for at lære dens grænseflade kan vi formulere vores intention i almindeligt sprog.
Og i stedet for at den fortæller os, hvilke knapper vi skal trykke på, kan vi fortælle den, hvad vi vil have gjort.
Fra software, man betjener, til intelligens, man instruerer
Det kan lyde som blot en forbedret brugeroplevelse, men det er større end det.
Det er begyndelsen på et skifte, hvor det klassiske applikationslag bliver tyndere, og hvor agenten i stigende grad bliver det, der ligger mellem mennesket og de data, funktioner og tjenester, der skal arbejdes med.
Computeren er altså ikke længere bare noget, vi betjener. Den bliver i stigende grad noget, vi instruerer. Det er en afgørende forskel.
For når interaktionen bliver sproglig, bliver afstanden mellem intention og handling kortere og mere naturlig. Man skal i mindre grad oversætte sig selv til systemets logik. Systemet skal i højere grad oversætte sig til menneskets.
Den første professionelle fase af den udvikling er allerede tydelig. Softwareplatforme og SaaS-løsninger bliver nødt til at indeholde generativ AI. Ikke som en gimmick, men som en ny måde at tage imod brugeren på.
Platformen skal kunne forstå fri formulering, hjælpe aktivt og i nogle tilfælde endda handle autonomt på brugerens vegne.
Men der er en anden bevægelse, som først vil blive rigtig tydelig på længere sigt: Platformene skal ikke kun selv have indbyggede agenter. De skal også kunne tage imod, at brugeren selv kommer med en agent.
Fra app til API til agentisk adgang
Man kan allerede se bevægelsen. Først havde man en app. Senere et API. Næste skridt er, at tjenester eksponerer data og funktioner på måder, som agenter direkte kan bruge, for eksempel via MCP-servere eller andre integrationslag rettet specifikt mod agenter.
Tag vejret som et enkelt eksempel. Tidligere åbnede jeg en vejr-app. Senere kunne en udvikler hente vejrdata gennem et API. I næste fase spørger jeg ikke længere en app om vejret. Jeg spørger min agent, og den ved det, fordi den har adgang til den relevante MCP-server.
Det lyder som en lille forskydning. Men det er det ikke. Pludselig ligger funktionaliteten ikke længere primært i den enkelte app. Den ligger i samspillet mellem min agent og de tjenester, agenten kan række ind i. Softwaren bliver mindre noget, jeg går ind i, og mere noget, min agent bruger på mine vegne.
Lige nu taler mange om agenter i flertal. En agent til mail. En agent til kalender. En agent til analyse. En agent til research. Det giver mening, men kun i en overgangsfase.
For mennesker ønsker i praksis ikke at forholde sig til et helt lille samfund af digitale hjælpere. Vi ønsker sammenhæng. Derfor peger meget i retning af én mere personlig agent, som er min, og som kan række ind i de forskellige systemer og tjenester, jeg har adgang til.
Min bank. Min læge. Mine offentlige løsninger. Mine dokumenter. Mine abonnementer. Min kalender. Mit hjem. Ikke fordi al intelligens nødvendigvis ligger ét sted, men fordi oplevelsen af intelligens gør. Agenten bliver det vedvarende lag mellem mig og den digitale verden.
Når det sker, ændrer computeren karakter igen. Så er den ikke længere først og fremmest en skærm med apps. Så er den en personlig mellemmand mellem mennesket og verden, som ikke ligner en computer som vi kender den i dag.
Fremtidens AI Agent følger dig
Hvis agenten altid er med os, giver det mening, at den flytter ud af laptoppen og mobilen og ind i noget mere kontinuerligt. For eksempel briller. Ikke som en gimmick, men som et nyt interface til verden.´
Her bliver augmented reality pludselig interessant på en mere jordnær måde. Ikke bare som grafik oven på virkeligheden, men som en aktiv hjælp til at forstå, huske, navigere og handle i den. Sprogmodellen kommer med dig og ser og hører med, som deltager i din virkelighed.
En multimodal AI agent kan nemlig se, høre, tale og huske. Den kan forbinde den aktuelle situation med tidligere interaktioner, aftaler og data. Den kan minde dig om, hvem du talte med, hvad I aftalte, og hvad der er relevant netop nu. Den kan i praksis blive et ekstra lag af hukommelse, overblik og handlekraft omkring os, og det er mindre fjernt, end mange forestiller sig.
Ikke fordi alle dele er modne endnu. Men fordi bevægelsesretningen allerede er tydelig: Vi går fra at have adgang til software til at have adgang til en vedvarende digital ledsager.
Fysiske robotter på menneskelige præmisser
Den samme udvikling peger også mod robotter. Når multimodale sprogmodeller bliver bedre til at forstå verden, bliver de ikke kun relevante som personlige agenter.
De bliver også relevante som styrelag for fysiske, humanoide robotter
Det interessante ved humanoide robotter er ikke kun, at de kan bevæge sig. Det er, at de er designet til at passe ind i en verden, der allerede er bygget til mennesker.
Trapper, dørhåndtag, værktøj, kontorer og sociale signaler er formet efter menneskekroppen og menneskelig adfærd. Derfor giver det mening, at robotten også møder os på menneskelige præmisser.
Igen ser vi det samme mønster: AI kommer mennesket i møde, i stedet for at mennesket først skal tilpasse sig maskinen.
Hvis den samme type multimodale modeller kan drive både personlige agenter og humanoide robotter, tegner der sig et bredere billede af fremtidens AI. Ikke som ét produkt, men som et nyt lag af intelligens omkring os, både digitalt og fysisk.
Så spørgsmålet er måske ikke, om fremtidens computer bliver en personlig agent. Spørgsmålet er snarere, hvor hurtigt vi vænner os til, at computeren ikke længere først og fremmest er noget, vi åbner.
Men noget, der følger os.
Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.
Har du en god historie, eller har du specialviden, som du synes trænger til at blive delt?
Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.