Giv Microsofts nye AI-app tre sekunders stemmeklip og den vil efterligne din stemme

Microsofts nye AI-værktøj giver imponerende resultater, der let ville kunne misbruges.

Artikel top billede

(Foto: Valent Lau/Unsplash)

Microsofts præsenterer denne måned et spritnyt AI-værktøj til automatisk generering af tale.

Værktøjet, døbt VALL-E, er blot i stand til effektivt at simulere tale, men kan også hurtigt trænes til at efterligne stemmer, skriver netmediet Ars Technica.

Det kræver blot et stemmeklip på tre sekunder, før VALL-E kan generere et lydklip, hvor stemmen kan fås til at sige hvad det skal være.

Udviklerne bag VALL-E ser mange anvendelsesmuligheder for det nye AI-værktøj, hvor der blandt andet vil kunne redigeres i lydoptagelser af personer ud fra et script, hvilket i praksis betyder at personer kan få deres lydklip efterbehandlet til at ytre vilkårlige ting.

VALL-E markerer sig samtidig ved at kunne genskabe tonefald og humøret fra taleren, mens det omgivelserne lydkulisse kan gengives.

Programmet vises frem på en GitHub demoside, hvor adskillige lydklip kan aflyttes her.

Her anerkender udviklerne bag værktøjet også potentialet for misbrug af teknologien, til at fabrikere falske udsagn fra udvalgte personer. Her understreges det, at hvis modellen skal udbredes til den brede offentlighed vil det skulle akkompagneres af en protokol til at sikre, at eventuel manipulation og talesyntese sker med indtalerens accept.

Af samme grund har Microsoft valgt ikke at gøre værktøjet bredt tilgængeligt.

Bryder tale ned i små bidder

VALL-E er ifølge Microsoft et såkaldt ’neural sprog-codec model’ som er en overbygning på en teknologi kaldet EnCodec, som Meta præsenterede i oktober 2022.

Modellerne fungerer ved at generere stemmer ud fra specifikke tekst og akustiske brudstykker, fremfor at bero på traditionel stemmesyntese.

VALL-E nedbryder altså stemme-input til brudstykker, kaldet ’tokens’, hvor bare tre sekunders klip er nok til at definere en talers stemmeklang, som derefter sammenkøres med en stemmesyntese-model, for at generere stemmeefterligningerne.

Microsofts AI-værktøj er ligesom Metas EnCodec trænet med LibriLight databasen som inkluderer over 60.000 timers engelsk tale indtalt af over 7.000 mennesker.

Event: Computerworld Cloud & AI Festival 2026

Digital transformation | Ballerup

Eksplosiv udvikling i cloud og AI kræver overblik og viden. Computerworld samler 3.000 it-professionelle, 70+ leverandører og 120+ talere om AI, infrastruktur, data, compliance og sikkerhed. To dage med viden og netværk. Tilmeld dig nu.

16 & 17 september 2026 | Gratis deltagelse

Navnenyt fra it-Danmark

Comsystem A/S har pr. 15. april 2026 ansat Iver Jakobsen som Technical Key Account Manager. Han skal især beskæftige sig med teknisk løsningssalg. Iver Jakobsen har 25 års erfaring fra TelCo-branchen. Han kommer fra en stilling som Key Account Manager hos E.ON Drive ApS. Han har tidligere beskæftiget sig med rådgivning og løsningssalg. Nyt job

Iver Jakobsen

Comsystem A/S

Renewtech ApS har pr. 1. april 2026 ansat Boris Sudar som Senior IT Specialist. Han skal især beskæftige sig med at sikre, at Renewtech cloudbaseret infrastruktur fortsætter på sit højeste niveau, mens han også skal drive system udvikling. Han kommer fra en stilling som Senior IT Specialist hos Eurowind Energy. Han har tidligere beskæftiget sig med Microsoft 365, Intune og sikker endepunktsstyring for hybrid og cloudbaseret infrastrukturer. Nyt job

Boris Sudar

Renewtech ApS

IFS Danmark A/S har pr. 1. april 2026 ansat Sarah Warm som Account Executive, Energy & Utilities. Hun skal især beskæftige sig med salg af IFS' løsninger til nye kunder inden for energibranchen. Hun kommer fra en stilling som Account Executive hos Synergy Investment Group i Holland. Hun er uddannet BSc Economics and Business Economics, Neuroscience & MSc Business Administration Digital Business. Hun har tidligere beskæftiget sig med Solution Sales & Cybersecurity. Nyt job

Sarah Warm

IFS Danmark A/S