Giv Microsofts nye AI-app tre sekunders stemmeklip og den vil efterligne din stemme

Microsofts nye AI-værktøj giver imponerende resultater, der let ville kunne misbruges.

Artikel top billede

(Foto: Valent Lau/Unsplash)

Microsofts præsenterer denne måned et spritnyt AI-værktøj til automatisk generering af tale.

Værktøjet, døbt VALL-E, er blot i stand til effektivt at simulere tale, men kan også hurtigt trænes til at efterligne stemmer, skriver netmediet Ars Technica.

Det kræver blot et stemmeklip på tre sekunder, før VALL-E kan generere et lydklip, hvor stemmen kan fås til at sige hvad det skal være.

Udviklerne bag VALL-E ser mange anvendelsesmuligheder for det nye AI-værktøj, hvor der blandt andet vil kunne redigeres i lydoptagelser af personer ud fra et script, hvilket i praksis betyder at personer kan få deres lydklip efterbehandlet til at ytre vilkårlige ting.

VALL-E markerer sig samtidig ved at kunne genskabe tonefald og humøret fra taleren, mens det omgivelserne lydkulisse kan gengives.

Programmet vises frem på en GitHub demoside, hvor adskillige lydklip kan aflyttes her.

Her anerkender udviklerne bag værktøjet også potentialet for misbrug af teknologien, til at fabrikere falske udsagn fra udvalgte personer. Her understreges det, at hvis modellen skal udbredes til den brede offentlighed vil det skulle akkompagneres af en protokol til at sikre, at eventuel manipulation og talesyntese sker med indtalerens accept.

Af samme grund har Microsoft valgt ikke at gøre værktøjet bredt tilgængeligt.

Bryder tale ned i små bidder

VALL-E er ifølge Microsoft et såkaldt ’neural sprog-codec model’ som er en overbygning på en teknologi kaldet EnCodec, som Meta præsenterede i oktober 2022.

Modellerne fungerer ved at generere stemmer ud fra specifikke tekst og akustiske brudstykker, fremfor at bero på traditionel stemmesyntese.

VALL-E nedbryder altså stemme-input til brudstykker, kaldet ’tokens’, hvor bare tre sekunders klip er nok til at definere en talers stemmeklang, som derefter sammenkøres med en stemmesyntese-model, for at generere stemmeefterligningerne.

Microsofts AI-værktøj er ligesom Metas EnCodec trænet med LibriLight databasen som inkluderer over 60.000 timers engelsk tale indtalt af over 7.000 mennesker.

Event: Cyber Security Festival 2026

Sikkerhed | København

Mød Danmarks skrappeste it-sikkerhedseksperter og bliv klar til at planlægge og eksekvere en operationel og effektiv cybersikkerhedsstrategi, når vi åbner dørene for +1.700 it-professionelle. Du kan glæde dig til oplæg fra mere end 70 talere og møde mere end 50 leverandører over to dage.

18 & 19 november 2026 | Gratis deltagelse

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Driftstærk IT-profil til Forsvarsministeriets Materiel- og Indkøbsstyrelse

Københavnsområdet

Netcompany A/S

Erfaren Linux Operations Engineer

Midtjylland

Capgemini Danmark A/S

IGNITE Graduate Program 2026

Københavnsområdet

Navnenyt fra it-Danmark

Thomas Nakai, Product Owner hos Carlsberg, har pr. 27. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aarhus Universitet via It-vest-samarbejdet. Færdiggjort uddannelse

Thomas Nakai

Carlsberg

Jakob Dirksen, SVP, Nordic Customer Delivery & Operations hos GlobalConnect, er pr. 1. maj 2026 forfremmet til EVP, Infrastructure Delivery & Operations. Han skal fremover især beskæftige sig med at lede Infrastructure Delivery & Operations, der har til opgave at drive og udvikle fibernetværket på tværs af virksomheden. Forfremmelse

Jakob Dirksen

GlobalConnect

Immeo har pr. 1. marts 2026 ansat Theo Lyngaa Hansen som Consultant. Han kommer fra en stilling som Data Manager hos IDA. Han er uddannet i Business Administration & Data Science. Nyt job
Lector ApS har pr. 2. februar 2026 ansat Jacob Pontoppidan som Sales Executive i Lectors TeamShare gruppe. Jacob skal især beskæftige sig med vækst af TeamShare med fokus på kommerciel skalering, mersalg og en stærk go to market eksekvering. Jacob har tidligere beskæftiget sig med salg og forretningsudvikling i internationale SaaS virksomheder. Nyt job

Jacob Pontoppidan

Lector ApS