Nvidia fremviste forleden en ny AI-model, som kan bruges til at skabe alle slags lyde og musik.
Modellen har fået navnet Fugatto (Foundational Generative Audio Transformer Opus 1).
Ved at indtaste en tekstprompt kan man få Fugatto til at skabe stort set enhver lyd. For eksempel en trompet, der gør som en hund.
Det er også muligt at bruge AI-modellen til at ændre dialekten på en sanger eller forvandle et klaverstykke til en sang.
Det rapporterer Reuters.
Nvidia har umiddelbart ikke planer om at gøre Fugatto offentligt tilgængeligt.
Kan ændre accenter
Teknologien minder om den fra startups som Runway og fra Meta Platforms, som genererer lyd eller video fra tekstprompter.
Det særlige ved Fugatto skulle være en evne til at ændre eksisterende lyd. Modellen kan forvandle en klaverlinje til en menneskelig stemme eller ændre accenten og stemningen i talte ord, hedder det i nyhedspublikationen.
Denne egenskab adskiller ifølge Reuters den nye Nvidia-model fra andre AI-teknologier, der er tilgængelige i øjeblikket.
Nvidias model siges at være trænet i open source-data, og virksomheden overvejer stadig, hvordan den skal frigives offentligt.
De overvejelser skal blandt andet ses i lyest af, at skabere af generativ AI står over for udfordringer med at forhindre misbrug såsom generering af misinformation eller krænkelse af ophavsrettigheder.