Fugatto: a assustadora IA da Nvidia que promete transformar o som como o conhecemos

A Nvidia, gigante das tecnologias gráficas, acaba de entrar no crescente mercado da música gerada por inteligência artificial. Sua nova criação, chamada Fugatto (uma sigla para Foundational Generative Audio Transformer Opus 1), promete ir além da criação de melodias ao transformar sons cotidianos e até vozes humanas em composições inéditas, quase como se desafiasse a lógica sonora.
A mágica por trás do Fugatto
Diferentemente de modelos que apenas geram música ou ruídos de maneira básica, o Fugatto funciona como um alquimista sonoro: transforma elementos já conhecidos em experiências auditivas únicas. Por exemplo, é capaz de transformar a melodia de um piano em uma performance vocal, ou recriar sons com sotaques diferentes e variações de humor. Imagine um violino “cantando” como uma soprano ou um trem que lentamente se torna uma orquestra completa — é essa a promessa que o Fugatto traz.
Segundo Bryan Catanzaro, vice-presidente de pesquisa em aprendizado profundo da Nvidia, a IA generativa na música tem o potencial de causar impacto semelhante ao dos sintetizadores eletrônicos, que revolucionaram a música nas últimas cinco décadas. “Os computadores transformaram os sons que ouvimos, e a IA está prestes a levar isso ainda mais longe”, declarou.
Músicas que nenhum DJ remixaria
Embora a Nvidia afirme que o Fugatto pode criar “paisagens sonoras nunca ouvidas”, há um debate sobre o quão original é essa inovação. Afinal, como toda IA, ele utiliza grandes bases de dados para “aprender” a criar suas saídas. Porém, a Nvidia garante que o diferencial está em como o Fugatto combina efeitos de áudio sobrepostos, criando camadas de som que desafiam os limites da criatividade.
Uma demonstração no YouTube ilustrou essas capacidades: o som de um trem se transformando em uma performance orquestral é apenas um dos exemplos. A possibilidade de manipular emoções, mudando vozes felizes para irritadas, também faz parte do pacote. Esse nível de controle sobre os elementos sonoros torna o Fugatto atrativo tanto para compositores profissionais quanto para curiosos explorando o universo musical.
Por que ainda não está nas suas mãos?
Apesar da empolgação, a Nvidia não liberou o modelo ao público — uma decisão guiada por preocupações de segurança. A empresa reconhece os riscos inerentes à tecnologia generativa, como a possibilidade de uso inadequado, além de potenciais conflitos relacionados a direitos autorais. Segundo Catanzaro, liberar o Fugatto sem precauções seria irresponsável.
Essas preocupações não são infundadas. Grandes gravadoras já processaram startups de música gerada por IA, acusando-as de usar material protegido para treinar seus modelos. Além disso, estrelas de Hollywood, como Scarlett Johansson, têm denunciado o uso indevido de suas vozes por ferramentas similares.
A Nvidia segue uma abordagem semelhante à da Meta, que recentemente lançou o Movie Gen, um modelo capaz de criar tanto vídeos quanto paisagens sonoras, mas também optou por não disponibilizá-lo publicamente.
A IA e o futuro da criatividade sonora
Enquanto o Fugatto permanece nos laboratórios da Nvidia, a promessa de uma revolução sonora segue animando artistas e desenvolvedores. A possibilidade de transformar sons comuns em experiências únicas pode abrir portas para novas formas de expressão criativa, desde trilhas sonoras de videogames até projetos musicais independentes.
Mas, como em toda grande inovação, é preciso cuidado. À medida que a IA adentra o mundo da arte, questões éticas e legais precisam ser enfrentadas. Ainda assim, é inegável que modelos como o Fugatto representam um novo capítulo na história da música e do áudio. [Sillicon Angle]
