Inteligência artificial usa esboços infantis para criar espetaculares imagens fotorrealísticas

Por , em 19.03.2019


A empresa Nvidia revelou um impressionante criador de imagens em sua conferência GTC 2019 no último 18 de março.

Usando redes antagônicas, os usuários do software são capazes de esboçar imagens quase fotorrealísticas com apenas alguns cliques: o programa transforma instantaneamente algumas linhas em um lindo pôr-do-sol no topo de uma montanha.

O quase, aqui, se deve ao fato de que os limites entre os objetos não são perfeitos. A equipe por trás do projeto, no entanto, disse que sua qualidade irá melhorar.

GauGAN

Chamado de GauGAN, o software é apenas uma demonstração do que é possível com as plataformas de rede neural da Nvidia.

Ele foi criado para compilar uma imagem de como um ser humano pintaria, com o objetivo de fazer um esboço e transformá-lo em uma foto realista em segundos. Em uma série de demonstrações iniciais, parece funcionar conforme anunciado:

O GauGAN possui três ferramentas: balde de tinta, caneta e lápis. Na parte inferior da tela, há uma série de objetos. Selecione o objeto de uma nuvem e desenhe uma linha com o lápis, e o software produzirá uma nuvem fotorrealista.

O programa também pode sintetizar centenas de milhares de objetos e sua relação com outros itens do mundo real. Se você mudar a estação, por exemplo, folhas podem desaparecer dos galhos. Se houver um lago em frente a uma árvore, a árvore será refletida na água.

Por fim, o software também é multimodal. Se dois usuários criarem o mesmo esboço com as mesmas configurações, os números aleatórios incorporados ao projeto garantirão que o GauGAN crie resultados diferentes.

Configurações

Para ter resultados em tempo real, o GauGAN precisa rodar em uma plataforma de computação Tensor. A Nvidia demonstrou seu software na sua plataforma RDX Titan.

Contudo, Bryan Catanzaro, vice-presidente do Laboratório Aplicado de Aprendizado Profundo da Nvidia, afirmou que, com algumas modificações, o GauGAN pode ser executado em praticamente qualquer plataforma, incluindo CPUs, embora os resultados possam demorar alguns segundos para serem exibidos.

A Nvidia utilizou cerca de um milhão de imagens da plataforma Flickr para treinar a rede neural. A maioria veio do Creative Commons (organização sem fins lucrativos voltada a expandir a quantidade de obras criativas disponíveis através de licenças que permitem a cópia e compartilhamento com menos restrições que o tradicional “todos direitos reservados”), uma vez que a empresa usa apenas imagens com permissão.

Aplicações

Catanzaro espera que o software esteja disponível no novo AI Playground da Nvidia, mas disse que a companhia ainda tem um pouco de trabalho pela frente antes que isso aconteça.

Ele vê ferramentas como essa sendo usadas em videogames para criar ambientes mais imersivos, mas observa que a Nvidia não constrói diretamente softwares para isso. Mesmo com essa demonstração limitada, o software de fato deve atrair a atenção de projetistas de games e jogadores casuais.

A empresa não tem planos de lançar o software comercialmente, mas poderá liberar um teste público para permitir que qualquer pessoa o utilize em breve.

Ressalvas

A facilidade com que esse software pode ser usado para produzir imagens não autênticas para fins nada nobres é uma preocupação atual em torno dessa tecnologia.

Catanzaro concorda que este é um tópico importante, mas afirma que se trata de uma questão de confiança, em vez de uma questão de tecnologia e que “nós, como sociedade, devemos lidar com isso como tal”. [TechCrunch]

Deixe seu comentário!